㈠ 这是一道初中数学题-对数据进行分组整理
组距:每组的最高数值与最低数值之间的距离。在分组整理统计量数时,组的大小可因系列内量数的全距及所要划分的组数的不同而有所不同。每一组的最小限度叫做下限,最大限度叫做上限。下限和上限之间的距离, 即为组距。
什么是组距分组
组距分组是将全部变量值依次划分为若干个区间,并将这一区间的变量值作为一组。组距分组是数值型数据分组的基本形式。
在组距分组中,各组之间的取值界限称为组限,一个组的最小值称为下限,最大值称为上限;上限与下限的差值称为组距;上限与下限值的平均数称为组中值,它是一组变量值的代表值。
把组距除以你要分的组数(若不规定,一般取10)即可
第一步:确定组数。一组数据分多少组合适呢?一般与数据本身的特点及数据的多少有关。由于分组的目的之一是为了观察数据分布的特征,因此组数的多少应适中。如组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规律为目的。在实际分组时,可以按Sturges提出的经验公式来确定组数K:
第二步:确定各组的组距。组距是一个组的上限与下限的差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=(最大值-最小值)÷组数。例如,对于前例的数据,最大值为139,最小值为107,则组距=(139-107)÷7=4.6。为便于计算,组距宜取5或10的倍数,而且第一组的下限应低于最小变量值,最后一组的上限应高于最大变量值,因此组距可取5。
第三步:根据分组整理成频数分布表。
㈡ 画频数分布直方图,如何确定组距和组数
在用频数分布直方图描述数据时,首先要把数据分组统计.合适地分组,会使数据分布规律显得更为清楚,能更准确地作出情况分析.一般数据越多,分成的组数也要多.经验表明,当数据个数在100个以内时,常常把数据分成5—12组来统计.分组时,往往与小组的组距联系在一起.也就是先定出组距,再确定组数,不同的组距会确定出不同的组数.
㈢ 数据分组
对一批观测数据进行整理,为了运算方便,往往要将数据按照一定要求分组。特别是在数据较多时分组计算的优越性尤为明显。数据分组之后也便于制图,如频数(数据落在每个组的数目称频数)分布直方图、频率(频数/总频数)直方图、累积频率(样本分组数据中各组频率累积之和)分布图等。下面以228个伽马数据为例,具体说明分组、列表、制图的方法。
(一)分组
将观测数据划分多少组,要根据数据的多少、数据的性质、数据的变化范围、观测质量等来适当划分。一般不宜少于5组,也不必多于15组或20组。一组中的最小值叫组下限,一组中的最大值叫组上限。分组时前一组的组上限,又是后一组的组下限。组上限与组下限之差叫组距;分组一般用等间距,组距记为L。各组中的中点数值为组中值。有些观测数据,如微量元素的含量等,往往要将元素含量取常用对数(微量元素含量不服从正态分布,而服从对数正态分布),然后将对数值按等差的方法分组。
分组具体步骤如下:
1.确定数据上界和下界
上界可比数据中最大值稍大一点,下界可比数据中最小值稍小一点。在对某花岗岩的γ测量中共有228个数据,最小值为18γ,最大值为51γ,那么下界可定为17γ,上界可定为53γ。
2.决定组距和组数
组距决定于极差R(上界-下界),此例中R=53γ-17γ=36γ,组距可定为4γ,分成9组。假定用n代表分组数,l为组距,计算公式如下:
放射性勘探技术
3.决定分组点
一般要求分组点比原观测精度高一位,使分组严密,避免一个数据可分在上一个组也可分在下一个组,由于值都是整数,于是取n.5为组限。将数据可分为如下9组:17.5~21.5,21.5~25.5,…,49.5~53.5。
4.统计频数
用选举唱票的方法计算出落在每个组的数目,即频数,并计算出频率与累积频率。
(二)列表
将统计结果列成表,如表8-1所示。
表8-1 某矿区伽马测量资料统计表
(三)制图
主要是绘制频数(或频率)分布直方图和累积频率折线图。
1.绘制频数(频率)分布直方图
在横坐标上标出分组点,纵坐标为对应的频数(频率),以组距为底画出高度为频数(频率)的矩形,便得频数(频率)直方图,如图8-1所示。
图8-1 某区伽马测量频数直方图和频率曲线图
2.绘制累计频率折线图
仍以横坐标标出分组点,纵坐标为累积频率f值(%)。在各组组上限处立一高为相对应的累积频率的虚线段,依次联结各虚线段的顶点,就构成了累积频率曲线图,如图8-2所示。
可以设想,如果取更多的样本,组分得更细,那么各样本值或者各组频率将趋于一个稳定的值。且由于组距L不断减小以至趋近于零,频率直方图的形状将逐渐趋近于一条曲线。换句话说,频率分布的极限,可以考虑一个稳定的函数。当样本值是连续变量(可以取一个或几个区间中,甚至整个数轴上一切数值的变量,叫连续变量,如某岩体的γ辐射照射量率)的情形,这个函数y=f(x)将表达一条光滑的曲线。这条曲线叫频率分布曲线。若数据波动的规律不同,频率分布曲线的形状也就不一样。在放射性物探工作中,形状如图8-2的曲线最多,应用也最广,称为正态分布曲线。
由于频率之总和(累积频率)为1(100%)。不难看出,如果纵坐标取为“频率/组距”,那么频率直方图矩形面积的总和等于1。换句话说,分布曲线y=f(x)与横轴所夹的面积等于1,显然可用积分之值来表示。即
放射性勘探技术
图8-2的纵坐标的含意是,在横轴的单位长度上平均分布有多少频率,也就是频率分布密度。所以由频率分布曲线所确定的函数y=f(x),叫作频率分布密度函数。
图8-2 某区伽马测量累积频率曲线图
㈣ 统计学原理中统计分组遵循的原则是什么
科学的统计分组应遵循两个原则:
1、必须符合“穷尽原则”,就是使总体中的每一个单位都应有组可归,或者说各分组的空间足以容纳总体的所有单位。
2、必须遵守“互斥原则“,即总体任一单位都只能归属于一组,而不能同时或可能归属于几个组。
(4)数学频数分组组数要注意什么扩展阅读:
统计分组的种类:
1、任务作用分组
类型分组的目的是划分经济类型,结构分类的目的是研究同质总体的构成,分析分组的目的是研究现象总体内部诸标志间的依从和制约关系。
2、分组标志分组
简单分组是将总体按一个标志进行分组,复合分组是将总体按两个或两个以上的标志重叠起来进行分组。
3、性质分组
品质分组是将总体按品质标志进行分组,如企业按经济成份、地理位置分组,职工按性别、文化程度分组等;变量分组是将总体按数量标志进行分组,如企业按职工人数、劳动生产率分组,职工按工龄、工资分组等。
㈤ 数据分组的分组方法
数据分组的方法有单变量值分组和组距分组两种。 在连续变量或变量值较多的情况下,通常采用组距分组。它是将全部变量值依次划分为若干区间,并将这一区间的变量值作为一组。在组距分组中,一个组的最小值称为下限;一个组的最大值称为上限。
分组原则
采用组距分组时,需要遵循不重不漏的原则。不重是指一项数据只能分在其中的某一组,不能在其他组中重复出现;不漏是指组别能够穷尽,即在所分的全部组别中每一项数据都能分在其中的某一组,不能遗漏。
分组步骤
第1步:确定组数。一组数据分多少组合适呢?一般与 数据本身的特点及数据的多少有关。由于分组的目的之一是观察数据分布的特征,因此组数的多少应适中。如果组数太少,数据的分布就会过于集中,组数太多,数据分布就会过于分散,这都不便于观察数据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规律为目的。一般情况下,一组数据所分的组数应不少于5组且不多于15组。实际应用时,可根据数据的多少和特点及分析要求来确定组数。
第2步:确定各组的组距。组距是一个组的上限与下限的差。组距可根据全部数据的最大值和最小值及所分的组数来确定,及组距=(最大值—最小值)/组数。
第3步:根据分组整理成频数分布表。
㈥ 频数中的组数和组距怎么求组数是如何计算出来的
在统计过程中,通常是根据数据的分布先确定组距,然后根据组数计算组距。
而公式 R÷组数=组距 是否有漏洞:比如R=30,组数=6,则组距=5,
但实际上当组距=5时,30/5=6,应该分6+1=7组。
㈦ 确定组距的大小和组数的多少时应考虑哪些原则
① 分组。将收集的数据分成若干组。一般地,数据越多,分的组数越多。当数据在100个以内时,通常分成5—12组。
② 决定各组的分点(即各组起点数和终点数),相邻两组之间不能交叉。
③ 累计出各组的频数,列出频数分布表。
④ 在水平方向取出组数相同的等份数作为宽,从小到大将各组数排列起来;
⑤ 将竖直方向分成适当的等份数(能表示出最多和最少的频数),以各组相应的频数为高,画出各个小长方形,即得频数分布直方图。
⑥在画频数分布直方图时,首先要列出频数分布表,在分组时要注意组数适当,组距相等。
⑦分组要不空、不重、不漏。
不空,即该组必须有数据;
不重,即一个数据只能在一个组中;
不漏,即不能漏掉某一个数据
㈧ 频数分布直方图的注意事项
运用频数分布直方图进行数据分析的时候,一般先列出它的分布表,其中有几个常用的公式:各组频数之和等于抽样数据总数;各组频率之和等于1;数据总数×各组的频率=相应组的频数。
画频数分布直方图的目的,是为了将频数分布表中的结果直观、形象地表示出来,其中组距、组数起关键作用,分组过少,数据就非常集中;分组过多,数据就非常分散,这就掩盖了分布的特征,当数据在100以内时,一般分5~12组。
㈨ 频数怎么求
问题一:频数如何求? 频数是一组数列当中,某个元素出现的次数,就叫做频数。
“一组数据”的个数称为总数
因为 频率=频数/总数
所以 频数=频率X总数
频数(Frequency),又称“次数”。指变量值中代表某种特征的数(标志值)出现的次数。按分组依次排列的频数构成频数数列,用来说明各组标志值对全体标志值所起作用的强度。各组频数的总和等于总体的全部单位数。频数的表示方法,既可以用表的形式,也可以用图形的形式。
问题二:什么是频数和频率怎么求 频数:在统计学中,将样本按照一定的方法分成若干组,每组内含有这个样本的个体的数目叫做频数.? 频率:某个组的频数与样本容量的比值叫做这个组的频率. 频率=频数÷样本容量
问题三:频数是什么,怎么求? 频数是一组数列当中,某个元素出现的次数,就叫做频数。简单的可以直接数出来,复杂的可以根据已知条件求出
问题四:如何根据频数算频率 1 原始数据 如某班40名学生体重记录:(单位kg) 44 46 43 51 51 52。。。。。。 2 计算数据的最大值减去最小值的差 如最大值是61,最小值是42,它们的差是19,算出了最大值与最小值的差,就知道了这组数据变动范围。 3 决定组距与组数 将一批数据分组,一般地,数据多,分的组数也多。当数据在100个以内时,按照数据的多少,常分为5到12组,每个组的两个端点之间的距离叫做组距 如取组距为3kg,那么 最大值-最小值/组距=19/3=6。333 分成7组。40个数据,分成7组,组数合适。 4 列频数分布表 有些数据正好是组与组之间的分点,规定每组中的数据含这组起止范围的最低值,不含最高值(其他问题可自定) 5 绘制频数分布直方图 ==================================== 一、基本概念 1.频数:落在不同小组中的数据个数为该组的频数.各组的频数之和等于这组数据的总数. 注:在统计频数多少的时候,我们一般通过数“正”字的方法累计. 2.频率:频数与数据总数的比,即频率=,各组频率之和为1.频率大小反映了各组频数在数据总数中所占的份量. 3.组数:把全体样本分成的组的个数称为组数. 4.组距:每一组两个端点的差. 二、列频数分布表的注意事项 运用频数分布直方图进行数据分析的时候,一般先列出它的分布表,其中有几个常用的公式:各组频数之和等于抽样数据总数;各组频率之和等于1;数据总数×各组的频率=相应组的频数. 画频数分布直方图的目的,是为了将频数分布表中的结果直观、形象地表示出来,其中组距、组数起关键作用,分组过少,数据就非常集中;分组过多,数据就非常分散,这就掩盖了分布的特征,当数据在100以内时,一般分5~12组. 三、直方图的特点 通过长方形的高代表对应组的频数,这样的统计图称为频数分布直方图. 它能:①清楚显示各组频数分布情况;②易于显示各组之间频数的差别. 四、制作频数分布直方图的步骤 1.找出所有数据中的最大值和最小值,并算出它们的差. 2.决定组距和组数. 3.确定分点 4.列出频数分布表. 5.画频数分布直方图. 五、频数分布折线图的制作 我们可以在直方图的基础上来画,先取直方图各矩形上边的中点,然后在横轴上取两个频数为0的点,这两点分别与直方图左右两端的两个长方形的组中值相距一个组距,将这些点用线段依次联结起来,就得到了频数分布折线图. 六、条形图和直方图的区别 1.条形图是用条形的高度表示频数的大小,而直方图实际上是用长方形的面积表示频数,当长方形的宽相等的时候,可以用矩形的的高表示频数; 2.条形图中,横轴上的数据是孤立的,是一个具体的数据,而直方图中,横轴上的数据是连续的,是一个范围; 3.条形图中,各长方形之间有空隙,而直方图中,各长方形是靠在一起的; 七、与统计图有关的数学思想方法 1.数形结合:从统计图中,能看出各组数据的特点,可进一步应用这些数据特点解决实际问题.通过整理数据,根据要求绘制统计图,可进一步分析数据、做出决策. 2.类比:绘制频数分布直方图和绘制条形图类似,如果长方形的宽一样,那么长方形的高度之比就是各组内数据个数之比.赞同202| 评论
㈩ 数值型数据的分组方法有哪些简述组距分组的步骤
数值型数据的分组方法主要有两种,分别是单变量值分组、组距分组。
组距分组的步骤:
1、确定组数。一组数据的组数一般与数据本身的特点及数据的多少有关。由于分组的目的之一是为了观察数据分布的特征,因此组数的多少应适中。如组数太少,数据的分布就会过于集中,组数太多,数据的分布就会过于分散,这都不便于观察数据分布的特征和规律。组数的确定应以能够显示数据的分布特征和规律为目的。
2、确定各组的组距。组距是一个组的上限与下限的差,可根据全部数据的最大值和最小值(即极差)及所分的组数来确定,即组距=(最大值-最小值)/组数。
3、根据分组整理成频数分布表。
(10)数学频数分组组数要注意什么扩展阅读:
采用组距分组时,需要遵循“不重不漏”的原则。“不重”是指一项数据只能分在其中的某一组,不能在其他组中重复出现;“不漏”是指组别能够穷尽,即在所分的全部组别中每项数据都能分在其中的某一组,不能遗漏。
在组距分组中,如果全部数据中的最大值和最小值与其他数据相差悬殊,为避免出现空白组(即没有变量值的组)或个别极端值被漏掉,第一组和最后一组可以采取“××以下”及“××以上”这样的开口组。