㈠ 這是一道初中數學題-對數據進行分組整理
組距:每組的最高數值與最低數值之間的距離。在分組整理統計量數時,組的大小可因系列內量數的全距及所要劃分的組數的不同而有所不同。每一組的最小限度叫做下限,最大限度叫做上限。下限和上限之間的距離, 即為組距。
什麼是組距分組
組距分組是將全部變數值依次劃分為若干個區間,並將這一區間的變數值作為一組。組距分組是數值型數據分組的基本形式。
在組距分組中,各組之間的取值界限稱為組限,一個組的最小值稱為下限,最大值稱為上限;上限與下限的差值稱為組距;上限與下限值的平均數稱為組中值,它是一組變數值的代表值。
把組距除以你要分的組數(若不規定,一般取10)即可
第一步:確定組數。一組數據分多少組合適呢?一般與數據本身的特點及數據的多少有關。由於分組的目的之一是為了觀察數據分布的特徵,因此組數的多少應適中。如組數太少,數據的分布就會過於集中,組數太多,數據的分布就會過於分散,這都不便於觀察數據分布的特徵和規律。組數的確定應以能夠顯示數據的分布特徵和規律為目的。在實際分組時,可以按Sturges提出的經驗公式來確定組數K:
第二步:確定各組的組距。組距是一個組的上限與下限的差,可根據全部數據的最大值和最小值及所分的組數來確定,即組距=(最大值-最小值)÷組數。例如,對於前例的數據,最大值為139,最小值為107,則組距=(139-107)÷7=4.6。為便於計算,組距宜取5或10的倍數,而且第一組的下限應低於最小變數值,最後一組的上限應高於最大變數值,因此組距可取5。
第三步:根據分組整理成頻數分布表。
㈡ 畫頻數分布直方圖,如何確定組距和組數
在用頻數分布直方圖描述數據時,首先要把數據分組統計.合適地分組,會使數據分布規律顯得更為清楚,能更准確地作出情況分析.一般數據越多,分成的組數也要多.經驗表明,當數據個數在100個以內時,常常把數據分成5—12組來統計.分組時,往往與小組的組距聯系在一起.也就是先定出組距,再確定組數,不同的組距會確定出不同的組數.
㈢ 數據分組
對一批觀測數據進行整理,為了運算方便,往往要將數據按照一定要求分組。特別是在數據較多時分組計算的優越性尤為明顯。數據分組之後也便於制圖,如頻數(數據落在每個組的數目稱頻數)分布直方圖、頻率(頻數/總頻數)直方圖、累積頻率(樣本分組數據中各組頻率累積之和)分布圖等。下面以228個伽馬數據為例,具體說明分組、列表、制圖的方法。
(一)分組
將觀測數據劃分多少組,要根據數據的多少、數據的性質、數據的變化范圍、觀測質量等來適當劃分。一般不宜少於5組,也不必多於15組或20組。一組中的最小值叫組下限,一組中的最大值叫組上限。分組時前一組的組上限,又是後一組的組下限。組上限與組下限之差叫組距;分組一般用等間距,組距記為L。各組中的中點數值為組中值。有些觀測數據,如微量元素的含量等,往往要將元素含量取常用對數(微量元素含量不服從正態分布,而服從對數正態分布),然後將對數值按等差的方法分組。
分組具體步驟如下:
1.確定數據上界和下界
上界可比數據中最大值稍大一點,下界可比數據中最小值稍小一點。在對某花崗岩的γ測量中共有228個數據,最小值為18γ,最大值為51γ,那麼下界可定為17γ,上界可定為53γ。
2.決定組距和組數
組距決定於極差R(上界-下界),此例中R=53γ-17γ=36γ,組距可定為4γ,分成9組。假定用n代表分組數,l為組距,計算公式如下:
放射性勘探技術
3.決定分組點
一般要求分組點比原觀測精度高一位,使分組嚴密,避免一個數據可分在上一個組也可分在下一個組,由於值都是整數,於是取n.5為組限。將數據可分為如下9組:17.5~21.5,21.5~25.5,…,49.5~53.5。
4.統計頻數
用選舉唱票的方法計算出落在每個組的數目,即頻數,並計算出頻率與累積頻率。
(二)列表
將統計結果列成表,如表8-1所示。
表8-1 某礦區伽馬測量資料統計表
(三)制圖
主要是繪制頻數(或頻率)分布直方圖和累積頻率折線圖。
1.繪制頻數(頻率)分布直方圖
在橫坐標上標出分組點,縱坐標為對應的頻數(頻率),以組距為底畫出高度為頻數(頻率)的矩形,便得頻數(頻率)直方圖,如圖8-1所示。
圖8-1 某區伽馬測量頻數直方圖和頻率曲線圖
2.繪制累計頻率折線圖
仍以橫坐標標出分組點,縱坐標為累積頻率f值(%)。在各組組上限處立一高為相對應的累積頻率的虛線段,依次聯結各虛線段的頂點,就構成了累積頻率曲線圖,如圖8-2所示。
可以設想,如果取更多的樣本,組分得更細,那麼各樣本值或者各組頻率將趨於一個穩定的值。且由於組距L不斷減小以至趨近於零,頻率直方圖的形狀將逐漸趨近於一條曲線。換句話說,頻率分布的極限,可以考慮一個穩定的函數。當樣本值是連續變數(可以取一個或幾個區間中,甚至整個數軸上一切數值的變數,叫連續變數,如某岩體的γ輻射照射量率)的情形,這個函數y=f(x)將表達一條光滑的曲線。這條曲線叫頻率分布曲線。若數據波動的規律不同,頻率分布曲線的形狀也就不一樣。在放射性物探工作中,形狀如圖8-2的曲線最多,應用也最廣,稱為正態分布曲線。
由於頻率之總和(累積頻率)為1(100%)。不難看出,如果縱坐標取為「頻率/組距」,那麼頻率直方圖矩形面積的總和等於1。換句話說,分布曲線y=f(x)與橫軸所夾的面積等於1,顯然可用積分之值來表示。即
放射性勘探技術
圖8-2的縱坐標的含意是,在橫軸的單位長度上平均分布有多少頻率,也就是頻率分布密度。所以由頻率分布曲線所確定的函數y=f(x),叫作頻率分布密度函數。
圖8-2 某區伽馬測量累積頻率曲線圖
㈣ 統計學原理中統計分組遵循的原則是什麼
科學的統計分組應遵循兩個原則:
1、必須符合「窮盡原則」,就是使總體中的每一個單位都應有組可歸,或者說各分組的空間足以容納總體的所有單位。
2、必須遵守「互斥原則「,即總體任一單位都只能歸屬於一組,而不能同時或可能歸屬於幾個組。
(4)數學頻數分組組數要注意什麼擴展閱讀:
統計分組的種類:
1、任務作用分組
類型分組的目的是劃分經濟類型,結構分類的目的是研究同質總體的構成,分析分組的目的是研究現象總體內部諸標志間的依從和制約關系。
2、分組標志分組
簡單分組是將總體按一個標志進行分組,復合分組是將總體按兩個或兩個以上的標志重疊起來進行分組。
3、性質分組
品質分組是將總體按品質標志進行分組,如企業按經濟成份、地理位置分組,職工按性別、文化程度分組等;變數分組是將總體按數量標志進行分組,如企業按職工人數、勞動生產率分組,職工按工齡、工資分組等。
㈤ 數據分組的分組方法
數據分組的方法有單變數值分組和組距分組兩種。 在連續變數或變數值較多的情況下,通常採用組距分組。它是將全部變數值依次劃分為若干區間,並將這一區間的變數值作為一組。在組距分組中,一個組的最小值稱為下限;一個組的最大值稱為上限。
分組原則
採用組距分組時,需要遵循不重不漏的原則。不重是指一項數據只能分在其中的某一組,不能在其他組中重復出現;不漏是指組別能夠窮盡,即在所分的全部組別中每一項數據都能分在其中的某一組,不能遺漏。
分組步驟
第1步:確定組數。一組數據分多少組合適呢?一般與 數據本身的特點及數據的多少有關。由於分組的目的之一是觀察數據分布的特徵,因此組數的多少應適中。如果組數太少,數據的分布就會過於集中,組數太多,數據分布就會過於分散,這都不便於觀察數據分布的特徵和規律。組數的確定應以能夠顯示數據的分布特徵和規律為目的。一般情況下,一組數據所分的組數應不少於5組且不多於15組。實際應用時,可根據數據的多少和特點及分析要求來確定組數。
第2步:確定各組的組距。組距是一個組的上限與下限的差。組距可根據全部數據的最大值和最小值及所分的組數來確定,及組距=(最大值—最小值)/組數。
第3步:根據分組整理成頻數分布表。
㈥ 頻數中的組數和組距怎麼求組數是如何計算出來的
在統計過程中,通常是根據數據的分布先確定組距,然後根據組數計算組距。
而公式 R÷組數=組距 是否有漏洞:比如R=30,組數=6,則組距=5,
但實際上當組距=5時,30/5=6,應該分6+1=7組。
㈦ 確定組距的大小和組數的多少時應考慮哪些原則
① 分組。將收集的數據分成若干組。一般地,數據越多,分的組數越多。當數據在100個以內時,通常分成5—12組。
② 決定各組的分點(即各組起點數和終點數),相鄰兩組之間不能交叉。
③ 累計出各組的頻數,列出頻數分布表。
④ 在水平方向取出組數相同的等份數作為寬,從小到大將各組數排列起來;
⑤ 將豎直方向分成適當的等份數(能表示出最多和最少的頻數),以各組相應的頻數為高,畫出各個小長方形,即得頻數分布直方圖。
⑥在畫頻數分布直方圖時,首先要列出頻數分布表,在分組時要注意組數適當,組距相等。
⑦分組要不空、不重、不漏。
不空,即該組必須有數據;
不重,即一個數據只能在一個組中;
不漏,即不能漏掉某一個數據
㈧ 頻數分布直方圖的注意事項
運用頻數分布直方圖進行數據分析的時候,一般先列出它的分布表,其中有幾個常用的公式:各組頻數之和等於抽樣數據總數;各組頻率之和等於1;數據總數×各組的頻率=相應組的頻數。
畫頻數分布直方圖的目的,是為了將頻數分布表中的結果直觀、形象地表示出來,其中組距、組數起關鍵作用,分組過少,數據就非常集中;分組過多,數據就非常分散,這就掩蓋了分布的特徵,當數據在100以內時,一般分5~12組。
㈨ 頻數怎麼求
問題一:頻數如何求? 頻數是一組數列當中,某個元素出現的次數,就叫做頻數。
「一組數據」的個數稱為總數
因為 頻率=頻數/總數
所以 頻數=頻率X總數
頻數(Frequency),又稱「次數」。指變數值中代表某種特徵的數(標志值)出現的次數。按分組依次排列的頻數構成頻數數列,用來說明各組標志值對全體標志值所起作用的強度。各組頻數的總和等於總體的全部單位數。頻數的表示方法,既可以用表的形式,也可以用圖形的形式。
問題二:什麼是頻數和頻率怎麼求 頻數:在統計學中,將樣本按照一定的方法分成若干組,每組內含有這個樣本的個體的數目叫做頻數.? 頻率:某個組的頻數與樣本容量的比值叫做這個組的頻率. 頻率=頻數÷樣本容量
問題三:頻數是什麼,怎麼求? 頻數是一組數列當中,某個元素出現的次數,就叫做頻數。簡單的可以直接數出來,復雜的可以根據已知條件求出
問題四:如何根據頻數算頻率 1 原始數據 如某班40名學生體重記錄:(單位kg) 44 46 43 51 51 52。。。。。。 2 計算數據的最大值減去最小值的差 如最大值是61,最小值是42,它們的差是19,算出了最大值與最小值的差,就知道了這組數據變動范圍。 3 決定組距與組數 將一批數據分組,一般地,數據多,分的組數也多。當數據在100個以內時,按照數據的多少,常分為5到12組,每個組的兩個端點之間的距離叫做組距 如取組距為3kg,那麼 最大值-最小值/組距=19/3=6。333 分成7組。40個數據,分成7組,組數合適。 4 列頻數分布表 有些數據正好是組與組之間的分點,規定每組中的數據含這組起止范圍的最低值,不含最高值(其他問題可自定) 5 繪制頻數分布直方圖 ==================================== 一、基本概念 1.頻數:落在不同小組中的數據個數為該組的頻數.各組的頻數之和等於這組數據的總數. 註:在統計頻數多少的時候,我們一般通過數「正」字的方法累計. 2.頻率:頻數與數據總數的比,即頻率=,各組頻率之和為1.頻率大小反映了各組頻數在數據總數中所佔的份量. 3.組數:把全體樣本分成的組的個數稱為組數. 4.組距:每一組兩個端點的差. 二、列頻數分布表的注意事項 運用頻數分布直方圖進行數據分析的時候,一般先列出它的分布表,其中有幾個常用的公式:各組頻數之和等於抽樣數據總數;各組頻率之和等於1;數據總數×各組的頻率=相應組的頻數. 畫頻數分布直方圖的目的,是為了將頻數分布表中的結果直觀、形象地表示出來,其中組距、組數起關鍵作用,分組過少,數據就非常集中;分組過多,數據就非常分散,這就掩蓋了分布的特徵,當數據在100以內時,一般分5~12組. 三、直方圖的特點 通過長方形的高代表對應組的頻數,這樣的統計圖稱為頻數分布直方圖. 它能:①清楚顯示各組頻數分布情況;②易於顯示各組之間頻數的差別. 四、製作頻數分布直方圖的步驟 1.找出所有數據中的最大值和最小值,並算出它們的差. 2.決定組距和組數. 3.確定分點 4.列出頻數分布表. 5.畫頻數分布直方圖. 五、頻數分布折線圖的製作 我們可以在直方圖的基礎上來畫,先取直方圖各矩形上邊的中點,然後在橫軸上取兩個頻數為0的點,這兩點分別與直方圖左右兩端的兩個長方形的組中值相距一個組距,將這些點用線段依次聯結起來,就得到了頻數分布折線圖. 六、條形圖和直方圖的區別 1.條形圖是用條形的高度表示頻數的大小,而直方圖實際上是用長方形的面積表示頻數,當長方形的寬相等的時候,可以用矩形的的高表示頻數; 2.條形圖中,橫軸上的數據是孤立的,是一個具體的數據,而直方圖中,橫軸上的數據是連續的,是一個范圍; 3.條形圖中,各長方形之間有空隙,而直方圖中,各長方形是靠在一起的; 七、與統計圖有關的數學思想方法 1.數形結合:從統計圖中,能看出各組數據的特點,可進一步應用這些數據特點解決實際問題.通過整理數據,根據要求繪制統計圖,可進一步分析數據、做出決策. 2.類比:繪制頻數分布直方圖和繪制條形圖類似,如果長方形的寬一樣,那麼長方形的高度之比就是各組內數據個數之比.贊同202| 評論
㈩ 數值型數據的分組方法有哪些簡述組距分組的步驟
數值型數據的分組方法主要有兩種,分別是單變數值分組、組距分組。
組距分組的步驟:
1、確定組數。一組數據的組數一般與數據本身的特點及數據的多少有關。由於分組的目的之一是為了觀察數據分布的特徵,因此組數的多少應適中。如組數太少,數據的分布就會過於集中,組數太多,數據的分布就會過於分散,這都不便於觀察數據分布的特徵和規律。組數的確定應以能夠顯示數據的分布特徵和規律為目的。
2、確定各組的組距。組距是一個組的上限與下限的差,可根據全部數據的最大值和最小值(即極差)及所分的組數來確定,即組距=(最大值-最小值)/組數。
3、根據分組整理成頻數分布表。
(10)數學頻數分組組數要注意什麼擴展閱讀:
採用組距分組時,需要遵循「不重不漏」的原則。「不重」是指一項數據只能分在其中的某一組,不能在其他組中重復出現;「不漏」是指組別能夠窮盡,即在所分的全部組別中每項數據都能分在其中的某一組,不能遺漏。
在組距分組中,如果全部數據中的最大值和最小值與其他數據相差懸殊,為避免出現空白組(即沒有變數值的組)或個別極端值被漏掉,第一組和最後一組可以採取「××以下」及「××以上」這樣的開口組。