導航:首頁 > 生物信息 > 生物統計學如何製作次數分布表

生物統計學如何製作次數分布表

發布時間:2022-09-02 21:31:24

1. 誰能介紹統計學都學什麼!

統計學主要又分為描述統計學和推斷統計學。給定一組數據,統計學可以摘要並且描述這份數據,這個用法稱作為描述統計學。另外,觀察者以數據的形態建立出一個用以解釋其隨機性和不確定性的數學模型,以之來推論研究中的步驟及母體,這種用法被稱做推論統計學。這兩種用法都可以被稱作為應用統計學。另外也有一個叫做數理統計學的學科專門用來討論這門科目背後的理論基礎。
[編輯本段]統計學的發展歷程
統計學的英文statistics最早是源於現代拉丁文statisticum collegium (國會)以及義大利文 statista (國民或政治家)。 德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表對國家的資料進行分析的學問,也就是「研究國家的科學」。在十九世紀統計學在廣泛的數據以及資料中探究其意義,並且由John Sinclair引進到英語世界。 統計學是一門很古老的科學,一般認為其學理研究始於古希臘的亞里斯多德時代,迄今已有兩千三百多年的歷史。它起源於研究社會經濟問題,在兩千多年的發展過程中,統計學至少經歷了「城邦政情」,「政治算數」和「統計分析科學」三個發展階段。所謂「數理統計」並非獨立於統計學的新學科,確切地說它是統計學在第三個發展階段所形成的所有收集和分析數據的新方法的一個綜合性名詞。概率論是數理統計方法的理論基礎,但是它不屬於統計學的范疇,而屬於數學的范疇。 統計學的發展過程的三個階段《商務管理統計學》封面圖 第一階段稱之為「城邦政情」(Matters of state)階段 「城邦政情」階段始於古希臘的亞里斯多德撰寫「城邦政情」或「城邦紀要」。他一共撰寫了一百五十餘種紀要,其內容包括各城邦的歷史,行政,科學,藝術,人口,資源和財富等社會和經濟情況的比較,分析,具有社會科學特點。「城邦政情」式的統計研究延續了一兩千年,直至十七世紀中葉才逐漸被「政治算數」這個名詞所替代,並且很快被演化為「統計學」(Statistics)。統計學依然保留了城邦(state)這個詞根。 第二階段稱之為「政治算數」(Politcal arthmetic)階段 與「城邦政情」階段沒有很明顯的分界點,本質的差別也不大。 「政治算數」的特點是統計方法與數學計算和推理方法開始結合。分析社會經濟問題的方式更加註重運用定量分析方法。 1690年英國威廉·配弟出版 (政治算數)一書作為這個階段的起始標志. 威廉·配弟用數字,重量和尺度將社會經濟現象數量化的方法是近代統計學的重要特徵。因此,威廉?配弟的(政治算數)被後來的學者評價為近代統計學的來源,威廉?配弟本人也被評價為近代統計學之父。 配弟在書中使用的數字有三類: 第一類是對社會經濟現象進行統計調查和經驗觀察得到的數字.因為受歷史條件的限制,書中通過嚴格的統計調查得到的數據少,根據經驗得出的數字多; 第二類是運用某種數學方法推算出來的數字。其推算方法可分為三種: 「(1)以已知數或已知量為基礎,循著某種具體關系進行推算的方法; (2)通過運用數字的理論性推理來進行推算的方法;《商務統計學》封面圖 (3)以平均數為基礎進行推算的方法」; 第三類是為了進行理論性推理而採用的例示性的數字.配弟把這種運用數字和符號進行的推理稱之為「代數的演算法」。從配弟使用數據的方法看,「政治算數」階段的統計學已經比較明顯地體現了「收集和分析數據的科學和藝術」特點,統計實證方法和理論分析方法渾然一體,這種方法即使是現代統計學也依然繼承。 第三階段稱之為「統計分析科學」(Science of statistical analysis)階段 在「政治算數」階段出現的統計與數學的結合趨勢逐漸發展形成了「統計分析科學」。 十九世紀末,歐洲大學開設的「國情紀要」或「政治算數」等課程名稱逐漸消失,代之而起的是「統計分析科學」課程.當時的「統計分析科學」課程的內容仍然是分析研究社會經濟問題。 「統計分析科學」課程的出現是現代統計發展階段的開端. 1908年,「學生」氏(William Sleey Gosset的筆名Student)發表了關於t分布的論文,這是一篇在統計學發展史上劃時代的文章。它創立了小樣本代替大樣本的方法,開創了統計學的新紀元。 現代統計學的代表人物首推比利時統計學家奎特萊(Adolphe Quelet),他將統計分析科學廣泛應用於社會科學,自然科學和工程技術科學領域,因為他深信統計學是可以用於研究任何科學的一般研究方法. 現代統計學的理論基礎概率論始於研究賭博的機遇問題,大約開始於1477年。數學家為了解釋支配機遇的一般法則進行了長期的研究,逐漸形成了概率論理論框架。在概率論進一步發展的基礎上,到十九世紀初,數學家們逐漸建立了觀察誤差理論,正態分布理論和最小平方法則。於是,現代統計方法便有了比較堅實的理論基礎。
[編輯本段]統計學的觀念
為了將統計學應用到科學,工業以及社會問題上,我們由研究母體開始。這可能是一個國家的人民,石頭中的水晶,或者是某家特定工廠所生產的商品。一個母體甚至可能由許多次同樣的觀察程序所組成;由這種資料收集所組成的母體我們稱它叫時間序列。 為了實際的理由,我們選擇研究母體的子集代替研究母體的每一筆資料,這個子集稱做樣本。以某種經驗設計實驗所搜集的樣本叫做資料。資料是統計分析的對象,並且被用做兩種相關的用途:描述和推論。《統計學導論》封面圖 描述統計學處理有關敘述的問題:資料是否可以被有效的摘要,不論是以數學或是圖片表現,以用來代表母體的性質?基礎的數學描述包括了平均數和標准差。圖像的摘要則包含了許多種的表和圖。 推論統計學被用來將資料中的數據模型化,計算它的機率並且做出對於母體的推論。這個推論可能以對/錯問題的答案所呈現(假設檢定),對於數字特徵量的估計(估計),對於未來觀察的預測,關聯性的預測(相關性),或是將關系模型化(回歸)。其他的模型化技術包括變異數分析(ANOVA),時間序列,以及資料采礦。 相關的觀念特別值得被拿出來討論。對於資料集合的統計分析可能顯示兩個變數(母體中的兩種性質)傾向於一起變動,好像它們是相連的一樣。舉例來說,對於人收入和死亡年齡的研究期刊可能會發現窮人比起富人平均來說傾向擁有較短的生命。這兩個變數被稱做相關的。但是實際上,我們不能直接推論這兩個變數中有因果關系;參見相關性推論因果關系(邏輯謬誤)。 如果樣本足以代表母體的,那麼由樣本所做的推論和結論可以被引申到整個母體之上。最大的問題在於決定樣本是否足以代表 整個母體。統計學提供了許多方法來估計和修正樣本和搜集資料過程中的隨機性(誤差),如同上面所提到的透過經驗所設計的實驗。參見實驗設計。 要了解隨機性或是機率必須具備基本的數學觀念。數理統計(通常又叫做統計理論)是應用數學的分支,它使用機率論來分析並且驗證統計的理論基礎。 任何統計方法是有效的只有當這個系統或是所討論的母體滿足方法論的基本假設。誤用統計學可能會導致描述面或是推論面嚴重的錯誤,這個錯誤可能會影響社會政策,醫療實踐以及橋梁或是核能發電計劃結構的可靠性。 即使統計學被正確的應用,結果對於不是專家的人來說可能會難以陳述。舉例來說,統計資料中顯著的改變可能是由樣本的隨機變數所導致,但是這個顯著性可能與大眾的直覺相悖。人們需要一些統計的技巧(或懷疑)以面對每天日常生活中透過引用統計數據所獲得的資訊。
[編輯本段]統計方法
1)測量的尺度 統計學一共有四種測量的尺度或是四種測量的方式。這四種測量(名目,順序,等距,等比)在統計過程中具有不等的實用性 。等比尺度(Ratio measurements)擁有零值及資料間的距離是相等被定義的,等距尺度(Interval measurements)資料間的距離是相等被定義的但是它的零值並非絕對的無而是自行定義的(如智力或溫度的測量)。( Ordinal measurements)順序尺度的意義並非表現在其值而是在其順序之上。名目尺度(Nominal measurements)的測量值則不具量的意義。 2)統計技術 以下列出一些有名的統計檢定方法以及可供驗證實驗數據的程序 費雪最小顯著差異法(Fisher's Least Significant Difference test ) 學生t檢驗(Student's t-test) 曼-惠特尼 U 檢定(Mann-Whitney U) 回歸分析(regression analysis) 相關性(correlation) 皮爾森積矩相關系數(Pearson proct-moment correlation coefficient) 史匹曼等級相關系數(Spearman's rank correlation coefficient ) 卡方分配(chi-square )
[編輯本段]統計學歷史中的學派
一、18-19世紀——統計學的創立和發展 德國的斯勒茲曾說過:「統計是動態的歷史,歷史是靜態的統計。」可見統計學的產生與發展是和生產的發展、社會的進步緊密相聯的。 (1)統計學的創立時期 統計學的萌芽產生在歐洲。17世紀中葉至18世紀中葉是統計學的創立時期。在這一時期,統計學理論初步形成了一定的學術派別,主要有國勢學派和政治算術學派。 1、國勢學派 國勢學派又稱記述學派,產生於17世紀的德國。由於該學派主要以文字記述國家的顯著事項,故稱記述學派。其主要代表人物是海爾曼·康令和阿亨華爾。康令第一個在德國黑爾姆斯太特大學以「國勢學」為題講授政治活動家應具備的知識。阿亨華爾在格丁根大學開設「國家學」課程,其主要著作是《近代歐洲各國國勢學綱要》,書中講述「一國或多數國家的顯著事項」,主要用對比分析的方法研究了解國家組織、領土、人口、資源財富和國情國力,比較了各國實力的強弱,為德國的君主政體服務。因在外文中「國勢」與「統計」詞義相通,後來正式命名為「統計學」。該學派在進行國勢比較分析中,偏重事物性質的解釋,而不注重數量對比和數量計算,但卻為統計學的發展奠定了經濟理論基礎。但隨著資本主義市場經濟的發展,對事物量的計算和分析顯得越來越重要,該學派後來發生了分裂,分化為圖表學派和比較學派。 2、政治算術學派 政治算術學派產生於17世紀中葉的英國,創始人是威廉·配第(1623-1687),其代表作是他於1676年完成的《政治算術》一書。這里的「政治」是指政治經濟學,「算術」是指統計方法。在這部書中,他利用實際資料,運用數字、重量和尺度等統計方法對英國、法國和荷蘭三國的國情國力,作了系統的數量對比分析,從而為統計學的形成和發展奠定了方法論基礎。因此馬克思說:「威廉·佩第——政治經濟學之父,在某種程度上也是統計學的創始人。」 政治算術學派的另一個代表人物是約翰·格朗特(1620-1674)。他以1604年倫敦教會每周一次發表的「死亡公報」為研究資料,在 1662年發表了《關於死亡公報的自然和政治觀察》的論著。書中分析了60年來倫敦居民死亡的原因及人口變動的關系,首次提出通過大量觀察,可以發現新生兒性別比例具有穩定性和不同死因的比例等人口規律;並且第一次編制了「生命表」,對死亡率與人口壽命作了分析,從而引起了普遍的關注。他的研究清楚地表明了統計學作為國家管理工具的重要作用。 (2)統計學的發展時期 18世紀末至19世紀末是統計學的發展時期。在這時期,各種學派的學術觀點已經形成,並且形成了兩主要學派,即數理統計學派和社會統計學派。 1、數理統計學派 在18世紀,由於概率理論日益成熟,為統計學的發展奠定了基礎。19世紀中葉,把概率論引進統計學而形成數理學派。其奠基人是比利時的阿道夫·凱特勒(1796-1874),其主要著作有:《論人類》、《概率論書簡》、《社會制度》和《社會物理學》等。他主張用研究自然科學的方法研究社會現象,正式把古典概率論引進統計學,使統計學進入一個新的發展階段。由於歷史的局限性,凱特勒在研究過程中混淆了自然現象和本質區別,對犯罪、道德等社會問題,用研究自然現象的觀點和方法作出一些機械的、庸俗化的解釋。但是,他把概率論引入統計學,使統計學在「政治算術」所建立的「算術」方法的基礎上,在准確化道路上大大跨進了一步,為數理統計學的形成與發展奠定了基礎。 2、社會統計學派 社會統計學派產生於19世紀後半葉,創始人是德國經濟學家、統計學家克尼斯(1821-1889),主要代表人物主要有恩格爾(1821- 1896)、梅爾(1841-1925)等人。他們融合了國勢學派與政治算術學派的觀點,沿著凱特勒的「基本統計理論」向前發展,但在學科性質上認為統計學是一門社會科學,是研究社會現象變動原因和規律性的實質性科學,以此同數理統計學派通用方法相對立。社會統計學派在研究對象上認為統計學是研究體而不是個別現象,而且認為由於社會現象的復雜性和整體性,必須地總體進行大量觀察和分析,研究其內在聯系,才能揭示現象內在規律。這是社會統計學派的「實質性科學」的顯著特點。 社會經濟的發展,要求統計學提供更多的統計方法;社會科學本身也不斷地向細分化和定量化發展,也要求統計學能提供更有效的調查整理、分析資料的方法。因此,社會統計學派也日益重視方法論的研究,出現了從實質性方法論轉化的趨勢。但是,社會統計學派仍然強調在統計研究中必須以事物的質為前提和認識事物質的重要性,這同數理統計學派的計量不計質的方法論性質是有本質區別的。 二、20世紀——迅速發展的統計學 20世紀初以來,科學技術迅猛發展,社會發生了巨大變化,統計學進入了快速發展時期。歸納起來有以下幾個方面。 1、由記述統計向推斷統計發展。記述統計是對所搜集的大量數據資料進行加工整理、綜合概括,通過圖示、列表和數字,如編制次數分布表、繪制直方圖、計算各種特徵數等,對資料進行分析和描述。而推斷統計,則是在搜集、整理觀測的樣本數據基礎上,對有關總體作出推斷。其特點是根據帶隨機性的觀測樣本數據以及問題的條件和假定(模型),而對未知事物作出的,以概率形式表述的推斷。目前,西方國家所指的科學統計方法,主要就是指推斷統計來說的。 2、由社會、經濟統計向多分支學科發展。在20世紀以前,統計學的領域主要是人口統計、生命統計、社會統計和經濟統計。隨著社會、經濟和科學技術的發展,到今天,統計的范疇已覆蓋了社會生活的一切領域,幾乎無所不包,成為通用的方法論科學。它被廣泛用於研究社會和自然界的各個方面,並發展成為有著許多分支學科的科學。 3、統計預測和決策科學的發展。傳統的統計是對已經發生和正在發生的事物進行統計,提供統計資料和數據。20世紀30年代以來,特別是第二次世界大戰以來,由於經濟、社會、軍事等方面的客觀需要,統計預測和統計決策科學有了很大發展,使統計走出了傳統的領域而被賦予新的意義和使命。 4、資訊理論、控制論、系統論與統計學的相互滲透和結合,使統計科學進一步得到發展和日趨完善。資訊理論、控制論、系統論在許多基本概念、基本思想、基本方法等方面有著共同之處,三者從不同角度、側面提出了解決共同問題的方法和原則。三論的創立和發展,徹底改變了世界的科學圖景和科學家的思維方式,也使統計科學和統計工作從中吸取了營養,拓寬了視野,豐富了內容,出現了新的發展趨勢。 5、計算技術和一系列新技術、新方法在統計領域不斷得到開發和應用。近幾十年間,計算機技術不斷發展,使統計數據的搜集、處理、分析、存貯、傳遞、印製等過程日益現代化,提高了統計工作的效能。計算機技術的發展,日益擴大了傳統的和先進的統計技術的應用領域,促使統計科學和統計工作發生了革命性的變化。如今,計算機科學已經成為統計科學不可分割組成部分。隨著科學技術的發展,統計理論和實踐深度和廣度方面也不斷發展。 6.統計在現代化管理和社會生活中的地位日益重要。隨著社會、經濟和科學技術的發展,統計在現代化國家管理和企業管理中的地位,在社會生活中的地位,越來越重要了。人們的日常生活和一切社會生活都離不開統計。英國統計學家哈斯利特說:「統計方法的應用是這樣普遍,在我們的生活和習慣中,統計的影響是這樣巨大,以致統計的重要性無論怎樣強調也不過分。」甚至有的科學有還把我們的時代叫做「統計時代」。顯然,20世紀統計科學的發展及其未來,已經被賦予了劃時代的意義。
[編輯本段]統計學現狀
在科學技術飛速發展的今天,統計學廣泛吸收和融合相關學科的新理論,不斷開發應用新技術和新方法,深化和豐富了統計學傳統領域的理論與方法,並拓展了新的領域。今天的統計學已展現出強有力的生命力。在我國,社會主義市場經濟體制的逐步建立,實踐發展的需要對統計學提出了新的更多、更高的要求。隨著我國社會主義市場經濟的成長和不斷完善,統計學的潛在功能將得到更充分更完滿的開掘。 第一,對系統性及系統復雜性的認識為統計學的未來發展增加了新的思路。由於社會實踐廣度和深度迅速發展,以及科學技術的高度發展,人們對客觀世界的系統性及系統的復雜性認識也更加全面和深入。隨著科學融合趨勢的興起,統計學的研究觸角已經向新的領域延伸,新興起了探索性數據的統計方法的研究。研究的領域向復雜客觀現象擴展。21世紀統計學研究的重點將由確定性現象和隨機現象轉移到對復雜現象的研究。如模糊現象、突變現象及混沌現象等新的領域。可以這樣說,復雜現象的研究給統計開辟了新的研究領域。 第二,定性與定量相結合的綜合集成法將為統計分析方法的發展提供新的思想。定性與定量相結合的綜合集成方法是錢學森教授於1990年提出的。這一方法的實質就是將科學理論、經驗知識和專家判斷相結合,提出經驗性的假設,再用經驗數據和資料以及模型對它的確實性進行檢測,經過定量計算及反復對比,最後形成結論。它是研究復雜系統的有效手段,而且在問題的研究過程中處處滲透著統計思想,為統計分析方法的發展提供了新的思維方式。 第三,統計科學與其他科學滲透將為統計學的應用開辟新的領域。現代科學發展已經出現了整體化趨勢,各門學科不斷融合,已經形成一個相互聯系的統一整體。由於事物之間具有的相互聯系性,各學科之間研究方法的滲透和轉移已成為現代科學發展的一大趨勢。許多學科取得的新的進展為其他學科發展提供了全新的發展機遇。模糊論、突變論及其他新的邊緣學科的出現為統計學的進一步發展提供了新的科學方法和思想。將一些尖端科學成果引入統計學,使統計學與其交互發展將成為未來統計學發展的趨勢。統計學也將會有一個令人振奮的前景。今天已經有一些先驅者開始將控制論、資訊理論、系統論以及圖論、混沌理論、模糊理論等方法和理論引入統計學,這些新的理論和方法的滲透必將會給統計學的發展產生深遠的影響。 統計學產生於應用,在應用過程中發展壯大。隨著經濟社會的發展、各學科相互融合趨勢的發展和計算機技術的迅速發展,統計學的應用領域、統計理論與分析方法也將不斷發展,在所有領域展現它的生命力和重要作用。
[編輯本段]學科分支
一些學科大量地利用了應用統計學,以至它們自己已經各自獨立成為一門學科。《統計學——科學與工程應用》封面圖 統計學的分支學科有: 統計學史 理論統計學 統計調查分析理論 統計核算理論 統計監督理論 統計預測理論 統計邏輯學 統計法學 描述統計學 推斷統計學 經濟統計學 宏觀經濟統計學 微觀經濟統計學 管理統計學 科學技術統計學 農村經濟調查 社會統計學 教育統計學 文化與體育統計學 衛生統計學 司法統計學 社會福利與社會保障統計學 生活質量統計學 人口統計學 環境與生態統計學 自然資源統計學 環境統計學 生態平衡統計學 國際統計學 國際標准分類統計學 國際核算體系與方法論體系 國際比較統計學 其他 生物統計學 商務統計學 工程統計學 心理統計學 化學統計學 檔案統計學 社會經濟統計學 水文統計學 數理統計學 統計語言學 統計物理學 化學統計學 延伸學科 有些科學廣泛的應用統計的方法使得他們擁有各自的統計術語,這些學科包括: 農業科學 生物統計 商用統計 資料采礦(應用統計學以及圖形從資料中獲取知識) 經濟統計學 電機統計 統計物理學 人口統計 心理統計學 教育統計學 社會統計(包括所有的社會科學) 文獻統計分析 化學與程序分析(所有有關化學的資料分析與化工科學) 運動統計學,特別是棒球以及曲棍球 統計對於商業以及工業是一個基本的關鍵。他被用來了解與測量系統變異性,程序控制,對資料作出結論,並且完成資料取向的決策。在這些領域統計扮演了一個重要的角色。

2. 生物統計學試題救急!!!

1、先設定區間大小,比如5為單位,則劃分區間為35-40,40-45,45-50,50-55,55-60,65-70
2、然後依次將原為表格中數據往對應區間中填
3、第三行表格寫出區間的母羊數量,亦即次數分布表

3. 可以看一下這道生物統計學的題,用電腦中excel怎麼操作謝謝!

excel公式 插入函數 統計找到正態分布,可以根據這個來計算概率
或者單元格直接輸入公式,把x表示出來即可求范圍

4. 生物統計學中研究的誤差有那些 各有何特點 在實際統計分析中如何對待

生物統計學分析的第一步是資料的收集和整理。收集資料主要有調研和開展生物學試驗兩種方法,而資料的整理主要通過對原始資料的核查、校對,製作次數分布表和次數分布圖來完成。生命科學領域的試驗資料一般都具有集中性、離散性及分布形態三個基本特徵:集中性主要利用算術平均數、中位數、幾何平均數等反映;離散性主要通過標准差、方差、變異系數等特徵數進行度量;分布形態則主要藉助偏度和峰度體現。本章首先介紹總體與變數等最基本的生物統計學名詞術語,繼而結合實例,應用軟體來闡明實驗原始數據整理的具體方法,並對實驗數據的特徵進行統計分析,全面闡明數據資料的整理分析方法。
在科學試驗與調查中,常常會得到大量的原始數據,這些對某種具體事物或現象觀察的結果稱為資料(data)。這些資料在統計分析前,一般是分散的、零星的和孤立的,是一堆無序的數字。為了揭示這些資料中所蘊含的科學意義,需要對其進行必要的整理分析,揭示其內在的規律。
2.1 常用統計學術語
為了更好地學習和理解後續章節的生物統計學知識,首先必須掌握以下幾組生物統計學基本概念。
2.1.1 總體、個體與樣本
總體(population)是指研究對象的全體,其中的每一個成員稱為個體(indivial)。依據構成總體的個體數目的多寡,總體可以分為有限總體(finitepopulation)和無限總體(infinitepopulation)。例如,研究珠母貝的殼高,因為無法估計出珠母貝的具體數量,可以認為珠母貝是無限總體。
總體的數目往往非常龐大,全部測定需要耗費大量的時間、人力和物力,甚至根本無法完全測定每一個個體;另外,有時候數據的獲取過程對研究對象具有破壞性,如要測定貝殼硬度,需要壓碎貝殼。因此,只能通過研究總體中的一部分個體來反映總體的特徵。從總體中隨機獲得部分個體的過程,稱為抽樣(sampling)。為了使抽樣的結果具有代表性,需要採取隨機抽樣(randomsampling)的方法,如對一個生物的總體,機會均等地抽取樣本,估計其總體的某種生物學特性。簡單的隨機抽樣的方法有抽簽、抓鬮、隨機數字表法等。從總體中抽取的一部分個體所組成的集合稱為樣本(sample)。樣本中個體的數量稱為樣本容量、樣本含量或樣本大小(samplesize),通常記為n。如果n≤30,則該樣本為小樣本;n>30,該樣本則為大樣本。例如,2009年3月,某珍珠養殖場為了調查2007年繁育的100萬只馬氏珠母貝生長情況,隨機取10籠,共227隻馬氏珠母貝。這里需要研究的100萬只馬氏珠母貝是總體,其中的每隻珠母貝則是個體,隨機抽取的全部227隻馬氏珠母貝是一個樣本。該樣本的樣本容量為227,遠大於30,屬於大樣本。
2.1.2 變數與常量
變數是研究對象所反映的指標,如海水中葉綠素a的含量,動物的體重、體長,魚的攝食量,酶活力,細胞的直徑,DNA分子的大小等。變數通常記作X或Y等大寫的英文字母,而變數的觀測值可以標記為x,稱為資料或數據。例如,測量一批魚的體長X,我們可以隨機抽取10尾魚作為一個樣本,測量它們的體長(x,cm),得到10個觀測值14.2、15.4、13.6、15.8、15.5、16.1、14.9、15.3、14.8、15.7,這里體長是變數X,而這10個觀測值就是樣本數據x。按照其可能取得的值,可將變數分為連續型變數(continuousvariable)和離散型變數(discretevariable)。連續型變數是指在某一個區間內可以取任何數值的變數,其測量值可無限細分,數值之間是連續不斷的。例如,50~60cm的水稻株高為連續變數,因為在該范圍內可取出無數個值,同樣,分子運動速度、魚的體重、貝類的殼高、酶活力的大小、DNA分子的大小等都屬於連續型隨機變數。連續型變數需通過測量才能獲得,其觀測值稱為連續型數據(continuousdata),也稱為度量數據(measurementdata),如長度值、時間、重量值等。如果變數可能取值的數值為自然數或整數,這種變數稱為離散型變數,其數值一般通過計數獲得,如魚、貝的懷卵量等。離散型變數的觀測值稱為離散型數據(discretedata),也稱為計數數據(countdata)。如果變數的取值,在一定的范圍內是一個相對穩定的數值,那麼這種變數稱為常量(constant)。例如,在一個小的時空范圍內,重力加速度是一個常量。常量的取值是一個常數,具有相對穩定性。

5. 生物統計附試驗設計

第一章緒論

1.生物統計學的內容:統計原理、統計方法和試驗設計。
2.生物統計的作用:a.科學地整理分析數據;b.判斷試驗結果的可能性;c.確定事物之間的相互關系;d.提供試驗設計的原理。
3.樣本容量常記為n,通常把n≤30的樣本稱為小樣本,n.>30的樣本稱為大樣本。
4.名解:(重)①生物統計:生物統計是應用概率論和數據統計的原理和方法來研究生物界數量變化的學科;
②總體:是被研究對象的全體,據所含的個體的多少,總體分為有限總體和無限總體。
③樣本:是指總體內隨機抽取出來若干個體所組成的單位。
④隨機誤差:由於許多無法控制的內在和外在的偶然因素所造成的誤差,內在如個體差異,外在如環境,它影響試驗的精確性。
(了)①參數:從總體計算出來的數量特徵值,它是一個真值,沒有抽樣變動的影響,一般用平均數u,標准差s。
②統計量:是從樣本計算出來的數量特徵值,它是參數的估計值,受樣本變動的影響,一般用拉丁字母表示,如平均數。
③系統誤差:主要是試驗動物的初始條件不同,試驗條件相差較大,儀器不準,標准試劑未經校正,葯品批次不同,葯品用量與種類不符合試驗計劃要求,以及觀察,記錄抄案,計算中的錯誤所引起的誤差,它影響試驗的准確性。
④准確性:指在試驗或調查中某試驗指標或形狀的觀測值與其真值接近的程度。
⑤精確性:指試驗或調查中一試驗指標或形狀的重復觀測值彼此接近的程度。

第二章資料的整理

1.統計資按性質分為:計量資料、次數資料和半定量資料。
2.計量資料是指用量測方式獲得的數量性狀資料,即用度、量、衡等計量工具直接測量獲得的數量性狀資料。計量資料整理的五步驟如下:
(1)求全距,即資料中最大值和最小值之差R=Max(x)—Min(x);
(2)確定組數即按樣本大小而定;
樣本含量與組數
樣本含量 組數
30~60 6~8
60~100 8~10
100~200 10~12
200~500 12~17
500以上 17~30
(3)確定組距,每組最大值與最小值之差記為i ,公式:組距(i)=全距(R)/組數k ;(4)確定組中值及組限,各組的最大值和最小值稱為組限,最小值為下限,最大值為上限,每組的中點值稱為組中值,組中值=(下限+上限)/2=下限+組距/2=上限-組距/2;(5)歸組劃線計數,作次數分布表。
3.常用的五種統計圖為長條圖、圓圖、線圖、直方圖、折線圖,掌握直方圖和折線圖的繪制。
4.原始資料的檢查核對主要進行下面三性的檢查:①檢查資料的完整性;②檢查資料的正確性;③檢查資料的精確性。
5大樣本資料需整理成次數分布表。

第三章資料的統計描述

1.平均數包括以下五種算術平均數、中位數、眾數、幾何平均數及調和平均數。
2.用來度量資料變異程度的指標主要有極差、方差、標准差、變異系數。
3.平均數的基本性質是(1)樣本各觀測值與平均數之差的和為零,簡述為離均差之和為;(2)樣本各觀測值與平均數之差的平方和為最小,簡述為離均差平方和為最小。
4.10頭母豬第一胎產仔數為9、8、7、10、12、10、11、14、8、9(頭)計算10頭母豬第一胎產仔數的平均數、中位數、標准差和變異系數。
解:①平均數Σx=9+8+7+10+12+10+11+14+8+9=98,n=10

②資料數據按小到大排列如:7、8、8、9、9、10、10、11、12、14
中位數
③標准差
④變異系數

第四章常用概率分布

1.事件概率具有以下性質:①對於任何事件A,有0≤P(A)≤1;②必然事件的概率為1,即P(Ω)=1:③不可能的事件概率為0,即P(Ø)=0。
2.(1)正態分布:若連續型隨機變數X的概率分布密度函數為
其中 為平均數,σ2為方差,則稱隨機變數X服從正態分布,記為X~ 。相應的概率分布函數為
正態分布密度曲線為:

(2)標准正態分布::當μ=0、σ=l時,正態總體稱為標准正態總體,其相應的函數表示式是,(-∞<x<+∞)
其相應的曲線稱為標准曲線;.標准正態總體的概率問題:

對於標准正態總體N(0,1), 是總體取值小於 的概率,
即 ,
其中 ,圖中陰影部分的面積表示為概率 只要有標准正態分布表即可查表解決.從圖中不難發現:當 時, ;而當 時,Φ(0)=0.5;標准正態總體 在正態總體的研究中有非常重要的地位,為此專門製作了「標准正態分布表」.在這個表中,對應於 的值 是指總體取值小於 的概率,即 , .
若 ,則 .
利用標准正態分布表,可以求出標准正態總體在任意區間 內取值的概率,即直線 , 與正態曲線、x軸所圍成的曲邊梯形的面積 .
(3)有關概率計算的公式:
P(0≤u<u1)=Φ(u1)-0.5
P(u≥u1) =Φ(-u1)
P(|u|≥u1)=2Φ(-u1)
P(|u|<u1)=1-2Φ(-u1)
P(u1≤u<u2)=Φ(u2)-Φ(u1)
註:用曲線圖和面積來理解記憶。
(4)關於標准正態分布要熟記下列幾種常用概率:
P(-1≤u<1)=0.6826
P(-2≤u<2)=0.9545
P(-3≤u<3)=0.9973
P(-1.96≤u<1.96)=0.95
P (-2.58≤u<2.58)=0.99
(5)例:①已知u~N(0,1),試求: (1) P(u<-1.64)=? (2) P (u≥2.58)=? (3) P (|u|≥2.56)=? (4) P(0.34≤u<1.53) =?
利用(4-12)式,查附表1得:
(1) P(u<-1.64)=0.05050
(2) P (u≥2.58)=Φ(-2.58)=0.024940
(3) P (|u|≥2.56)=2Φ(-2.56)=2×0.005234=0.010468
(4) P (0.34≤u<1.53)=Φ(1.53)-Φ(0.34)=0.93669-0.6331=0.30389
②已知u~N(0,1)試求:
(1) P(u<- )+P(u≥ )=0.10的
(2) P(- ≤u< ﹚=0.86的
因為附表2中的α值是:

所以
(1) P(u<- )+ P(u≥ )=1- P(- ≤u< ﹚=0.10=α
由附表2查得: =1.644854
(2) P (- ≤u< )=0.86 ,α=1- P (- ≤u< )=1-0.86=0.14
由附表2查得: =1.475791
對於x~N(μ,σ2),只要將其轉換為u~N(0,1),即可求得相應的雙側分位數。
③已知豬血紅蛋白含量x服從正態分布N(14.52, ), 若P(x<1.1) =0.025, P(x> )=0.025,P(x< ) =0.005,P(x> )=0.005,求 , , , 。
由題意可知,α/2=0.025,α=0.05 又因為

P(x> )=
故 P(x< =+ P(x> )= P(u<- =+ P(u> )
=1- P(- <P< )=0.05=α
由附表2查得: =1.959964,所以
( -14.52)/1.68=-1.959964, ( -14.52)/1.68=1.959964
即 ≈11.23, ≈17.81。
同理 =2.575829,所以
( -14.52)/1.68=-2.575829, ( -14.52)/1.68=2.575829
即 ≈10.19, ≈18.85。
④已知豬血紅蛋白含量x服從正態分布N(12.86, ), 若P(x< ) =0.03, P(x≥ )=0.03,求 , 。
由題意可知,α/2=0.03,α=0.06 又因為
P(x≥ )=
故 P(x< =+ P(x≥ )= P(u<- =+ P(u≥ )
=1- P(- ≤P< )=0.06=α
由附表2查得: =1.880794,所以
( -12.86)/1.33=-1.880794, ( -12.86)/1.33=1.880794
即 ≈10.36, ≈15.36。
3. ①雙側概率(重):把隨機變數X落在平均數 左右標准差σ一定倍數區間之外的概率記作σ;②單側概率:指所求得隨機變數X小於平均數 左側標准差σ一定倍數或大於平均數 右側標准差σ一定倍數的概率記作σ/2。

第五章假設檢驗

1.顯著性檢驗:就是指在對資料進行統計分析時,先提某一問題對樣本所在總體的參數提出一個統計假設,然後根據從樣本獲得的統計量所服從的概率分布,對這一假設進行檢驗;其目的是主要是看樣本是否來自於均數相同的總體即通過對樣本的研究來對總體作出統計推斷;檢驗的對象是在統計學中,是以樣本平均數差異x1- x2的大小時樣本所在的總樣本平均數 1、 2是否相同作出推斷。
2.為什麼以樣本均數作為檢驗對象呢?是因為樣本平均數具有下述特性:
(1)離均差的平方和 (xi- )2最小。說明樣本平均數與樣本各個觀測值最接近,平均數是資料的代表數。
(2)樣本平均數是總體平均數的無偏估計值,即E( )= 。
(3)根據統計學中心極限定理,樣本平均數 服從或逼近正態分布。
所以,以樣本平均數作為檢驗對象,由兩個樣本平均數x1和x2的差異去推斷樣本所屬總體平均數是否相同時有依據的。
3.(了) ①標准誤(平均數抽樣總體的標准差) 的大小反映樣本平均數 的抽樣誤差的大小,即精確性的高低。標准誤大,說明各樣本平均數 間差異程度大,樣本平均數的精確性低。反之, 小,說明 間的差異程度小,樣本平均數的精確性高。 的大小與原總體的標准差σ成正比,與樣本含量n的平方根成反比。從某特定總體抽樣,因為σ是一常數,所以只有增大樣本含量才能降低樣本平均數 的抽樣誤差。在實際工作中,總體標准差σ往往是未知的,因而無法求得 。此時,可用樣本標准差S估計σ。於是,以 估計 。記 為 ,稱作樣本標准誤或均數標准誤。②區別:樣本標准差與樣本標准誤是既有聯系又有區別的兩個統計量, = 已表明了二者的聯系。二者的區別在於:樣本標准差S是反映樣本中各觀測值 , ,…, 變異程度大小的一個指標,它的大小說明了 對該樣本代表性的強弱。樣本標准誤 是樣本平均數 的標准差,它是 抽樣誤差的估計值, 其大小說明了樣本間變異程度的大小及 精確性的高低。
4. ①小概率事件通常指發生的概率小於5%的事件,認為在一次試驗中該事件是幾乎不可能發生的。隨機事件的概率表示了隨機事件在一次試驗中出現的可能性大小。若隨機事件的概率很小,例如小於0.05、0.01、0.001,稱之為小概率事件。小概率事件雖然不是不可能事件,但在一次試驗中出現的可能性很小,不出現的可能性很大,以至於實際上可以看成是不可能發生的。在統計學上,把小概率事件在一次試驗中看成是實際不可能發生的事件稱為小概率事件實際不可能性原理,亦稱為小概率原理。小概率事件實際不可能性原理是統計學上進行假設檢驗(顯著性檢驗)的基本依據。
②一統計資料進行統計推斷判斷的原則如下:
Ⅰ、當 < ,P>0.05 時,差異不顯著,用「NS」表示,不能否H0 ;
Ⅱ、當 ≤ ≤ ,0.01< P <0.05時,差異顯著,用「*」表示,接受HA,否定H0 ;
Ⅲ、當 ≥ ,P≤0.01時,差異極顯著,用「**」表示,接受HA,否定H0 。
5.計算題:了解樣本均數與總體均數的差異性顯著檢驗及兩樣本均數的差異性顯著檢驗;重點知道正態總體平均數 的置信區間。
例:①計算下列資料總體平均數的95%,99%置信區間,119、22、104、32、53、31、118、57、30、101、、58、48、68、70。
解:資料總體平均數的95%,99%置信區間
df=n-1=14-1=13,故 =2.160, =3.012
=65.0714 ,S=33.3293, 9.2431
所以⑴95%置信半徑為 =19.9668
95%置信下限為 — =45.1046
95%置信上限為 — =85.0382
即該資料總體平均數u 的95%置信區間為45.1046≤u≤85.0382
⑵99%置信半徑為 =27.8426
99%置信下限為 — =37.2288
99%置信上限為 — =92.9140
即該資料總體平均數u 的99%置信區間為37.2288≤u≤92.9140 。
②隨機抽測了10隻兔的直腸溫度,其數據為:38.7、39.0、38.9、39.6、39.1、39.8、38.5、39.7、39.2、38.4℃。已知該品種兔直腸溫度的總體平均數為 ℃,檢驗該樣本平均數溫度與 是否有顯著性差異?
解:⑴提出無效假設與備擇假設
H0 : =39.5,HA: <39.5
⑵計算t值 經計算得 =39.09,S=0.4909
t=( - )/ =-2.6411
⑶統計推斷
由df=n-1=10-1=9,查附表得臨界t值
=2.262 =3.250, <︱t︱< ,0.01< P < 0.05
否定H0,HA接受,表明樣本平均數 與已知總體平均數 差異顯著。

6. 生物統計學的計算題怎麼做

不同
72>(63.5+5.6)

7. 生物統計學最重要的學科有哪些

生物統計學概述

第一章 研究設計中的基本統計學原則
第一節 研究設計的重要性 第二節 系統誤差與控制方法 第三節 研究設計的基本類型 第四節 抽樣總體與抽樣方法 第五節 實驗研究設計的基本要素 第六節 隨機化的意義及方法 第七節 對照的設置與對照的均衡性 第八節 重復的作用與樣本含量的影響因素 第九節 盲法及其作用

第二章 生物醫學數據的組織與表達
第一節 數據與數據類型 第二節 頻數分布表 第三節 統計圖形表達

第三章 單變數綜合性描述統計量
第一節 中心趨勢度量 第二節 離散與變異性度量 第三節 率、比的均數與方差

第四章 隨機變數、概率和概率分布
第一節 概率基本概念 第二節 隨機變數及其概率分布 第三節 二項分布與泊松分布 第四節 正態分布 第五節 統計量的分布

第五章 統計學推斷與單參數檢驗
第一節 樣本均數與樣本方差的抽樣模擬 第二節 抽樣誤差與統計學推斷 第三節 總體均數的置信估計 第四節 總體均數的假設檢驗 第五節 總體方差的置信估計與假設檢驗 第六節 顯著性檢驗中的兩類錯誤 第七節 參數置信區間估計與假設檢驗的關系

第六章 樣本含量的估計與檢驗效能
第一節 概述 第二節 檢驗效能及其計算 第三節 樣本含量的估計

第七章 總體分布的擬合優度檢驗
第一節 擬合優度檢驗的原理與計算步驟 第二節 離散型隨機變數分布的擬合優度檢驗 第三節 連續型隨機變數分布的擬合優度檢驗

第八章 兩總體均數差異性檢驗
第一節 成組t檢驗 第二節 兩方差間的差異性檢驗 第三節 t''檢驗 第四節 配對t檢驗

第九章 一元線性相關與回歸分析
第一節 相關與回歸的概念 第二節 直線相關分析 第三節 簡單線性回歸分析

第十章 方差分析(一)
第一節 方差分析概述 第二節 單向方差分析 第三節 均數間的多重比較

第十一章 方差分析(二)
第一節 區組設計資料的方差分析 第二節 方差齊性檢驗 第三節 加權方差分析:Welch檢驗 第四節 變數變換

第十二章 競爭模型假設與廣義F檢驗
第一節 競爭模型假設檢驗的基本概念 第二節 應用於方差分析的廣義F檢驗 第三節 應用於回歸分析的廣義F檢驗 第四節 應用於協方差分析的廣義F檢驗

第十三章 名義分類頻數表數據分析(X2檢驗)
第一節 X2檢驗的基本原理 第二節 X2檢驗的基本步驟 第三節 兩個樣本率的比較 第四節 行×列裘資料的X2檢驗 第五節 行×列表X2分割分析

第十四章 有序列聯表與配比設計方表的分析
第一節 有序列聯表的基本分析方法 第二節 單向有序表數據分析 第三節 雙向有序表數據分析第四節 配比設計方形表數據分析

第十五章 非參數統計
第一節 概述 第二節 兩獨立樣本檢驗 第三節 K個獨立樣本檢驗 第四節 兩個相關樣本檢驗 第五節 K個相關樣本檢驗 第六節 等級相關與列聯相關

第十六章 多元線性回歸分析
第一節 多元統計分析方法概述 第二節 多元線性回歸分析的基本原理 第三節 多元線性回歸分析的數學模型 第四節 多元線性回歸分析的方法步驟 第五節 多元線性回歸分析的逐步回歸法 第六節 多元相關分析 第七節 多元線性回歸分析在醫學中的應用

第十七章 Logistic回歸分析
第一節 Logistic回歸分析的數學模型 第二節 Logistic回歸模型的建立和檢驗 第三節 Logistic回歸模型系數的解釋 第四節 配對病例-對照研究的條件Logistic回歸分析 第五節 Probit回歸分析

第十八章 生存分析
第一節 生存分析中基本的概念 第二節 生存率的估計與生存曲線 第三節 生存曲線的對數秩檢驗 第四節 Cox比例風險回歸模型

8. 統計學 概念

統計學概述
統計學是應用數學的一個分支,主要通過利用概率論建立數學模型,收集所觀察系統的數據,進行量化的分析、總結,並進而進行推斷和預測,為相關決策提供依據和參考。它被廣泛的應用在各門學科之上,從物理和社會科學到人文科學,甚至被用來工商業及政府的情報決策之上。
統計學主要又分為描述統計學和推斷統計學。給定一組數據,統計學可以摘要並且描述這份數據,這個用法稱作為描述統計學。另外,觀察者以數據的形態建立出一個用以解釋其隨機性和不確定性的數學模型,以之來推論研究中的步驟及母體,這種用法被稱做推論統計學。這兩種用法都可以被稱作為應用統計學。另外也有一個叫做數理統計學的學科專門用來討論這門科目背後的理論基礎。
[編輯本段]統計學的發展歷程
統計學的英文statistics最早是源於現代拉丁文statisticum collegium (國會)以及義大利文 statista (國民或政治家)。 德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表對國家的資料進行分析的學問,也就是「研究國家的科學」。在十九世紀統計學在廣泛的數據以及資料中探究其意義,並且由John Sinclair引進到英語世界。
統計學是一門很古老的科學,一般認為其學理研究始於古希臘的亞里斯多德時代,迄今已有兩千三百多年的歷史。它起源於研究社會經濟問題,在兩千多年的發展過程中,統計學至少經歷了「城邦政情」,「政治算數」和「統計分析科學」三個發展階段。所謂「數理統計」並非獨立於統計學的新學科,確切地說它是統計學在第三個發展階段所形成的所有收集和分析數據的新方法的一個綜合性名詞。概率論是數理統計方法的理論基礎,但是它不屬於統計學的范疇,而屬於數學的范疇。
統計學的發展過程的三個階段
第一階段稱之為「城邦政情」(Matters of state)階段
「城邦政情」階段始於古希臘的亞里斯多德撰寫「城邦政情」或「城邦紀要」。他一共撰寫了一百五十餘種紀要,其內容包括各城邦的歷史,行政,科學,藝術,人口,資源和財富等社會和經濟情況的比較,分析,具有社會科學特點。「城邦政情」式的統計研究延續了一兩千年,直至十七世紀中葉才逐漸被「政治算數」這個名詞所替代,並且很快被演化為「統計學」(Statistics)。統計學依然保留了城邦(state)這個詞根。
第二階段稱之為「政治算數」(Politcal arthmetic)階段
與「城邦政情」階段沒有很明顯的分界點,本質的差別也不大。
「政治算數」的特點是統計方法與數學計算和推理方法開始結合。分析社會經濟問題的方式更加註重運用定量分析方法。
1690年英國威廉·配弟出版 (政治算數)一書作為這個階段的起始標志.
威廉·配弟用數字,重量和尺度將社會經濟現象數量化的方法是近代統計學的重要特徵。因此,威廉?配弟的(政治算數)被後來的學者評價為近代統計學的來源,威廉?配弟本人也被評價為近代統計學之父。
配弟在書中使用的數字有三類:
第一類是對社會經濟現象進行統計調查和經驗觀察得到的數字.因為受歷史條件的限制,書中通過嚴格的統計調查得到的數據少,根據經驗得出的數字多;
第二類是運用某種數學方法推算出來的數字。其推算方法可分為三種:
「(1)以已知數或已知量為基礎,循著某種具體關系進行推算的方法;
(2)通過運用數字的理論性推理來進行推算的方法;
(3)以平均數為基礎進行推算的方法」;
第三類是為了進行理論性推理而採用的例示性的數字.配弟把這種運用數字和符號進行的推理稱之為「代數的演算法」。從配弟使用數據的方法看,「政治算數」階段的統計學已經比較明顯地體現了「收集和分析數據的科學和藝術」特點,統計實證方法和理論分析方法渾然一體,這種方法即使是現代統計學也依然繼承。
第三階段稱之為「統計分析科學」(Science of statistical analysis)階段
在「政治算數」階段出現的統計與數學的結合趨勢逐漸發展形成了「統計分析科學」。
十九世紀末,歐洲大學開設的「國情紀要」或「政治算數」等課程名稱逐漸消失,代之而起的是「統計分析科學」課程.當時的「統計分析科學」課程的內容仍然是分析研究社會經濟問題。
「統計分析科學」課程的出現是現代統計發展階段的開端. 1908年,「學生」氏(William Sleey Gosset的筆名Student)發表了關於t分布的論文,這是一篇在統計學發展史上劃時代的文章。它創立了小樣本代替大樣本的方法,開創了統計學的新紀元。
現代統計學的代表人物首推比利時統計學家奎特萊(Adolphe Quelet),他將統計分析科學廣泛應用於社會科學,自然科學和工程技術科學領域,因為他深信統計學是可以用於研究任何科學的一般研究方法.
現代統計學的理論基礎概率論始於研究賭博的機遇問題,大約開始於1477年。數學家為了解釋支配機遇的一般法則進行了長期的研究,逐漸形成了概率論理論框架。在概率論進一步發展的基礎上,到十九世紀初,數學家們逐漸建立了觀察誤差理論,正態分布理論和最小平方法則。於是,現代統計方法便有了比較堅實的理論基礎。
[編輯本段]統計學的觀念
為了將統計學應用到科學,工業以及社會問題上,我們由研究母體開始。這可能是一個國家的人民,石頭中的水晶,或者是某家特定工廠所生產的商品。一個母體甚至可能由許多次同樣的觀察程序所組成;由這種資料搜集所組成的母體我們稱它叫時間序列。
為了實際的理由,我們選擇研究母體的子集代替研究母體的每一筆資料,這個子集稱做樣本。以某種經驗設計實驗所搜集的樣本叫做資料。資料是統計分析的對象,並且被用做兩種相關的用途:描述和推論。
描述統計學處理有關敘述的問題:資料是否可以被有效的摘要,不論是以數學或是圖片表現,以用來代表母體的性質?基礎的數學描述包括了平均數和標准差。圖像的摘要則包含了許多種的表和圖。
推論統計學被用來將資料中的數據模型化,計算它的機率並且做出對於母體的推論。這個推論可能以對/錯問題的答案所呈現(假設檢定),對於數字特徵量的估計(估計),對於未來觀察的預測,關聯性的預測(相關性),或是將關系模型化(回歸)。其他的模型化技術包括變異數分析(ANOVA),時間序列,以及資料采礦。
相關的觀念特別值得被拿出來討論。對於資料集合的統計分析可能顯示兩個變數(母體中的兩種性質)傾向於一起變動,好像它們是相連的一樣。舉例來說,對於人收入和死亡年齡的研究期刊可能會發現窮人比起富人平均來說傾向擁有較短的生命。這兩個變數被稱做相關的。但是實際上,我們不能直接推論這兩個變數中有因果關系;參見相關性推論因果關系(邏輯謬誤)。
如果樣本足以代表母體的,那麼由樣本所做的推論和結論可以被引申到整個母體之上。最大的問題在於決定樣本是否足以代表 整個母體。統計學提供了許多方法來估計和修正樣本和搜集資料過程中的隨機性(誤差),如同上面所提到的透過經驗所設計的實驗。參見實驗設計。
要了解隨機性或是機率必須具備基本的數學觀念。數理統計(通常又叫做統計理論)是應用數學的分支,它使用機率論來分析並且驗證統計的理論基礎。
任何統計方法是有效的只有當這個系統或是所討論的母體滿足方法論的基本假設。誤用統計學可能會導致描述面或是推論面嚴重的錯誤,這個錯誤可能會影響社會政策,醫療實踐以及橋梁或是核能發電計劃結構的可靠性。
即使統計學被正確的應用,結果對於不是專家的人來說可能會難以陳述。舉例來說,統計資料中顯著的改變可能是由樣本的隨機變數所導致,但是這個顯著性可能與大眾的直覺相悖。人們需要一些統計的技巧(或懷疑)以面對每天日常生活中透過引用統計數據所獲得的資訊。
[編輯本段]統計方法
1)測量的尺度
統計學一共有四種測量的尺度或是四種測量的方式。這四種測量(名目,順序,等距,等比)在統計過程中具有不等的實用性 。等比尺度(Ratio measurements)擁有零值及資料間的距離是相等被定義的,等距尺度(Interval measurements)資料間的距離是相等被定義的但是它的零值並非絕對的無而是自行定義的(如智力或溫度的測量)。( Ordinal measurements)順序尺度的意義並非表現在其值而是在其順序之上。名目尺度(Nominal measurements)的測量值則不具量的意義。
2)統計技術
以下列出一些有名的統計檢定方法以及可供驗證實驗數據的程序
費雪最小顯著差異法(Fisher's Least Significant Difference test )
學生t檢驗(Student's t-test)
曼-惠特尼 U 檢定(Mann-Whitney U)
回歸分析(regression analysis)
相關性(correlation)
皮爾森積矩相關系數(Pearson proct-moment correlation coefficient)
史匹曼等級相關系數(Spearman's rank correlation coefficient )
卡方分配(chi-square )
[編輯本段]統計學歷史中的學派
一、18-19世紀——統計學的創立和發展
德國的斯勒茲曾說過:「統計是動態的歷史,歷史是靜態的統計。」可見統計學的產生與發展是和生產的發展、社會的進步緊密相聯的。
(1)統計學的創立時期
統計學的萌芽產生在歐洲。17世紀中葉至18世紀中葉是統計學的創立時期。在這一時期,統計學理論初步形成了一定的學術派別,主要有國勢學派和政治算術學派。
1、國勢學派
國勢學派又稱記述學派,產生於17世紀的德國。由於該學派主要以文字記述國家的顯著事項,故稱記述學派。其主要代表人物是海爾曼·康令和阿亨華爾。康令第一個在德國黑爾姆斯太特大學以「國勢學」為題講授政治活動家應具備的知識。阿亨華爾在格丁根大學開設「國家學」課程,其主要著作是《近代歐洲各國國勢學綱要》,書中講述「一國或多數國家的顯著事項」,主要用對比分析的方法研究了解國家組織、領土、人口、資源財富和國情國力,比較了各國實力的強弱,為德國的君主政體服務。因在外文中「國勢」與「統計」詞義相通,後來正式命名為「統計學」。該學派在進行國勢比較分析中,偏重事物性質的解釋,而不注重數量對比和數量計算,但卻為統計學的發展奠定了經濟理論基礎。但隨著資本主義市場經濟的發展,對事物量的計算和分析顯得越來越重要,該學派後來發生了分裂,分化為圖表學派和比較學派。
2、政治算術學派
政治算術學派產生於19世紀中葉的英國,創始人是威廉·配第(1623-1687),其代表作是他於1676年完成的《政治算術》一書。這里的「政治」是指政治經濟學,「算術」是指統計方法。在這部書中,他利用實際資料,運用數字、重量和尺度等統計方法對英國、法國和荷蘭三國的國情國力,作了系統的數量對比分析,從而為統計學的形成和發展奠定了方法論基礎。因此馬克思說:「威廉·佩第——政治經濟學之父,在某種程度上也是統計學的創始人。」
政治算術學派的另一個代表人物是約翰·格朗特(1620-1674)。他以1604年倫敦教會每周一次發表的「死亡公報」為研究資料,在 1662年發表了《關於死亡公報的自然和政治觀察》的論著。書中分析了60年來倫敦居民死亡的原因及人口變動的關系,首次提出通過大量觀察,可以發現新生兒性別比例具有穩定性和不同死因的比例等人口規律;並且第一次編制了「生命表」,對死亡率與人口壽命作了分析,從而引起了普遍的關注。他的研究清楚地表明了統計學作為國家管理工具的重要作用。
(2)統計學的發展時期
18世紀末至19世紀末是統計學的發展時期。在這時期,各種學派的學術觀點已經形成,並且形成了兩主要學派,即數理統計學派和社會統計學派。
1、數理統計學派
在18世紀,由於概率理論日益成熟,為統計學的發展奠定了基礎。19世紀中葉,把概率論引進統計學而形成數理學派。其奠基人是比利時的阿道夫·凱特勒(1796-1874),其主要著作有:《論人類》、《概率論書簡》、《社會制度》和《社會物理學》等。他主張用研究自然科學的方法研究社會現象,正式把古典概率論引進統計學,使統計學進入一個新的發展階段。由於歷史的局限性,凱特勒在研究過程中混淆了自然現象和本質區別,對犯罪、道德等社會問題,用研究自然現象的觀點和方法作出一些機械的、庸俗化的解釋。但是,他把概率論引入統計學,使統計學在「政治算術」所建立的「算術」方法的基礎上,在准確化道路上大大跨進了一步,為數理統計學的形成與發展奠定了基礎。
2、社會統計學派
社會統計學派產生於19世紀後半葉,創始人是德國經濟學家、統計學家克尼斯(1821-1889),主要代表人物主要有恩格爾(1821- 1896)、梅爾(1841-1925)等人。他們融合了國勢學派與政治算術學派的觀點,沿著凱特勒的「基本統計理論」向前發展,但在學科性質上認為統計學是一門社會科學,是研究社會現象變動原因和規律性的實質性科學,以此同數理統計學派通用方法相對立。社會統計學派在研究對象上認為統計學是研究體而不是個別現象,而且認為由於社會現象的復雜性和整體性,必須地總體進行大量觀察和分析,研究其內在聯系,才能揭示現象內在規律。這是社會統計學派的「實質性科學」的顯著特點。
社會經濟的發展,要求統計學提供更多的統計方法;社會科學本身也不斷地向細分化和定量化發展,也要求統計學能提供更有效的調查整理、分析資料的方法。因此,社會統計學派也日益重視方法論的研究,出現了從實質性方法論轉化的趨勢。但是,社會統計學派仍然強調在統計研究中必須以事物的質為前提和認識事物質的重要性,這同數理統計學派的計量不計質的方法論性質是有本質區別的。
二、20世紀——迅速發展的統計學
20世紀初以來,科學技術迅猛發展,社會發生了巨大變化,統計學進入了快速發展時期。歸納起來有以下幾個方面。
1、由記述統計向推斷統計發展。記述統計是對所搜集的大量數據資料進行加工整理、綜合概括,通過圖示、列表和數字,如編制次數分布表、繪制直方圖、計算各種特徵數等,對資料進行分析和描述。而推斷統計,則是在搜集、整理觀測的樣本數據基礎上,對有關總體作出推斷。其特點是根據帶隨機性的觀測樣本數據以及問題的條件和假定(模型),而對未知事物作出的,以概率形式表述的推斷。目前,西方國家所指的科學統計方法,主要就是指推斷統計來說的。
2、由社會、經濟統計向多分支學科發展。在20世紀以前,統計學的領域主要是人口統計、生命統計、社會統計和經濟統計。隨著社會、經濟和科學技術的發展,到今天,統計的范疇已覆蓋了社會生活的一切領域,幾乎無所不包,成為通用的方法論科學。它被廣泛用於研究社會和自然界的各個方面,並發展成為有著許多分支學科的科學。
3、統計預測和決策科學的發展。傳統的統計是對已經發生和正在發生的事物進行統計,提供統計資料和數據。20世紀30年代以來,特別是第二次世界大戰以來,由於經濟、社會、軍事等方面的客觀需要,統計預測和統計決策科學有了很大發展,使統計走出了傳統的領域而被賦予新的意義和使命。
4、資訊理論、控制論、系統論與統計學的相互滲透和結合,使統計科學進一步得到發展和日趨完善。資訊理論、控制論、系統論在許多基本概念、基本思想、基本方法等方面有著共同之處,三者從不同角度、側面提出了解決共同問題的方法和原則。三論的創立和發展,徹底改變了世界的科學圖景和科學家的思維方式,也使統計科學和統計工作從中吸取了營養,拓寬了視野,豐富了內容,出現了新的發展趨勢。
5、計算技術和一系列新技術、新方法在統計領域不斷得到開發和應用。近幾十年間,計算機技術不斷發展,使統計數據的搜集、處理、分析、存貯、傳遞、印製等過程日益現代化,提高了統計工作的效能。計算機技術的發展,日益擴大了傳統的和先進的統計技術的應用領域,促使統計科學和統計工作發生了革命性的變化。如今,計算機科學已經成為統計科學不可分割組成部分。隨著科學技術的發展,統計理論和實踐深度和廣度方面也不斷發展。
6.統計在現代化管理和社會生活中的地位日益重要。隨著社會、經濟和科學技術的發展,統計在現代化國家管理和企業管理中的地位,在社會生活中的地位,越來越重要了。人們的日常生活和一切社會生活都離不開統計。英國統計學家哈斯利特說:「統計方法的應用是這樣普遍,在我們的生活和習慣中,統計的影響是這樣巨大,以致統計的重要性無論怎樣強調也不過分。」甚至有的科學有還把我們的時代叫做「統計時代」。顯然,20世紀統計科學的發展及其未來,已經被賦予了劃時代的意義。
[編輯本段]統計學現狀
在科學技術飛速發展的今天,統計學廣泛吸收和融合相關學科的新理論,不斷開發應用新技術和新方法,深化和豐富了統計學傳統領域的理論與方法,並拓展了新的領域。今天的統計學已展現出強有力的生命力。在我國,社會主義市場經濟體制的逐步建立,實踐發展的需要對統計學提出了新的更多、更高的要求。隨著我國社會主義市場經濟的成長和不斷完善,統計學的潛在功能將得到更充分更完滿的開掘。
第一,對系統性及系統復雜性的認識為統計學的未來發展增加了新的思路。由於社會實踐廣度和深度迅速發展,以及科學技術的高度發展,人們對客觀世界的系統性及系統的復雜性認識也更加全面和深入。隨著科學融合趨勢的興起,統計學的研究觸角已經向新的領域延伸,新興起了探索性數據的統計方法的研究。研究的領域向復雜客觀現象擴展。21世紀統計學研究的重點將由確定性現象和隨機現象轉移到對復雜現象的研究。如模糊現象、突變現象及混沌現象等新的領域。可以這樣說,復雜現象的研究給統計開辟了新的研究領域。
第二,定性與定量相結合的綜合集成法將為統計分析方法的發展提供新的思想。定性與定量相結合的綜合集成方法是錢學森教授於1990年提出的。這一方法的實質就是將科學理論、經驗知識和專家判斷相結合,提出經驗性的假設,再用經驗數據和資料以及模型對它的確實性進行檢測,經過定量計算及反復對比,最後形成結論。它是研究復雜系統的有效手段,而且在問題的研究過程中處處滲透著統計思想,為統計分析方法的發展提供了新的思維方式。
第三,統計科學與其他科學滲透將為統計學的應用開辟新的領域。現代科學發展已經出現了整體化趨勢,各門學科不斷融合,已經形成一個相互聯系的統一整體。由於事物之間具有的相互聯系性,各學科之間研究方法的滲透和轉移已成為現代科學發展的一大趨勢。許多學科取得的新的進展為其他學科發展提供了全新的發展機遇。模糊論、突變論及其他新的邊緣學科的出現為統計學的進一步發展提供了新的科學方法和思想。將一些尖端科學成果引入統計學,使統計學與其交互發展將成為未來統計學發展的趨勢。統計學也將會有一個令人振奮的前景。今天已經有一些先驅者開始將控制論、資訊理論、系統論以及圖論、混沌理論、模糊理論等方法和理論引入統計學,這些新的理論和方法的滲透必將會給統計學的發展產生深遠的影響。
統計學產生於應用,在應用過程中發展壯大。隨著經濟社會的發展、各學科相互融合趨勢的發展和計算機技術的迅速發展,統計學的應用領域、統計理論與分析方法也將不斷發展,在所有領域展現它的生命力和重要作用。
[編輯本段]學科分支
一些學科大量地利用了應用統計學,以至它們自己已經各自獨立成為一門學科。
統計學的分支學科有:
統計學史
理論統計學
統計調查分析理論
統計核算理論
統計監督理論
統計預測理論
統計邏輯學
統計法學
描述統計學
推斷統計學
經濟統計學
宏觀經濟統計學
微觀經濟統計學
管理統計學
科學技術統計學
農村經濟調查
社會統計學
教育統計學
文化與體育統計學
衛生統計學
司法統計學
社會福利與社會保障統計學
生活質量統計學
人口統計學
環境與生態統計學
自然資源統計學
環境統計學
生態平衡統計學
國際統計學
國際標准分類統計學
國際核算體系與方法論體系
國際比較統計學
其他
生物統計學
商務統計學
工程統計學
心理統計學
化學統計學
檔案統計學
社會經濟統計學
水文統計學
數理統計學
統計語言學
統計物理學
化學統計學
延伸學科
有些科學廣泛的應用統計的方法使得他們擁有各自的統計術語,這些學科包括:
農業科學
生物統計
商用統計
資料采礦(應用統計學以及圖形從資料中獲取知識)
經濟統計學
電機統計
統計物理學
人口統計
心理統計學
教育統計學
社會統計(包括所有的社會科學)
文獻統計分析
化學與程序分析(所有有關化學的資料分析與化工科學)
運動統計學,特別是棒球以及曲棍球
統計對於商業以及工業是一個基本的關鍵。他被用來了解與測量系統變異性,程序控制,對資料作出結論,並且完成資料取向的決策。在這些領域統計扮演了一個重要的角色。

閱讀全文

與生物統計學如何製作次數分布表相關的資料

熱點內容
word中化學式的數字怎麼打出來 瀏覽:743
乙酸乙酯化學式怎麼算 瀏覽:1408
沈陽初中的數學是什麼版本的 瀏覽:1358
華為手機家人共享如何查看地理位置 瀏覽:1049
一氧化碳還原氧化鋁化學方程式怎麼配平 瀏覽:890
數學c什麼意思是什麼意思是什麼 瀏覽:1416
中考初中地理如何補 瀏覽:1307
360瀏覽器歷史在哪裡下載迅雷下載 瀏覽:706
數學奧數卡怎麼辦 瀏覽:1396
如何回答地理是什麼 瀏覽:1030
win7如何刪除電腦文件瀏覽歷史 瀏覽:1060
大學物理實驗干什麼用的到 瀏覽:1490
二年級上冊數學框框怎麼填 瀏覽:1708
西安瑞禧生物科技有限公司怎麼樣 瀏覽:990
武大的分析化學怎麼樣 瀏覽:1252
ige電化學發光偏高怎麼辦 瀏覽:1341
學而思初中英語和語文怎麼樣 瀏覽:1660
下列哪個水飛薊素化學結構 瀏覽:1427
化學理學哪些專業好 瀏覽:1490
數學中的棱的意思是什麼 瀏覽:1066