2013年統計師考試時間為10月13日,為了幫助考生系統的學習統計師考試課程,全面了解統計師考試的教材重點,小編特編輯了2013年統計師考試統計基礎理論及相關知識輔導資料,希望對您參加本次考試有所幫助!
統計數據的搜集
統計數據的搜集,涉及數據的計量尺度與類型、數據調查的組織方式與數據搜集的具體方法、調查方案的設計以及對數據的質量要求等內容。
一、統計數據的計量與類型
統計數據計量(Measurement,亦稱測量)的質量,影響甚至決定統計描述和分析的質量。數據計量的準確程度,視所觀察的客體及其標志的性質和測量工具而定。自然科學以物理、化學或力學的某些特征為觀察現象,自然界的客體也比較穩定,而且大多有較精確的儀器作為測量工具。故自然科學的計量在精度上領先于社會科學。社會科學以人類行為、社會關系、價值觀念等為研究對象,甚至涉及被研究者的隱私(Privacy),而不易得到研究對象的合作;即使有時研究對象給予合作,由于計量的原因,也很難取得準確的數據。所以,改進并確切運用測量工具,始終是社會工作者的一項重要工作。要改進并確切運用測量工具,獲取令人滿意的統計數據,首先就要考慮數據的計量尺度與類型。
(一)數據的計量尺度
在計量學的一般分類方法中,依據對事物計量的精確程度,可將所采用的計量尺度由低級到高級、由粗略到精確分為四個層次,即名類尺度、順序尺度、區間尺度和比尺度。
1、名類尺度
名類尺度(Nominal scale,亦稱分類尺度、列名尺度等)是這樣一種品質標志,按照它可對研究客體進行平行的分類或分組,使同類同質,異類異質。例如,按照性別將人口分為男、女兩類;按照經濟性質將企業分為國有、集體、私營、混合制企業等。這里的“性別”和“經濟性質”就是兩種名類尺度。名類尺度是最粗略、計量層次最低的計量尺度,利用它只可測度事物之間的類別差,而不能了解各類之間的其他差別。名類尺度計量的結果表現為某種類別;但為了便于統計處理,例如為了計算和識別,也可用不同數字或編碼表示不同類別。比如用1表示男,0表示女;用1表示國有企業,2表示集體企業,3表示私營企業,等等。這些數字只是不同類別的代碼,決不意味著它區分了大小,更不能進行任何數學運算。名類尺度能對事物做最基本的測度,是其他計量尺度的基礎。
2、順序尺度
順序尺度(Ordinal scale,亦稱序數尺度、順位尺度等)是這樣一種品質標志,利用它不僅能將事物分成不同的類別,還可確定這些類別的等級差別或序列差別。例如“產品等級”就是一種測度產品質量好壞的順序尺度,它可將產品分為一等品、二等品、三等品、次品等;“考試成績”也是一種順序尺度,它可將成績分為優、良、中、及格、不及格等;“對某一事物的態度”作為一種順序尺度,可將人們的態度分為非常同意、同意、保持中立、不同意、非常不同意,等等。顯然,順序尺度對事物的計量要比名類尺度精確些,但它至多測度了類別之間的順序,而未測量出類別之間的準確差值。因此,順序尺度的計量結果只能比較大小,不能進行加、減、乘、除等數學運算。
3、區間尺度
區間尺度(Interval scale,亦稱間隔尺度、等距尺度、定距尺度等)是能測度事物類別或次序之間間距的數量標志,更具體些說,區間尺度是可將事物區分為不同類別,對這些類別進行排序,并較準確度量類別之間數量差距的一種計量尺度。該尺度通常使用自然或物理單位作為度量單位,如收入用人民幣“元”度量,考試成績用“百分制”度量,溫度用攝氏或華氏的“度”來度量,重量用“克”度量,長度用“米”度量等。區間尺度的計量結果表現為數值。區間尺度的數值可做加、減法運算,例如,考試成績80分與90分之間相差10分,一個地區的溫度20°C與另一個地區的25°C相差5°C,等等。但不能做乘、除法運算。而且,區間尺度沒有絕對零點。
4、比尺度
比尺度(Ratio scale,亦稱為比率尺度)的計量結果也表示為數值,跟區間尺度屬同一層次,有時對兩者可不作區分。比尺度這種數量標志不僅能測度各類別的大小和多少,還有一個絕對零點(Absolute zero)作為起點。這個絕對零點是它跟區間尺度的明顯差別,就是說,區間尺度中沒有絕對零點,即使其計量值為“0”,這個“0”也是有客觀內容的數值,即“0”水平,而不表示“沒有”或“不存在”。例如,某個學生統計學的考試成績為“0”分,這個“0”分是他的統計學的客觀成績,并不表示他沒有考試成績或沒有任何統計學知識;一個地區的溫度為0°C,這表示一種溫度的水平,并不是說沒有溫度。而比尺度中絕對零點的“0”,表示“沒有”或“不存在”。例如,一個人的身高為“0”米,表示這個人不存在;一個人的收入為“0”,表示這個人沒有收入;一個產品的產量為“0”,表示沒有這種產品;等等。現實中,大多數場合人們使用的都是比尺度。
比尺度與上述三種計量尺度相比還有一個特性,就是可以計算數值之間的比值。例如,一個人的月工資收入為600元,另一個人的為300元,可以得出一個人的收入是另一個的兩倍。但區間尺度由于不存在絕對零點,就只能比較數值差,而不能計算比值。比如,可以說30°C與15°C之差為15°C,而不能說30°C比15°C熱一倍。可見,比尺度可以做加、減、乘、除法運算。
上述四種計量尺度對事物的計量層次是由低級到高級、由粗略到精確,逐步遞進的。高層次的計量尺度可以計量低層次計量尺度能夠計量的事物,但不能反過來。顯然,可以很容易地將高層次計量尺度的計量結果轉化為低層次計量尺度的計量結果;將考試成績的百分制轉化為五等級分制就是一例。
(二)數據的類型
在第一章中,我們曾把統計標志分為品質標志和數量標志,這兩種統計標志的標志表現在廣義上都可叫做統計數據。更確切些說,在計量學的意義上,統計數據是采用某些計量尺度對事物進行計量的結果,但采用不同的計量尺度會得到不同類型的統計數據。就上述四種計量尺度計量的結果來看,我們可以大體上將統計數據分為兩種類型:定性的數據和定量的數據。定性數據(Qualitative data,亦稱品質數據)是說明事物的品質特征表現的具體類別,不能用數值表示;因這類數據由名類尺度和順序尺度計量形成,故又可細分為名類數據和順序數據。定量數據(Quantitative data,亦稱數量數據)是說明現象數量特征表現的,能夠甚至必須用數值來表現;因這類數據由區間尺度和比尺度計量形成,故又可細分為區間數據和比數據。對不同類型的數據,可采用不同的統計方法來處理和分析,比如,對定性數據一般只采用分組法計算,分析各組的頻數或頻率,而對定量數據則可用更多的統計方法去處理,計算、分析更多的統計指標或統計量。
在統計中,一般把表示現象某種特征的概念稱為變量(Variable)。這樣,統計標志和指標都可以稱為變量。變量的具體表現稱為變量值(Variate-value);統計標志的標志表現和指標數值都是變量值。如果一個變量的變量值由品質數據來記錄,該變量就是品質變量(Qualitative variable),如“性別”就是個品質變量,其變量值是“男”或“女”;“產品等級”也是個品質變量,它可以表現為“一等品”、“二等品”、“三等品”、“次品”等。如果一個變量的數值由數量數據來記錄,該變量就是數量變量或稱數字變量(Quantitative variable),如“產品產量”、“商品銷售額”、“零件尺寸”、“年齡”、“時間”等都是數量變量,它們可以表現為不同的數值。數量變量還可以細分為離散變量和連續變量。離散變量(Discrete variable)的取值是有限的,所有取值都以整位數斷開,且可一一列舉,如“企業數”、“產品數量”等就是離散變量。而連續變量(Continuous variable)的取值是無窮的,連續不斷的,不能一一列舉,如“年齡”、“溫度”、“零件尺寸”等都是連續變量。另外,應該注意,多數情況下我們所說的變量是指數量變量,統計標志中的數量標志和所有的統計指標就是這種變量,大多數統計方法所處理的也都是數量變量,因此有時把數量變量就簡稱為變量。本書以后各章多沿用這種做法。
二、統計數據的調查方式和搜集方法
在本源上,統計數據都來自直接的調查或試驗,這種來源的數據也被稱為第一手或直接的統計數據。有時,別人調查或試驗的數據也是使用者搜集統計數據的一個來源,當然,這種數據屬第二手或間接的統計數據。但任何一種統計數據的獲取都要進行適當的組織和運用具體的搜集方法。這里,我們著重討論取得社會經濟統計數據的主要調查組織方式和具體搜集方法。
(一)統計調查的組織方式
實際中常用的統計調查組織方式主要有普查、抽樣調查、統計報表、重點調查和典型調查等。
1、普查。普查(Census)是為某一特定目的而專門組織的一次性全面調查方式,如人口普查、工業普查、農業普查等。世界各國一般都定期進行各種普查。普查適用于特定目的、特定對象,旨在搜集有關國情國力的基本統計數據,為國家制定有關政策或措施提供依據。它主要用于搜集處于某一時點狀態上的社會經濟現象的數量。普查作為一種特殊的調查組織方式有以下幾個特點:
(1)普查通常是一次性或周期性的。普查涉及面廣,調查單位多,要耗費大量的人力、物力和財力,所以間隔較長時間,如10年才進行一次。我國的人口普查從1953年到1990年共進行過4次。今后,我國的普查將規范化、制度化,每逢末尾為“0”的年份進行人口普查,末尾為“3”的年份進行第三產業普查,末尾為“5”的年份進行工業普查,末尾為“7”的年份進行農業普查,末尾為“1”或“6”的年份進行統計基本單位普查。
(2)普查一般需要規定統一的標準調查時間,以避免調查數據的重復或遺漏,保證普查結果的準確性。我國前四次人口普查的標準時間定為普查年份的7月1日0時,第五次人口普查為2000年11月1日0時。農業普查的標準時間定為普查年份的1月1日0時。標準時間一般定為調查對象比較集中、相對穩定的時期。
(3)普查的數據一般比較準確,規范化程度也高,因此可作為抽樣調查和其他調查的依據。
(4)普查的使用范圍較窄,只能調查一些最基本或特定的現象。
2、抽樣調查。抽樣調查(Sampling survey)是按照一定的概率從總體中抽取一部分單位構成樣本,并根據樣本信息推斷總體數量特征的一種非全面調查。這是一種應用最為廣泛的調查組織方式。抽樣調查的內容將在后面設專章討論。
3、統計報表。統計報表(Statistical report forms)是按照國家有關法規規定,自上而下統一布置,自下而上逐級填報的一種調查組織方式。這種調查組織方式在我國政府統計工作中,經過幾十年的改進和完善,已形成了一套比較完備的統計報告制度,它要求以原始數據為基礎,按照統一的表式、指標、報送時間和報送程序填報,已成為國家和地方政府部門獲取統計數據的主要統計調查組織方式。
統計報表類型多樣。統計報表按調查范圍可分為全面報表和非全面報表;按報送時間可分為日報、月報、季報和年報等;按報送受體可分為國家、部門、地方統計報表。
4、重點調查。重點調查(Key-point investigation)是這樣一種調查組織方式,它只從全部總體單位中選擇少數重點單位進行調查,這些重點單位盡管在全部總體單位中出現的頻數極少,但其某一數量標志卻在所要研究的數量標志值總量中占有很大的比重。例如,要了解全國的鋼鐵生產總量,只要對產量很大的少數幾個鋼鐵企業,如鞍鋼、寶鋼、首鋼等進行調查,就可對全國的鋼鐵生產總量有個大致的認識。這幾個產量很大的企業,構成了這次全國鋼產量調查的重點單位,因為它們的鋼鐵產量,在全國的鋼鐵生產總量中占有很大比重。
5、典型調查。典型調查(Model survey)是從全部總體單位中選擇一個或幾個有代表性的單位進行深入細致調查的一種調查組織方式。典型調查的目的是通過典型單位來描述或揭示事物的本質或規律,因此所選擇的典型單位應能反映所研究問題的本質屬性或特征。例如,要研究工業企業的經濟效益問題,可以在同行業中選擇一個或幾個經濟效益突出的單位做深入細致的調查,從中找出經濟效益好的原因和經驗。典型調查主要用于定性研究,調查結果一般不能推斷總體。
(責任編輯:xll)
近期直播
免費章節課
課程推薦
統計師
[協議護航-退費班]
12大模塊 準題庫資料 協議退費校方服務
統計師
[協議護航-暢學班]
12大模塊 準題庫資料 協議續學校方支持
統計師
[豐羽計劃-暢學班]
4大模塊 題庫練習 精品課程