為了幫助考生系統的復習2011年質量工程師課程,全面的了解2011年質量工程師考試教材的相關重點,小編特編輯匯總了2011年質量工程師考試各章復習的重點資料,希望對您參加本次考試有所幫助!
統計學主要的任務
簡單地說,總體就是一個分布,不同總體有不同分布。統計學主要的任務就是:
l 研究總體是什么分布?
l 這個總體(分布)的均值、方差(或標準差)各是多少?
例1 對某產品僅考察其合格與否,并記合格品為0,不合格品為1‘
分析:
總體={該產品的全體}={由0或1組成的一堆數}
若記l在總體中所占比例為P,則該總體可用如下二項分布b(1,P)(n=l的二項分布)表示:
X01
P1-PP
例2有兩個工廠生產同一產品,甲廠的不合格品率P=0.01,乙廠的不合格品率P=0.08,甲乙兩廠所生產的產品(即兩個總體)分別用如下兩個分布描述:
X甲01
P0.990.01
X乙01
P0.920.08
例3考察某橡膠件的抗張強度。它可用0到∞上的一個實數表示,這時總體可用區間[0,∞]上的一個概率分布表示。國內外橡膠業對其抗張強度有較多研究,認為橡膠件的抗張強度服從正態分布 ,該總體常稱為正態總體。
例4例如某型號電視機的壽命全體所構成的總體就是一個偏態分布。
又如兩個不同的正態總體混合也可以產生一個偏態總體。如將兩位不同的操作工(或在不同機器上,或用不同原料,或不同轉速等)生產的同一種零件混在一起,其質量特性常呈偏態分布,應該重視考察偏態分布產生的原因。
分析:用非對稱分布(即偏態分布)描述的總體也是常見的。
二、 統計量與抽樣分布
樣本來自總體,因此樣本中包含了有關總體的豐富的信息,但是這些信息是零散的,為了把這些零散的信息集中起來反映總體的特征,我們取得樣本之后,并不是直接利用樣本進行推斷,而需要對樣本進行一番“加工”和“提煉”,把樣本中所包含的有關信息盡可能地集中起來,種有效的辦法就是針對不同的問題,構造出樣本的某種函數,這就是統計量。不同的函數可以反映總體的不同的特征。
1統計量
把不含未知參數的樣本函數稱為統計量。一個統計量也是一個隨機變量。
定義4:設(X1,X2,…,Xn)為取自總體X的一個樣本,g(X1,X2,…,Xn)為一個連續函數,如果這個函數中不包含任何未知參數,則稱g(X1,X2,…,Xn)為一個統計量。
例如,設X~N(m ,s 2),其中m 已知,s 2未知,(X1,X2,…,Xn)為取自X的樣本,則 是統計量, ---不是統計量。
統計量是樣本的函數,因而統計量是隨機變量。
由統計量進行推斷,便可獲得對總體的認識,統計推斷是數理統計的核心內容。
2抽樣分布
統計量的分布稱為抽樣分布。
例:從均值為 ,方差為 的總體中抽得一個樣本量為n的樣本 ,其中 與 均未知。
在此情形, 是統計量;而 , 都
不是統計量,因為后者包含 , 等未知參數。
3常用統計量
常用統計量可分為兩類,一類是用來描述樣本的中心位置,另一類用來描述樣本的分散程度。為此先介紹有序樣本的概念,再引入幾個常用統計量。
有序樣本
設 是從總體X中隨機抽取的樣本,樣本量為n,將它們的觀測值從小到大排列為: ,這便是有序樣本。其中 是樣本中的最小觀測值, 是樣本中的最大觀測值。
例 從某種合金強度總體中隨機抽取樣本量為5的樣本,記為 ,樣本觀測值為:140,150,155,130,145
解析:將它們從小到大排序后為:130,140,145,150,155,這便是有序樣本,其中最小的觀測值為 =30,最大的觀測值為 =155。
(1)描述樣本的中心位置的統計量
總體中每一個個體的取值盡管是有差異的,但是總有一個中心位置,如樣本均值、樣本中位數等。描述樣本中心位置的統計量反映了總體的中心位置,常用的有以下幾種:
①樣本均值
樣本觀測值有大有小,樣本均值大致處于樣本的中間位置,它可以反映總體分布的均值。
例 上例數據: ,樣本觀測值為:140,150,155,130,145。
樣本均值為 =(140+150+155+130+145)/5=144。
對分組數據,樣本均值的近似值為
其中 是分組數, 是第 組的組中值, 是第 組的頻數, 。
例 下表是經過整理的分組數據表,結出了110個電子元件的失效時間:
分組區間[0,400][400,800)[800,1200)[1200,1600)[1600, 2000)[2000,2400)
組中值xi2006001000140018002200
頻數ni628372397
解析:
平均失效時間近似為:
= 1170.9
②樣本中位數
中位數有時也記為Me。
當n為奇數
, 當n為偶數
例 現有一組數據(已經排序):2,3,4,4,5,5,5,5,6,6,7,7,8,
解析:
共有13個數據,處于中間位置的是第7個數據,樣本中位數即為 。
(3)描述樣本數據分散程度的統計量
總體中各個個體的取值總是有差別的,因此樣本的觀測值也是有差異的,這種差異有大有小,反映樣本數據的分散程度的統計量實際上反映了總體取值的分散程度,常用的有如下幾種:
①樣本極差:
例 數據為 ,樣本觀測值為:140,150,155,130,145,那么將它們從小到大排序后為:130,140,145,150,155
解析:最小值為130,最大值為155,因此樣本極差R=155-130=25
②樣本方差:
同樣,對分組數據來講,樣本方差的近似值為:
例 數據為 ,樣本觀測值為:140,150,155,130,145
解析:
上式有兩個簡化的計算公式:
樣本極差的計算十分簡便,但對樣本中的信息利用得也較少,而樣本方差就能充分利用樣本中的信息,因此在實際中樣本方差比樣本極差用得更廣。
③樣本標準差:
在上例中 。
樣本標準差的意義:
樣本方差盡管對數據的利用是充分的,但是方差的量綱(即數據的單位)是原始量綱的平方,例如樣本觀測值是長度,單位是“毫米”,而方差的單位是“平方毫米”,單位不同就不便于比較,而采用樣本標準差就消除了單位的差異。
四 樣本數據的整理
從總體x中獲得的樣本是總體的一個縮影,具有豐富信息的數據,我們需要對數據進行加工,將有用的信息提取出來,以便對總體有所了解。
對數據加工有兩種方法:
一是計算統計量,二是利用圖形與表格。上面提到的便是常用的統計量,它具有概括性,但不夠形象,下面給出對效據進行整理的表格與圖形描述。
下面我們結合一個例子來敘述對計量數據結出頻數頻率分布表的步驟。
|
例 食品廠用自動裝罐機生產罐頭食品,由于工藝的限制,每個罐頭的實際重量有所波動,現從一批罐頭中隨機抽取100個稱其凈重,數據如下:
342 352 346 344 343 339 336 342 347 340 340 350 347 336 341
349 346 348 342 346 347 346 346 345 344 350 348 352 340 356
339 348 338 342 347 347 344 343 349 341 348 341 340 347 342
337 344 340 344 346 342 344 345 338 351 348 345 339 343 345
346 344 344 344 343 345 345 350 353 345 352 350 345 343 347
354 350 343 350 344 351 348 352 34
熱門文章:
編輯推薦:
(責任編輯:中大編輯)