第5章 信度
1、 信度是指:測量結果的可靠性和一致性。因為心理測驗通常測量人的行為,行為會由于各種各樣的原因,因時、因事、因地而產生變動,這些因素有些是偶然的,有些是固有的,人在完成心理測驗時的行為也會受上述因素的影響,從而使測驗結果與真實結果不完全一致,所以我們要用信度來衡量測驗的可靠性和一致性。
2、 信度的操作化定義:
(1) 誤差理論認為:一個人的測驗分數X是由真實分數(T)和誤差(E)兩部分構成的,公式是X = T + E。
(2) 因此信度就被定義為:一組測量分數的真實方差與實得方差的比,或者是指真實方差占總方差的百分比。公式為:rxx = 1-SE 2/SX 2
(3) 根據統計學理論,真實方差與實得方差的比是一個相關系數的平方,所以我們把這種相關系數的平方叫做信度系數。
(4)計算公式為:rxx = ST2/SX2
3、 由于誤差的來源信度的可分為:這種分類是基于信度的傳統定義-真分數理論。
(1) 重測信度:考慮的誤差來源是時間取樣。
(2) 復本信度:考慮的誤差來源是內容取樣。
(3) 分半信度:它考慮的誤差來源也是內容取樣,它與復本信度的差別是:分半信度考查一個測驗內容的兩半題目測量的是否是同一個心理特點行為。
(4) 同質性信度(內部一致性系數):考慮的是測驗內容是否異質。
(5)評分者信度:考慮的誤差來源是評分者間的差別。
4、 信度的表示方法:
(1) 信度系數和信度指數:
1 信度系數:rxx = rx2T = S2T/S2
2 信度指數:rXT = ST/SX
(2) 測量標準誤:SE = SX 1-rxx
5、 信度的意義:
(1) 信度系數可以解釋為樣本測驗分數的總方差中有多少比例是真分數方差,也就是測驗的總變異中真分數造成的變異占百分之幾。它直接告訴我們測量的誤差有多大。
(2) 測量的標準誤可以告訴我們有多大可能性真實分數在某一分數范圍內,并且可以預測實得分數再測時可能的變化情況。
6、 信度的作用:
(1) 解釋預測個人分數的意義。
(2) 解釋真實分數與實得分數間的關系,明確告訴我們測驗誤差大小。
(3) 新編的測驗信度應高于原有的同類測驗或相似測驗。
(4)下結論說某測驗比較可靠,必須是依據情境的,經多次證實的。
(5) 它是確定測驗好壞的一個指標。一般的原則是:
1 當rxx< 0.70時,測驗不能用于對個人作出評價或預測,而且不能做團體間比較。
2 當0.70≤rxx<0.85時,可用于團體比較。
3 當rxx ≥0.85時,才可以用來鑒別或預測個人成績或作用
7、 重測信度:有時也叫穩定性,主要針對時間變量。
(1) 重測信度采集數據得方法是:對同一組被試間隔一定的時間重復測試一次。
(4) 重測信度的計算方法是積差相關法,因而rxx就是皮爾遜的積差相關系數。
(7) 重測信度的時間間隔選擇依測驗性質和目的而定,如果測驗是用于長期預測,則測量間隔長一些。對兒童的智力測驗一般是兩周到四周為宜。對成年人,間隔可到半年,很少超過6個月。
(8)使用重測信度應注意:不是所有測驗都可以計算重測信度。并且重測信度只是反映了隨機誤差的影響,而不是反映被試心理特點的長期變化。
8、 復本信度:又叫等值性系數。
(1) 數據采集方法是:給被試施測兩個內容等值但題目不同的測驗,求兩組數值的相關。計算方法常見的也是積差相關法。
(2) 復本信度的高低反映了兩個互為復本的測驗等價的程度,而不是反映一個測驗本身受隨機誤差影響的大小。復本信度的高低關鍵取決于復本測驗的選擇,因而施題目取樣問題,或者說是測驗的內容取樣問題。
3)復本信度優于重測信度的地方是:避免了重測帶來的記憶效應和練習效應;可用于長期追蹤研究前后測量;減少了作弊的可能性。
(4)復本信度的缺點:有些測驗的復本很難找到;有些測驗因正遷移效應使測驗性質改變;如測量的內容很容易受練習的影響,復本信度也無法清除這種練習效應。
(5)重測復本信度,即再不同的時間里施測兩個等值的測驗(復本),得到的相關就是重測復本信度,也叫穩定等值系數。它比單一的重測信度或復本信度都要嚴格、全面一些。
9、 斯皮爾曼-布朗公式:rnn = nrtt/1 +(n-13、 1)rtt,14、 rnn是校正以后的相關系數,15、 rtt是實得的相關系數,16、 n為rnn對應的測驗長度與rtt 對應的測驗長度之比。分半時,17、 n = N/(N/2)= 2(N為測驗全長),18、 所以分半法信度的校正公式是:rxx = 2 rnn/1 + rhh 其中rhh為兩半測驗的相關系數。
(1) 盧倫公式:rxx = 1-Sd2/Sx2 其中Sd2是兩半測驗分數之差的方差,Sx2為總方差。
(2) 從理論上分析,分半信度反映的實際上是兩半測驗能夠測量相同內容或心理特點的程度。
10、 內部一致性信度(同質性信度):同質性是指測驗的所有題目間性質的一致性,即測的是同一種心理特質或行為。同質性是測量單一特質的必要條件。這里講的同質性是指測驗題目得分反映的心理特質一致,同質性的判別標準是:題目間呈高正相關,如果相關很低或是呈負相關,則題目為異質。
(1) 庫德和里查德森提出的K-R20公式只適合預測題目是二分法計分的。克倫巴赫α系數適合于非二分法計分的測驗的內部一致性信度估計法。
(2) 從同質性信度的含義我們不難看出,分半信度是求測驗兩半之間的一致性或同質性,而同質性是求所有題目間的一致性。因此分半信度實際上是同質性信度的一種,可以作為測驗同質性評價的粗略估計指標。因為可以根據測驗得分來推論或驗證某種概念或理論構思,因此同質性信度也是一種構思效度,或叫結構效度,它實際上介于信度與效度之間。
11、 評分者信度:有些心理測驗的得分不是根據客觀的計分系統計分的,是由評分者來給被試打分,因此,這樣的測驗的可靠性如何取決于評分者評分的一致性和穩定性如何。
評分者信度因評分者人數不同而估計方法不一樣。如果是兩個評分者,獨立對被試的反應評分,則可以用積差相關來計算,或用斯皮爾曼等級相關法計算。如果評分者在三人以上,而且是等級評分,則可以用“肯德爾和諧系數”(W)來求評分者信度。
12、 以測量標準誤表示信度的好處是:
(1) 信度的單位與測驗分數的單位相同,因此解釋個人分數時非常直接,能直接指出允許測驗分數變化的范圍。
(2) 測驗同質與否并不影響測量標準誤的大小。測量標準誤的不足之處時:無法比較不同測驗間的信度高低。比較不同測驗的信度用信度系數(rxx)解釋個人分數時用測量標準誤(SE)。
13、 常見的影響信度的因素有:樣本特征、測驗的長度、測驗的難度、測量的時間間隔等。
14、 我們做信度考驗時,常常選取一個與常模樣本性質相同的樣本施測,根據被試得分求出信度系數
(1) 樣本團體得分分布的影響:求信度的樣本團體得分分布如果比較窄小的話信度就低。
(2) 樣本團體異質性的影響:樣本團體異質的話,測驗分數的分布就比同質樣本的要廣,分數的離差就大,樣本的方差就大,信度就高。實際上,高信度可能是假性高信度,是由樣本團體的異質造成的。但如果常??傮w要求各種各樣的人,則異質的信度樣本求得的信度就是真信度。這時,相反的情況就需要校正信度。
(3)樣本團體平均能力水平的影響。由于信度也會因樣本間團體平均能力水平的不同而不同,因此在求信度時,一定要注意信度樣本與常模總體間是否一致。
15、 測驗的長度:在其他條件均等的情況下,測驗越長,信度越高。原因在于:
(1) 測驗越長,即題目越多,測驗的內容取樣就越有可能有代表性。
(2) 測驗越長,被試的猜測因素影響就越小。
16、 測驗的難度:難度對信度的影響之存在于某些測驗中,如智力測驗、成就測驗、能力傾向測驗、教育測驗等。測驗的難度對信度有間接影響,因為如果測驗過難,被試的得分會集中在低分區。過于容易,分數則集中在高分區。兩種情況都使信度樣本的得分范圍變窄,變異量降低,從而低估測驗信度。
17、 測驗的時間間隔:這一因素之對重測信度和不同時測量時的復本信度有影響,對其余的信度來說不存在時間間隔問題。
相關內容:
(責任編輯:)