李克特項調查視為常態分配
對於某件事情的主觀評估,無法客觀的衡量,如病人滿意度,此為序位類型的資料型態。舉例來說,病人也許分類其滿意程度為非常不滿意/不滿意/中立/滿意/非常滿意或評估他們的疼痛程度為很小/中度/重度/無法忍受。此種類型的資料也稱為〝序位〞資料。
針對序位資料,我們不能說〝有點滿意〞是〝有點不滿意〞兩倍好,或各個程度間的差異是一樣的(舉例來說,從非常不滿意到有點不滿意和從有點滿意到非常滿意相較)。當序位類別的資料,如滿意度調查的李克特式尺度,應抵制將這些數字當成有統計意義。 舉例來說,對於計算滿意度平均不夠敏感。這些資訊僅包含序位的資訊。母數方法是依據計算平均及標準差,所以他們不適用於序位的資料,如滿意度。
話雖如此,使用Google搜尋,傳回很多以平均值及標準差計算滿意度調查的結果(如美國Press-Ganey調查)。且因我們醫院報給醫務管理學會,要求使用滿意度五分法的平均,我們網頁提供這些計算方法於下。
實例
對調查問卷中的一個項目進行分析,填答者從五分法中選擇1~5中一個,該細項的結果為:
{4, 5, 4, 5, 5, 5, 5, 3, 4, 3}.
表一、使用 Excel 函數由原始數據計算
統計參數
|
Excel 函數
|
結果
|
算術平均值
|
= AVERAGE(4, 5, 4, 5, 5, 5, 5, 3, 4, 3) |
= 4.3 |
標準偏差
|
= STDEV(4, 5, 4, 5, 5, 5, 5, 3, 4, 3) |
= 0.823273 |
樣本數
|
= COUNT(4, 5, 4, 5, 5, 5, 5, 3, 4, 3) |
= 10 |
信賴區間
|
= CONFIDENCE(0.05, STDEV(), COUNT()) |
|
信賴區間(續)
|
= CONFIDENCE(0.05, 0.823273, 10) |
= 0.51027 |
然而,因為我們的網頁呈現群組的調查資料,這個區塊呈現群組資料給予相同分數的結果如何?
-
區間 c 是常數,在我們的滿意度調查裡,使用的李克特量表設為等距(=1)
-
u 是李克特五分法的值(1~5中其中一個)
-
f 是在回答問卷的人中,給予特定值的人數
-
s 是樣本標準差
表二、使用 Excel 函數由分組數據計算
從調查的分組數據
|
計算
|
A |
B |
C |
D |
E |
F |
G |
H |
I |
J |
K |
1 |
李克特分數
|
u |
1 |
2 |
3 |
4 |
5 |
Σ |
|
|
2 |
投票率
|
f |
0 |
0 |
2 |
3 |
5 |
=SUM(D2:H2) |
10 |
=Σf |
3 |
分組數據
|
fu 2 |
0 |
0 |
18 |
48 |
125 |
=SUM(D3:H3) |
191 |
=Σfu 2 |
4 |
分組數據
|
fu |
0 |
0 |
6 |
12 |
25 |
=SUM(D4:H4) |
43 |
=Σfu |
使用分組的數據來計算統計參數:
樣本標準差
`s`:
`
= c \times sqrt ((Sigma f u^2)/(Sigma f) - ((Sigma f u)/(Sigma f))^2) \times sqrt ((Sigma f) / ((Sigma f - 1)))
`
`
= 1 \times sqrt ((191 / 10) - (43 / 10)^2) \times sqrt (10/((10 - 1)))
`
`= 0.781025 \times 1.054093`
`= 0.823273`
與表1其中所用的原始數據計算的結果相同
⇒ STDEV(4, 5, 4, 5, 5, 5, 5, 3, 4, 3)
平均值
`bar x`:
`
= (Sigma f u)/(Sigma f)
`
`
= (43 / 10)
`
`= 4.3 `
`= 0.823273`
與表1其中所用的原始數據計算的結果相同
⇒ AVERAGE(4, 5, 4, 5, 5, 5, 5, 3, 4, 3)
信賴區間
`CI`:
`
= bar x ± z_c s/sqrt(N)
`
`
= (Sigma f u)/(Sigma f) ± z_c s/sqrt(Sigma f)
`
`
= 43 / 10 ± 1.96 0.823273/sqrt(10)
`
`= 4.3±0.51027 `
與表1其中所用的原始數據計算的結果相同
⇒ CONFIDENCE(0.5, 0.823273, 10)
`= 4.3 ` `(3.78973 ∼ 4.81027)`
或作為5的最大李克特量表的百分比
`= 4.3/5 (3.78973/5 ∼ 4.81027/5)`
`= 86.0% (75.8% ∼ 96.2%)`
信賴區間是一個範圍,用來說明點估計的不確定性(如滿意度),及資料變異性的測量。信賴區間是用機率來計算(如 95%),且我們會說有 95% 的機會,信賴區間會涵蓋真正的數值。
因為統計檢定常定在 0.05,所以絕大多數的信賴區間皆以 95% 計算之,換句話說,只不過是因為〝大家這麼做〞而已。
這是很武斷的:在偶然情況下,100 次中有 5 次例外被當作有統計上的顯著差異,但發生 6 次例外就不算統計上有顯著差異!
信賴區間未考量點估計不確定性的其他來源,包括遺漏值、資料不完整、其他數據錯誤或由未填答者以及不好的數據收集過程造成的偏差。
常態分配
在 np 和 n(1-p) 都大於 5 的條件下近似常態是合理的,但是員工滿意度調查的回收率,或任何滿意度調查的層別法分析,通常會落在此值之下;在這種情況下,建議使用累積較長期的資料﹝如:半年或一年﹞
在此公式中,`hat p` 是由統計樣本估計出來的比例,n 是樣本數,z(1-α/2) 是標準常態分布的 (1-α/2) 百分位數(以 95% 信賴區間來說,這個值為 1.96 。當 np及 n(1-p) 都大於 5 的時候,用常態近似法是合理的,因此,他只適用於大樣本的資料 (≥ 30);然而,像員工滿意度調查的回收率或任何調查的分層分析,其樣本數往往會在這個標準之下 (n < 30)。舉例來說,如果 `hat p` = 0.1,那 N 應至少要 50,若 `hat p` = 0.01,那N至少要 500。決定樣本數大小的條件在其他地方也受到廣泛的討論,且當使用管制圖的時候,這是很重要的。
在很多單純的情況下,特別是牽涉到常態分布的資料,或其他分布的大樣本資料,常態估計也許會被用來計算信賴區間。
計算方式使用近似常態二項分配算得調查比例的標準誤差:
` hat p ± z_(1 - \alpha \/2) sqrt ((hat p (1 - hat p))/n) `
p-hat 是統計樣本的抽樣比例,n 是樣本數,z1-α/2 是標準常態分配的 1-α/2 百分位 ﹝例如本網站使用的 95% 信賴區間值是 1.96﹞。
計算常態分配的信賴區間的實例
卓越指標:一共有 86 人填表,其中 33 人給四分、12 人給滿分五分。
因此,卓越指標之分子為 33 + 12 = 45、其分母為 86,
p = 45 ÷ 86 = 0.523
1-p = 0.477
n = 86
且使用近似常態二項分配算得需要 np 和 n(1-p) 都 > 5,因此:
np = 86 x 0.523 = 44.978
n(1-p) = 86 x (1-0.523) = 41.02
確實兩個都
> 5。
依據上述的公式,
95% CI
`
= 0.523 ± 1.96 sqrt((0.523 × 0.477) / 86)
`
`
= 0.523 ± 0.105
`
卓越指標 = 52.3% ﹝下限:41.8%, 上線:62.9%﹞或解釋時該說其範圍為 41.8% ~ 62.9% 之間。
我們滿意度調查結果的網頁最右邊兩個欄位是95%信賴區間。
二項式分配
過去,很多分析師建議當樣本數很小的時候,直接從二項式分布算〝精確的〞信賴區間。
然而,精確的信賴區間容易變的太寬。
Agresti & Coull 指出分數的間隔幾乎在所有情況下都比精確的間隔好,即使是樣本數很小的時候。
因此,建議指出分數的間隔適合所有樣本大小的資料,因此此網站的滿意度調查使用使用此種方法。
對二項式分布的資料來說,會利用二次方程式以分數的間隔來計算信賴區間 :
`
hat p = ((2nx + z_(\alpha \/ 2)^2 n ) ± sqrt(((2nx + z_(\alpha \/ 2)^2 n)^2 - 4 (n^2 + z_(\alpha \/ 2)^2 n) x^2)) )
/ (2 ( n^2 + z_(\alpha \/ 2)^2 n ))
`
在此式中,n 是樣本數,x 是成功的數量,zα/2 是α/2 程度的常態離散 (如:1.96 對 95% 的間隔),且 `hat p`是估計的信心水準。
利用此種方法,下限不會是負值,但是若使用二項分布的常態近似法將不會有這樣的效果。
除非 p ≅ 0.5,否則二項分布的信賴區間並不是對稱的。
計算二項式分配信賴區間的實例
上雙盒指標:一共有 20 人填表,其中 3 人給四分、1 人給滿分五分。
因此,上雙盒指標之分子﹝x﹞為 3 + 1 = 4、其分母﹝n﹞為 20,
` hat p ` = x ÷ n = 4 ÷ 20 = 0.2 (20%)
依據上述的公式:
95% CI
`
= ((2nx + z_(\alpha \/ 2)^2 n) ± sqrt(((2nx + z_(\alpha \/ 2)^2 n)^2 - 4 (n^2 + z_(\alpha \/ 2)^2 n) x^2)) )
/ (2 ( n^2 + z_(\alpha \/ 2)^2 n ))
`
`
= (2 × 20 × 4 + 1.96^2 × 20 ± sqrt((2 × 20 × 4 + 1.96^2 × 20)^2 -
4 × (20^2 + 1.96^2 × 20 ) × 4^2))
/ (2 × ( 20^2 + 1.96^2 × 20 ))
`
`
= (160 + 76.832 ± sqrt((160 + 76.832)^2 -
4 × (400 + 76.832 ) × 16))
/ (2 × ( 400 + 76.832 ))
`
`
= (236.832 ± sqrt(56089.39622 - 30517.248)) / 953.664
`
`
= (236.832 ± 159.9129395) / 953.664
`
`
UCL = (396.7449395) / 953.664 = 0.416021722
`
`
LCL = (76.91906049) / 953.664 = 0.080656353
`
依據上述的公式,上雙盒指標 = 20.0% ﹝下限:8.1%, 上線:41.6%﹞或解釋時該說其範圍為 8.1% ~ 41.6% 之間。
須注意的是這個結果距平均值是不對稱的,與平均值的距離下限為11.9%,上限為 21.6%。
圖八、患者滿意度的單變量分析
圖八顯示單因素分析,患者滿意度參數均為非常態分佈,通常偏向左(會員登陸後才能使用此鏈接)。
圖九、常態和二項計算的比較
圖九示出信賴區間根據常態和二項式分佈計算的比較。
當在進行短期、小範圍、小樣本數的品質改進(PDSA)專案時,這是特別重要的。
在這種情況下,圖九的左半邊表明,使用常態近似計算將導致不可能的結果(小於零的信賴區間或大於100%)。
圖九的右半部分錶示二項式計算是總是正的,永不超過100%,並且兩側的長度不等。
使用 Excel 計算
1.
在新的工作表,建立實驗的變量,如下:
A1 : "α "
B1: "1.96"
95%CI (如果需要改變為其他值)
A2 : "n "
B2: "20"
有效問卷的總張數(分母)
A3 : "x "
B3: "4"
給出所期待的意見,如頂雙盒(分子)
2.
在工作表中的不同格子利用函數設置二項式置信區間的公式,如下:
UCL : "
=(2 * $B$2 * $B$3 + POWER($B$1, 2) * $B$2 + SQRT(POWER(2 * $B$2 * $B$3 + POWER($B$1, 2) * $B$2, 2) - 4 * (POWER($B$2, 2) + POWER($B$1, 2) * $B$2) * POWER($B$3, 2))) / (2 * (POWER($B$2, 2) + POWER($B$1, 2) * $B$2))
"
LCL : "
=(2 * $B$2 * $B$3 + POWER($B$1, 2) * $B$2 - SQRT(POWER(2 * $B$2 * $B$3 + POWER($B$1, 2) * $B$2, 2) - 4 * (POWER($B$2, 2) + POWER($B$1, 2) * $B$2) * POWER($B$3, 2))) / (2 * (POWER($B$2, 2) + POWER($B$1, 2) * $B$2))
"
3.
結果應該是與上述的實例一樣的,如下所示(如果沒有,請檢查您複製的公式):
UCL : 0.416021722
LCL : 0.080656353
- Altman DG. Practical statistics for medical research. Chapman & Hall/CRC, 1991. pp.231-2
- Spiegel MR. Shaum's outline of theory and problems of statistics. McGraw-Hill Inc.
1972. p.78-9 section 4.16
- Online calculator for Binomial and Poisson confidence intervals:
statpages.org/confint.html
- Online calculator for Mean & Standard Deviation from frequency table & grouped data:
knowpapa.com/sd-freq/
-
Vollset SE. Confidence intervals for a binomial proportion.
Statistics in Medicine 1993; 12(9): 809-823.
-
Agresti A & Coull BA. Approximate is better than
"exact" for interval estimation of binomial proportions,
The American Statistician, 1998; 52(2): 119-126.