故障樹分析

通過最小切割集計算來調查根本原因

故障樹分析(Fault Tree Analysis, FTA)與事件樹分析(Event Tree Analysis,ETA)

圖 1、故障樹分析與事件樹分析之蝴蝶結狀效應

故障樹分析與事件樹分析是互補的方法(且經常一起使用),兩者分別側重不良事件的相反面向。 圖 1 顯示它們如何組合在一起。 由圖一可知它們組合起來的樣子。有時會將這樣的組合稱為「蝴蝶結狀」模式(因為看起來像一個蝴蝶結),當同時使用故障樹與事件樹分析時,也稱為蝴蝶結手法。

故障樹著眼於分析可能導致事件的錯誤,而事件樹則是希望防止錯誤程度升高。此二者皆能用於質性分析,如果你手邊有數據資料,亦可用於量性分析。

故障樹構造

  1. 定義錯誤狀況,並將最上層的錯誤紀錄下來。
  2. 使用技術訊息及專業判斷,確定導致錯誤發生的可能原因。記得,這些原因是第二層的元素,因為它們位置是在故障樹的最頂層錯誤之下。
  3. 繼續將每個元素分解到不同次級層別的路徑閘門。必須考量各元素間的關係,以幫助你決定要使用「和(and)」或是「或(or)」的邏輯閘門
  4. 完成並查看完整的故障樹圖。故障鏈只能終止在人為、硬體或軟體的基本錯誤(故障)
  5. 如果可以,評估每個最低級別的元素發生率,並由下至上統計機率。

故障樹分析

  1. 尋找並解釋割集與路徑集合。
  2. 測試成功範圍的邏輯性,進行驗證
  3. 共同原因事件/現象
  4. 尋找並解釋割集
  5. 重要性
  6. 路徑集合
  7. 減少弱點;敏感度測試

        

故障樹分析報告
圖 2、故障樹分析報告的結構
  1. 標題:公司,作者,日期…等。
  2. 執行總結:(完整報告之摘要)
  3. 分析範圍
    簡要的系統描述
    頂端事件(TOP)描述/嚴重度之範圍界限
    分析範圍
    …實體範圍/介面探討
    …作業範圍/解析限制
    …作業階段/暴露間隔
    …在○○○中/外的人員作業/其他
  4. 分析
    方法討論(引用參考文獻)
    使用何軟體
    故障樹的描述/討論
    機率資料來源(如果為量性資料)
    常見原因搜尋(已完成的)
    敏感度測試(如果有進行測試)
    割集(如果有分析結構及/或量化之重要性)
    路徑集(如果已分析)
    權衡分析(Trade Studies);如果已完成
  5. 分析結果 …
    頂端事件(TOP)發生機率(提出信賴區間)
    系統弱點缺陷評論
    主要促成因素
    可能之降低對策(如果適用)
  6. 結論與建議 …
    風險比較(如果適用,使用重複抽樣估計法(亦稱自助抽樣法/拔靴法,Bootstrapping)進行資料統計分析)
    是否需要進一步的分析?建議使用何分析方法?


  7. 敘明何者已完成分析,何者未進行分析。
  8. 將故障樹以圖顯示。將包含資料來源、割集、路徑集…等內容整理成表。

釋義與科學記號

可靠度(Reliability)

這裡所述的系統(system),是指由執行某些功能的n個可識別的零組件(或是元件、成分、作業...等)所構成的集合。有關系統執行其預設功能,區分其能力的兩個作業狀態,分別定義如下:

  • 成功(success):系統在特定時間區段內令人滿意地完成其應有功能,明確符合所謂成功的標準。
  • 失敗(failure):系統無法令人滿意地完成其應有之功能。

系統可靠度(Reliability, `R`)是指系統令人滿意地完成應有功能的機率(即成功機率,Probability of success, `bar (P_S)` )。如果系統正常運作,則系統可靠度=1。
在符號上方有短劃線( ` bar P ` ) 表示其成功屬性。

串聯系統(Series System)

需要所有系統內全部組成元件(作業)都正常運行才算成功的系統稱為串聯系統

` Pr{A∩B} :    R = bar (P_S) `
`= \prod_{i=1}^n bar (P_i)`
`= bar (P_1) × bar (P_2) × bar (P_3) … × bar (P_n) `

立體音響系統範例:串聯 ` Pr{A∩B}`

例如,附帶光碟播放器、擴大機及2個揚聲器(揚聲器 A 及揚聲器 B)的立體音響系統。 如果成功運作需要所有四個組成元件都正常運作(光碟→擴大機→揚聲器A→揚聲器B),則代表此為串聯系統。 任何一個組件的失敗都會導致系統失敗。
如果各元件的可靠度是:光碟( `bar (P_1) = 0.97` )、擴大機( `bar (P_2) = 0.99` )、及每個揚聲器( `bar (P_3) = bar (P_4) = 0.98` ),則產品的可靠度則是:
`R = bar (P_1) × bar (P_2) × bar (P_3) × bar (P_4) = 0.9222`

並聯系統(Parallel System)

若任何一個組件的成功相當於系統的成功,那就是一個並聯系統。換句話說,所有組件都必須失效才會導致並行系統發生故障。 並聯系統的可靠度是指所有的元件(作業)沒有都失敗的機率。

`Pr{A∪B} :`
`R = ∐_{i=1}^n P_i = 1 - \prod_{i=1}^n (1-bar P_i) `
`R = 1 - (1- bar(P_1))(1- bar (P_2))…(1-bar (P_n)) `

立體音響系統範例:並聯 ` Pr{A∪B}`

範例:如果立體音響系統只需要至少一個揚聲器正常運作即為成功,則兩個揚聲器即構成了並聯系統。
` bar P_x = 1 - (1-bar (P_3)) × (1-bar (P_4)) `
` bar P_x = 1 - (0.02)(0.02) = 0.9996`
揚聲器組合與CD播放機和放大器形成一個串聯系統,因此總體可靠性為:
`R = bar (P_1) × bar (P_2) × bar P_x`
`R = (0.97)(0.99)(0.9996) = 0.9599`

太空船電腦:並聯 ` Pr{A∪B}`

一艘太空船上有三台相同的電腦同時運行及解決相同的問題。 比較三台電腦的運算結果,如果兩台以上的結果相同,則採用其結果。 在這個模式下,三台電腦當中的一台即使失敗了,仍然不會造成整體系統失敗。這個即是三選二系統(two-out-of-three system)。 透過變項 `bar (P_1)`、 `bar (P_2)` 及 `bar (P_3)` 找出每台電腦的成功或失敗,公式如下:

`R = 1 - (1- P_1P_2)(1-P_1P_3)(1-P_2P_3) `
`R = 1 - (1-0.9^2)(1-0.9^2)(1-0.9^2)`
`R = 1 - (0.19)^3`
`R = 0.993`

三台電腦組合的可靠度( `0.993` )顯著高於任何一台單獨的電腦( `0.9` )。 此為使用「重複(冗餘)」來提高可靠度的範例。 由於只需一台電腦來執行功能,故其他兩台電腦從功能性觀點來看,它們屬於冗餘的作業。 然而,備援(重複/冗餘)在增加系統的可靠度上卻發揮了重要的功能。

失敗(錯誤)的常見原因

在這裡,失敗(錯誤)的獨立性顯得很重要。 如果有某失敗(錯誤)的機制導致三台電腦全部同時失效,則可靠度的改善將無法實現。 舉例來說,如果三台電腦都用相同的程式,程式中有個錯誤,則運算結果組合肯定不會優於任何一台獨立運算的結果。 我們經常在錯誤可能造成特別嚴重結果的系統中看見「冗餘(備援)」法的運用,例如太空計畫或內含許多組成元件的複雜系統。

常見原因是一個事件或現象,如果發生了,將引出故障樹內兩個以上的組成要素出現。
常見原因的失察是故障樹分析裡經常發現的問題!

防盜警鈴範例:微波、光電、腳步震動及聲波等4個完全獨立的警報系統被用來進行侵入的偵測及警示。 這些設備沒有任何兩個是使用相同的運作原理。好像絕對存在互相備援(冗餘設計)的情況。
但是!
假設這四個系統的運作電力是使用同一個來源,當電力來源失效、且沒有電力備援時會怎麼樣?

常見錯誤原因/錯誤來源

  • 供應中斷:如電力、冷卻水、氣動壓力、蒸氣…等
  • 潮濕、腐蝕、灰塵/沙礫
  • 地震干擾
  • 溫度影響(冷凍/過熱)
  • 電磁干擾
  • 單一操作者(供應商)出錯

常見原因的抑制方法

  • 系統組成元件的分離/隔離/絕緣/密封/屏蔽
  • 使用不同作業原理的冗餘(備援)元件
  • 將冗餘(備援)元件的供電/維修/保養分離
  • 利用分開的操作者(供應商)/督察員

根據時間函數的可靠度:浴缸曲線

圖 3、浴缸曲線

多數系統元件在使用壽命此一較長的區段時間內的故障(失敗)率(λ)為常數。在此時間內,會隨機發生故障。

圖 4、以指數方式建立「錯誤」的計算模型

透過指數可良好地建構故障率暴露時間(T)函數。對短暫的暴露期間(暴露期間 ≤ 0.2 平均故障間隔時間、MTBF),故障率 `P_F` 大約在 λT 的 2% 以內。

參數 λ 稱為組成元件故障率,以單位時間內的故障單位數表示。 `λ` = 故障率 = `1/(MTBF)`

關於可靠度(reliability)、割集(cut sets)及路徑集(path sets),請參閱下面編號第13號參考文獻,奧斯汀大學的「Reliability」。


`S` = Successes, `F` = Failures
"Barring" terms ( ` bar P ` ) denotes consideration of their success properties.
`bar (P_S)` = Success Probability = `R` = Reliability
`P_F` = Failure Probability
`bar (P_S) + P_F = S / ((S+F)) + F / ((S+F)) ≡ 1 `
` P_F = 1 - bar (P_S) `
`λ` = 故障率 = `1/(MTBF)`



` Pr{A∩B} : P_S `
`= ∏_(i=1)^n P_i`
`= P_1 × P_2 × P_3 … × P_n `

` Pr{A∪B} : P_F `
`= ∐_(i=1)^n P_i `
` = 1 - ∏_(i=1)^n (bar P_i) `
` = 1 - ∏_(i=1)^n (1 - P_i) `
` = 1 - [(1-P_1)(1-P_2)…(1-P_n)] `


機率數據資料的來源

故障樹真正的能力在於進行機率分析(probabilistic analyses)。 實際上,大多數健康照護系統並沒有各項基礎事件的實際比率數據。 除此之外,在人為錯誤與設備錯誤率的部分,團隊通常只掌握到非常有限的可用訊息。

另外,最上層的錯誤往往可能是良性結果或被病人疾病表徵遮蔽,因此常導致發生數據資料被低估。

儘管如此,風險模式建立團隊仍然須要根據團隊的經驗及/或文獻所載的比率來估計發生率。 由於機率估計基礎為團隊經驗,儘管會有很大的變異程度,仍然優於完全沒有估計機率。

當團隊處於明顯對估計比率沒有共識的時候,可以從「固定」起始點附近的機率開始進行估計,例如將某項事件的錯誤率訂定為每1,000次嘗試會發生1次錯誤( `1×10^(-3)`),藉此來促進團隊的討論。 爾後,團隊將能在最終估計結果定案前,透過向上或向下的疊代過程調整其估算的內容。 實際上,團隊會在估計錯誤率及處於風險行為的比率的任務中快速便利地獲得進展。

範例:病人手圈辨識

以下為一個團隊進行機率估計的範例,請思考在給藥時出現手圈確認錯誤的機率。 這是一個常見且不易在事件調查中找到的風險行為,特別是在組織整體的通常率方面而言。

護理人員花費很長的當班時間了解他們的病人、病人的診斷及藥物。 儘管有明訂必須在給藥前確認病人識別手圈的政策或程序,護理人員也承認,在實務上,因為各種不同的理由,他們普遍無法完成這個安全性的檢查工作。

調查團隊可以詢問他們,無法正確識別的機率是每發給100次藥物中,會發生1次、5次或50次。 透過這個重複的詢問過程,跨職類專業團隊就可以完成符合該機構文化通常的機率估計。

經驗告訴我們,這樣的團隊估計結果會比從事件數據資料中得到的比率更貼近真實、能使人接受。無巧不巧,這些結果也通常會比院內高階管理層所預測的比率更加準確。

圖 9、估計機率之對數平均數法

如果機率難以估計,可以由信賴區間的上界與下界進行判斷:

  • 估計討論中現象發生機率信賴區間的上界與下界。
  • 平均上界與下界的對數。
  • 相同因子之上下界對數的「對數平均數」小於上界,並大於下界。因此,此數介於估計範圍的幾何中間位置。
  • 以圖 9 為例,算術平均數為:
    ` (0.01 + 0.1) / 2 = 0.055 `
    亦即下界的 5.5 倍,及上界的 0.55 倍。
  • 在EXCEL中:
    機率下界
    = `P_L` = 0.01
    機率上界 = `P_U` = 0.1
    上界及下界平均 `= avgB`
    `=(LOG(P_L) + LOG(P_U))/2`
    `=((-2) + (-1))/2`
    `= ((-3))/2`
    `= -1.5`

    對數平均數
    `= POWER(10,AvgB) `
    `= POWER(10, (-1.5)) `
    `= 0.0316228`

機率數據資料的來源

  • 製造商的數據資料
  • 產業共識標準
  • 美國軍方標準
  • 歷史證據 ─ 相同或相似的系統(體系)
  • 模擬/測試結果
  • 德菲估計(Delphi estimates)
  • WASH-1400 (NUREG-75/014)報告(關於核電廠應用的若干出版品)
  • 美國電機電子工程師學會IEEE 500標準
  • 其他列在「機率數據資料」段後的參考文獻
表一、常見事件錯誤率
活動 錯誤率
處置中遺漏/物品插入錯誤 `3×10^(-3)`
自我檢查的簡單計算錯誤 `3×10^(-2)`
作業員監督的檢查員錯誤 `10^(-1)`
一般等級/高壓/危險作業 `2×10^(-1)  ~ 3×10^(-1)`
不當使用檢查規定 `10^(-1)  ~ 9×10^(-1)`
`(5 × 10^(-1) avg)`
「遺漏/10項查檢表」的錯誤 `10^(-4)  ~ 5×10^(-3)`
`(10^(-3) avg)`
執行「廠方政策/未檢查操作者」 `5×10^(-3)  ~ 5×10^(-2)`
`(10^(-2) avg)`
選擇錯誤的「控制/相同歸類控制組」 `10^(-3)  ~ 10^(-2) `
`(3 × 10^(-3) avg)`

一些影響操作人員錯誤機率的因素

  • 經驗
  • 壓力
  • 訓練
  • 個人自我紀律/責任心
  • 疲勞
  • 對錯誤後果的認知(對自己/他人)
  • 使用指引及查檢表
  • 過去經驗對錯誤的認知
  • 任務特性─複雜度/重複性

割集

割集(Cut Set)定義

  • 割集是任何一個故障樹的引發事件(initiators/basic event基本事件)路徑集合,如果全部發生,將會引發最頂端(TOP)的事件。
  • 最小割集(minimal cut set)是故障樹中引發事件(基本事件)到最頂端事件的最短路徑集合,如果全部發生,將會引發最頂端(TOP)的事件。

尋找割集

  1. 忽略引發事件(基本事件)以外的所有故障樹組成元件。
  2. 直接從最頂端事件的下面開始,給每一個閘門(gate,最上層閘門為「A」)分配一個獨立的字母(或文字)標記。請勿重複使用字母(或文字)。
  3. 直接從最頂端事件的下面開始,給每個引發事件分配一個獨立的數字標記。如果一個基本引發事件出現超過一次,每次出現請使用同一個數字表示。
圖 6、空白故障樹
圖 7、填入引發事件及閘門標記的故障樹

從頂端事件逐步往下,由閘門A開始,使用字母(或文字)及數字標記建構矩陣。

    • 將所有閘門/引發事件用的字母(可以為複數,如AA)/數字(可以為複數,如11)放回所有的「及(AND)」閘門,在矩陣中同一行水平顯示。
    • 將所有閘門/引發事件用的字母(可以為複數,如AA)/數字(可以為複數,如11)放回所有的「或(OR)」閘門,在矩陣中垂直顯示。 每形成一個新的「或」閘門取代行時,必須包含所有在原始母行中可以找到的項目。
  1. 最終的矩陣僅會顯示表示引發事件的數字標記。矩陣的每一行都是用布林邏輯(Boolean)顯示的割集。
  2. 透過檢查,淘汰包含所有建構在次要行中元件的任何行。
  3. 淘汰在行中的冗餘元件及與其他行重複的行。餘存的行為「最小割集」。

流程步驟說明

圖 8、割集矩陣產生最小割集

{第一行,由左至右閱讀}

  1. 第一行閘門為A,記入起始矩陣。
  2. A為「及(AND)」閘門;將B及D以水平方式記入取代之。
  3. B為「或(OR)」閘門;將1及C以垂直方式記入取代之。每個事件需要使用矩陣的新列。
  4. C為「及(AND)」閘門;將2及3以水平方式記入取代之。

{第二行,由左至右閱讀}

  1. D(最上一行)為「或(OR)」閘門;將2及4以垂直方式記入取代之。用2取代原本記D的位子。複製此行成為新行,並把2改成4。
  2. D(第二行)為「或(OR)」閘門。同上,以垂直方式取代為2及4。取代D同時在矩陣中新增一行。
    矩陣中所有行皆為「割集」。
  3. 將同一行重複的數字刪除: 2-2-3 → 2-3
    刪除包含其他行數字的行:如2-4-3此行包含了2-3,因此雖然2-4-3也是割集,但並不是包含相同引發事件的最小割集,故將2-4-3此行刪除。
    矩陣最後的內容:1-2/2-3/1-4皆為「最小割集」。
    最小割集行是引發頂端事件的「最少引發事件集合」。

割集用途

表 2、最小割集
  • 評估頂端不良事件的機率: ` P_T ≅ ∑ P_e `
    割集機率(`P_k`)是割集內所有事件發生機率的乘積,是割集引發頂端事件的機率。 ` P_k = ∏ P_e `
    表 2 之中:
    第一行: ` P_k^1 = P_1 × P_2 `
    第二行: ` P_k^2 = P_1 × P_3 `
    第三行: ` P_k^3 = P_1 × P_4 `
    第四行: ` P_k^4 = P_3 × P_4 × P_5 × P_6 `
    ` P_T ≅ ∑ P_e = P_k^1 + P_k^2 + P_k^3 + P_k^4 `
  • 評估「重要性」
    • 評估割集結構的「重要性」。 分析結構重要性是能針對系統失效(故障)之因素進行定性(質性)分級排序。 若其他的條件都是相同的…
      • 「長割集」表示漏洞/弱點小(舉例來說,表 2 中的第4行)。
      • 「短割集」表示漏洞/弱點較大(舉例來說,表 2 中的第1~3行)。
      • 有許多割集存在表示漏洞/弱點較大。
      • 單一割集表示是潛在的「單點失效(Single-Point Failure)」。
    • 評估割集量化的「重要性」。 割集(`I_k`)的量化重要性是引發頂端事件的數字機率,已於割集介紹過。
      `I_k = P_k / P_T `
      其中 `P_k = ∏ P_e ` 代表最小割集。
      定量分析的重要性是能使系統失效(故障)之因素進行數字分級排序。 最有效的降低系統弱點,最重要的就是針對割集進行改善。 一般而言,短割集重要性較高,長割集重要性較低。
    • 評估割集項目(事件)的「重要性」。 單一項目(`I_e`)定量分析的重要性,在於其能夠提供此單一項目引發頂端事件的數字機率。

      ` I_e ≅ ∑^(N_e) I_(ke) `
      ` N_e ` = 包含項目「e」的最小割集數
      ` I_(ke) ` = 包含項目「e」的最小割集重要性
      範例:項目1重要性:
      ` I_1 ≅ ((P_1 × P_2) + (P_1 × P_3) + (P_1 × P_4)) / P_T `
  • 評估「常見原因」
    • 找到常見原因的漏洞(弱點)
    • 分析常見原因發生機率
圖 9、割集用途:常見原因漏洞(弱點)

圖例說明:為引發事件增加唯一的下標符號,使用小寫字母表示常見原因的易感受性,如「m」表示濕氣、「h」表示人員作業、「q」表示熱氣、「v」表示震動 … 等。 有些引發事件可能容易受到好幾種常見原因的影響,並有幾種相應的下標符號標示。有些引發事件則可能沒有任何常見原因漏洞 — 無下標符號標示。

在這個割集裡的所有引發事件都易感於濕氣這個漏洞,濕氣即是常見因素且會引發頂端事件。
建議:給予一個或多個項目防潮對策。

more cut set diagrams

路徑集

路徑集(Path Set)定義

  • 路徑集是故障樹中引發事件(基本事件)的集合,如果沒有任何一個事件發生,可以保證頂端事件(TOP)不會被引發。
  • 路徑集機率( `P_p`)是系統在依照其路徑所訂的作業程序中遭遇一點(個)或多點(個)錯誤的機率。

尋找路徑集

  • 將所有「及(AND)」閘門與「或(OR)」閘門對調,以尋找路徑集。即是將所有「及(AND)」閘門改為「或(OR)」閘門,並將所有「或(OR)」閘門改為「及(AND)」閘門。
  • 然後繼續使用如同用於割集的矩陣架構。結果即為路徑集。

使用路徑集增加可靠度(Reliability)

  • 為使失效(故障)機率減到最小,應將路徑集機率減到最小(短)。
  • 將對策資源散佈於路徑集當中。 計算每個新調整後的路徑集內容項目之機率減少量。 選擇 ` (ΔP_p) / (Δ$) ` 最有效益的整體對策。
圖 10、割集轉換為路徑集

降低弱點(Vulnerability):總括一覽

  • 檢查樹狀圖─尋找/處理主要的PT(頂端不良事件機率)促成因素
    • 增加干預/重複(冗餘)法(延伸割集)
    • 減少組成元件(增加強度/降低錯誤發生率 `P_e` )
    • 加強維修保養/零組件補充更換(延長平均故障間隔時間 MTBF)
  • 檢查/修改系統架構─增加路徑集/割集比
  • 評估割集重要性。使用單一項目( `I_e`)分析排序項目(事件),找出可以改善的項目。
  • 評估路徑集機率。減少最有效益的整體對策( ` (ΔP_p) / (Δ$) `)內的路徑集機率( `P_p` )。

針對所有新的對策,思考對策○○○的 • 成本 • 效能 • 可行性(包含進度時程)
以及
新的對策○○○會不會 • 引發新的危害? • 損壞甚至癱瘓系統?

一些「及(AND)」閘門的特性

圖 12、免除單點失效(Single-Point Failure)

成本:假設兩個相同的元件 `P = 0.1`
TOP `P_T = 0.01`
兩個元件(引發事件) `P = 0.1` 之成本可能比單一個元件 `P = 0.01` 來得低。
重複(冗餘)法可確保當 之中任何一個失效(故障)時,不會引發頂端事件。


重要性測量

什麼是重要性測量?

一種針對那些「影響風險」與「影響零組件改變之風險敏感度」的個別因素,有效用來進行分隔、尋找、及量化數值的方法。常見的重要性測量包括:
  • FV重要度指標(Fussell-Vesely)
  • 降低風險或風險降低值(Risk Reduction Worth, RRW)
  • 增加風險或風險增加值(Risk Achievement Worth, RAW)
  • Birnbaum重要度
  • 系統及元件失效

計算範例


引發事件

T = 1/year
A = 6×10-4
B = 1×10-2
C = 3×10-3
D = 1×10-3

最小割集

TA = 1/year × (6×10-4) = 6×10-4
TBC = 1/year × (1×10-2) × (3×10-3) = 3×10-5
TCD = 1/year × (3×10-3) × (1×10-3) = 3×10-6
Σ(minimal cut sets) = F(x) = 6.33×10-4

FV重要度指標(Fussell-Vesely)

  • 量計包含引發總風險的特定基本事件之割集總和貢獻百分比。
  • 找尋引起特定基本事件(xi)的割集值,並除以所有割集的總風險值(基準風險 baseline risk),計算得出FV值。
    FVxi = F(i) / F(x)

    F(i)為從包含事件xi的割集計算的風險
    F(x) 為所有割集的風險總和
  • FV值範圍從0至1(0% to 100%)。
FVT = FT ÷ F(x)
FVT = (6.33×10-4) ÷ (6.33×10-4)
FVT = 1.0

FVA = FA ÷ F(x)
FVA = (6.00×10-4) ÷ (6.33×10-4)
FVA = 0.948

FVB = FB ÷ F(x)
FVB = (3.00×10-5) ÷ (6.33×10-4)
FVB = 0.047

FVC = [FC + FD] ÷ F(x)
FVC = [(3.00×10-5) + (3.00×10-6)] ÷ (6.33×10-4)
FVC = 0.052

FVD = FD ÷ F(x)
FVD = (3.00×10-6) ÷ (6.33×10-4)
FVD = 0.005

降低風險

  • 計算基本事件失效率為0(即從不失效)的假設下,總風險會減少的計數。
  • 計算代表「風險總和的所有割集值(基準風險)」與「失效率(xi)設定為0的引發特定基本事件總風險值」兩者間的比(ratio)或差異。
    比(ratio): RRRxi = RRWxi = F(x) / F(0)
    差異(或間隔距離): RRIxi = F(x) - F(0)
    其:
    F(x)為「所有割集」及「所有基本事件的名目失效率」的總風險
    F(0)為所有基本事件xi失效率設定為0時的總風險
  • 風險降低比範圍從1至無限大(∞)
  • 風險降低如Fussell-Vesely重要度提供一樣的等級順序。
  • 在核電廠維護法規(10 CFR 50.65)、美國核能協會NUMARC Guide 93-01(通過美國核能管制委員會許可)規定中,使用1.005作為風險降低比是否顯著的標準
    等同Fussell-Vesely重要度0.005。
RRRT = F(x) ÷ (0)
RRRT = (6.33×10-4) ÷ (0) = ∞

RRRA = F(x) ÷ (0 + TBC + TCD)
RRRA = (6.33×10-4) ÷ (3.3×10-5)
RRRA = 19.18

RRRB = F(x) ÷ (TA + 0 + TCD)
RRRB = (6.33×10-4) ÷ (6.03×10-4)
RRRB = 1.05

RRRC = F(x) ÷ (TA + 0 + 0)
RRRC = (6.33×10-4) ÷ (6.00×10-4)
RRRC = 1.06

RRRD = F(x) ÷ (TA + TBC + 0)
RRRD = (6.33×10-4) ÷ (6.30×10-4)
RRRD = 1.00

風險增加值(Risk Achievement Worth, RAW)

  • 計算基本事件失效率為1(例如:停止服務或失敗的零組件)的假設下,總風險會增加的計數。
  • 計算代表「失效率設定為1的引發特定基本事件(xi)總風險值」與「風險總和(基準風險)」兩者間的比(ratio)或差異。
    比(ratio): RIRxi = RAWxi = F(1) / F(x)
    差異(或間隔距離): RIIxi = F(1) - F(x)
    其,
    F(x)為「所有割集」及「所有基本事件的名目失效率」的總風險
    F(1)為所有基本事件xi失效率設定為1時的總風險
  • 此「比」計算測量稱為風險增加值(Risk Achievement Worth, RAW)
  • RAW範圍為1以上(包含1)
    解釋引發事件的RAW時要非常小心,要記得在輸入資訊計算時,引發事件通常是用頻率而非機率。
  • 在核電廠維護法規(10 CFR 50.65)、美國核能協會NUMARC Guide 93-01(通過美國核能管制委員會許可)規定中,使用2作為風險增加值是否顯著的標準
RAWT = Σ[(T=1)A + (T=1)BC + (T=1)CD] ÷ (6.33×10-4)
RAWT = (6.33×10-4) ÷ (6.33×10-4)
0.00063 ÷ 0.00063
RAWT = 1.0 (RIIT = 0.0)

RAWA = Σ[T(A=1) + TBC + TCD] ÷ (6.33×10-4)
RAWA = (1.000033) ÷ (6.33×10-4)
RAWA = 1579.78 (RIIA = 0.9994)

RAWB = Σ[TA + T(B=1) + TCD] ÷ (6.33×10-4)
RAWB = (3.603×10-3) ÷ (6.33×10-4)
0.003603 ÷ 0.00063
RAWB = 5.691943128 ≈ 5.692 (RIIB = 0.00297)

RAWC = Σ[TA + TB(C=1) + T(C=1)D] ÷ (6.33×10-4)
RAWC = (1.16×10-2) ÷ (6.33×10-4)
RAWC = 18.32543444 ≈ 18.325 (RIIC = 0.010967)

RAWD = Σ[TA + TBC + TC(D=1)] ÷ (6.33×10-4)
RAWD = (3.63×10-3) ÷ (6.33×10-4)
RAWD = 5.734597156 ≈ 5.735 (RIID = 0.002997)

Birnbaum重要度

  • 計算因為個別基本事件發生機率改變而造成的總風險改變
  • 依照「當事件名目值改變時,產生的風險級別影響」來排列事件
    Bix = ∂F(x) / ∂x
    其:
    F(x)為「所有割集」及「所有基本事件的名目失效率」的總風險
    ∂/∂x 為特定基本事件(xi)風險式的一階導函數
  • 當風險式為線性型時
    Bixi = F(1) - F(0)
  • Bi範圍為0至累積引發事件的頻率數
    即是,如果Bi = 0時,表示風險敏感度是小的;Bi = 累積引發事件的頻率數時,表示風險敏感度是大的。
[ 如何找到函數式中的一階導函數請見 www.varsitytutors.com]
BiT = Σ[(T=1)A + (T=1)BC + (T=1)CD] − (0)
BiT = (6.33×10-4) − (0)
BiT = 6.33×10-4

BiA = Σ[T(A=1) + TBC + TCD] − (0 + TBC + TCD)
BiA = (1.0) − (3.3×10-5)
BiA = 1.0

BiB = Σ[TA + T(B=1)C + TCD] − (TA + 0 + TCD)
BiB = (3.603×10-3) − (6.03×10-4)
BiB = 3.0×10-3

BiC = Σ[TA + TB(C=1) + T(C=1)D] − (TA + 0 + 0)
BiC = (1.16×10-2) − (6.00×10-4)
BiC = 1.10×10-2

BiD = Σ[TA + TBC + TC(D=1)] − (TA + TBC + 0)
BiD = (3.63×10-3) − (6.30×10-4)
BiD = 3.0×10-3

路徑集與可靠度

圖13、為路徑集添加對策併計算最有利的。

路徑集機率(`P_p`)是系統在依照其路徑所訂的作業程序中遭遇一點(個)或多點(個)錯誤的機率。
`P_p ≅ ΣP_e`

  • 將對策資源散佈於路徑集當中。
  • 計算每個新調整後的路徑集內容項目之機率減少量。
  • 選擇 `(ΔP_p)/(Δ$)` 最有效益的整體對策。
  • 選擇結果可經由計算 `(ΔP_T)/(Δ$)` 比較候選對策,來進行驗證。

實踐場景

練習題 1、鬧鐘未能喚醒睡眠者

假定每年260次操作。 因果因素(和率作為錯誤/年)

  1. 鬧鐘的時針干擾內部機制:1次/20年
  2. 鬧鐘的時針脫落:1次/10年
  3. 電氣故障: 1次/15年
  4. 停電: 3次/1年
  5. 忘了設置鬧鐘: 2次/1年
  6. 鬧鐘機制故障: 1次/10年
  7. 忘了轉動鬧鐘: 3次/1年
  8. 夜間耳聾:微不足道

邏輯分析

  • [1] 和 [2] 導致〝{a}機械故障〞 (第四層級事件)
  • {a} 或 [3] 導致〝{b}有缺陷的內臟機〞 (第三層級事件)
  • {b} 或 [4] 或 [5] 導致〝{c}主插件時鐘失敗〞 (第二層級事件)
  • [6] 或 [7] 或 [8] 導致〝{d}備份(發條)時鐘失敗〞 (第二層級事件)
  • {c} 和 {d} 導致〝{e}鬧鐘失敗〞 (第一層級事件)
  • {e} 或 {f} 導致〝{g}人工喚醒失敗〞 (頂級事件)
圖 14、人工喚醒的 FTA 圖

練習題 2、鞏膜的壞血病 — 宇航員的禍害。

背景

所有返航的太空人中有10%感染了硬化性壞血症。 疾病潛伏期為13天。 之後一週,感染者開始出現包括萎靡不適、倦怠及易怒等症狀。 如在潛伏期中對受感染的太空人投予抗毒素,能夠100%發揮藥效,預防此疾病。 然而,如果對未感染的太空人投予抗毒素,則會出現方向定位障礙、混亂及增強所有不良的人格特質表現等副作用,副作用持續時間約為7天。 目前可在潛伏期中施行一項檢驗以確定太空人是否感染此疾病。 檢驗之結果大約有2%為偽陽性(未感染者判定為感染者),約有1%的偽陰性結果。

無論是對未感染的太空人進行治療或未對感染的太空人進行治療,皆為誤診瀆職。

問題

使用感染檢驗,以及依照檢驗結果需要使用抗毒素,則返航的太空人遭遇誤診瀆職情形的機率有多少?


練習題 3、尋找最小割集和路徑集


練習題答案

練習題 1、鬧鐘未能喚醒睡眠者

圖 14、人工喚醒的 FTA 圖

練習題 2、鞏膜的壞血病 — 宇航員的禍害。

圖16、宇航員壞血病的 FTA

練習題 3、尋找最小割集和路徑集

圖 11、割集轉換為路徑集(答案)

        

參考文獻:

  1. 陳曉惠
    集合的基本概念 2010-03-30 (22 slides) 467KB (22 slides)
  2. Clements PL.
    邏輯閘概率計算 3,055KB (11 slides)
  3. Clements PL.
    Event Tree Analysis 1990-06-30 2nd Edition (13pp)
  4. Clements PL.
    Fault Tree Analysis 1993-05-30 4th Edition (96pp)
  5. Abecassis ZA, McElroy LM, Patel RM, Khorzad R, Carroll C, Mehrotra S. Applying fault tree analysis to the prevention of wrong site surgery.
    J Surg Res 2014; 193(1): 88-94.
  6. Hyman WA, Johnson E. Fault tree analysis of clinical alarms.
    thehtf.org 2014; 193(1): 88-94.
  7. Marx DA, Slonim AD. Assessing patient safety risk before the injury occurs: an introduction to sociotechnical probabilistic risk modelling in health care.
    qualitysafety.bmj.com 2003; 12 (Suppl II): ii33-ii38. [probability data]
  8. Wreathall J, Nemeth C. Assessing risk: the role of probabilistic risk assessment (PRA) in patient safety improvement.
    qualitysafety.bmj.com 2004; 13: 206-212. [probability data]
  9. NEBOSG National Diploma. Fault Tree Analysis (FTA) and Event Tree Analysis (ETA)
    www.icao.int 2004; 13: 206-212. [bow-tie model]
  10. Lyons M, Adams S, Woloshynowych M, Vincent C. Human reliability analysis in healthcare: a review of techniques.
    International Journal of Risk & Safety in Medicine 2004; 16: 223-237. [probability data] VIP REVIEW
  11. McElroy LM, Khorzad R, Rowe TA, Abecassis ZA, Apley DW, Barnard C, Holl JL. Fault Tree Analysis: assessing the adequacy of reporting efforts to reduce postoperative bloodstream infection.
    American Journal of Medical Quality 2017; 32(1): 80-86.
  12. Charters DA, Barnett JR, Shannon M, Harrod P, Shea D, Morin K. Assessment of the probabilities that staff and/or patients will detect fires in hospitals.
    Fire Safety Science Proceedings of the fifth international symposium. pp. 747-758. [probability data]
  13. Rice WP. Medical Device Risk Based Evaluation and Maintenance Using Fault Tree Analysis.
    Biomedical Instrumentation & Technology 2007; 41(1): 76-82.
  14. Department of Mechanical Engineering (UT Austin) Reliability
    www.me.utexas.edu 2002; May 28.
  15. Precalculus: Find the First Derivative of a Function
    www.varsitytutors.com