9)數據處理
在安全檢測檢驗中,通常用隨機抽取的樣本來推斷總體。為了使樣本的性質充分反映總體的性質,在樣本的選取上遵循隨機化原則:樣本各個體選取要具有代表性,不得任意刪留;樣本各個體選取必須是獨立的,各次選取的結果互不影響。
若采用了無效或無代表性的數據,會造成檢查、檢測結果錯誤,得出不符合實際情況的評價結論。對獲得的數據在使用之前,要進行數據處理,消除或減弱不正常數據對檢測結果的影響。在處理數據時常注意以下幾種數據特性。
(1)概率。隨機事件在若干次觀測中出現的次數叫頻數,頻數與總觀測次數之比叫頻率。當檢測次數逐漸增多時,某一檢測數據出現的頻率總是趨近某一常數,此常數能表示現場出現此檢測數據的可能性,這就是概率。在概率論中,把事件發生可能性的數稱為概率。在實際工作中,我們常以頻率近似地代替概率。
(2)顯著性差異。概率在0~1的范圍內波動。當概率為1時,此事件必然發生;當概率為0時,此事件必然不發生。數理統計中習慣上認為概率P≤0.05為小概率,并以此作為事物間差別有無顯著性的界限。
原設定的系統,若系統之間無顯著性差異(通過顯著性檢驗確定),就可將其合并,采用相同的安全技術措施;若系統之間存在顯著性差異,就應分別對待。
數據整理和加工有3種基本形式:按一定要求將原始數據進行分組,作出各種統計表及統計圖;將原始數據由小到大順序排列,從而由原始數列得到遞增數列;按照統計推斷的要求將原始數據歸納為一個或幾個數字特征。
10)“異常值”和“未檢出”的處理
(1)“異常值”的處理。異常值是指現場檢測或實驗室分析結果中偏離其他數據很遠的個別極端值,極端值的存在導致數據分布范圍拉寬。當發現極端值與實際情況明顯不符時,首先要在檢測條件中直接查找可能造成干擾的因素,以便使極端值的存在得到解釋,并加以修正。若發現極端值屬外來影響造成則應舍去;若查不出產生極端值的原因時,應對極端值進行判定再決定取舍。
對極端值有許多處理方法。在這里介紹一種“Q值檢驗法”。
“Q值檢驗法”是迪克森(W.J.Dixon)在1951年專為分析化學中少量觀測次數(n10)提出的一種簡易判據式。檢驗時將數據從小到大依次排列:X1,X2,X3,…,Xn-1,Xn,然后將極端值代入以下公式求出Q值,將Q值對照表3的Q0.90,若Q值≥Q0.90則有90%的置信此極端值應被舍去。
式中 及 ——極端值與鄰近值間的偏差;
——全距。
例:現場儀器測在同一點上4次測出:0.1014,0.1012,0.1025,0.1016,其中0.1025與其他數值差距較大,是否應該舍去
根據“Q值檢驗法”:
(4次觀測的Q0.90=0.76)
所以,0.1025不能舍棄,測出結果應用4次觀測均值0.1017。
(2)“未檢出”的處理。在檢測上,有時因采樣設備和分析方法不夠精密,會出現一些小于分析方法“檢出限”的數據,在報告中稱為“未檢出”。這些“未檢出”并不是真正的零值,而是處于“零值”與“檢出限”之間的值,用“0”來代替不合理(可造成統計結果偏低)。“未檢出”的處理在實際工作中可用兩種方法進行處理:將“未檢出”按標準的1/10加入統計整理;將“未檢出”按分析方法“最低檢出限”的1/2加入統計。總之,在統計分組時不要輕易將“未檢出”舍掉。
(3)檢測數據質量控制。檢測質量控制經常采用兩種控制方式來保證獲得數據的正確性:一是用線性回歸方法對原制作的“標準曲線”進行復核;二是核對精密度和準確度。
記錄精密度和準確度最簡便的方法是制作“休哈特控制圖”,通過控制圖可以看出檢測、檢驗是否在控制之中,有利于觀察正、負偏差的發展趨勢,及時發現異常,找出原因,采取措施。
(4)安全評價的數據處理。收集到的數據要經過篩選和整理,才能用于安全評價。數據要:來源可靠,收集到的數據要經過甄別,舍去不可靠的數據;數據完整,凡安全評價中要使用的數據都應設法收集到;取值合理,評價過程取值帶有一定主觀性,取值正確與否往往影響評價結果。
為提高取值準確性可從以下三方面著手:嚴格按技術守則規定取值;有一定范圍的取值,可采用內插法提高精度;較難把握的取值,可采用向專家咨詢方法,集思廣益來解決。