當前位置:文思屋>社會工作>財會金融>

醫學統計學基礎概念整理2017

文思屋 人氣:3.16W

統計學是研究資料的收集、整理和分析的一門科學。其工作流程為設計、蒐集、整理、分析與結果報告。打個通俗的比喻,統計學就好比“打牌”,抓牌就是蒐集資料,牌抓好後要整理一下,然後研究怎麼打就是分析,打的輸贏就是結果報告。下面是本站小編為大家帶來的關於醫學統計學基礎概念整理的知識,歡迎閱讀。

一.總體與樣本

總體:是指根據研究目的所確定的觀察單位某項特徵的集合。比如說我想研究山西醫科大學所有在校生的平均體重,那根據此目的,我們研究的總體就是:山西醫科大學所有在校生的體重資料的集合。但是需要註明一點:總體分為有限總體和無限總體,上面的例子就是有限總體,畢竟山西醫科大學學生還是有限的,然而科研過程中面臨的大多數是無限的總體,我們是無法取得其總體進行研究的。那我們面對無限總體怎麼辦呢?

我們為了研究無限總體,發明了抽樣的方法。就像我們想知道一鍋老母雞湯的鹹淡,不需要喝完所有的湯,只要搖勻,嘗其一勺就可以了,這種思想就叫“抽樣”。

樣本:就是從總體中抽出的部分觀察單位某項特徵的集合。但是在抽樣過程中必須遵守隨機化的原則。

隨機化原則:是指總體中的任何一個觀察單位都要有同等的機會被抽到作為樣本進行研究。那麼如何保證隨機化抽樣呢,一般包括單純隨機抽樣、系統抽樣、分層抽樣、整群抽樣和多級抽樣等方法。

二.引數與統計量

引數:用於描述總體特徵的指標;

統計量:用於描述樣本特徵的指標;

總體、樣本、引數與統計量的關係如下圖。

統計學就是通過描述樣本的統計量去推斷描述總體的引數。這是通過偶然去發現必然的過程,通過一般去發現普遍的過程,是以小見大的過程。

三.誤差

誤差:觀察值與真知之差。即我們通過一次試驗得到的結果與事件真實結果之間的差值。誤差根據其產生的原因,分為四種:

(1)系統誤差:因為試劑未校正或儀器沒有調零等因素造成的研究結果傾向性的增大或減小。如我們路過藥房,門口放個一個體重計,請問我們在稱自己的體重之前,首先要乾的第一件事情是什麼呢?從統計學角度,我們應該看看體重計上的指標是不是對準零,如果本身就有5Kg底重,那我們所有的同學去稱,都將會重5Kg,即發生傾向性的偏大。其特點:傾向性的增大或減小,如果我們就行調零,就可以避免。

(2)隨機誤差(random error):是由各種偶然因素造成的觀察值與真值之差。比如班級所有同學用同一把尺子測量我的身高,結果發現我的身高值是不一樣的。其特點為:不可以避免,但可以減少。統計學有一定律叫做“測不準定律”,不管你怎麼測,就是測不準,因此我們通常多次測量後取平均。

(3)抽樣誤差(sampling error):因為抽樣造成的樣本統計量與總體引數之間的差異。有人會說,剛才那一勺老母雞湯的鹹淡應該和鍋裡湯的鹹淡是完全一樣的啊,是的,但上面的例子是在講抽樣的原理,而我們科學研究和喝老母雞湯是不一樣的,因為湯裡的氯化鈉是均勻分佈的,而我們科學研究的目標事件是不均勻分佈的。比如某個班級120名同學的近視眼患病率為50%,我按照隨機化原則隨機抽取50名同學,則50名同學的近視眼患病率絕對不等於50%,因為近視眼同學在班級中的`分佈是不均勻的。因此抽樣誤差的特點為:不可以避免,但可以減少。我們可以通過增大樣本量進行減少。

(4)過失誤差(gross error):

由於觀察過程中的不仔細造成的錯誤判斷或記錄。過失誤差可以通過仔細核對進行避免。

那我們統計學的存在主要是解決那種誤差呢?我們通過統計設計減少系統誤差、通過統計學檢驗去排除抽樣誤差的。

四.概率與頻率

概率(P):用於反映某一事物發生可能性大小的一種量度。一般用大寫的斜體P表示。

我們根據事物發生概率的大小,把事件分為3類:P=1為必然事件,發生率為100%;P=0為不可能事件,發生率為0;0

頻率(f):是指我們進行了N次試驗,其中一個事件出現的次數m與總的試驗次數N的比值。

問題是:我們到底如何能夠得到某一事件發生的概率呢,比如說誰能夠告訴我一個半截粉筆從講臺上掉下摔斷的概率P=?。我們至今的科學發展也沒有辦法通過公式去計算該值。那我們是怎麼做的呢?有句話叫做“有些事情越想越煩,做起來卻極其簡單”。我們只需要那兩盒同樣的粉筆進行重複摔就可以了,如果總共100支粉筆,斷了98只,那斷的頻率就等於f=98/100=0.98。而統計學上證實,當某事件發生次數較多時,頻率就會接近於概率。意即f=P。因此,其實我們就是通過頻率去估計概率的。

五.同質與變異

同質:是指觀察單位所受的影響因素相同。而我們科研的觀察單位所受的影響因素只可能相對的相同,不可能絕對的相同,因此,同質是相對的。

變異:是指觀察單位在同質的基礎上的個體差異。天底下沒有兩個完全一樣的事物,唯一不變的就是變化。因此,變異是絕對的。

這一對概念對我們研究統計的意義:如果沒有同質的話,就沒有我們研究的總體或者樣本。因為如果不同質,我們是不可能把他們放在一起進行研究的。如果沒有變異,就根本沒有統計學產生的必要,因為如果沒有變異,我們拿一種藥物治療某病的一個病人,如果有效,該藥對所有該病病人都應該有效,這是不可能的。

六.試驗vs實驗

試驗——對已知事物結果的探索過程:為了檢視某事的結果或某物的效能而從事某種活動。

實驗——已有明確的結論/假說後的驗證過程:為了檢驗某種科學理論或假設而進行某種操作或從事某種活動。

從上述來自《現代漢語詞典》的兩個解釋,可以看出:實驗中被檢驗的是某種科學理論或假設,通過實踐操作來進行;而試驗中用來檢驗的是已經存在的事物,是為了察看某事的結果或某物的效能,通過使用、試用來進行。

在我們實際應用中,很多詞彙中到底是用“試驗”還是“實驗”是已經根據前人的經驗明確了的。比如RCT(Randomized Controlled Trial),我們會叫“隨機對照試驗”,我想多半是因為翻譯的過程中Trial翻譯為“試驗”更為合適。而RCT中,患者被分為兩組時,則被稱為“實驗組”(Treatment Group)和對照組(Control Group)。

七.病人/患者vs受試者/研究物件

這兩組詞,也許沒有必要把定義在貼上來了,因為他們的區別顯而易見。病人/患者的稱法,當然應該用於病人和患者的身上。如果研究是在健康人或者潛在患者人群中開展的,此時研究物件還不能確定為病人/患者,那麼只能稱其為受試者或研究物件。相似的,在產科的研究中,如果研究物件為一般的產婦,我們通常也不應該用“患者”或“病人”這樣的稱謂。

研究物件可以說是一個萬金油,什麼時候用都是可以的。而受試者我們又要說一下了,“受試者”常與某種干預聯絡在一起,通常僅在干預性研究(RCT、類實驗)和診斷試驗中才會使用。

八.終點vs結局

結局(Outcome)——研究中患者可能出現的一種結果:某種疾病或某種狀態影響下的(人的)最終(健康)狀態。

終點(Endpoint)——研究中患者某一結果的替代指標:用於在研究中判斷干預或因素作用效果的某種“結局”。

在臨床研究中,結局通常是指患者的某種轉歸,比如腫瘤患者中,痊癒、死亡、復發、轉移這些都可以作為結局。當然,干預或某種因素暴露下短期的改變也可以成為結局,比如紅血球的升高、體溫降低等等。而終點,則是臨床研究中的效應評價點,比如主要終點、次要終點,此時用“結局”就不合適了。

上面這些看起來很頭疼吧,那就記個最簡單的。一般在試驗性研究中(比如在RCT)我們一般使用“終點”,生存分析是有時也會用觀察終點這一說法;而在其他型別的研究中,常使用“結局”。

九.排除vs剔除

所謂的排除標準就是考慮到研究的可行性和研究物件的安全,將一部分無法保證研究物件安全及不可行的符合入選條件的研究物件排除在研究之外。針對研究物件開始進行研究前,不將符合排除標準的物件作為研究物件納入,這就是排除。

在臨床研究中,根據入選排除標準確定研究物件之後,在研究中我們還會發現一些患者無法接受進一步干預或觀察,或者在研究期間才能發現研究物件的某些特徵不屬於我們將要外推的範圍。此時雖然這些物件在研究初期被確定為“研究物件”,認為他們屬於研究結果將要外推到的人群,但實際上他們並不屬於該類人群。這時我們就要將該類研究物件“剔除”出研究,相應的標準就是剔除標準。

簡而言之,排除是在研究初期用於選擇研究物件的;剔除是在研究中期用於去除隨時發現的非外推人群的研究物件。