流行病学数据分析基础:识别和控制混杂
識別和控制混雜
(一)控制混雜的必要性和原理
混雜是一種由于暴露因素對某疾病的作用與其他病因對同一疾病的作用在同一個研究里交織在一起所引起的在暴露效應估計上的誤差。混雜是一種偏倚,一種在暴露與結局關系上的偏倚,混雜因素必須同時具備一下三個條件(圖2):一、是疾病確定的病因或危險因素,即圖2里性別必須是肺癌的真正病因或危險因素;二、不是暴露和疾病關系之間的中間因素,如性別不可能是吸煙和肺癌之間的中間因素;三、在目前的研究中與暴露因素有關,即可疑的混雜因素在暴露組和非暴露組存在差異或叫不可比,如吸煙人群中男性占比高于不吸煙人群。結果是,在研究吸煙與肺癌關系的研究中,如果性別是混雜因素,性別將會扭曲吸煙與肺癌的關系,低估或高估吸煙對肺癌危險的作用。
圖2 流行病學研究中暴露因素、結局事件和混雜因素
在觀察性研究里,混雜是普遍的。因此,觀察性研究對混雜的控制是必要的,需控制的因素必須首先符合前兩個條件,控制的原理是切斷第三個條件,即去除可疑危險因素在暴露組和非暴露組之間的區別或迫使它們可比。對于前兩個條件的判斷,必須基于現有最好的、來自其他研究的發現或證據,而不是根據目前研究中的結果。如果控制了不符合前兩個條件的因素,可能會引起不必要的偏倚。切斷第三個條件,指在目前研究中切斷第三個條件,從研究設計上有三種方法:限制、匹配和隨機分組;在數據分析階段也有三個方法:直接標化法、分層分析和多元回歸。
隨機分組(random allocation)使隨機對照試驗中比較組之間所有可能的已知和未知的混雜因素得到平衡和可比,從而同時切斷了所有可能的混雜因素的第三個條件,是所有控制混雜的方法中最簡單、最有效的方法,因此隨機對照試驗無需在數據分析階段采取混雜控制措施。但是,隨機分組只能用于干預性研究,不能用于病因研究。其他控制混雜的方法主要適用于非隨機分組的對照試驗和觀察性研究。
文章剩余內容查看<<<<<<
?
總結
以上是生活随笔為你收集整理的流行病学数据分析基础:识别和控制混杂的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 怎么使用ChatGPT写代码?
- 下一篇: 怎么使用ChatGPT写论文?