【初心者向】交絡因子の見つけ方や補正方法は?統計での調整も徹底解説!

こんにちは!大学院で統計を勉強してるそらです!

交絡因子の見つけ方が分からない・・・補正や調整ってどうやるの?という方も多いと思います。

そこで今回は交絡因子の見つけ方や補正・調整方法についてまとめています!

交絡、交絡因子の見つけ方

  • 先生に聞く
  • 先行研究など似ている研究の論文を参考にして交絡となる変数を入れる
  • 重回帰分析でデータが変わったら交絡
  • 交絡だと思うものを全て入れる
  • 〇×付けて調べる

研究の計画段階での調整
1.無作為化 2.制限 3.マッチング

統計解析段階での調整
1.層別化 2.標準化 3.回帰

となります。

では詳しく見ていきましょう!

交絡、交絡因子の見つけ方

先生に聞いてみたところ・・・

 

「交絡の見つけ方ってあるんですか」

「見つけ方といわれても・・・何となく分かるでしょ!

「・・・( ^ω^)(分かりません)」

 

慣れてくると感覚で分かるらしいです。

 

他には、

詳しい教授に聞く

どの変数が交絡となるか討論する

という方法も。

 

犬くん
犬くん
聞ける人なんていない!

という人は、

  • 先行研究など似ている研究の論文を参考にして交絡となる変数を入れる
  • 交絡だと思う変数を入れる前と入れた後でそれぞれ重回帰分析をして、データが変わるかどうかで見る(変わったら交絡)
  • 交絡だと思うものを全て入れて解析する(肺がんにかかるリスクであれば、性別、年齢、喫煙など)
  • 交絡3要素と変数の表を作って〇×を付けて調べていく↓

という方法もあります。

犬くん
犬くん
聞ける人がいるなら聞くのが一番

交絡因子を排除するには?交絡の補正・調整方法

交絡因子を排除するための補正や調整方法は、大きく分けて研究前の計画段階での調整と、データを集め終わった後の統計解析段階での補正方法があります。

研究の計画段階での調整
1.無作為化 2.制限 3.マッチング

統計解析段階での調整
1.層別化 2.標準化 3.回帰

研究の計画段階での調整

無作為化

交絡因子が分からないという時に有効なのが、無作為化です。

「介入研究」での手法でランダム化比較試験※などがあります。

すでにあるデータを分析する「観察研究」ではできません・・・。

※ランダム化比較試験(無作為化比較試験):研究の対象者を2つ以上のグループにランダムに分け(ランダム化)、治療法などの効果を検証することです。 ランダム化により検証したい方法以外の要因がバランスよく分かれるため、公平に比較することができます。

出典:国立研究開発法人国立がん研究センター

制限

研究を行う際、交絡因子となりそうな集団を含めないよう対象集団を制限することです。

ただし、交絡因子が多い場合、制限により人数が減ってしまい検出力の低下や妥当性の減少に繋がります。

 

例えば、お酒と肝臓癌の関係を研究する場合、対象者が昭和33年予防接種をした人(注射針の使いまわし)や輸血経験者は交絡因子となる可能性があります。

これを防ぐには影響のない者に限定して対象者とする必要があります。

マッチング

交絡因子となりそうな要因を持つ人同士をペアにして比較することで交絡の影響を最小限にすることができます。

例えば、肺がんの罹患に年齢差がある場合には、症例と対照の年齢が一致するように対応させて対象者を設定します。

複数の交絡因子を扱えますが、マッチングの指標となる項目は、病気の危険因子としては考えられなくなります。

統計解析段階での調整

層化(サブグループ解析)

収集したデータをグループ(層)に分けて、層ごとに解析する方法です。

 

例えば年齢や性別、喫煙の有無、飲酒の有無などによって患者をグループ分けし、比較します。

交絡因子がたくさんあるときは使えません。

標準化

結果に影響をすると考えられる要因により重み付けをしてから分析します。

例えば「年齢調整死亡率」などのように、1つの基準に合わせて結果を調整します。

 

都道府県別の死亡率を見る場合、高齢者の多い地域では死亡率が高く見えてしまいます。

これを調整するために、ある地域の死亡率を、年齢構成を基準集団と同じになるようにして求め直すなどの方法です。

多変量解析(回帰モデルによる調整)

調べたい要因以外の因子も共変量として統計学的に処理します。いくつもの交絡因子を同時に処理できます。

重回帰分析、多重ロジスティック分析、比例ハザードモデルなど

アウトカム(結果)が2値   → ロジスティック回帰分析
アウトカム(結果)が連続数 → 重回帰分析

※特に、年齢、性別は交絡因子になりやすいので、解析の時に暴露要因として入れた方がいいです。

犬くん
犬くん
多変量解析は無料統計ソフトのEZRでできる!

となります。

まとめ

まとめです!

交絡、交絡因子の見つけ方

  • 先生に聞く
  • 先行研究など似ている研究の論文を参考にして交絡となる変数を入れる
  • 重回帰分析でデータが変わったら交絡
  • 交絡だと思うものを全て入れる
  • 〇×付けて調べる

研究の計画段階での調整
1.無作為化 2.制限 3.マッチング

統計解析段階での調整
1.層別化 2.標準化 3.回帰

となります!

 

関連記事

そらいろブログ

医学統計や心理学でも出てくる交絡や交絡因子ですが、よく分からないという方も多いと思います。 そこで今回は交絡や交絡因子の…

スポンサーリンク