【初心者向】交絡因子の見つけ方や補正方法は?統計での調整も徹底解説!

こんにちは!大学院で統計を勉強してるそらです!

交絡因子の見つけ方が分からない・・・補正や調整ってどうやるの?という方も多いと思います。

そこで今回は交絡因子の見つけ方や補正・調整方法についてまとめています!

交絡、交絡因子の見つけ方

  • 先生に聞く
  • 先行研究など似ている研究の論文を参考にして交絡となる変数を入れる
  • 重回帰分析でデータが変わったら交絡
  • 交絡だと思うものを全て入れる
  • 〇×付けて調べる

研究の計画段階での調整
1.無作為化 2.制限 3.マッチング

統計解析段階での調整
1.層別化 2.標準化 3.回帰

となります。

では詳しく見ていきましょう!

交絡、交絡因子の見つけ方

先生に聞いてみたところ・・・

 

「交絡の見つけ方ってあるんですか」

「見つけ方といわれても・・・何となく分かるでしょ!

「・・・( ^ω^)(分かりません)」

 

慣れてくると感覚で分かるらしいです。

 

他には、

詳しい教授に聞く

どの変数が交絡となるか討論する

という方法も。

 

犬くん
犬くん
聞ける人なんていない!

という人は、

  • 先行研究など似ている研究の論文を参考にして交絡となる変数を入れる ←1番おすすめ!!
  • 交絡だと思う変数を入れる前と入れた後でそれぞれ重回帰分析をして、データが変わるかどうかで見る(変わったら交絡)
  • 交絡だと思うものを全て入れて解析する(肺がんにかかるリスクであれば、性別、年齢、喫煙など)

他の項目と競合するのが無いように(BMIであれば、身長と体重を入れないなど)

  • 交絡3要素と変数の表を作って〇×を付けて調べていく↓

という方法もあります。

 

一番大事なことは、交絡因子とするかどうかは根拠があるかどうか、交絡因子とした意味を説明できるかどうかを考える必要があります。

 

具体例を出すと、

・性別の項目はよく交絡因子として入っています(男性は1、女性は0など2値に変換しておきます)

 

・運動量を交絡とする場合は一例として「23メッツ・時/週か毎日60分以上の歩行を行っているか、いないかで分ける」

これは、「健康づくりのための身体活動基準2013」より、

強度が3メッツ以上の身体活動を23メッツ・時/週行う。
具体的には歩行又はそれと同等以上の強度の身体活動を毎日60分以上行う。

となっているためです。

 

※先行研究を読むと交絡因子として解析しているものと、どうやって分けているかもでてくるので、それを参考にするのが一番良いでしょう。

 

交絡因子を排除するには?交絡の補正・調整方法

交絡因子を排除するための補正や調整方法は、大きく分けて研究前の計画段階での調整と、データを集め終わった後の統計解析段階での補正方法があります。

研究の計画段階での調整
1.無作為化 2.制限 3.マッチング

統計解析段階での調整
1.層別化 2.標準化 3.回帰

研究の計画段階での調整

無作為化

交絡因子が分からないという時に有効なのが、無作為化です。

「介入研究」での手法でランダム化比較試験※などがあります。

しかし、すでにあるデータを分析する「観察研究」ではできません・・・。

 

※ランダム化比較試験(無作為化比較試験):研究の対象者を2つ以上のグループにランダムに分け(ランダム化)、治療法などの効果を検証することです。 ランダム化により検証したい方法以外の要因がバランスよく分かれるため、公平に比較することができます。

出典:国立研究開発法人国立がん研究センター

制限

研究を行う前段階で、交絡因子となりそうな集団を含めないよう、対象集団を制限することです。

ただし、交絡因子が多い場合、制限により人数が減ってしまい検出力の低下や妥当性の減少に繋がります。

 

例えば、お酒と肝臓癌の関係を研究する場合、対象者が昭和33年予防接種をした人(注射針の使いまわし)や輸血経験者は交絡因子となる可能性があります。

これを防ぐには影響のない者に限定して対象者とする必要があります。

 

マッチング

交絡因子となりそうな要因を持つ人同士をペアにして比較することで交絡の影響を最小限にすることができます。

 

例えば、肺がんの罹患に年齢差がある場合には、症例と対照の年齢が一致するように対応させて対象者を設定します。

複数の交絡因子を扱えますが、マッチングの指標となる項目は、病気の危険因子としては考えられなくなります。

統計解析段階での調整

層化(サブグループ解析)

収集したデータをグループ(層)に分けて、層ごとに解析する方法です。

 

例えば年齢や性別、喫煙の有無、飲酒の有無などによって患者をグループ分けし、比較します。

しかし、交絡因子がたくさんあるときは使えません。

標準化

結果に影響をすると考えられる要因により重み付けをしてから分析します。

例えば「年齢調整死亡率」などのように、1つの基準に合わせて結果を調整します。

 

都道府県別の死亡率を見る場合、高齢者の多い地域では死亡率が高く見えてしまいます。

これを調整するために、ある地域の死亡率を、年齢構成を基準集団と同じになるようにして求め直すなどの方法です。

多変量解析(回帰モデルによる調整)

調べたい要因以外の因子も共変量として統計学的に処理します。

いくつもの交絡因子を同時に処理できます。

 

重回帰分析、多重ロジスティック分析、比例ハザードモデルなど

アウトカム(結果)が2値   → ロジスティック回帰分析
アウトカム(結果)が連続数 → 重回帰分析

※特に、年齢、性別は交絡因子になりやすいので、解析の時に暴露要因として入れた方がいいです。

 

犬くん
犬くん
多変量解析は無料統計ソフトのEZRでできる!

となります。

まとめ

まとめです!

交絡、交絡因子の見つけ方

  • 先生に聞く
  • 先行研究など似ている研究の論文を参考にして交絡となる変数を入れる
  • 重回帰分析でデータが変わったら交絡
  • 交絡だと思うものを全て入れる
  • 〇×付けて調べる

研究の計画段階での調整
1.無作為化 2.制限 3.マッチング

統計解析段階での調整
1.層別化 2.標準化 3.回帰

となります!

 

関連記事

そらいろブログ

医学統計や心理学でも出てくる交絡や交絡因子ですが、よく分からないという方も多いと思います。 そこで今回は交絡や交絡因子の…

スポンサーリンク