医学統計や心理学でも出てくる交絡や交絡因子ですが、よく分からないという方も多いと思います。
そこで今回は交絡や交絡因子の効果や意味とは何かや、交絡3条件などを初心者向けにわかりやすく解説していきたいと思います。
交絡があると何がいけないのか
交絡因子となる3条件
がわかる!
結論から言うと、
・交絡とは、データ解析時に結果と要因の両方に相関する変数で、交絡があると誤った結果が出てしまう。→補正が必要
・交絡因子とは、交絡を起こす変数(データ)のこと
・交絡因子になってしまう3条件
1)結果に影響を与える
2)要因と関連がある
3)要因と結果の中間因子でない
となります。
では詳しくいってみましょう!
「交絡」の意味とは?
交絡(英語:confounding)の意味は、
データの解析をするときに、結果と要因の両方に相関する変数がある状態のこと。
結果に影響を及ぼす変数(データ)=独立変数(説明変数)
として説明されていることも!
また、辞書での説明では、
「暴露と疾病の関連性が、第三の要因の影響によって過大または過小に評価されてしまう現象をいいます。
例えば、喫煙と肺がんの関連性を調べようとする場合、 調べようとする要因(喫煙)以外の要因(飲酒など)ががんの発生率に影響を与えている可能性もあります。
このとき、飲酒が交絡要因に該当し、飲酒が調査に影響を与えないように、データを補正する必要があります。(weblio辞書:交絡 より)」
となっています。
「交絡因子」の意味とは?
「交絡因子」とは、交絡を起こす変数(データ)のこと
ちなみに、
交絡因子=交絡バイアス=交絡変数(英語:confounding factor)
とも呼ばれています。
「交絡因子」と「共変量」の違いとは
交絡因子とは「交絡を起こす因子」のことです。
共変量とは結果を出すための独立変数として結果に影響を及ぼす変数(データ)のことです。
年齢・性別など、交絡因子だと思うものを共変量として解析します。
「交絡」と「効果修飾」の違いとは
交絡は前に書いた通り補正が必要となります。
しかし、効果修飾は、ある要因の結果の数値を変化させるような第3の要因なので、詳細な影響評価を行う必要があります。
※効果修飾はあんまり出てこないので頭の片隅にでも置いといてください。
交絡があるとどうなる→正しい結果が得られない
結果を出すための変数が、他の要因の効果と混ざり合っている(交絡している)と、要因と結果の関連性が、過大または過小に評価されてしまい、正しい結果が得られなくなります。
補正方法は↓
交絡因子となってしまう3条件
交絡因子となるには3つの条件があります!
それが、
1)結果に影響を与える
2)要因と関連がある
3)要因と結果の中間因子※でない
この3つをすべて満たす場合は交絡因子として考えます。
※中間因子とは:結果と因果関係の間に来るもの。交絡と違い調整しない方がよい変数。
言葉だと分かりにくいですが、図にしてみると、
となります。
交絡因子の実例
という結果が出た場合、
交絡として飲酒という要素が絡むとどうなるかというと、
となります。
コーヒーを飲むから大腸がんになりやすいのではなく、
コーヒーを飲む人は実はお酒も沢山飲んでいる、飲酒が原因で大腸がんになりやすいという結果が隠れていることに。
この時の交絡因子は飲酒となります。
他にも、
×ドラえもんをよく見ている人は肺がんになりにくい
〇ドラえもんをよく見ている人ほど年齢が低いので肺がんになる確率は低い
交絡因子→年齢
×ライターやマッチを持っている人ほど肺がんになりやすい
〇ライターやマッチを持っている人ほど喫煙をするので肺がんになりやすい
交絡因子→喫煙
×高血圧の人は収入が高い
〇年齢が高いほど高血圧になりやすく、収入も高い
交絡因子→年齢
と、交絡があると、因果関係が違ってきてしまいます
まとめ:交絡や交絡因子、交絡となる3条件は?
・交絡とは、データ解析時に結果と要因の両方に相関する変数で、交絡があると誤った結果が出てしまう。→補正が必要
・交絡因子とは、交絡を起こす変数(データ)のこと
・交絡因子になってしまう3条件
1)結果に影響を与える
2)要因と関連がある
3)要因と結果の中間因子でない
となります。
関連記事
こんにちは!大学院で統計を勉強してるそらです! 交絡因子の見つけ方が分からない・・・補正や調整ってどうやるの?という方も…