■資料 問題の本質■共謀罪
■【因果関係】の真実と欺瞞
相関関係と因果関係
出典: フリー百科事典『ウィキペディア(Wikipedia)』
相関関係と因果関係(そうかんかんけいといんがかんけい)では、相関関係と因果関係の関わりについて解説する。
相関関係があるだけでは因果関係があるとは断定できず、因果関係の前提に過ぎない[1]。
「相関関係は因果関係を含意しない (Correlation does not imply causation)」は、科学や統計学で使われる語句で、
2つの変数の相関が自動的に一方がもう一方の原因を意味するというわけではないことを強調したものである(もちろん、そのような関係がある場合を完全に否定するものではない)[2][3]。
全く逆の言葉である「相関関係は因果関係を証明する (correlation proves causation)」は誤謬であり、同時に発生した2つの事象に因果関係を主張するものである。
このような誤謬は虚偽の原因の誤謬(英: false cause)と呼ばれる(ラテン語では "cum hoc ergo propter hoc"、直訳すると「それとともに、そしてそれ故に」)。
前後即因果の誤謬は、2つの事象に順序関係があることが前提であり、「虚偽の原因の誤謬」の一種である。
概要
広く研究された例として、ホルモン補充療法 (HRT) を行っている女性での冠状動脈性心臓病 (CHD) の発生率が低いことから、HRT が CHD 予防に効果があるという提案がなされたことがある。
しかし対照試験を行ってみると、HRTによってCHDのリスクが若干ではあるが明らかに有意な増加を示した。
データを再検討してみると、HRTを受けていた女性は上流階級の婦人が多く、ダイエットやエクササイズをよく行っていたことがわかった。
つまり、HRTを受けることとCHD発症率が低いことは共通の原因の結果であり、両者に提案されたような原因と結果の関係は存在しない[4]。
数学的には "Correlation does not imply causation"(相関は因果を含意しない)は正しい。
しかし、"imply" という言葉は通常「示唆する」という意味でも使われる。
相関と因果に何らかの関係があるというのは正しく、
因果関係を証明する際には相関関係の存在が必要となる。
確かに相関関係は因果関係ではないが、それらが等価でないことを単に述べると、両者の関係についての情報が欠落する。
タフティは、相関関係と因果関係について述べるには、最低でも以下のようにすべきではないかと示唆した。
- 「経験的に観察された共変動は、因果関係の必要条件だが十分条件ではない」
あるいは
- 「相関関係は因果関係と同じではない。相関関係は因果関係の単なる必要条件の1つである」
一般形式
虚偽の原因の誤謬は次のように表現できる。
- A の発生は B と相関している。
- したがって、A が B の原因である。
この種の論理的誤謬では、2つかそれ以上の要因の間の相関関係を観測しただけで、それらの因果関係について早まった結論に飛びつく。
一般に、1つの要因 (A) がもう1つの要因 (B) と相関していることが観測されたとき、それだけをもって A が B の原因だとする。
しかし、実際には他に以下のような4つの可能性があるので、
このような早とちりは論理的誤謬である。
- B が A の原因かもしれない。
- 未知の第3の要因 C があり、実際には A も B も C が原因かもしれない。
- その「関係」は単なる偶然か、事実上偶然といってもいいような複雑で迂遠なものかもしれない。すなわち、2つの事象は同時に発生したが、直接の関係はなく単に同時に起こっただけである。
- B が A の原因であると同時に、A が B の原因である。ポジティブフィードバックシステムの動作はこれに当たる。
言い換えれば、AとBに相関があるという事実だけで、それらの間の因果関係を結論付けることはできない。
誤謬の例
因果関係の逆転
- 火災現場に出動する消防士が多いほど、火災の規模は大きい。
- したがって、出動する消防士が多くなることが、火災が大きくなる原因だ。
消防士の人数と火災規模には強い相関関係があるが、上のような因果関係は存在しない。実際には火災が大きいから多数の消防士がそこに送り込まれているのであり、因果関係は逆である。
第3の要因が2つの共通原因
以下の例では、交絡変数という未知の変数が相関する両者に影響している。
例えば「例 3」の場合は「夏の暑さ」が真の原因である。
- 例 1
- 靴を履いたまま寝ると、起きたとき頭痛になることが多い。
- したがって、靴を履いたまま寝ることが頭痛の原因である。
この場合、真の原因が「靴を履いたまま寝る」ことと「頭痛」の共通の原因であり、アルコールによる酩酊が相関の原因と考えられる。
- 例 2
- 明かりをつけたまま眠る若者は、その後近視になる可能性が高い。
これは、ペンシルベニア大学医療センターが比較的最近行った研究の例である。その研究は1999年5月13日発行のネイチャー誌で発表され、一般的なメディアでも大きく取り上げられた[6]。しかし、後にオハイオ州立大学が行った研究では、赤ちゃんを明かりをつけたまま寝かせることと近視に関係があるという結果は得られなかった。それとは別に両親が近視の子供は近視になる確率が高いという結果が得られ、近視の両親が子供を明かりをつけた寝室で寝かせることが多いという傾向があった[7]。つまり、この場合の交絡変数は、両親の近視と考えられる。
- 例 3
- アイスクリームの売り上げが伸びると、水死者数も確実に増える。
- したがって、アイスクリームが水死の原因だ。
アイスクリームがよく売れるのは夏であり、水死が増えるのも夏である。したがって、夏の暑さが両方の事象の共通する原因である。
偶然の一致
- 海賊の数が減るにつれて、同時に地球温暖化が大きな問題となってきた。
- したがって、地球温暖化は海賊の減少が原因だ。
- 1950年代以降、大気のCO2レベルと犯罪レベルは同時に増大してきた。
- したがって、大気中のCO2増加が犯罪増加の原因だ。
この例はもし因果関係があるとしたら非常に複雑で迂遠なものと考えられ、増加が相関しているというだけで因果関係を結論付けるのは尚早である。他のジョーク的な例として、Mierscheid Lawがある(ドイツ社会民主党の選挙での得票率と鉄の生産量の相関を示したもの。ただし、社会民主主義政党の得票と鉄の生産量の間には、「経済成長の推移が双方の原因」という擬似相関の関係はあるかもしれない)。
互いに一方がもう一方の原因
- (気体は)圧力が高まるに連れて、温度が上昇する。
- したがって、圧力によって温度が高くなっている。
理想気体の状態方程式 PV=nRT は圧力と温度の関係を示したもので、両者には相関関係がある。質量が変わらない場合、圧力を高くすると温度が上がり、温度を高くすると圧力が上がる。この場合、両者は独立しておらず、直接的な比例関係にある。
因果関係の判定
デイヴィッド・ヒュームは、因果関係は経験に基づくとし、同様に経験は未来が過去にならうという仮定に基づくとし、その仮定も経験に基づくとした。
彼は「因果関係は具体的推論に基づかない」と結論付け、観測できるのは相関関係だけだとした[8]。
直観的に、因果関係には相関関係だけでなく反事実的依存関係 (counterfactual dependence) も必要と思われる。
例えば、ある学生のテストの成績が悪く、その原因が勉強しなかったためだとしよう。これを証明するには、反事実 (counterfactual) として、同じ学生が同じ環境で同じテストを受けるが、勉強はしっかりしてきた場合を想定する。時間を巻戻すことができれば、これ(その学生に勉強させること)を実際に試すことができ、元のバージョンとやり直したバージョンを比較することで因果関係を観測できる。
実際には時間を巻戻してやり直すことはできないので、因果関係は正確に知ることはできず、推測することしかできない。これを「因果的推論の根本問題 (Fundamental Problem of Causal Inference)」と呼ぶ[9]。
科学的実験と統計的手法は、世界の反事実的状態を可能な限り近似することを主な目標の1つとしている[10]。
例えば、一貫してテストで同じ成績をとる一卵性双生児を対象として実験を行うとする。
一方を6時間勉強させ、もう一方は遊園地で遊ばせる。その後のテストで成績が大きく異なれば、勉強(あるいは遊園地に行くこと)がテストの成績に因果的効果をもたらす強い証拠になる。
このような実験を経れば、勉強とテストの成績の間には因果関係があるとほぼ確実に言える。
統計学的手法は、個人の等価性の代わりに集団の等価性を用いる。
そのために、2つ以上の集団から無作為に標本を抽出する。
完全なシステムではないが、被験者を無作為に抽出して、実際の治療を行う集団と偽薬を与える集団に置き、それら集団がなるべくあらゆる面で等質となるようにする。
これによって、その治療法と偽薬の効果に大きな違いが現れれば、
その治療法はその疾病を治療する因果的効果があると結論付けることができる。
実験結果の有意性を定量化したものを統計用語でP値と呼ぶ。
関連項目
後件肯定(こうけんこうてい、
英:
Affirming the consequent)とは、形式的
誤謬の一種。以下のような
論証形式の
推論をいう。
- もし P ならば、Q である。
- Q である。
- したがって P である。
この形式は論理的に
妥当でない。言い換えれば、この形式では前提が真であっても結論を導く推論の構造が正しくない。「後件肯定」の「後件」とは、大前提(
条件文)の後半部分(上の場合、「
Q である」)を指す。
小前提は後件を肯定しているが、そこから大前提の前件(「もし P ならば」)を導くことはできない。
後件肯定は
演繹としては間違った推論方法であるが、
アブダクション(仮説形成)において使われる。
正統
バラモン教の一派に、この世のすべての事象は、
原因の中にすでに結果が包含されている、とするものがある。
仏教 一切は、直接的要因(因)と間接的要因(縁)により生じるとされる。また、「原因に縁って結果が起きる」という法則を、縁起と呼ぶ。
確証バイアス(かくしょうバイアス、
英:
Confirmation bias)とは、
認知心理学や
社会心理学における用語で、
仮説や信念を検証する際にそれを
支持する情報ばかりを集め、反証する情報を無視または集めようとしない傾向のこと。
認知バイアスの一種。また、その結果として稀な事象の起こる
確率を過大評価しがちであることも知られている。
右図のような4枚のカードが示され、「偶数が表に書かれたカードの裏は赤色である」という
仮説を
検証するにはどのカードをひっくり返すべきかと尋ねられたとする。
この回答として多いのは「8と赤色」あるいは「8」のカードをひっくり返すというものであるが、これらは
合理的ではない。なぜならば仮説の
反例になり得るのは「偶数が表に書かれていて、かつ裏が赤色でないカード」だけである。その他の組合せは仮説の検証にまったく役に立たない。したがって
「8と茶色」のカードをひっくり返すのが合理的である。多くの人がこのような問題に誤答することは確証バイアスの結果として説明される。
【この正解は詳しく下記に記載しています】KIKITATA
「確証バイアス」偽りの確証・・・(偽りで無い確証の裏付に有用)

バイアス(英語: bias)とは. 偏りのこと。「サンプリングバイアス」(標本抽出の問題により 、母集団を代表しない特定の性質がまぎれこんでいる)のように統計で用いられる
実験計画法の基本的な原則は次の3つである。
局所管理化
影響を調べる要因以外のすべての要因を可能な限り一定にする。
反復
実験ごとの偶然のバラツキ(
誤差)の影響を除くために同条件で反復する。
以上は
物理学などの実験でも普通に採用されるが、さらに次の原則が加えられる。
以上でも制御できない可能性のある要因の影響を除き、
偏りを小さくするために条件を無作為化する。
一度ある事件が起これば、
次々と連鎖的にある事件が起こるとする理論全般を言う。
検証や論理の正確性を欠く場合は、
誤謬や
詭弁だと見なされる場合もある。
ある事象が別の事象の後に起きたことを捉えて、
前の事象が原因となって後の事象が起きたと判断する誤謬(因果の誤謬)である。
相関関係の順序があまり重視されない「
虚偽の原因の誤謬」とは微妙に異なる。
前後即因果の誤謬は、時系列に
因果関係があると見なす点で誤りとなる傾向がある。誤謬は、因果関係を否定するような他の要因を無視し、事象の順序だけに基づいて結論を導くことで生じる。身近なところでは、
迷信や
呪術的思考の多くはこの誤謬に分類される。
擬似相関(ぎじそうかん、
英:
Spurious relationship, Spurious correlation)は、2つの事象に
因果関係がないのに、
見えない要因(
潜伏変数)によって
因果関係があるかのように推測されること。
擬似相関は、客観的に精査するとそれが妥当でないときにも、2つの集団間に意味の有る関係があるような印象を与える。
2つの(確率)変数間の擬似相関は、第三の原因変数を導入することで生み出される。
換言すれば、A と B の間の
相関を見出す。従って、考えられる関係としては次の3つがある。
- A が B を発生させる
- B が A を発生させる
- または
- C が A と B を発生させる
最後の関係が擬似相関である。そのため、「相関関係は因果関係を包含しない」とよく言われる。
統計学では、依存か連合は2つの確率変数間の統計的な関係、かどうか因果かどうか、または変量データである。相関関係は、一般的な使用法ではほとんどの場合、2つの変数が互いに線形の関係を持っている範囲を参照していますが、依存性を含む統計的リレーションシップの広範なクラスのいずれかです。従属現象の身近な例としては、親とその子孫の身体的立像と、製品の需要と価格との相関関係があります。