どうすればその説明は説得力を持つのか。データをどうやって活用できるのか。
EBPMや統計的因果推論に通ずる、因果推論の全体を概観してみたい。
原因を特定するのは簡単ではない
因果関係なのか、相関関係なのか
「酒は百薬の長」と言われてきた。少量のアルコール摂取は、全く摂取しないよりも死亡率を引き下げる、というものだ。
しかし、これは近年では否定されてきている。健康上に問題があり死亡リスクが元々高い人が禁酒することにより、アルコールを摂取しない人の死亡率を集計すると高めに出てしまうものと解釈される。
※例えば下記記事を参照。
https://www.asahi.com/articles/ASQ2W3FRXQ2WTIPE003.html
このように、裏に存在するメカニズムの影響で、見た目上の因果関係が見える例は多数ある。ではどうすれば原因を正しく特定することができるだろうか。
原因を考えるとき、理由の説明を聞くときに注意すべきこと
特定に向けては、まずは仮説が必要である。筋の良い仮説とするために注意しておきたいポイントには以下のようなものがある。
根本的な帰属の誤り
個人の行動を説明する際に、個人の特性や文化的背景による原因を重視しすぎ、状況による原因を軽視すること。
例えば、
日本人は誰かが傘をさすと他もみんな傘をさし始める。日本人の同調的性格によるものだ!
⇒実際には、雨が降ってきたからみんな傘をさしていた。
歴史的な出来事や各国の事情に説明において、国民性や文化的特性からの説明を耳にすることは多い。興味深い、しっくりくる説明であることは多いのだが、この誤りに陥っていないか、一考は必要だろう。
N=K問題
説明の対象の数(N:従属変数)に対して、同じだけの説明の数(K:独立変数)を使うと、どんなものでも説明がついてしまう。
例えば以下のようなこともそれらしくいえる。(内容自体は全くの適当です。)
日本は島国だから国家内で小さなコミュニティが乱立する構造になり、多様な方言が育った。
イギリスでは紅茶文化により社交性が重視された結果、国内全体での言語統一がなされ、英語は国際的にも普及できるほどの汎用性を持った。
これも様々なところで目にする問題である。例えば日々の市況コメントなどN<Kですらある。
それぞれの事例に新たな要素を使って説明を加えていないか、留意したい。
反証可能性
科学とは否定されていない仮説の集合である。これを成立させておくためには、反証しようがない仮説は含めることができない。つまり、どういう実験結果が出れば間違いだとわかるか、ということが明らかでない仮説は科学的には採用できない。(但し、反証しようがない仮説の内容が正しくない、と言っているわけではない。)
疑似科学の見分け方として、反証可能性のある説明かどうか、をチェックしてみると良い。
(※)チェックによる効果には個人差があります。
原因説明には強さがある
エビデンスピラミッド
因果推論はまず医療界で発展し、因果関係/再現性の確からしさの程度に基づき、エビデンスピラミッドとして整理されている。粒度など表現は様々なものがあるが、一例として下表の通り。
高 | メタアナリシス | 複数のRCTを統合したもの | |
ランダム化比較実験(RCT) | 対象をランダムに2つ以上のグループに割り当てて比較することで差を評価 | ||
調査データ分析 | 取得できるデータを疑似的に複数グループに分離して比較 | ||
事例研究 | 体験談や、体系化されていない事例群 | ||
低 | 専門家の意見 |
実験の対象をコントロールして比較実験できるのがやはり望ましい。ただ、人道的/倫理的など様々な理由でできないこともある。エビデンスレベルが低くくとも、そういう場合にはデータからの推定が重要となる。
因果推論(2)では、この調査データ分析について整理する予定。
参考図書
1.「原因と結果」の経済学
https://www.amazon.co.jp/dp/447803947X
エビデンスピラミッドの体系に従い、各段階の手法説明がされている。読みやすい。
2.原因を推論する
https://www.amazon.co.jp/dp/4641149070
理論と事例の両面から、「原因の説明」に取り組む。面白い。何よりタイトルがかっこいい。
コメント