ビジネスリサーチラボ

open
読み込み中

コラム

因果関係とはなにか? 相関関係との違い・検証方法

コラム

「因果関係」と「相関関係」とはなにか?

このコラムでは、組織における施策検討において重要な論点になる「因果関係」と「相関関係」について、特に私が専門としている社会心理学や人事データ分析などの立場から、実務家の方々向けに説明をします。まず両者の違いをごく簡単にまとめると、次の通りです。

現実には多くの分析が「相関関係」を基本として行われており、それをもとに意思決定が行われることも多くあります。しかし、上記の通り、厳密に言えば相関関係の背後には2つの因果関係(要因A→要因B、要因B→要因A)が存在しえます。例えば、上記の例でいえば人事異動の経験を積んで組織を広く知ることがエンゲージメントにつながったのか、それともエンゲージメントが高い(やる気に満ちた)社員が引く手あまたとなり、人事異動が増えたのかなどが、明確ではありません。そのため、相関関係をもとに施策実施の意思決定を下すと(この場合でいえば「エンゲージメントを高めるために人事異動の頻度を増やす」)、誤った結果を生みかねないというリスクがあります。

他方で、因果関係の検証には慎重なデータ収集や、高度な分析が必要です。そのため、因果関係に迫ることが望ましくはあるものの、方法上の限界から、データで得られた相関関係(定量的知見)と過去の理論的・経験的知識(定性的知見)をもとに意思決定を下すこともやむをえないこともあります。
しかし、それでもなお「よりよいデータ分析と施策検討を目指す」という観点から、どのような限界を超えれば因果関係の検証に近づけるかについて、代表的な方法を整理します。

方法1. 実験計画(ランダム化比較実験; RCT)

因果関係の検証において優れた方法の一つが対象者のランダム化を伴う実験を行うことです。例えば社員100人を対象として、①ランダム(無作為)に選ばれた50人にだけ研修を実施し、②研修後に非参加者50人も含めた100人全体のエンゲージメントに関する調査を実施、③対象者と非対象者のエンゲージメントの得点を比較する、といった内容です。

ランダムに対象者を選ぶことによって、①特定の特徴を持つ人たち(例: 昇進意欲の高い人)に偏って介入が起きるバイアスを排除することもできるほか、②何かの得点が伸びたと主張しやすくなります(ランダムに対象者が選ばれたのであれば、実験実施前の得点は研修群と対照群で理論上は同じになるため)。

しかし現実的にこうした取り組みを人事・組織の領域で実現可能かといえば、難しいことも事実です。研修であれば、時間差をつけて全員に受講させることも可能なため、比較的実現は用意です。しかし、人事異動や採用・登用基準の変更などの重要な意思決定であればどうでしょうか。こうした重要な施策の対象者をランダムに(乱暴に言い換えればサイコロを振って)選ぶことは、たとえ科学的には厳密であっても、企業倫理の問題が伴います。

方法2. 縦断データを取得する

2つめの方法が、データを複数時点で測定して時系列性を持たせる方法です。例えば人事異動とエンゲージメントの例を挙げれば、社員の所属部署とエンゲージメントの高さの情報を数年分継続して取得し、「人事異動が多かった社員ほど、2020年のエンゲージメントが2015年よりも上昇している」という分析に備える方法です。このことによって、少なくとも時間の前後関係は捉えることができ、「エンゲージメントが高い人が人事異動の対象になったのではないか?」という逆因果の可能性に対する反論が一部可能になります(エンゲージメントが異動後に「上昇」しているとはいえるため)。

私見ですが、人事・組織領域のデータ分析において因果関係に迫るには、この方法が最も現実的ではないかと考えています。サーベイの質問方法などのデータ形式や、データの保管場所を定めれば、多くのデータ収集は自然に経年的に蓄積されていきます。方法1の実験のような作為的な介入を伴わない分、実施のリスクも低いのではないでしょうか。

方法3. 統計的因果推論

3つめの方法が、昨今社会心理学の領域でも話題に挙がることが多い「統計的因果推論」(または単純に「因果推論」)と呼ばれる分析手法を使用するものです。元々は主に計量経済学の領域で使用されていたと聞く方法で、横断的な介入のデータをもとに、因果関係に近づく分析が可能です(例: 研修を受けることによって、エンゲージメントが何点ほど高まりそうか?)。詳細はここでは割愛しますが、代表的な方法である「傾向スコア」を用いた分析では、「介入の対象になりやすい確率」を推定し、分析に用いることで、疑似的に方法1のランダム化比較実験に近い効果推定を行うことが目指されます。

ただし、一般的な回帰分析などの統計分析手法と比べるとやや実施が難しく、すぐに取りかかることは難しいかもしれません。例えば、私が専門とする社会心理学の領域でもまだ一般的な方法として普及しているとまでは言えず、人事・組織領域のデータ分析に適用した際の問題点や注意点も明確ではないように感じます。その点においては、方法1・2を踏まえた「発展的な内容」として、キーワードを押さえておくことが初めの一歩としては重要といえるかもしれません。

まとめ

本コラムでは「因果関係」をテーマにして、相関関係との違いや、主な検証方法について整理しました。人事・組織領域のデータ分析という観点から内容をまとめると、次のようになります。これらの内容が人事・組織領域のデータ分析や施策検討の質向上につながることを願っています。

  1. 相関関係と因果関係の違いには注意が必要。ただし厳密な因果関係の特定は困難なことも多いため、「常に頭の片隅に置いて、注意深く相関関係を解釈する」ことが現実的か。
  2. 縦断データの収集は積極的に行った方がよい。サーベイの質問方法やデータ形式を定め、社員の個人IDなどに紐づけて保持する。ただし個人情報保護への留意が必要。
  3. 厳密な「介入や施策の効果」を検討するためには、統計的因果推論という手法も有効。ただし分析手法がやや高度なため、発展的な話題にはなる。

参考情報

因果関係にまつわる知識や、分析手法をさらに学びたい方には、次の書籍をおすすめしています。
山本勲(2015)『実証分析のための計量経済学―正しい手法と結果の読み方』中央経済社
安井翔太(著)株式会社ホクソエム(監修)(2020)『効果検証入門~正しい比較のための因果推論/計量経済学の基礎』技術評論社

 

著者

正木 郁太郎
2017年東京大学大学院人文社会系研究科博士後期課程修了。
博士(社会心理学)。2020年現在、同研究科研究員として在籍。
人事・組織に関する研究やHRTech、さらに中等教育などの領域で、民間企業からの業務委託や、アドバイザーなどを複数兼務。組織のダイバーシティに関する研究を中心として、社会心理学や産業・組織心理学を主たる研究領域としており、企業や学校現場の問題関心と学術研究の橋渡しとなることを目指している。著書に『職場における性別ダイバーシティの心理的影響』(東京大学出版会)がある。

 

 

 

 

#正木郁太郎 #人事データ分析

テレワーク(リモートワーク)に伴う
課題のご相談も受け付けています