2025年7月28日
相関の希薄化:測定における誤差がもたらす影響
様々なデータを収集・分析し、意思決定に活かすことの重要性が高まっています。人事領域では、従業員のエンゲージメント、パフォーマンス評価、離職といった指標の関連性を把握することが人材マネジメントの基盤となります。こうした変数間の関連性を数値化する手法の一つが「相関分析」です。相関係数は-1から+1の間の値をとり、絶対値が大きいほど強い関連性を表します。
しかし、相関分析を実務で活用する際、ある注意点が存在します。それが「相関の希薄化」と呼ばれる現象です。これは「本当はもっと強い関連があるはずなのに、測定データ上では弱い相関しか見られない」という状況を指します。この現象は人事データのように主観的評価や複雑な概念を測定する際に生じ得ます。
相関の希薄化が起きると、実際には強い関連性がある要因を見落としたり、重要な施策の効果を過小評価したりするリスクが生じます。例えば「研修とパフォーマンス向上の間には強い相関があるはず」と期待していたのに、データ分析では弱い相関しか見られないと、研修の価値を正確に評価できません。
本コラムでは、この相関の希薄化という現象について、その原理、発生メカニズム、人事データにおける例示、そして対処法について解説します。人事データの分析結果をより正確に解釈し、データに基づく意思決定の質を高めるために役立つでしょう。
相関の希薄化とは
相関の希薄化とは、2つの指標について、実際に観測されたデータの相関係数[1]が、本来あるべき「真の相関」よりも小さくなってしまう現象を指します。
例えば、「従業員のエンゲージメント」と「業務パフォーマンス」に関連があるはずだと理論的に考えられるとします。ところが実際にアンケートや業務評価指標を用いて測定すると、想定よりずっと低い相関しか得られない場合があります。こうした「本当は関連性があるはずなのに、データ上の相関係数が小さく算出されてしまう」ことを相関の希薄化と呼びます。
相関の希薄化が起きる一つの要因は、測定における誤差によって生じる信頼性の不足です。これは、測定の対象(心理的特性や行動特性など)を完全に正確に捉えきれていないことが原因と考えられます。組織サーベイのように、人間の主観に依拠した回答を集める場合や、評価基準のばらつきが大きい場合などは注意が必要です。
相関の希薄化は、変数の測定精度が低いほど顕著になります。人事データには、パフォーマンス評価の主観性、エンゲージメントのような抽象的な概念の測定の難しさ、回答者の気分や状況による影響など、様々な誤差要因が含まれやすいものです。
相関の希薄化は、データから得られる示唆の質に影響する課題です。相関が低く出たからといって「関連性がない」と結論づけるのではなく、測定の質や信頼性を考慮した解釈が求められます。
測定における誤差の関与
誤差が相関を小さくする仕組みについて、詳しく説明しましょう。測定には誤差が含まれ、測定した指標におけるデータのばらつきには、その指標における真のばらつきに「不要なばらつき(ノイズ)」が加わります。誤差が大きいほど、実際にはあるはずの2変数間の連動が測定値のノイズに埋もれてしまい、観測される相関係数は低くなります。
もし誤差なく完璧な測定が可能ならば、観測される相関係数は「真の相関」に等しくなります。しかし現実の測定では必ず何かしらの誤差が含まれ、誤差が大きくなるほど、「真の相関」よりも低い値しか観測されません。
この論点は、「信頼性」という概念を導入して掘り下げることができます。測定の「誤差」が少なく、安定して同じ対象の特性を測れている程度を、信頼性と呼びます。組織サーベイの項目においては、信頼性は多くの場合、「外向性など変動が少ないと想定される指標において、同じ個人が何度回答してもおおむね同じ結果になる」ことや、「複数項目が同じ概念を一貫して捉えており、内部で回答に食い違いが生じにくい」ことを指します。
信頼性を定量的に示す指標の一つに、α係数があります[2]。これはアンケートなどの尺度の「内部一貫性」を評価する指標で、複数の質問項目が同じ概念を一貫して測定しているかを数値化します。α係数は0から1の値をとり、一般的に0.7以上であれば、一定の信頼性があると解釈され、誤差が小さければ1.0に近くなります[3]。
人事データの分析においては、このα係数を確認することが重要です。例えば、エンゲージメントのα係数が0.35しかない場合、その測定値はエンゲージメントを正確には捉えられていないと考えられます。そのため、他の変数(例:生産性)との相関を分析しても、相関の希薄化によって、実際の関連性よりも弱い相関しか示されない可能性が高くなります。
信頼性が高い測定尺度であるほど、同じ概念を正確に測っているとみなせるため、そのデータを用いて他の指標との相関を計算しても相関の希薄化が起こりにくく、観測された相関が真の相関に近くなると考えられます。[4]反対に、信頼性の低い測定値で相関分析を行うと、本来存在する強い関連性が「希薄化」して、弱い相関しか検出できなくなります。
相関の希薄化の例
組織サーベイを例にとります。従業員がどれほど組織に愛着を感じているか(エンゲージメント)の度合いを、複数の質問項目を用いて測定したとします。
例えばエンゲージメントを測るために、「今の組織で働くことに誇りを感じる」「組織の目標達成に貢献したいと強く思う」「この組織がうまくいくと、私も嬉しい」などの項目を用意します。これらを5件法(1=全くそう思わない~5=非常にそう思う)で回答してもらい、各項目の点数合計や平均値を「エンゲージメントスコア」としてまとめることが多いかもしれません。
もしこれらの項目のα係数が0.5程度しかなかった場合、何を意味するでしょうか。それぞれの項目が同じ概念を厳密には捉えきれておらず、回答にばらつきがあるということが推察されます。あるいは、個々の項目の理解度や回答にまつわるノイズが大きい可能性もあります。同じ「エンゲージメント」という概念でも異なる捉え方が混在しているということも考えられます。
その結果、この「エンゲージメントスコア」は「真のエンゲージメント」をきちんと反映していない可能性が高くなります。要するに、誤差が大きく信頼性が低いということになります。この「信頼性が低い」測定尺度と、例えば「離職意向」や「顧客満足度」など他の指標との相関をとったときに、本来あるはずの相関係数が小さく計算されてしまい、本来の関係性が見えにくくなるのが相関の希薄化です。
数値例で説明しましょう。例えば、真のエンゲージメントと離職意向の間には強い負の相関(r=-0.7程度)があるかもしれません。しかし、エンゲージメントの測定において信頼性が低い(α=0.5)場合、観測される相関は低下し、例えばr=-0.3程度になってしまうことがあります。これによって「エンゲージメントと離職意向の関連は強くない」という誤った印象を与える可能性があります。
このプロセスをさらにくわしく見ていきましょう。本来、「エンゲージメントが高い人ほど離職意向が低い」という比較的強い負の相関があるかもしれません。しかし、サーベイの信頼性が低いと、エンゲージメントスコア自体に誤差(ノイズ)が含まれます。離職意向を測定するアンケートにも誤差が含まれるかもしれません。それぞれのノイズが相関係数の計算に混入して、観測される相関が下がるというメカニズムが働き、「-0.7くらいあると思っていたのに実際は-0.3程度しか出なかった」などという状況が起こりえます。これが「相関の希薄化」です。
α係数との関係
前述のように、誤差が小さいほど 信頼性が高く(α係数が高く)、相関の希薄化が起きにくくなり、理論的に期待される相関(真の相関)と実際に測定される相関の差が小さくなります。逆に言えば、信頼性が低いほど、相関の希薄化が著しくなります。
なぜα係数が相関の希薄化に影響を与えるのでしょうか。ここまで示してきた通り、α係数の性質として、複数項目が全体として同じ概念を安定的に測定できている場合、α係数が高くなります。これは誤差が小さいということです。一方、α係数が低い場合は、項目間の一貫性が低く、誤差が大きいことを意味します。誤差が大きいほど「実際の(真の)相関」から離れてしまうので、相関係数は低めに推移する、すなわち相関の希薄化が生じるというわけです。
例えば、エンゲージメントのα係数が0.9と高い場合と0.5と低い場合で、離職意向との間の相関を比べてみます。エンゲージメントと離職意向の真の相関を0.5、離職意向のα係数をα=0.9とすると、エンゲージメントのα係数がα=0.9の場合、観測相関は約0.45(真の相関に近い)になります。他方で、α=0.5の場合は約0.33(真の相関より低い)になります。信頼性の違いによって、同じ関連性であっても観測される相関が異なってきます。
この結果を見ると、人事データの分析において相関係数を解釈する際には、測定尺度の信頼性(α係数など)も併せて確認することが重要だとわかります[5]。信頼性が低い場合、観測された相関係数は実際の関連性を過小評価している可能性があります。
モデルで考える
2つの変数(指標) X と Y を、それぞれ真の得点と誤差を考慮したモデルで考えると、相関係数の値を表す式を次のように書くことができます。
r(X_obs, Y_obs)≈r(X_true, Y_true)×√(ρ_X×ρ_Y)
この式において、X_obsとY_obsは実際に観測された測定値、X_trueとY_trueは「真の値」(誤差のない、本来捉えたい値)、r(X_obs, Y_obs)は観測された相関係数、r(X_true, Y_true)は真の相関係数、ρ_XとρYは各変数の信頼性(例えばα係数)を表します[6]。
式から見てわかるように、XとY両方の信頼性が1、つまりいずれの変数も誤差なく測定できているならば√(1×1)=1となって「真の相関」をそのまま観測できます。しかし、信頼性が0.7や0.6のように小さくなるほど、√(0.7×0.6) のように1より小さい値が乗算されるため、観測相関は小さくなります。これが相関の希薄化のイメージです。
この式を用いると、観測された相関から真の相関を推定することもできます。具体的には次の式で計算できます[7]。
r(X_true, Y_true)≈r(X_obs, Y_obs)÷√(ρ_X×ρ_Y)
例えば、エンゲージメント(ρ_X=0.7)と業績評価(ρ_Y=0.8)の間で観測された相関が r(X_obs, Y_obs)=0.3だった場合、真の相関は次のように推定できます。
r(X_true, Y_true)≈0.3÷√(0.7×0.8)≈0.3÷0.75≈0.4
このように、観測された相関(0.3)よりも実際の関連性(0.4)は強いと推定されます。ただし、この修正式は両変数の信頼性が正確に推定できる場合に限り有効であることに注意が必要です[8]。
脚注
[1] 相関係数に関する詳細な解説は、当社コラムをご一読いただければと思います。
[3] α係数が.95を超えるなど非常に高い場合は、項目の個数が多すぎたり、ほぼ同じ内容の質問項目ばかり測定しているなどの別の問題も考慮する必要があります。
[4] 高い信頼性がα係数で示されたとしても、それだけで測定誤差が存在しないとは断定できません。例えば2指標のいずれも社会的望ましさの影響を受けているなど、2つの指標に共通の系統誤差と呼ばれる測定誤差が含まれている場合、両者の相関は真の関係よりも過剰に大きくなる可能性があります。
信頼性とは、尺度を構成する項目群が同じものを測定していることを示す指標ですが、先の例のようにすべての項目が社会的望ましさの影響を受けていると、回答が一貫して“望ましい方向”に偏ることで、表面的には高い信頼性を示すことがあります。つまり、項目同士が本来の構成概念ではなく、共通の系統誤差によって結びついてしまっているのです。
このように、信頼性が高い=測定が正確とは限りません。信頼性や相関係数といった指標の解釈にあたっては、その背後にある誤差を常に検討する姿勢が、心理測定においては不可欠です。系統誤差については、当社コラムをご参照ください。
[5] 本コラムではα係数を信頼性の指標として多く言及していますが、これは信頼性の一側面(内部一貫性)のみを測るものです。包括的な信頼性評価には、テスト–再テスト信頼性(同じ対象に時間をおいて測定した際の安定性)や評定者間信頼性(異なる評価者間での一致度)なども考慮したほうが良いでしょう。
[6] 相関の希薄化を表す式において、平方根項が登場する理由は測定理論に基づいています。測定モデルでは、観測値は「真の値」と「誤差」の和として表現され、信頼性係数(ρ)は「観測値の分散のうち、真の値の分散が占める割合」と定義されます。
相関係数の計算過程では共分散を各変数の標準偏差で割りますが、標準偏差は分散の平方根です。真の値の標準偏差と観測値の標準偏差の比率は√ρとなるため、二変数間の相関では両方の影響を考慮して√(ρ_X×ρ_Y)という項が生じます。
これは「測定の不完全さが相関係数をどれだけ減衰させるか」を表しています。例えば、信頼性が両方とも0.6の場合、√(0.6×0.6)=0.6となり、観測される相関は真の相関の60%の大きさに減少します。
[7] ここで「÷√(ρ_X×ρ_Y)」と除算を行うのは、先に説明した相関の希薄化の式を変形して「真の相関」を求めるためです。元の式では「観測される相関=真の相関×信頼性の平方根」という関係でした。要するに、観測される相関は常に真の相関よりも小さくなります。
この関係を逆算して真の相関を求めるには、観測相関を信頼性の平方根で「割る」必要があります。これはシンプルな操作です。例えば観測相関が0.3で、両変数の信頼性がそれぞれ0.7と0.8だとします。このとき√(0.7×0.8)=0.75となり、真の相関は0.3÷0.75=0.4と推定されます。実際の関連性は観測値よりも約33%強いと考えられます。
[8] 本コラムで紹介したモデルは、相関の希薄化に焦点を当てて、特に誤差を「ランダムな要因で生まれるばらつき・ノイズ」を指す偶然誤差のみであると捉える古典的テスト理論に基づき考案されたものです。他方、相関係数に影響を及ぼす要因は、このモデルで挙がる信頼性以外に様々な誤差が考えられ、実際の実務データ分析ではそれらも考慮することが有効です。その際には、構造方程式モデリングや項目反応理論などの応用的手法が用いられます。
執筆者
伊達 洋駆 株式会社ビジネスリサーチラボ 代表取締役
神戸大学大学院経営学研究科 博士前期課程修了。修士(経営学)。2009年にLLPビジネスリサーチラボ、2011年に株式会社ビジネスリサーチラボを創業。以降、組織・人事領域を中心に、民間企業を対象にした調査・コンサルティング事業を展開。研究知と実践知の両方を活用した「アカデミックリサーチ」をコンセプトに、組織サーベイや人事データ分析のサービスを提供している。著書に『60分でわかる!心理的安全性 超入門』(技術評論社)や『現場でよくある課題への処方箋 人と組織の行動科学』(すばる舎)、『越境学習入門 組織を強くする「冒険人材」の育て方』(共著;日本能率協会マネジメントセンター)などがある。2022年に「日本の人事部 HRアワード2022」書籍部門 最優秀賞を受賞。東京大学大学院情報学環 特任研究員を兼務。