2026年1月6日
組織サーベイと正規分布の誤解:「歪んだデータ」という現実
企業が組織の現状を診断し、より良い職場環境を築くために実施する組織サーベイ。数千人、あるいは数万人規模の従業員から得られたデータは、組織の現状を客観的に把握し、未来への示唆となるべきものです。しかし、その第一歩であるデータ解釈の段階で、ある種の担当者が陥るかもしれない「思い込み」が存在します。
それは、従業員エンゲージメントや仕事満足度といった指標のスコア分布をグラフ化した際、それが統計学の教科書で目にするような左右対称の美しい「正規分布」を示していないことに対して、「これは問題だ」「データとしておかしいのではないか」と考えてしまうことです。
この反応は、一見するとデータに対する誠実な態度のようにも見えますが、組織サーベイの価値を損ないかねない誤解に基づいています。結論を先に述べると、サーベイのスコアが正規分布に従わないのは、多くの場合は異常でも問題でもなく、むしろそれが組織の「ありのままの姿」を反映した自然な結果です。
本コラムでは、この「正規分布への過度な期待」という誤解を解きほぐしていきます。なぜ私たちは、無意識のうちに正規分布を理想的な形だと考えてしまうのでしょうか[1]。そして、不完全に見えるデータの「歪み」や「偏り」から、組織のリアルな状態や、具体的な改善策につながる洞察をいかに引き出すべきなのでしょうか。サーベイ結果のグラフを前に、短絡的な判断を下すのではなく、データが真に伝えようとしているメッセージに耳を傾けることの重要性を解説していきます。
分布の形が語る組織のリアルな姿
基本的な問いから始めましょう。なぜ組織サーベイで測定される心理尺度のスコアが、正規分布に従うと期待されるのでしょうか。この期待の背景には、物理的な測定値と心理的な測定値の性質の混同があるかもしれません。
身長や体重といった生物学的な測定値は、数多くの遺伝的・環境的要因がランダムに、かつ独立して影響を及ぼし合った結果として、その分布が正規分布に近くなることが知られています[2]。しかし、従業員の「仕事への満足度」や「エンゲージメント」といった心理的な状態は、そのようなランダムな要因の集合体ではありません。「経営陣が打ち出した新しい人事制度」「直属の上司のマネジメントスタイル」「所属する部署の文化」といった、強力で特定の方向性を持った要因に左右されます。
例えば、全社的に従業員のエンゲージメント向上施策が成功し、多くの従業員が高い意欲を持って仕事に取り組んでいる組織を想像してみてください。この組織のエンゲージメントスコアを測定すれば、その分布は高得点側に偏るはずです。これは何ら問題ではなく、組織が目指した状態が実現していることを示す、喜ばしい結果でしょう[3]。
逆に、ほとんどの従業員が過度なストレスなく働けている職場であれば、ストレスに関するスコアの分布は、低得点側に偏るのが自然な姿です。もし、これらのスコアが正規分布を描いたとしたら、それは「平均的な満足度の社員が最も多く、極端に満足している社員と不満な社員がほぼ同数存在する」という解釈に悩む状態になります。
したがって、「正規分布からのズレ」を問題視するのではなく、その分布の形が、組織の状態を解読するための重要な情報源なのだと認識を改める必要があります。分布の具体的な形状は、多様な組織の現実を私たちに教えてくれます。
- 二峰性の分布(山が二つある形):組織内に性質の異なる二つの集団が存在することを示唆するサインです[4]。例えば、営業部門と開発部門の間で満足度に格差が生じているのかもしれません。あるいは、正社員と契約社員の間でエンゲージメントに断絶がある可能性も考えられます。管理職と従業員の認識が割れている状態を反映していることもあります。
- 特定のスコアへの集中と歪み:スコアが上限や下限に集中し、歪みを見せている場合、組織の状態だけでなく、サーベイの設問自体に問題がある可能性も疑うべきでしょう。例えば、設問が容易に「あてはまる」を答えやすい簡単すぎる内容であったり、従業員にとって好ましい回答が明らかでそう答えざるを得ない状態だと、多くの回答が最高点に集中する「天井効果」が起こります。逆に、「自分を犠牲にしてでも自社に貢献を果たしたい」など設問が極端な表現ばかりだと、「さすがに、そこまでの気持ちは持つことができない」と最低点に回答が集中する「床効果」が生じます。これらは、組織の実態を正確に反映していない、測定上の課題を示唆しています。
このように、分布の歪みや偏りは、組織の成功、課題、内部の分断、あるいは測定方法の妥当性など、多岐にわたる情報を含んでいます[5]。それを「正規分布ではないから問題だ」と片付けてしまうことは、組織の現状を理解するための手がかりを放棄することに等しいのです。
「良い尺度」の意味を理解する
こうした説明に対して、「いや、『科学的にきちんとした尺度』で測定すれば、結果は正規分布するはずだ」という反論が聞かれます。この考えもまた、尺度の品質と測定結果の分布を混同した誤解に基づいています。
心理測定論の世界において、「良い尺度」であるための科学的な基準は、主として「信頼性」と「妥当性」という二つの概念によって定義されます。
- 信頼性:測定の「安定性」や「一貫性」を意味します。例えば、体重計に乗るたびに数値が±10キログラムも変動するようでは、その体重計は信頼できません。心理尺度も同様に、同じ人が短い期間内に再回答した場合などに、結果が大きくブレないことが求められます。
- 妥当性:その尺度が「測定したい概念を、本当に正しく測れているか」という「的確性」を意味します。例えば、数学の能力を測りたいのに、国語の読解力ばかりを問うテストを作成しても、それは妥当性の低いテストです。エンゲージメントを測定するための尺度が、「権限移譲を受けている程度」や「同僚との仲の良さ」を測ってしまっているとしたら、その尺度は妥当性に欠けると言えます。
重要なのは、この尺度の品質を担保する信頼性と妥当性の定義の中に、「測定結果が正規分布すること」という要件は含まれていない、という事実です。尺度の品質と、その尺度を用いて特定の集団から得られたデータの分布形状は、別の問題として扱われるべきです。
むしろ、話は逆です。妥当性の高い、要するに「測りたいものを正しく測れている」尺度であればあるほど、測定対象となる組織のありのままの姿を反映します。もし組織の満足度が実際に高い水準にあるのなら、妥当性の高い尺度は、その高い状態を「高得点側に歪んだ分布」として正確に描き出すはずです。それこそが、その尺度の品質が高いことの証左です。
どのような組織を測定しても常に正規分布を描き出す尺度があったとしたら、それは現実の多様性を無視して、すべての結果を「正規分布」という型にはめ込んでいる、妥当性の低い尺度である可能性すらあります。
このことは、同じ尺度を異なる性質の組織に適用した場合を想像すると、より明確に理解できます。例えば、ある優れたストレス尺度を、従業員を大切にする組織と、過酷な労働環境で知られる組織の両方で実施したとします。もしこの尺度が本当に「良い尺度」であるならば、前者の組織ではスコアが低得点側に偏り、後者の組織では高得点側に偏るという、異なる分布を示すはずです。この二つの組織の違いを描き出せる能力が、尺度の価値です。
「良い尺度なら正規分布するはずだ」という考えは、尺度が果たすべき本来の役割を見失った議論と言わざるを得ません。
「正規分布」という思い込みが生まれる理由
論理的に考えると不自然な「正規分布への期待」が、なぜ一定の人々の思考に影響を与えているのでしょうか。その背景には、私たちが受けてきた統計教育のあり方と、人間の直感的な思考のクセが関わっているかもしれません。
第一の理由は、統計学の基礎教育が「正規分布」を主に展開されることに関連しています。大学などで統計学を学ぶ際、t検定や分散分析といった分析手法から入ります。これらの伝統的な手法の多くが、その数学的な理論の前提として「分析対象のデータが母集団において正規分布に従うこと」を仮定しています[6]。
この分析上の仮定を勘違いしてしまい、「統計分析を行う上での『技術的な前提条件』」であったはずの正規分布が、いつの間にか「データが本来あるべき『理想の姿』」へと、私たちの認識の中で無意識のうちにすり替わっている可能性があります。
この誤解を後押しするのが、統計学における有名な定理の一つである「中心極限定理」の存在です。この定理が述べているのは、「母集団がどのような分布であっても、そこから無作為に抽出した標本のサイズが十分に大きければ、『標本平均の分布』は正規分布に近づく」ということです[7]。
ここが重要なポイントです。この定理が言っているのは、あくまで「平均値の分布」が正規分布に近づくということであり、「実際に測定・取得されるデータ一つひとつからなる分布」が正規分布になるということではありません。例えば、1万人の従業員の中から無作為に100人を選んでその平均点を計算する、という作業を何千回も繰り返せば、その結果として得られる無数の「平均点」の分布は正規分布に近づきます。しかし、もととなる「1万人一人ひとりのスコアの分布」が正規分布になることは、この定理は保証していません。
第二の理由は、正規分布が持つ、視覚的・心理的な魅力です。左右対称で、中央(平均値)が最も高く、なだらかに裾野が広がるカーブは、見た目に美しく、安定感や調和を感じさせます。これは推測でしかないのですが、私たちはこの視覚的な印象から、「偏りがない」「バランスが取れている」「自然な状態」といった、ポジティブで規範的な価値観を無意識に投影してしまうのかもしれません。その心地よいイメージを、科学的な正しさやデータの健全さと混同してしまうのです。
歪んだ分布は、直感的に「不自然」「偏向している」「どこかおかしい」と感じられ、その感情的な反応が、データを客観的に評価する際の妨げとなるのでしょう。
脚注
[1] 正規分布を「本来あるべき理想の姿」と見なすのは誤解ですが、「思考の出発点となる基準」として用いることには価値があります。例えば、「もし人的・環境要因がランダムに作用するならば、分布はこの正規分布に近いはず。しかし、実際のデータは大きく左に歪んでいる。この『ズレ』を生み出している特定の要因は何か」という問いを立てることができます。このように、正規分布とのギャップに着目することで、組織に強く作用している特有の要因を検討する手がかりが得られます。
[2] 厳密には、成人の身長や体重など連続的な身体指標も左右対称な完全正規分布ではなく、平均値より高い側(体重なら重い側)に裾がわずかに長く伸びる「正の歪み」を示すことがあります。成長障害など下方向の生物学的な制約が強い一方、上方向には生活環境や栄養状態による余地が残るためです。
[3] 本文では説明のために単純化していますが、実際に分布の歪みを組織状態と直接関連付ける際は注意が必要です。右に歪んだ分布が必ずしもエンゲージメント施策の成功を意味するとは限りません。回答者の社会的望ましさバイアス(好ましい回答をしようとする傾向)、測定尺度の天井効果、特定部署からの回答偏重、回答率の偏りなど、様々な測定上の問題が同様の分布を生み出す可能性があります。分布の解釈には、これらの代替説明を検討し、追加的な分析や質的データとの照合を通じて、より慎重な判断を行いましょう。
[4] 二峰性分布の出現は、必ずしも組織内の集団分化を意味するわけではありません。測定尺度の中点回避傾向(中間的な回答を避ける心理的傾向)、極端回答スタイル(常に両極端で回答する個人特性)、設問の曖昧性による解釈の分裂、回答選択肢の不適切な設定などが原因となることもあります。また、データ収集時期の違いや回答環境の差異も二峰性を生み出す可能性があります。したがって、二峰性を観察した際は、まず測定方法の要因を検証し、その上で組織構造上の要因を検討しましょう。
[5] 分布の非対称性を示す指標が「歪度」、分布の尖り具合を示す指標が「尖度」です。歪度は、正の値なら左に分布の山が偏っている「右に歪んだ」分布、負の値なら右に山がある「左に歪んだ」分布を示します。尖度は、正規分布を基準(0)とし、正の値ならより尖った分布、負の値ならより平坦な分布であることを意味します。これらの指標を用いることで、分布の形状を数値で比較・評価することが可能になります。
[6] 統計モデルが持つ仮定(例えば、正規分布)が厳密には満たされていなくても、ある程度まで信頼できる結果を出力できる性質を「頑健性」と呼びます。t検定や分散分析は、サンプルサイズが十分に大きい場合、中心極限定理の恩恵により、この頑健性を持つことが知られています。ただし、データが極端に偏っていたり、外れ値が多かったりする場合には、この頑健性は損なわれます。
[7] ただし、統計分析の実践においては、中心極限定理の恩恵を受けられる「標本平均の分布」だけでなく、個々のデータの分布も重要な意味を持ちます。例えば、回帰分析では残差の正規性、分散分析では各群内のデータの正規性が仮定されており、これらは個々の観測値の分布特性に依存します。また、外れ値の検出や信頼区間の正確性も、元データの分布形状に影響されます。要するに、中心極限定理があるからといって、個々のデータの分布を無視してよいわけではなく、分析の目的と手法に応じて、適切な分布仮定の確認と、必要に応じた変換や代替手法の検討が求められます。
執筆者
伊達 洋駆 株式会社ビジネスリサーチラボ 代表取締役
神戸大学大学院経営学研究科 博士前期課程修了。修士(経営学)。2009年にLLPビジネスリサーチラボ、2011年に株式会社ビジネスリサーチラボを創業。以降、組織・人事領域を中心に、民間企業を対象にした調査・コンサルティング事業を展開。研究知と実践知の両方を活用した「アカデミックリサーチ」をコンセプトに、組織サーベイや人事データ分析のサービスを提供している。著書に『組織内の“見えない問題”を言語化する 人事・HRフレームワーク大全』、『イノベーションを生み出すチームの作り方 成功するリーダーが「コンパッション」を取り入れる理由』(ともにすばる舎)、『越境学習入門 組織を強くする「冒険人材」の育て方』(共著;日本能率協会マネジメントセンター)などがある。2022年に「日本の人事部 HRアワード2022」書籍部門 最優秀賞を受賞。東京大学大学院情報学環 特任研究員を兼務。

