ビジネスリサーチラボ

open
読み込み中

コラム

「うちの部署は特別だから」を乗り越える:個別分析の限界と多母集団同時分析の可能性

コラム

現代の企業経営において、データは航海の羅針盤にたとえられます。市場の動向、顧客のニーズ、そして自社の組織状態。これらをデータで把握し、次の一手を決めることは、企業の存続に有用な活動です。人事領域では、従業員のエンゲージメントや満足度、生産性といった「ソフト」な側面をいかにデータで捉え、改善につなげるかがテーマとなっています。

そうした中で生まれるのが「部署間の違いを理解したい」というニーズです。「なぜ営業部は離職率が高いのか」「開発部のエンゲージメント施策を他部署にも展開できないか」「マネジメントのあり方は、部署によって効果が違うのではないか」。こうした問いに答えるべく、組織サーベイや社内データを手に、分析の世界へと足を踏み入れます。

ここで、一つの素朴で、一見すると合理的に思えるアプローチが頭に浮かびます。それは、「部署ごとにデータを分けて、それぞれ分析すれば良いのでは」という考え方です。営業部のデータで分析し、次に開発部のデータで分析する。いわばそれぞれの「カルテ」を作成し、それらを並べて比較検討する。明快で分かりやすい方法です。

しかし、この分かりやすさは、組織の真実を見誤らせる「罠」です。もし皆さんが分析担当者に「部署を単位に、関係性の違いを比較してほしい」と依頼したにもかかわらず、提出されたのが「部署ごとの分析レポート」の束だったとしたら、それは依頼の意図が満たされていない可能性があります。

本コラムの目的は、「部署ごとの個別分析」というアプローチに潜む問題点を解説し、それとは異なる分析手法である「多母集団同時分析」の特徴に迫ることにあります。なぜ、ただ数値を並べるだけでは「比較」にならないのか。組織の多様性と共通性をつかむための手続きとは何か。データという羅針盤を正しく使いこなし、組織という大海原を航海するための知見を解説していきたいと思います。

なぜ「部署ごとの分析」は選ばれがちなのか

問題の核心に迫る前に、「部署ごとの構造方程式モデリング(Structural Equation ModelingSEM)」というアプローチを理解し、なぜそれが魅力的に映るのかを考えてみましょう。

SEMは、それ自体が強力な分析手法です[1]。「ABに関連し、そのBCに関連する」といった、複数の要因が絡み合う複雑な関係の「構造」をモデル化し、その妥当性を検証することができます。「従業員満足度」や「組織へのコミットメント」といった、直接測定できない潜在的な概念を、複数のアンケート項目から統合して扱える点が、人事・組織領域の分析と相性が良い点です。

このSEMを部署ごとに行うというのは、どのようなプロセスを辿るのでしょうか。想像してみてください。

皆さんは、全社の従業員アンケートのデータを手にしています。巨大なデータの中から「営業部」のデータだけをフィルタリングして抽出します。この営業部データセットを用いて、「上司の支援」や「同僚との連携」が「仕事への熱意」にどう影響するか、というモデルを構築し、SEMを実行します。結果、営業部における各要素の関係性の強さ(パス係数)や、モデル全体の当てはまり具合(適合度)を表す数値が出力されます。皆さんは「なるほど、営業部では上司の支援がこれくらい熱意につながっているのか」と納得し、その結果をレポートにまとめます。

次に、データの中から「開発部」のデータを抽出します。営業部と同じ構造のモデルを、今度は開発部のデータに当てはめて分析します。再び、開発部特有のパス係数や適合度の数値が得られます。最後に、人事部のデータ、マーケティング部のデータ⋯と、社内に存在する部署の数だけ、この作業を繰り返していきます。

皆さんの手元には、各部署の「個別カルテ」とも言うべき分析レポートの束が出来上がります。そこには、部署ごとに異なる数値が並んでおり、一見すると、各部署の特性が見事に描き出されているように感じられます。「営業部はAの影響が強いが、開発部はBの影響が強い」といった結論が見つけ出せるように思えます。

このアプローチの魅力は、その直感的な分かりやすさとプロセスのシンプルさにあります。データを分割し、同じ分析を繰り返す。出力された結果を横並びに比較すれば、何かが見えてくるような気がする。この手軽さが、迅速な結果を求められる分析担当者にとっても誘惑となり得ます。

この個別カルテ方式は、各部署の健康状態を個別に診断するには有効かもしれませんが、部署間の「体質の違い」を比較するという目的においては欠陥を抱えています。それは、あたかも異なる言語で書かれたカルテを、翻訳機も使わずに無理やり比較しようとするような行為なのです。

個別分析の二つの課題

部署ごとの個別カルテを並べ、その数値の違いに一喜一憂する。この行為には、統計的な観点から見て二つの「課題」が存在します。それは「統計的検定の不在」と「測定の前提の欠如」です。この二つの問題点を理解することが、なぜ多母集団同時分析が必要なのかを理解する上で鍵となります。

統計的検定の不在:その差は本当に「差」なのか

具体的な分析結果を想像してみましょう。皆さんは部署ごとのSEMを行い、次の結果を得ました。

  • 営業部:「上司の支援」が「仕事への熱意」に与える影響の強さ(標準化パス係数)=0.60
  • 開発部:「上司の支援」が「仕事への熱意」に与える影響の強さ(標準化パス係数)=0.40

二つの数値を見比べて、皆さんはどう結論付けますか。直感的に「営業部の方が、開発部よりも上司の支援が仕事の熱意につながりやすい。その差は0.2だ」と考えるかもしれません。「営業部には支援型のマネジメントが有効だが、開発部には別の要因が重要なのかもしれない」といった考察へと進んでいくでしょう。

しかし、この思考プロセスが、個別分析における問題です。その0.2という差が、果たして本当に意味のある差なのかを検証していないからです。

統計学の基本的な考え方として、「母集団」と「標本」の区別があります。私たちが分析しているのは、あくまでアンケートに回答してくれた従業員という「標本」のデータであり、「母集団」そのものではありません。標本には、「サンプリングによる誤差」が含まれます。今回たまたま回答が集まった営業部のメンバーの傾向が少し強く出たり、開発部のメンバーの傾向が少し弱く出たりしただけで、母集団全体で見れば、実は両者に差がない、という可能性が存在するのです。

この「見かけ上の差」が「誤差の範囲内」なのか、それとも「誤差では説明できない、統計的に意味のある(有意な)差」なのかを判断するための手続きが、統計的検定です。個別分析では、この検定プロセスが欠落しています。営業部と開発部の分析は、それぞれ独立した世界で完結しており、二つの世界の間に存在する「0.2」という差を評価するための橋が架けられていません。

したがって、個別分析の結果を基に「営業部の方が影響が強い」と断定することに対しては慎重になるべきです。たまたま隣の家の子供の身長が自分の子供より2cm高かったからといって、「隣の家系は背が高くなる体質に違いない」と結論付けるのと同じような、早計な判断です。

比較の前提の欠如:「モノサシ」は同じか

個別分析が抱える問題は、さらに根深いところにもあります。それは、比較を行う上での前提、「全ての部署で、同じモノサシを使って測定できているか」という問いに答えていない点です。

私たちは「上司の支援」や「仕事への熱意」といった目に見えない概念を、複数のアンケート項目を通して測定しています。これらのアンケート項目群が、いわば概念を測るための「モノサシ」の役割を果たします。もし、このモノサシの性能が部署によって異なっていたとしたら、どうなるでしょうか。

例えば、「私は仕事に熱意を持っている」という項目を考えてみましょう。顧客と日々接し、目標達成へのプレッシャーが高い営業部の社員は、この「熱意」という言葉を「目標達成に向けた情熱」や「顧客への貢献意欲」と解釈するかもしれません。一方、長期的な視点で製品開発に没頭する開発部の社員は、「熱意」を「技術的な探求心」や「プロダクトへのこだわり」と解釈する可能性があります。

同じ「熱意」という言葉、同じ質問項目であっても、それが指し示すニュアンスや重点が、部署の文化や業務内容によって微妙に異なってしまいます。これは、ある部署ではインチのモノサシを使い、別の部署ではセンチメートルのモノサシを使って長さを測っているようなものです。当然、それぞれのモノサシで測定された数値をそのまま比較しても、意味のある結論は得られません。営業部で測定された「熱意スコア:5」と、開発部で測定された「熱意スコア:5」は、異なる「質」を持つ可能性があるのです。

個別分析では、この「測定のモノサシが部署間で同じように機能しているか(=測定不変性)」を検証する手続きがありません。各部署の分析は、その部署で使われている独自のモノサシの存在を疑うことなく進められてしまいます。その結果、観測されたパス係数の違いが、真の関係性の違いを反映しているのか、それとも「モノサシの違い」に起因するものなのかを、区別することができなくなります。

これら二つの課題、すなわち統計的検定の不在と、測定の前提の欠如は、部署ごとの個別分析が、なぜ「比較」という目的において適切ではないのかを示しています。では、これらの問題を克服するためには、どうすれば良いのでしょうか。

多母集団同時分析の特徴

部署ごとの個別分析が抱える限界を乗り越え、複数のグループ間に存在する共通性と差異を解き明かす。そのための処方箋が、「多母集団同時分析」です[2]。この手法は、全ての部署を一つの分析フレームワークの中に位置づけ、厳密な手続きに則って比較検討を行います[3]

この手法の核心は、「段階的な制約」を用いた検証プロセスです。複数のグループ間で「ここまでは同じだと言えるか」「では、ここも同じだと言えるか」と、少しずつ仮説のハードルを上げ、どこでその仮説が成り立たなくなるか(=グループ間に差異が存在するか)を探っていくプロセスです。

ステップ1:モデルの「形」は共通か?

比較の旅は、最も基本的な問いから始まります。「検証したいモデルは、そもそも全ての部署に当てはまるのか」。配置不変性の検証です。

この段階では、全ての部署で同じ構造のモデルを仮定しますが、パス係数や因子負荷量といったパラメータは、各部署で自由に動くことを許します(制約なしモデル)。このベースラインとなるモデルを全データに適用し、モデル全体の当てはまり具合(適合度)を評価します。この時点で適合度が低い場合、それはモデルの構造自体が特定の部署には全くフィットしていない可能性を示唆しており、比較の前提が揺らぐことになります。全ての部署で、まずまずの適合度が確保されること。それが第一歩です。

ステップ2:比較の前提を築く

先ほど指摘した個別分析の問題点、「モノサシは同じか」という問いに、多母集団同時分析は正面から向き合います。この検証こそ、多母集団同時分析の心臓部と言えるでしょう。

モノサシをそろえる

まず課すのは、「因子負荷量」に対する等値制約です。因子負荷量とは、潜在変数(例えば「上司の支援」)を測定するための個々のアンケート項目(観測変数)の「重み」のことです。この重みが全部署で等しい、という制約をモデルに課します。これを計量不変性の検証と呼びます。

これは、モデルが抽出する概念が、どの部署でも同じであることを保証する作業のようなものです。例えば、この制約を課したモデルと、制約のないベースラインモデルを統計的に比較し、制約を課したモデルの方がベースラインモデル以上に適合度が良ければ、「測定された概念は全部署で共通だ」と結論できます。この段階をクリアして初めて、「上司の支援」から「仕事への熱意」へのパス係数の「強さ(傾き)」を部署間で比較することに意味が生まれます。

モノサシの「目盛り」をそろえる

さらに厳しい制約を課します。因子負荷量に加え、観測変数の「切片(または閾値)」も部署間で等しいという制約です。これをスカラー不変性の検証と呼びます。

これは、同じ概念を測定できていることに加えて、モノサシの目盛りの間隔も全部署でそろっていることを保証する作業です。この厳しい制約が成り立つと、潜在変数の「平均値」を部署間で直接比較することが可能になります。「営業部は、開発部よりも潜在的な『上司の支援』のレベルが統計的に有意に高い(低い)」といった、より踏み込んだ議論が行えるようになるのです。

ステップ3:本丸への挑戦

比較のための頑健なモノサシが用意できて、初めて本題である「関係性の比較」へと進むことができます。これが構造不変性の検証です。

ここで検証したい特定のパス係数、例えば「上司の支援」「仕事への熱意」のパス係数に対して、「この係数は全部署で等しい」という等値制約を課します。この制約モデルと、制約を課す直前のモデル(測定不変性が担保されたモデル)の適合度を比較します。

もし、適合度が統計的に有意に悪化しなければ、この制約は「妥当」であると判断されます[4]。これは、パス係数を等しいと仮定しても問題ない、すなわち「上司の支援が熱意に与える影響の強さは、部署間で差があるとは言えない」という結論を意味します[5]。逆にもし、適合度が統計的に有意に悪化した場合、この制約は「棄却」されます。これは、パス係数を無理やり等しいと置いたことで、データへの当てはまりが悪くなったことを意味し、「この関係性の強さは、部署によって有意に異なる」と結論付けられます。

ここで、私たちが求めていた答えが得られます。個別分析では「0.60.4だから、たぶん違うだろう」という推測しかできませんでしたが、多母集団同時分析では、「統計的な検定の結果、この二つの係数には有意な差が存在する」と述べることができるのです。

多母集団同時分析がもたらす価値

多母集団同時分析は、個別分析では得ることのできない知見を組織にもたらします[6]。それは組織のダイナミクスを理解し、より的確な意思決定を行うための情報となります。

施策の「普遍性」と「特異性」の峻別

多母集団同時分析がもたらす価値の一つは、人事施策やマネジメントアプローチの効果範囲を特定できることです。

例えば、「裁量権の付与(付与なし=0/付与あり=1)」が「従業員の自律性」に与える影響について、パス係数の等値制約が棄却されなかったとします。これは、「裁量権を与えるというアプローチは、営業部であろうと開発部であろうと、等しく従業員の自律性を高める効果がある」という施策の普遍性を示唆します。これは、全社一律で展開すべき、費用対効果の高い施策である可能性が高いことを意味します。

一方で、「1on1ミーティングの頻度」が「上司への信頼感」に与える影響について、パス係数の等値制約が棄却されたとします。これは、1on1の効果が部署によって異なる施策の特異性を示しています。制約を外して係数を見ると、顧客対応で日々状況が変わる営業部では効果が高い(係数が大きい)が、プロジェクト単位で動く開発部ではそれほど効果が見られない(係数が小さい、あるいは有意でない)といった発見があるかもしれません。

このような知見は、限られた経営資源をどこに集中投下すべきか、という重要な経営判断に直結します。「全社一律の研修」よりも「特定部署に特化した施策」の方が有効なケースや、その逆のケースを、データに基づいて判断できます。

組織文化という「なぜ」への洞察

多母集団同時分析の結果は、それ自体が最終的な答えではなく、より深い問いへの出発点となります。「なぜ、この部署ではこの関係性が特に強いのか」「なぜ、あの部署ではこの関係性が見られないのか」という「なぜ」を考えることで、数値の背後にある組織文化や風土、マネジメントスタイルの違いを浮き彫りにすることができます。

例えば、開発部でのみ「同僚からのフィードバック」が「個人の成長実感」に強く結びついていることが分かったとします。この結果を基に、開発部のメンバーにヒアリングを行うと、「コードレビューの文化が根付いており、同僚からの技術的な指摘が成長の糧になっている」という実態が見えてくるかもしれません。一方で、他の部署ではフィードバックが形式的なものに留まっている可能性も示唆されます。

このように、定量的な分析結果を、定性的な情報と組み合わせることで、各部署が持つ無形の資産や、逆に改善すべき課題を、より解像度高く理解することができます。データは、組織の深層を探るための「問い」を投げかけてくれます。

科学的根拠が育む建設的な対話

組織変革を進める上で壁となるのが、「うちの部署は特別だから」「他所のやり方は通用しない」といった、各部署の個別事情を盾にした抵抗です。このような場では、建設的な議論は生まれません。

多母集団同時分析は、この状況を打破する武器となります。分析結果を基に、人事担当者や経営層は、各部署のマネージャーに対して次のように語りかけることができます。

「データによれば、『公正な評価制度』が従業員の満足度に与える影響は、全社共通の傾向として確認されました。この点については、まず全社基準で制度の浸透を図ることが重要です。一方で、『上司による頻繁な声かけ』の効果については、皆さんの部署に特有の低い傾向が見られます。これはなぜだと思われますか。一緒に原因を探り、皆さんの部署に合ったコミュニケーションのあり方を考えていきませんか」

このような対話は、相手を一方的に否定するものではありません。「共通の課題」と「個別の課題」をデータで切り分け、尊重した上で、協力を促すものです。これによって、感情的な反発を避け、各部署が自身の状況を見つめ直し、課題解決に向けて主体的に動き出すきっかけを創出することができます。

脚注

[1] 構造方程式モデリングの詳細は当社のセミナーレポートが参考になります。

[2] 多母集団同時分析の詳細は当社コラムをご覧ください。

[3] 多母集団同時分析は有効な手法ですが、実用上、比較対象となる各グループで十分なサンプルサイズ(回答者数)が確保されていることが前提となります。明確な基準はありませんが、一般的に各グループで100名程度が目安とされることがあります。サンプルサイズが小さいグループでは、モデルの推定結果が不安定になったり、統計的検定力が低くなったりする問題が生じます。その結果、本来は存在するはずの部署間の違いを「差はない」と誤って結論付けてしまうリスクが高まるため、分析を適用する際には注意が必要です。

[4] ここで行う検定としては、カイ二乗値の差の検定が有名です。SEMを行う複数の分析モデルに対して各モデルのカイ二乗値を算出し、それらの差が有意か否か検討することで、いずれのモデルがよりデータにフィットしているか判断することができます。

[5] 統計的検定において、「有意差がない」という結果は「両者に差がない(完全に等しい)」ことを証明するものではありません。これはあくまで「両者の間に差がある、と結論付けるための積極的な証拠が見つからなかった」ことを意味します。サンプルサイズが小さいなどの理由で、本当は存在する小さな差を検出できなかった可能性も残ります。

[6] 多母集団同時分析を含む構造方程式モデリング(SEM)は、変数間の関連性の構造を検証する手法ですが、結果の解釈には注意が必要です。分析モデル内のパスは、あくまでデータから示唆される統計的な関連の強さを示すものであり、直ちに「ABの原因である」という因果関係を証明するものではありません。


執筆者

伊達 洋駆 株式会社ビジネスリサーチラボ 代表取締役
神戸大学大学院経営学研究科 博士前期課程修了。修士(経営学)。2009年にLLPビジネスリサーチラボ、2011年に株式会社ビジネスリサーチラボを創業。以降、組織・人事領域を中心に、民間企業を対象にした調査・コンサルティング事業を展開。研究知と実践知の両方を活用した「アカデミックリサーチ」をコンセプトに、組織サーベイや人事データ分析のサービスを提供している。著書に『組織内の“見えない問題”を言語化する 人事・HRフレームワーク大全』、『イノベーションを生み出すチームの作り方 成功するリーダーが「コンパッション」を取り入れる理由』(ともにすばる舎)、『越境学習入門 組織を強くする「冒険人材」の育て方』(共著;日本能率協会マネジメントセンター)などがある。2022年に「日本の人事部 HRアワード2022」書籍部門 最優秀賞を受賞。東京大学大学院情報学環 特任研究員を兼務。

#実務のための統計解析 #伊達洋駆 #人事データ分析

アーカイブ

社内研修(統計分析・組織サーベイ等)
の相談も受け付けています