ビジネスリサーチラボ

open
読み込み中

コラム

データから施策へ:マルチレベル分析の読み解き方

コラム

データ分析の重要性が高まる中、複数の階層を持つデータを適切に分析することは、人事施策の効果検証や従業員エンゲージメント向上のために重要です。企業内では、個人のデータが部署やチームという集団に属しているという階層構造があります。

このような「入れ子構造」を持つデータを分析する際、従来の統計手法には限界があります。同じ部署に所属する従業員間のデータには相関関係が生じることがあり、データの独立性という統計分析の前提条件が満たされないからです。組織サーベイを例にすると、同じ上司の下で働く従業員は似たような回答傾向を示すことがあり、これを無視した分析では誤った結論に至る可能性があります。

マルチレベル分析は、このようなデータの階層性を考慮に入れることができる手法です。個人レベルと集団レベルの影響を同時に評価できるため、「どの程度の違いが個人に起因し、どの程度が環境に起因するのか」といった問いにも答えることができます。本コラムでは、マルチレベル分析の結果を理解し、実務に活かせるよう、その読み解き方を解説していきます。

マルチレベル分析とは何か

マルチレベル分析は、階層構造を持つデータを分析するための手法です。組織サーベイを例に考えてみましょう。企業の従業員一人ひとりがアンケートに回答する場合、各従業員はチームや部署に所属しており、さらにはその部署は企業全体の中に位置づけられています。このような状況では、個人(レベル1)がチームや部署(レベル2)に内包された構造になっています。

通常の回帰分析でこうしたデータを扱う場合、同じ部署に所属する従業員の回答には類似性があることが十分に考慮されません。例えば、リーダーシップの強い上司がいる部署では、その部署に属する従業員全体のエンゲージメントが高くなる可能性があります。逆に、コミュニケーションが不足しているチームでは、全体的に低いエンゲージメントを示すかもしれません。集団レベルの影響を無視してデータを分析すると、実際より効果を過大または過小に評価してしまいます。

データの階層性を無視すると、個人レベルで見られる関係性と集団レベルで見られる関係性を区別できません。例えば、「個人の業務経験が豊富なほどエンゲージメントが高い」という個人レベルの関係と、「経験豊富なメンバーが多い部署ほど平均エンゲージメントが高い」という集団レベルの関係は、質的に異なる意味を持ちます。マルチレベル分析はこれらを区別して推定できます。

マルチレベル分析では、変動(ばらつき)の源泉を複数のレベルに分解します。組織サーベイの場合、従業員のエンゲージメントスコアの違いは、個人差によるものと部署差によるものに分けて考えることができます。どちらの影響がより大きいのかを知ることで、施策の方向性も変わってくるでしょう。

マルチレベル分析の全体イメージ

マルチレベル分析においては、段階的にモデルを構築していきながら、データの階層構造を明らかにしていきます。組織サーベイを例に、この流れを見ていきましょう。

最初に、何も説明変数を入れない「無条件モデル」を構築します。これは部署間にエンゲージメントスコアの得点が多様かどうかだけを確認するためのモデルです。このステップで、部署による違いがどの程度存在するのかを把握します。例えば、「複数ある部署間にある、エンゲージメントスコアのばらつき」が統計的に有意なのか、ばらつきは具体的にどの程度あるかを評価します。

続いて、個人レベルの要因を加えたモデルを検討します。年齢、勤続年数、職位、あるいは自己効力感などの個人属性を説明変数として追加し、それらがエンゲージメントにどのように影響しているかを調べます。例えば、「勤続年数が長い従業員ほどエンゲージメントが高い」といった関係性を確認できます。このステップで大事なのは、部署間にあるエンゲージメントスコアのばらつきをモデルに含めてあることで、従業員間の個人差に焦点を当てた分析がより正確にできることです。

さらにこれを、部署レベルの要因を加えたモデルへと発展させます。リーダーシップスタイル、部署の雰囲気、部署の規模など部署全体で捉えられる変数を追加することで、部署間の違いを説明する要因を特定します。例えば、「変革型リーダーシップが実践されている部署ほど、平均エンゲージメントが高い」といった関係性が見えてくるかもしれません。

必要に応じてモデルをさらに複雑化させます。例えば、「部署によって、勤続年数がエンゲージメントに与える影響の大きさが異なる」といった交互作用を検討することもあります。ある要因の効果が部署ごとに変化する可能性を考慮するというものです。

マルチレベル分析の解釈では、主に次の点に注目します。まず、変量効果(部署間のばらつき)を確認し、モデルに含まれていない部署レベルの要因がどの程度存在するかを把握します。次に、固定効果(説明変数の回帰係数)を見て、各要因がエンゲージメントにどのような影響を与えているかを理解します。そして、モデルの適合度指標を比較して、モデルがデータをよく説明しているかを判断します。

このように段階的なアプローチを取ることで、複雑な階層構造を持つデータから意味のある知見を抽出し、効果的な人事施策の立案につなげることができるのです。

ステップ別の解釈方法

マルチレベル分析の結果を正しく解釈するために、分析の各ステップでどのようなことを確認すべきかを理解しましょう。ステップごとの解釈方法を解説します。

分析を行う前にデータの全体像を把握します。エンゲージメントスコアの分布はどうなっているでしょうか。平均値や標準偏差、最小値・最大値などの基本統計量を確認します。部署ごとの回答者数に偏りがないか、極端に少ない部署はないかといった点もチェックします。データに極端な外れ値がある場合は、それが分析結果に不当な影響を与えないよう注意が必要です。

ステップ1:無条件モデル

無条件モデル(あるいはNull Model)の結果を解釈します。これは説明変数を全く含まないモデルで、単にエンゲージメントスコアを個人レベルと部署レベルの変動に分解するだけのものです。このモデルから得られる重要な情報は、級内相関係数(ICCIntraclass Correlation Coefficient)です。ICCは全体の変動のうち、部署間の違いによって説明される割合を表します。例えば、ICC=0.15であれば、エンゲージメントスコアの変動の15%は部署の違いによるものだと解釈できます。ICC0.055%)未満であれば部署による差はあまり大きくなく、0.1010%)以上あれば部署による差が無視できないという見方が一つの参考値として使われたり、ICCが有意か否かを有意性検定で判断することが多いです。ただし、これはあくまで目安の一つであり、領域や分析の文脈によって判断基準は異なります[1]

ステップ2:個人レベルの要因を入れる

個人レベルの要因を加えたモデルに進みます。ここでは、年齢、勤続年数、職位(管理職なら1、一般職なら0)などの個人変数がエンゲージメントにどう影響しているかを検証したとしましょう。例えば、各変数の回帰係数とその統計的有意性(p値)が得られるでしょう。「勤続年数の係数=0.05, p<0.01」という結果は、モデルに含まれる他のすべての影響指標を統制した勤続年数(の残差)が1ポイント増えるごとにエンゲージメントスコアが平均して0.05点上昇することを示しています。これが統計的に有意であれば、勤続年数とエンゲージメントの間に正の関連があると解釈できます。

同様に、「職位の係数=0.30, p<0.05」という結果があれば、一般社員と比較して管理職のエンゲージメントは有意に高いことを示します。また、「年齢の係数=0.01, p=0.20」のように統計的に有意でない結果は、年齢とエンゲージメントの間に明確な関連は見られないことを意味します。

ステップ3:部署レベルの要因を入れる

部署レベルの要因を加えたモデルを解釈します(ランダム切片モデル)。ここでは、リーダーシップスタイル、チーム風土、部署規模などの部署ごとに共通の特性を説明変数として追加します。例えば、「変革型リーダーシップスコアの係数=0.40, p<0.01」という結果は、モデルに含まれる他のすべての影響指標を統制したリーダーシップスコア(の残差)が1ポイント高い部署では、平均エンゲージメントが0.40点高いことを示しています。上司のリーダーシップが優れている部署ほど、従業員のエンゲージメントも高いと解釈できます[2]

「部署の平均残業時間の係数=-0.05, p<0.05」という結果があれば、部署全体の残業時間が増えるごとに、部署全体のエンゲージメントが下がることを意味します。仕事量が多すぎる部署ではエンゲージメントが低下すると言えるでしょう[3]

部署レベルの変数を追加した後、部署間のばらつきがさらにどれほど減少したかも確認します。例えば、部署レベルの変数を入れた後の部署間ばらつきが0.15だったのが、部署レベル変数を追加した後に0.05に減少したとします。これは、残りの部署間の違い(約5%)がリーダーシップや部署の特性によって説明されることを意味します。もし部署間のばらつきがほとんどゼロに近くなれば、「部署による違いのほとんどは、我々が考慮した要因で説明できる」と言えます。

ステップ4:ランダム係数モデルなど

必要に応じて、ランダム係数モデルを検討します。これは、個人レベルの変数の効果が部署ごとに異なることを検証するモデルです。例えば、「勤続年数の効果は部署によって異なるか」という問いに答えることができます。分析結果からは、「個人レベルにおける勤続年数の効果のばらつき」とその統計的有意性が示されます。これが有意であれば、勤続年数がエンゲージメントに与える影響は部署ごとに異なることを意味します。

このようなランダム係数に対して、部署レベルの変数がどう影響するかの調整効果を検討することもできます[4]。例えば、「勤続年数の効果×リーダーシップスコアの調整効果(交互作用[5]=0.03, p<0.05」という結果があれば、リーダーシップの高い部署では、勤続年数がエンゲージメントに与えるプラスの効果がさらに強まることを表しています。「良いリーダーがいる部署では、長く働く人ほどエンゲージメントが高い傾向が強い」などといった解釈ができるかもしれません[6]

マルチレベル分析の結果を段階的に解釈することで、個人と部署の両レベルで従業員エンゲージメントに影響を与える要因を特定し、より効果的な施策へとつなげることができます。

結果をどう実務で活かすか

マルチレベル分析から得られた知見を人事施策に活かすことで、エンゲージメント向上が期待できます。ここでは、分析結果を実務にどのように応用できるかを見ていきましょう。

部署間のエンゲージメント平均に有意なばらつきがあり、部署レベルの影響指標における有意な関連が確認された場合、それに応じた対策を講じることができます。例えば、部署レベルの変数として「変革型リーダーシップ」がエンゲージメントと強い正の関連を示した場合、管理職研修を充実させると良いかもしれません。また、「チーム内コミュニケーションの頻度」が要因として浮かび上がった場合は、チーム会議やフィードバックを促進する仕組みを整えることが有効でしょう。

部署間にあるエンゲージメントのばらつきが「部署の平均残業時間」によって説明される場合、働き方改革や業務効率化のための施策を優先的に実施することが考えられます。残業時間の多い部署に対して、業務プロセスの見直しや人員配置の適正化などを検討する必要があるでしょう。ここまで挙げた分析結果の例は部署レベルで示された関連なため、いずれも個々の従業員向けでなく、部署やチーム全体に向けた施策として企画することが重要です。

個人レベルの要因に関しては、例えば「勤続年数が長い従業員ほどエンゲージメントが高い」という結果が得られた場合、人材の定着を促進する施策に力を入れるという考え方があり得ます。長期的なキャリアパスの明確化や、勤続年数に応じた報酬制度の見直しなどが考えられます。逆に「勤続年数とともにエンゲージメントが低下する」傾向が見られる場合は、中堅社員向けのリフレッシュ施策や新たな挑戦の機会を提供するなど、マンネリ化を防ぐ施策が重要になるでしょう。

「自己効力感」がエンゲージメントと強い関連を示した場合は、社員の成功体験を増やし、肯定的なフィードバックを提供することで自信を高める取り組みが効果的です。小さな成功を積み重ねられるような業務設計や、成果を評価する仕組みを整えることが考えられます。ここまで挙げた関連はすべて個人レベルのものであるため、施策は個々の従業員に向けた個別アプローチを強調することが大切です。

マルチレベル分析から得られる調整効果の結果も、実務に示唆を与えます。例えば「支持的なリーダーシップがある部署では、新入社員のエンゲージメントが特に高い」という調整効果(交互作用)が見られた場合、新人受け入れ部署の上司に対してサポート型のリーダーシップ研修を強化することが効果的でしょう。

また「テレワーク比率が高い部署では、コミュニケーション満足度とエンゲージメントの関連が特に強い」という結果が得られた場合、テレワーク環境下でのコミュニケーション強化策(オンライン会議の質向上、非公式コミュニケーションの場の創出など)に注力すべきだと判断できます。

脚注

[1] ICC以外に、デザイン・エフェクトと呼ばれる指標を参照することもあります。これは、ICCの値を「部署に含まれる人数の平均」など平均人数情報で重みづけた値で、2.00を超えていれば部署による差があると見なし、マルチレベル分析を適用できると判断されます。

[2] マルチレベル分析の結果から得られた関連性は、必ずしも因果関係を示すものではないことに注意が必要です。例えば、「リーダーシップとエンゲージメントの正の関連」は、優れたリーダーシップがエンゲージメントを高める可能性もありますが、エンゲージメントの高い部署だからこそリーダーが効果的に機能する可能性や、両者に影響を与える第三の要因(部署の業績など)が存在する可能性もあります。

[3] マルチレベル分析においても、重要な変数がモデルから欠落している場合、結果の解釈に歪みが生じる可能性があります。例えば、「部署の平均残業時間とエンゲージメントの負の関連」は、測定されていない第三の変数(業務の複雑性、人員不足、業界特性など)によって説明される可能性があります。また、個人レベルと部署レベルの両方で交絡因子が存在する可能性があるため、結果を解釈する際には、モデルに含まれていない潜在的な影響要因を考慮することが重要です。

[4] 調整効果については、当社コラムでくわしく解説しています。

[5] この効果を検証するものを、個人レベル・部署レベルと異なるレベルにある変数間にある交互作用を強調して「クロスレベル交互作用」と呼びます。

[6] 4ステップで検証した各モデルのどれがもっともデータに合うかも、モデル適合度から評価が可能です。例えば、AIC(赤池情報量基準)やBIC(ベイズ情報量基準)などの指標を比較します。これらの値が小さいほど、モデルとデータの当てはまりが良いことを示します。モデルを段階的に複雑化させていく中で、これらの指標が減少するかどうかを確認することで、各ステップで追加した変数が本当に重要かどうかを判断できます。


執筆者

伊達 洋駆 株式会社ビジネスリサーチラボ 代表取締役
神戸大学大学院経営学研究科 博士前期課程修了。修士(経営学)。2009年にLLPビジネスリサーチラボ、2011年に株式会社ビジネスリサーチラボを創業。以降、組織・人事領域を中心に、民間企業を対象にした調査・コンサルティング事業を展開。研究知と実践知の両方を活用した「アカデミックリサーチ」をコンセプトに、組織サーベイや人事データ分析のサービスを提供している。著書に『60分でわかる!心理的安全性 超入門』(技術評論社)や『現場でよくある課題への処方箋 人と組織の行動科学』(すばる舎)、『越境学習入門 組織を強くする「冒険人材」の育て方』(共著;日本能率協会マネジメントセンター)などがある。2022年に「日本の人事部 HRアワード2022」書籍部門 最優秀賞を受賞。東京大学大学院情報学環 特任研究員を兼務。

#伊達洋駆 #人事データ分析

アーカイブ

社内研修(統計分析・組織サーベイ等)
の相談も受け付けています