2026年2月2日
級内相関係数:集団の効果を検討するための準備
企業が従業員の意欲や働きがいを把握する目的で実施する組織サーベイは、個々の従業員がどう回答しているかという「個人レベルの違い」に焦点が当たりがちです。しかし、実際には「部署」や「チーム」といった集団レベルによる影響も大きい可能性があります。
例えば、ある部署は非常に風通しが良くモチベーションが高い従業員が多い一方、別の部署では業務負荷が大きかったりマネジメントスタイルが厳しかったりして、エンゲージメントが低い傾向が見られるかもしれません。もしこうした「部署間の差」を考慮せずに、個人の属性や行動だけに注目した分析を行うと、部署特有の影響を個人に由来する影響と見なして分析がされてしまい、結果として見誤った結論を導いてしまうリスクが高まります。
そこで、マルチレベルの構造をモデル化する意義を見極める上で役立つのが、「級内相関係数(ICC:Intraclass Correlation Coefficient)」です。ICCは端的に述べると「同じ部署に属する人同士がどの程度似た回答をするか」を数値として表す指標であり、この値を確認することで部署単位の差を無視すべきでないかどうかを判断できます。
本コラムでは、ICCの基本的な考え方や計算式、具体的な解釈、そして実務での活かし方を解説していきます。
ICCの基礎
組織サーベイの回答データは、典型的には「個人レベル(従業員i)」と「部署レベル(部署j)」の二つの階層構造を持つと想定できます。同じ部署にいる従業員は、共通する業務内容や上司のマネジメント方針、組織文化などの影響を共有しているため、回答が互いに似ていることが少なくありません[1]。
例えば、もし部署ごとに平均スコアが極端に高い部署と低い部署が存在する場合、それらの部署差を分析で取りこぼしてしまうとどうなるでしょうか。
本来であれば「部署Xはエンゲージメント平均がかなり高い」「部署Yは何らかの理由でかなり低い」といった重要な情報があるにもかかわらず、それを「個人の違いしかない」と見なしてしまうと、ある特定の部署に所属していること自体が持つ影響力を正しく評価できなくなってしまいます。結果として、例えば「特定の個人属性がエンゲージメントを高めている」と判断してしまうような誤った解釈に陥るリスクが高まるのです。
こうした問題を解決するために用いられるのが、マルチレベル分析と呼ばれる手法です。その中でも最も基本的な形として、階層線形モデル「ランダム切片モデル」があります。
「ランダム切片モデル」とは、全社員で共通する平均値(固定効果)に加えて、「部署ごとの平均値がランダムに変動する」と仮定したモデルのことです。すなわち、部署によってエンゲージメントの平均値が高い部署や低い部署があるかもしれないと考え、それを統計的に表現しようというわけです。
数式で表すと、ランダム切片モデルは次のように書くことができます。
Y_ij=β_0+u_j+e_ij
ここにおいて、Y_ijは「部署jに属する個人iのエンゲージメントスコア(成果指標)」を意味します。β_0は「全従業員の平均」あるいは「基準点」と捉えられる定数項(固定効果)です。企業全体を通して見たとき、「各従業員のエンゲージメントはだいたいこれくらいの水準だろう」という大枠の平均値を表しています。
次にu_jは、部署jが持つ平均値からのズレを表す項で、これを「ランダム切片」と呼びます。例えば部署Aは全体平均よりもエンゲージメントがやや高い、部署Bは平均より低い、といった部署ごとで生じる差異のばらつきをu_jという変数でモデル化するイメージです。つまり「企業全体の平均β_0に対して、各部署がどれだけプラスかマイナスか」といったばらつきを考慮しているわけです。
最後にe_ijは「個人レベルの誤差」であり、所属している部署jに左右されない、従業員iごとに回答が異なる理由を表現します。例えば「個人的なモチベーションの違い」や「ライフステージの違い」など、部署内でも一人ひとりが異なる状況を持っており、それがY_ij(成果指標)に及ぼす影響があることを捉えているわけです。
このとき、u_jは「部署間のばらつき」を確率分布として扱うために、平均を0とする正規分布に従うと仮定し、その分散をσ²_uと置きます。平均を0にするのは、部署全体で見たときに「プラスの部署もあればマイナスの部署もあるけれど、集計すれば大きく偏らずに全体平均に落ち着くだろう」という考え方に基づきます。正規分布は「平均を中心とした釣り鐘状の分布」で、分散によって各データが平均からどれほど広くばらつくかを表しており、その大きさが大きいほど、部署ごとの平均スコアが大きく異なっていると解釈できます。
同様にe_ijも平均0の正規分布に従うとし、その分散をσ²_eとします。これは「所属している部署に関わらず、個人ごとの回答にはバラつきがある」ことを想定しているという意味です。分散が大きければ、「部署内でも回答がかなりバラバラ」という状況を示し、分散が小さければ「部署内での回答傾向が似通っている」状況を示します。
このように、部署レベルの違い(u_j)と個人レベルの違い(e_ij)を別々の確率分布で表すことによって、分析上は「部署間でどれほど平均値が異なっているか」と「同じ部署内で従業員同士の回答がどれほど違うか」の両方をモデル化できます。
ICCの求め方
ランダム切片モデルでは、部署ごとのランダムな差u_jを考慮するようになりました。本コラムのテーマである「級内相関係数(ICC)」は、部署間の分散が「全体の分散」の中でどれほどの割合を占めているかを示す指標として定義されます。具体的には、次のような計算式を用います。
ICC=σ²_u/(σ²_u+σ²_e)
まず、σ²_uは先ほど出てきた「部署間の分散」で、部署ごとの平均値がどれだけ異なるかを表します。部署ごとのエンゲージメント平均スコアが大きくばらつくほど、σ²_uは大きくなります。
一方、σ²_eは「個人レベルの残差[2]の分散」で、個々の従業員の回答がどれだけ平均からばらついているかを示します。例えば、部署による上下を仮定した上でも、モチベーションの高さや仕事観は人によってまちまちですので、それらをすべて集計したときのバラつきが σ²_eと考えられます[3]。
σ²_uとσ²_eの和 (σ²_u+σ²_e) は、「部署レベル」と「個人レベル」の両方を含めた「全体のばらつき」を表します。要するに、企業全体で従業員のエンゲージメントスコアがばらつく原因には、大きく分けて「部署間の違い」と「個人間の違い」の二つがあるということです。(σ²_u+σ²_e) は、この二つを合計した「総合的なばらつき」になり、ICCは「部署間のばらつきσ²_uが、この全体のばらつきのうちどのくらいの割合を占めるのか」を計算する仕組みです。
企業内の各部署で平均エンゲージメントがかなり違う場合、σ²_uが大きくなり、結果としてICCも大きくなります。例えば、ある部署は全体平均より大幅に高いエンゲージメントを示し、別の部署は平均よりかなり低いというように、企業全体で見ても様々な部署間で差が顕著に見られるときは、部署ごとの特性が従業員の回答に影響しているということになります。こうなると、分母 (σ²_u+σ²_e) に対してσ²_uが占める割合が相対的に大きくなるため、ICCも高い値になるのです。
逆に、企業全体で見て各部署の平均スコアがほぼ同じで、部署による違いがあまり見られない状況であれば、σ²_uは小さな値にとどまります。すると (σ²_u+σ²_e) のなかでσ²_uが占める割合が小さいので、ICCも自然と低い値になります。企業全体として部署差があまり顕在化していないことを統計的に表すのが「ICCが小さい」という状態です。
ICCを実際に算出するには、まず統計ソフトウェアで先ほどのランダム切片モデルを推定します。すると、推定結果として「部署間分散(σ²_uの推定値)」と「残差分散(σ²_eの推定値)」が得られます。あとはICC=σ²_u/(σ²_u+σ²_e) を計算すれば、ICCの数値を手にすることができます。
この手順は通常の回帰分析よりやや複雑に感じられるかもしれませんが、多くの統計ソフトには「階層線形モデル」などの機能が標準または追加パッケージとして用意されています。それらの機能を使えば、σ²_u と σ²_eを推定し、ICCも算出できます。
ICCの値が高ければ「部署差が大きく、同じ部署の従業員同士が似ている回答をしている」、低ければ「個人差が支配的で、部署間の違いはあまり大きくない」という解釈が得られます。
なお、ICCが高いからといって、すぐに「なぜ部署差が生じているか」が分かるわけではありません。例えば部署間の平均スコアに大きな差がある場合、その要因としては「上司のリーダーシップ」「業務量・残業時間の多寡」「チーム内の人間関係」など、さまざまな可能性が考えられます。
ICCはあくまで「部署差が全体のばらつきの何割程度か」を示す数値にすぎないため、本格的に背景要因を知りたいときは、マルチレベル分析の枠組みで部署レベルの影響指標をモデルに組み込むなど、さらに一歩踏み込んだ解析が必要になります。
ICCの活用方法
ICCは、例えば、「部署間の違い」が「個人間の違い」と比べてどれくらい重要かを示す目安となります。ICCが0.10(10%)を超える場合は、「全体のばらつきのうち少なくとも10%は部署の違いによって生じている」と考えられます。
こうした状況において、部署間の違いを無視して個人レベルだけの分析を行うと、部署ごとの特性が個人差の要因と区別されずに処理されてしまい、実際には存在する部署の影響力が見過ごされ、個人要因が過大評価される恐れがあります。具体的には、部署全体で認識されている上司のマネジメントスタイルの高さがエンゲージメントに寄与しているのに、それを見落として「個々の従業員が上司のマネジメントを高く評価していれば、エンゲージメントが高い」と誤解してしまう、といった事態が起こり得るのです。
正確な分析に基づいた打ち手は「部署全体で上司マネジメントの発揮を実感してもらう」全体的な対策に重点を置く方針を考えることになりますが、誤解した結果だと「上司マネジメントを実感していない個々の従業員に、きめ細かく接する」と個別的な対策に重点を置く方針に進んでしまいます。
一方、ICCが0.01や0.02程度にとどまるなど、小さい値であれば、「部署間の差による成果指標の高低はほとんど生じていない」と考えられます。このような場合には、部署レベルの特徴をモデルに入れなくても分析結果はあまり変わらないかもしれません。
ただし、人事施策として部署単位で何かを行う予定があるなら、たとえICCが小さくとも部署の差を精密に捉えておくことには意味があります。大企業などで従業員数が多い場合、ごくわずかな差でも総人数にかけ合わせると無視できない影響力を持つ可能性があるからです[4]。また、将来的に部署ごとに施策を打っていく計画があるなら、あらかじめ部署レベルの違いを把握しておくことで、より緻密なアプローチを検討できるでしょう。
このようにICCの大きさは、あくまで「部署間の違いがどの程度無視できないか」の概算的な指標です。具体的な数値に絶対的な基準はありませんが、例えば、0.05や0.10といった境界を目安に「部署差をモデル化すべきか」を議論するケースが多いと言えます。ただし、最終判断は理論や実務的な目的との関連も踏まえ、組織の意図(例えば部署単位で施策を打つ可能性があるかどうか)に沿って行うことが望ましいでしょう。
実務での応用ポイント
まず、組織サーベイの結果を分析するときには、単純な集計や個人レベルだけの回帰分析を行う前に、部署レベルの差異を考慮する「ランダム切片モデル」を構築し、ICCを算出するのも良いでしょう。統計ソフトで分析を行い、部署間分散(σ²_u)と残差分散(σ²_e)の推定値を得ます。そこからICC=σ²_u/(σ²_u+σ²_e) を計算すれば、企業全体として部署差が大きいか小さいかの定量的な感触を得ることができます。
もし ICCが高いと分かったら、部署間の特性が従業員の回答を左右している可能性が高いと推察されます。その場合には、部署レベルのランダム切片(数式のu_j)をモデルに含めることで、部署の違いによる影響を考慮したより正確な分析が可能となります。
加えて、マルチレベル分析によって部署レベルの影響指標をモデルに加えることで、どんな部署特性がエンゲージメント向上につながりやすいのかを深く探ることができるでしょう。部署単位で施策を行った結果がどの程度成果に結びつくかを検証するときも、マルチレベルの枠組みを使うことでより妥当な評価が可能になります。
とはいえ、ICCが低くても一概に部署差が無意味とは言えません。大企業ほど従業員数が多い場合、わずかな部署差でも合計すると相当数の従業員に影響を与える可能性があります。また、同じ部署内でも職務内容や雇用形態、キャリアステージが大きく異なる人同士をまとめてしまうと、「部署」という単位だけでは本質的な差を捉えにくいケースもあります。このような場合には、部署よりも細かいユニットを新たに設定するなど、分析設計そのものを見直す機会になるかもしれません。
最終的には、ICCは「部署差を無視してよいかどうか」を判断する入り口となる指標です。ICCが高ければマルチレベル分析を積極的に導入して部署要因を探り、ICCが低ければ個人レベル中心の分析で十分かもしれません。しかし、企業によっては部署単位に施策を打つことが多いので、たとえICCが小さくても組織開発や改善策の設計上、部署単位での分析が有用な場合はあります。状況や目的に応じて判断し、エンゲージメントを向上させるための方法を検討していただければと思います[5]。
脚注
[1] 級内相関係数(ICC)には、実は複数の種類が存在します。代表的なものとして、ICC(1, 1)、ICC(1, k)、ICC(2,1)、ICC(2, k)、ICC(3, 1)、ICC(3, k)があります。
ICC(1, 1)とICC(1, k)は単一測定の信頼性を評価し、個々の評価者の評定値がどの程度信頼できるかを示します。ICC(2, 1)とICC(2, k)は固定された複数の評価者による評定値の信頼性を表します。ICC(3, 1)とICC(3, k)は固定されていない複数の評定者による一貫性に焦点を当て、複数名評定による評定値の信頼性を評価します。後ろの値が1とk(kは測定回数)の違いはその後の分析に用いるデータの目的にあり、各測定値を個別に用いる目的の級内相関ならば1、各測定値の平均を用いる目的の級内相関ならばkとなります。
組織サーベイにおいて部署効果の有無を検討する際にはICC(1, 1)を用いることが一般的です。ただし、研究目的によって適切なICCは異なります。分析の目的に応じて適切なタイプを選択しましょう。
Koo, T. K., & Li, M. Y. (2016). A guideline of selecting and reporting intraclass correlation coefficients for reliability research. Journal of chiropractic medicine, 15(2), 155-163.
[2] 分析において、残差と誤差は似たところに登場して紛らわしいですが、残差は「実際のデータで算出される、モデルで推定した値と実際のデータのズレ」を指し、誤差は「元の数理モデル上で仮定されるデータのばらつき」を指します。
[3] マルチレベル分析では、部署間で個人レベルの誤差分散が等しいことを仮定しています。この仮定が満たされない場合、推定結果の信頼性に影響を与える可能性があります。
[4] この観点でICCを重みづけた指標として、デザイン・エフェクト(DE)と呼ばれるものがあります。これはDE= 1 + (k – 1)×ICC で計算される指標で、kは「部署など、着目した集団指標における、各集団の平均人数」を表します。数式から、集団の平均人数kが増えるとICCの値が大きく計算され、部署レベルの分散の意味合いが大きく見積もられる仕組みです。
[5] 従業員が複数の部署やプロジェクトチームに同時に所属することもあるかもしれません。このような構造がある場合、単純な階層構造を仮定したICCでは組織の実態を正確に捉えられない可能性があります。例えば、ある従業員の回答が所属部署の影響なのか、参加しているプロジェクトチームの影響なのかを区別することが難しくなります。より複雑なマルチレベルモデルの検討が必要になるでしょう。
執筆者
伊達 洋駆 株式会社ビジネスリサーチラボ 代表取締役
神戸大学大学院経営学研究科 博士前期課程修了。修士(経営学)。2009年にLLPビジネスリサーチラボ、2011年に株式会社ビジネスリサーチラボを創業。以降、組織・人事領域を中心に、民間企業を対象にした調査・コンサルティング事業を展開。研究知と実践知の両方を活用した「アカデミックリサーチ」をコンセプトに、組織サーベイや人事データ分析のサービスを提供している。著書に『組織内の“見えない問題”を言語化する 人事・HRフレームワーク大全』、『イノベーションを生み出すチームの作り方 成功するリーダーが「コンパッション」を取り入れる理由』(ともにすばる舎)、『越境学習入門 組織を強くする「冒険人材」の育て方』(共著;日本能率協会マネジメントセンター)などがある。2022年に「日本の人事部 HRアワード2022」書籍部門 最優秀賞を受賞。東京大学大学院情報学環 特任研究員を兼務。

