2025年8月14日
順位相関係数:順序データの関連性を探る
二つの変数間の関連性を測る指標として相関係数があります。一般的なのはピアソンの積率相関係数ですが、これは変数が連続的な数値であり、等間隔の尺度を持つことを前提としています。しかし人事データ分析においては、必ずしもそのようなデータばかりを扱うわけではありません。
評価ランキングや順位付けなど、データが「順序」という形で与えられることもあります。例えば、社員の業績評価を「A、B、C、D」といったランクで表したり、チーム内での貢献度合いに応じて順位付けしたりするケースが該当します。このような順序データ間の関連性を分析するためには、順位相関係数を用います。
順位相関係数は、二つの変数の順位関係に着目した手法であり、変数の絶対的な値や間隔の等質性に依存しないという特徴があります。順序情報がメインとなるデータの分析に適しています。本コラムでは、代表的な順位相関係数であるスピアマンの順位相関係数とケンドールの順位相関係数について解説し、人事分野での活用方法についても紹介します。
順位相関係数が必要となる場面
人事データ分析においては、必ずしも数値間隔が等しい連続量ばかりを扱うとは限りません。順序や順位の形式でデータが提供されることがあります。例えば「ポテンシャルの高い順番ランキング」や「営業成績に基づく営業社員の上位から下位までの順位付け」など、データが「順位」という形で与えられることもあります。
組織内での貢献度ランキングや、プロジェクトへの適性による人材の優先順位付けなど、純粋な数値ではなく序列として情報が整理されることもあるでしょう。こうした順序情報があるデータ同士の関係を見たいときに、順位相関係数が有効な手法となります。
一般的な相関係数(ピアソンの積率相関係数)は、基本的に「数値的な差」(間隔が一定)を前提とした手法です。例えば、「4と5の差」と「7と8の差」が等価であると仮定しています。一方、順位相関係数は「大なり小なりという順序関係が保たれるかどうか」を評価するため、観測値が数値間隔をもつ必要がありません。「AはBより上位か下位か」という関係性だけで計算可能です。
昇給率のランキング、プロジェクト参加希望者の優先順位など、もともと順位で表現されるデータの関連性を検討する場合には、順位相関係数が一つの選択肢となります。他にも、評価者によって基準が大きく異なる可能性がある場合(例えば、ある部署の上司は全体的に厳しく評価し、別の部署の上司は甘く評価する傾向がある場合)でも、各評価者内での相対的な順位関係に着目することで、比較が可能になります。
スピアマンの順位相関係数
スピアマンの順位相関係数は、各変数を順位に変換し、その順位をもとに一般的な(ピアソンの)相関係数を求めたものです。例えば、社員Aから社員Zまでを「営業成績の高い順(営業成績が高い人ほど1位に近い)」に並べて1, 2, 3, …と順位を割り当てます。もう一方では、「上司評価の高い順」に同じ社員AからZまでを1, 2, 3, …と順位付けします。それぞれの社員に対して「営業成績順位」と「上司評価順位」のペアが得られるので、これらのペアを用いてピアソンの相関係数を計算したものがスピアマンのρ(ロー)です。
各社員i(i = 1, 2, …, n)の順位が
- R(X_i):変数X(例:営業成績)の順位
- R(Y_i):変数Y(例:上司評価)の順位
とするとき、スピアマンのρは次のように表されます。
ρ=Σ[(R(X_i)-R_X)(R(Y_i)-R_Y)]/[√(Σ(R(X_i)-R_X)²)×√(Σ(R(Y_i)-R_Y)²)]
これはピアソンの相関係数の定義式と同じですが、元の値ではなく順位を使っているのがポイントです[1]。
この式は、「各社員の二つの異なる順位(例えば、営業成績順位と上司評価順位)が、それぞれの平均順位からどれだけ同じ方向にずれているかの一貫性」を計算しています。分子部分では、各社員について「営業成績の順位が平均よりどれだけ良いか(または悪いか)」と「上司評価の順位が平均よりどれだけ良いか(または悪いか)」の積を合計しています。両方の順位が平均より良い(または両方とも悪い)社員が多ければ正の値となり、一方が良く他方が悪い社員が多ければ負の値となります。分母は各順位のばらつきの大きさで割ることで、値を-1から1の範囲に標準化しています。
スピアマンの順位相関係数の値の範囲は-1から1までです[2]。ρが1に近いほど、「片方の順位が高い社員ほど、もう片方の順位も高い」という単調増加関係が強いことを示します。例えば、営業成績の順位が高い社員は上司評価の順位も高い傾向があることを意味します。
逆に、ρが-1に近いほど、「片方の順位が高い社員ほど、もう片方の順位は低い」という単調減少関係が強いことを指します。例えば、営業成績が高い社員ほど、チームワーク評価が低い、といった関係が見られる場合です。
ρが0付近ならば、明確な単調関係は認められないと解釈できます。ただし厳密には「全く無関係」という意味ではなく、「単調な関係が見られない」ことを意味します。例えば、U字型やその他の複雑な関係があっても、スピアマンの順位相関係数は0に近くなることがあります。
ケンドールの順位相関係数
ケンドールのτ(タウ)は、「観測値の対ごとに、順位関係が一致しているか否か」を直接評価します。2つの変数XとYに対して、全てのペア(i, j)(i < j)を取り出し、もし(X_i-X_j)と(Y_i-Y_j)が同じ符号(共に正か共に負)なら「順位関係が一致」、符号が異なれば「順位関係が不一致」とみなします。これを全ペアについて数え上げ、その差から求められるのがケンドールのτです。
τ=(一致のペア数–不一致のペア数)/[n(n-1)/2]
人事データで例を挙げると、10人の社員について「研修成績の順位」と「1年後の業績評価の順位」を考えます。社員AとBの場合、「研修ではAがBより上位」かつ「業績評価でもAがBより上位」なら一致、「研修ではAがBより上位」だが「業績評価ではBがAより上位」なら不一致となります。このような比較を全ての社員ペアについて行い、一致ペアと不一致ペアの差を数え上げることで、研修成績と業績評価の関連性を探ります。
ケンドールのτの範囲はスピアマンのρと同様に-1から1までとなります。値が大きいほど「順位関係が整合的」、小さい(負の方向に大きい)ほど「順位の逆転が多い」と解釈します。例えば、τが0.8であれば、「研修成績が良い社員は、概ね1年後の業績評価も良い傾向にある」と言えます。
スピアマンのρとの比較としては、スピアマンのρは順位を数値として扱い、それを相関係数の形で計算します。一方、ケンドールのτはすべての組み合わせ(ペア)に注目し、一致・不一致を直接数え上げるという手法です。
人事データ分析における例示
昇進候補ランクと営業成績ランクの相関という例を取り上げてみましょう。
ある企業の人事部が「社員の昇進候補リスト」を策定し、各マネージャーが「昇進させたいと思う優秀な社員を上位から順にランク付け(1位最有力、2位、3位…)」しているとします。一方で、実績指標として「営業成績の上位・中位・下位」でも社員を順位付けしています(たとえば、期末の営業売上高に基づき、1位、2位、3位…)。
この状況での分析の目的は、「実際の営業成績が高い社員ほど、昇進候補ランキングでも上位に来ているか」を検証することです。順位相関係数を用いて「主観的な評価(昇進候補度)と客観的な成果指標(売上順位)が一致しているかどうか」を検証します。
手順としては、各社員について「昇進候補順位(1位が最も候補度合いが高い)」を記録します。続いて、各社員について「営業成績順位(1位が最も営業成績が高い)」を記録します。全社員について、上記2つの順位のペアを取得したら、スピアマンのρを計算する場合は、スピアマンの計算用の式を使って、2つの順位データの相関係数を求めます。
結果の解釈としては、もし順位相関が0.7などの高い正の相関を示していれば、営業成績が高いほど昇進候補リストでも上位に挙がっている、単調増加の関係があると言えます。逆に-0.6などの負の相関が出た場合、営業成績が高い人が昇進候補リストでは下位に来る単調減少の関係があると言え、結果として人事評価が必ずしも実績を反映していないことが示唆されます。相関の値が0に近ければ、少なくとも順位ベースでは一致していない(主観評価と客観指標はずれている)と解釈できます。
もう一つの例として、ある企業がリーダーシップ研修の参加者を選抜する場合を考えてみましょう。各部署から候補者が推薦されますが、予算の都合上、全員を参加させることはできません。そこで、各候補者について「直近の業績評価順位」と「リーダーシップポテンシャル評価順位」を記録し、これらの順位相関を調べます。
さらには、社内公募制度への応募順位(複数人が推薦や希望を出した際の順序)と結果としての選抜順位の関係、アセスメントセンターの順位と後の昇格スピードの順位など、様々な人事データの関連性を分析する際に順位相関係数は活用できるでしょう。いずれも、「順位」というデータであれば、一貫して高順位同士か、あるいは高順位と低順位が相関しているかなどを観察するために、順位相関係数を使うことができます。
順位相関を用いる上での注意点
順位相関係数を人事データ分析で活用する際には、いくつかの点に留意する必要があります。
第一に、同順位(タイ)の扱いについてです。社員Aと社員Bが同じ営業成績順位の場合、どのように順位を割り当てるかで値が変わることがあります。重複順位を処理する方法(平均順位を割り当てる、厳密には順位を細分化しておくなど)によってスピアマンのρやケンドールのτの算出方法が変わります。
例えば、5人の社員のうち2人が同率1位(1位タイ)の場合、単純に1位、1位、3位、4位、5位と割り当てる方法と、1.5位、1.5位、3位、4位、5位(平均順位)と割り当てる方法があります。同順位が多いデータを扱う際には、どの処理方法を用いるかを考える必要があります[3]。
第二に、順位だけでは情報の「粗さ」があるという点です[4]。順位化によって、もともとの数値情報の差異(例えば「1位と2位では数値上大差だが、2位と3位はわずかの差」など)は捨てられます。順位のみに基づく分析では必ずしも元データの細かい差異を反映できません。
しかしその分、元のデータがどの程度の「間隔」や「尺度」特性を持っているか不明な場合でも有効に活用できます。例えば、異なる部署の評価者による人事評価を統合して分析する場合、評価者によって「5」の意味するレベルが全く異なることが想定されるのであれば、各評価者内での順位を用いれば比較しやすくなります。
第三に、いずれの順位相関もあくまで「単調な関係」を捉える指標です。そのため、U字型のように一度下降してから後に上昇するような単調でない関連性がある場合には、順位相関ではその関係性を適切に捉えることができません。これはピアソンの相関も同様で、相関という指標が持つ弱点となります。
例えば、「中程度のストレスレベルの社員が最も生産性が高く、ストレスが非常に低い、または非常に高い社員の生産性は低い」というような逆U字型の関係があった場合、順位相関係数では0に近い値が出て、「関連がない」と誤って解釈されるかもしれません。指標間の関連に着目する際には、相関係数に加えて散布図などで視覚的に確認しましょう。
第四に、サンプルサイズと統計的検定についても触れておきます。相関係数の値だけを見るのではなく、その相関が統計的に有意かどうかを検定することも重要です。スピアマンやケンドールにも有意性検定の手法があります。サンプルサイズが小さい場合などは、特に慎重な解釈が必要です。
例えば、10人程度の少人数チームでの分析では、たとえ相関係数が0.6という比較的高い値であっても、統計的に有意でない場合があります。この結果は、このデータでは相関係数がゼロである可能性を排除できないことを表します。実際には関係性が全くないにもかかわらず、大きな相関係数のインパクトで「関係がある」と誤って判断してしまうリスクがあるということです。このリスクは、人事施策の方向性を誤るなど実務において大きな影響を及ぼすため、注意が必要です[5]。
脚注
[1] スピアマンのρには、順位差を二乗して足し合わせる簡便式と、順位をそのままピアソン相関に用いる一般式の二通りがあります。前者は「同順位(タイ)がない」場合だけ正しい値を返します。タイを含む実データでは、同点の観測に平均順位を与えて一般式を使うか、タイ補正付き係数を計算しなければなりません。
[2] 順位相関係数が「-1から1の範囲」になるのは、全ての順位が一意に決まる理想状態での上限です。同順位が多いデータでは最大値が1にならず、例えば、全員が複数人ずつ同率1位ならρやτは0.9程度で頭打ちになります。したがって「1に届かない=評価がずれている」とは限りません。この上限縮小はタイ補正後も残るため、解釈時には理論上の最大値ではなく、実際に到達可能な上限を意識することが大切です。
[3] 同順位の処理方法としては「平均順位法」が広く使われています。例えば、同率1位が2名いる場合は両者に1.5位を割り当て、次の人を3位とします。また、ケンドールのτでは同順位の扱いによってτ_a, τ_bなどのバリエーションがあります。本文中で示した計算式はタイなし前提のτ_aです。人事評価では同点が発生するため、使用するソフトウェアやパッケージがどの処理方法を採用しているか確認しておくと安心です。
[4] 順位化するとその粗さゆえに外れ値の影響は小さくなる特徴はありますが、その影響を完全に無視できるわけではありません。売上1000万円と900万円の差も順位では1つしか離れず、差の情報が重要なら順位相関だけで判断すると危険です。反対に、値が極端でも順位が変わらなければ異常に気づけない恐れもあります。元データの分布を確認し、グラフで実値を目視する作業とセットで用いると安全です。
[5] 統計的検定の結果だけで判断せず、信頼区間を確認して推定の不確実性を把握することも推奨されます。データから計算された相関係数が.35であった時、信頼区間を計算すると、例えば[.10-.60]といった値の範囲が得られます。この結果は、今回のデータにおける分析結果から全体傾向としての真の相関が.10~.60のいずれの値になると考えられることを意味しています。
この信頼区間の場合、真の相関が.10と実は非常に関連は小さい可能性もあれば.60と関連は大きい可能性も考えられます。このように、信頼区間を見れば、データにおける相関係数.35に対して全体傾向の相関係数は様々な値を取りうることがわかり、全体傾向の相関がどのくらいの大きさになりえるかを把握できます。順位相関係数の信頼区間はブートストラップ法により推定することができます。
信頼区間については、当社コラムもご覧ください。
執筆者
伊達 洋駆 株式会社ビジネスリサーチラボ 代表取締役
神戸大学大学院経営学研究科 博士前期課程修了。修士(経営学)。2009年にLLPビジネスリサーチラボ、2011年に株式会社ビジネスリサーチラボを創業。以降、組織・人事領域を中心に、民間企業を対象にした調査・コンサルティング事業を展開。研究知と実践知の両方を活用した「アカデミックリサーチ」をコンセプトに、組織サーベイや人事データ分析のサービスを提供している。著書に『60分でわかる!心理的安全性 超入門』(技術評論社)や『現場でよくある課題への処方箋 人と組織の行動科学』(すばる舎)、『越境学習入門 組織を強くする「冒険人材」の育て方』(共著;日本能率協会マネジメントセンター)などがある。2022年に「日本の人事部 HRアワード2022」書籍部門 最優秀賞を受賞。東京大学大学院情報学環 特任研究員を兼務。