ビジネスリサーチラボ

open
読み込み中

コラム

理論に基づいていれば高品質か:適性検査における理論の位置づけとその限界

コラム

適性検査の案内を見ると、時々「〇〇理論に基づいています」「世界的に評価される△△モデルを採用」といった、その検査の学術的な背景を説明する言葉が目に留まります。複雑で捉えどころのない「人の可能性」を客観的に評価したいと考える人事担当者にとって、これらの言葉は判断の拠り所の一つとして機能するでしょう。科学的な裏付けがあるのなら、信頼できるだろうと考えるのは、ごく自然なことです。

しかし、私たちはここで一度立ち止まり、問いを立ててみる必要があります。その「理論」という言葉が、時として検査の品質を測る上で、判断を簡略化させる側面を持ってはいないでしょうか。理論的背景があることは、それだけで検査の高品質を保証するものなのでしょうか。もしそうでないとしたら、私たちはその言葉の向こう側にある、何を見つめるべきなのでしょうか。

本コラムの目的は、適性検査における理論的背景の価値を軽視することではありません。むしろ、その重要な役割を正しく位置づけた上で、それだけでは語り尽くせない適性検査の品質に光を当てます。「理論」という土台のさらに下に広がる、地道で、しかし重要な世界を探求し、私たちが適性検査というツールと健全に向き合い、その価値を引き出すための視点を探っていくことを目指します。

理論的背景の光と影

適性検査の品質を語る上で、理論的背景が重要な出発点であることは間違いありません。そもそも適性検査における「理論」は、一体どのような役割を担っているのでしょうか。その光、すなわちメリットを理解することは、その限界、すなわち影の部分を理解するための第一歩となります。

適性検査が測定しようとしているのは、知能、性格、価値観といった、目には見えない抽象的な概念です。これらの概念を測定可能なものにするためには、「知能とは何か」「性格とは、どのような要素で構成されているのか」といった問いに対する、体系的な答えの仮説が必要になります。この仮説を提供するのが「理論」です。

例えば、性格を測定するにあたり、人のパーソナリティをいくつかの基本的な特性の組み合わせで捉える「特性論」という潮流があります。その中でも、特に広く知られているのが「ビッグ・ファイブ理論」で、これは人の性格を主に五つの因子(開放性、誠実性、外向性、協調性、神経症傾向)で説明しようと試みるものです[1]

このように、理論は測定対象を定義し、その構造を明らかにする「設計図」としての役割を果たします。設計図がなければ、何を測っているのかが曖昧になり、一貫性のない問題の寄せ集めになってしまう可能性も否定できません。理論があるからこそ、開発者は「この因子を測るためには、このような内容を問う項目が必要だ」という一貫した方針のもとに、検査を体系的に構築することができます。

理論は検査結果を解釈する際にも機能します。「Aという概念でスコアが高い」という事実の羅列ではなく、「ビッグ・ファイブ理論に基づけば、このスコアのパターンは、新しい経験に対して積極的で、知的好奇心が強い傾向を示唆している」といった、深く説得力のある解釈を可能にします。受検者自身へのフィードバックはもちろん、採用担当者がその人物像を多角的に理解する上でも、解釈の枠組みは有用です。

そして、理論は科学的な検証を行うための土台となります。優れた理論は、「もしこの理論が正しければ、このような特性を持つ人物は、特定の状況下でこのような行動をとるはずだ」といった予測、すなわち「仮説」を生み出します。例えば、「誠実性のスコアが高い人物は、入社後の職務遂行能力も高い傾向にあるはずだ」といった仮説です[2]。このように、仮説を構築し実際のデータと照らし合わせて検証するプロセスにおいて、理論はその出発点となります。

しかし、この優れた設計図であるはずの理論も、それだけでは万能ではありません。ここには光の裏側にある、考慮すべき点が存在します。どんなに著名な建築家が描いた素晴らしい設計図があっても、それだけで快適で安全な家が建つわけではないのと同様に、理論という設計図がそのまま高品質な適性検査に直結するわけではないのです。

その実現を阻む第一の壁は、「測定ツールの質」です。理論を具体的な項目や課題へと落とし込む作業は、それ自体が高度な専門性と職人技を要求されるプロセスです。項目で使われる言葉遣い一つ、選択肢のニュアンスの違いが、受検者の回答に大きな影響を与えます。ある文化圏では自然に受け取られる表現が、別の文化圏では誤解を招くかもしれません。質問の意図が曖昧であれば、受検者は何を問われているのか分からず、結果として測定の精度は低下します。優れた理論も、それを体現する良質な問題群がなければ、その真価を発揮することはできません。

第二の壁として立ちはだかるのが、「統計的な裏付け」という実証のプロセスです。開発された検査が、意図したものを安定して測定できているかという「信頼性」の問題があります。例えば、同じ人が短い期間内に二度検査を受けたとして、その結果が大きく異なってしまうようでは、その人の安定した特性を捉えているとは言えません。

また、測りたいものを正しく測れているかという「妥当性」も重要です。前述の通り、理論に基づいて立てた仮説、例えば「この検査は仕事のパフォーマンスを予測できる」という仮説が、実際に実データによって支持されなければ、それは一つの仮説に過ぎません。この検証プロセスは、理論の正しさとは別の次元で、地道なデータ収集と統計分析を必要とする作業です[3]

そして第三の壁が、「標準化」という運用上の課題です。ある個人のスコアが「高い」のか「低い」のかを判断するためには、比較の基準となる物差しが必要です。この物差しが「基準」であり、通常は特定の集団の平均的なスコア分布などから作成されます。この基準となるデータが、自社が採用したい人材層と乖離していたり、情報として古すぎたりすれば、個人のスコアを正しく位置づけることはできません。

全ての受検者が同じ条件下で検査を受けられるように実施方法を統一し、公平な採点を行い、適切な基準データに基づいて結果を解釈するという標準化のプロセスは、理論の洗練されたイメージとはまた別に、地道で緻密な運用努力の賜物です。

理論的背景は適性検査の品質を支える骨格として不可欠な「光」の部分であると同時に、それだけでは決して品質を保証しないという「影」の部分も併せ持っています。私たちはこの両面を理解することで、適性検査の品質というものを立体的に捉えることができるようになります。

なぜ「理論」という言葉に関心を寄せるのか

適性検査の品質が、理論という設計図だけでなく、問題の質、統計的検証、標準化といった地道なプロセスによって成り立っているにもかかわらず、なぜある特定の人々は「〇〇理論準拠」という言葉に強い関心を寄せるのでしょうか。この背景には、私たちの意思決定に影響を与える、いくつかの心理的な働きが関係していると考えられます。

その要因の一つが、「権威への信頼」と、それに伴う「ハロー効果」です。ハロー効果とは、ある対象が持つ一つの顕著な特徴に影響され、その対象全体の評価まで同じように見てしまう心理傾向を指します[4]。適性検査の文脈では、「世界的に評価の高い〇〇理論に基づいています」という一文が、検査全体の信頼性や妥当性までも保証しているかのような印象を与えることがあります。私たちはその分かりやすい情報に注目し、その背後にある検証プロセスを確認するまでには至らないことがあります。

次に挙げられるのが、できるだけ効率的に判断を下そうとする「認知的な近道」です[5]。適性検査の品質、すなわち信頼性や妥当性のデータを一つひとつ吟味し、その科学的な妥当性を評価するのは、専門的な知識も必要となり、多大な労力がかかります。そのため、より簡単な手がかりに基づいて結論を出そうとする傾向が人にはあります。

この場合、「権威ある理論に基づいている」という情報が、その分かりやすい手がかりとして機能します。「これほど有名な理論を使っているのだから、専門家たちが品質を検証しているだろう」といった具合に、私たちは複雑な評価プロセスを省略し、「理論に基づいている=高品質」という判断に至ることがあります。

この心理を後押しするのが、特に採用という重要な意思決定の場面で生じる「不安」と、それを和らげたいという「安心感への希求」です。一人の人間を採用するという決断は、個人と組織の未来にも影響を及ぼす重いものです。その中で、面接官の主観や経験だけに頼ることに不安を感じることがあります。自分の決定が正しいものであるという根拠が欲しいという気持ちが生まれるのです。

ここで「科学的根拠」や「理論的背景」という言葉は、客観性を示すものとして受け止められます。それらは主観的な判断を補強し、正当なものに見せる「お墨付き」のように機能します。「科学的な適性検査の結果に基づいて判断した」と説明できることは、意思決定者の心理的な負担を軽くし、安心感につながります。

こうした受け手側の心理と、提供者側の情報発信とが結びつくことがあります。適性検査を提供する側と利用する側との間には、専門知識に関する差があるのが一般的です。そのため、専門的で複雑な品質データを詳細に伝えるよりも、「〇〇理論」という分かりやすい言葉が、コミュニケーションの中心になることがあります。その結果、理論の持つ権威性が強調され、市場全体に「理論に基づいていることが高品質の証である」というイメージが広まっていく側面があるのです。

このように、権威への信頼、思考の簡略化、安心感への希求といった人間の心理的な傾向と、コミュニケーションのあり方が相互に作用し合うことで、「理論」という言葉は本来の役割以上に、品質を保証する象徴として捉えられてしまいます。この構造を理解することは、私たちが冷静な目で品質を見極めるための第一歩となります。

言葉の印象を超え、本質を見抜くために

理論という言葉が持つ影響力とその背景にある心理を理解した上で、私たちは次のステップに進む必要があります。具体的にどのようにすれば、理論という言葉の印象だけに頼ることなく、適性検査の価値を評価することができるのでしょうか。ここでは、価値あるツールを見抜くための視点を提案します。

何よりも重要なのは、私たち自身の心構えです。適性検査を導入する際に、提供される情報をただ受け入れるだけでなく、自ら問いを立て、その品質を能動的に吟味する視点を持つことが始まりとなります。適性検査は、人の未来を自動的に予測するものではなく、あくまで人の多面的な可能性の一側面を、特定の角度から照らし出すための「ツール」です。どんなツールもそうであるように、その性能や使い方を正しく理解することで、その価値を最大限に引き出すことができます。

しかし、組織内、特に意思決定者の中に「理論に基づいているのだから問題ない」という考えがある場合、その認識を改めてもらうのは簡単ではないでしょう。このような状況で求められるのは、一方的に説得しようとする姿勢ではなく、対話を通じて共に理解を深めようとする協力的なアプローチです。

例えば、相手の考えを否定するのではなく、まずは共感を示すことから始めます。「おっしゃる通り、〇〇理論に基づいているというのは、検査の骨格がしっかりしている証拠であり、非常に重要なことですよね」と、一度相手の視点を受け止めます。その上で、誰もが理解しやすい比喩を用いて、新しい視点を付け加えます。「それはまさに、家を建てる時の素晴らしい『設計図』のようなものだと思います。

ただ、どんなに立派な設計図があっても、実際にその通りに頑丈な家が建っているかを確認するために、『耐震性能証明書』のような性能評価データも一緒に見ておけると、さらに安心ですよね」といった具合です。このように、相手の考えを尊重しつつ、「設計図(理論)」と「性能証明書(実証データ)」の両方を見ることの重要性を提案することで、相手は抵抗なく新しい視点を受け入れやすくなります。目指すべきは、より良い採用判断をするための「協力者」として、同じ目標に向かう関係性を築くことです。

このような対話の土台ができた上で、私たちは具体的な確認作業へと進むことができます。適性検査の提供企業に対して、理論の名前を尋ねるだけでなく、その品質を裏付ける証拠について、いくつかの問いを投げかけてみましょう。

第一の問いは、「この検査の有効性を示す証拠はありますか」というものです。これは、検査の品質の中でも最も実用的で重要な「基準関連妥当性」を確認するための質問です。より具体的には、例えば、「この検査で高いスコアを示した人々が、実際に入社後の業務において高いパフォーマンスを発揮した、という追跡調査のデータはありますか」あるいは「貴社が顧客企業で分析した際に、ハイパフォーマーとそうでない人々の間で、検査結果に統計的に意味のある差が見られた事例はありますか」と尋ねることです。

もし提供企業が真摯に品質管理に取り組んでいるならば、守秘義務の範囲内で、相関係数などの統計データや、匿名化された導入事例を示してくれるはずです。この問いは、その検査が性格診断に留まらず、採用場面で「役に立つ」ツールであるかどうかを見極めるための試金石となります。

第二の問いは、「検査結果は安定していますか」というものです。これは「信頼性」に関する質問です。「同じ人物が、例えば数週間の間隔をあけて再度この検査を受けた場合、その結果はどの程度一致するのでしょうか」と尋ねてみましょう。もし体調や気分によって結果が大きく変動するのであれば、その検査はその人の安定した特性ではなく、一時的な状態を測定しているに過ぎません。信頼性係数といった数値データを開示してもらえるかどうかも、品質を判断する上での一つの指標となります。

第三の問いは、「どのような人々を基準に結果は解釈されるのですか」というものです。これは「標準化」の適切性を確認するための質問です。検査結果は、必ず何らかの基準集団と比較されて初めて意味を持ちます。そこで、「この検査の基準データは、どのような属性(年齢、学歴、職種など)の人々から収集されたものですか」「データはいつ更新されたものですか」と確認します。

例えば、自社が大卒の総合職を採用したいのに、検査の基準データが高校生の集団のものであれば、結果の解釈は歪んでしまいます。自社が求める人材層と、検査の物差しとが適合しているかを確認することは、ツールを正しく使うための前提です。

これらの問いは、提供者側を試すためのものではなく、我々自身がツールを理解し、その価値を引き出すための、いわば健康診断のようなものです。このプロセスを通じて、私たちは理論という言葉の背景をより深く理解し、その奥にある検査の真の姿に触れることができます。

理論という言葉の向こう側にある、地道なデータと科学的な検証のプロセスに敬意を払い、提供者との対話を重ね、ツールの性能と限界を深く理解すること。それこそが、適性検査というツールの価値を最大限に引き出し、採用のミスマッチを減らし、個人と組織の双方にとってより良い未来を築くための、確かな一歩となるに違いありません。私たちの探求は、ひとつのツールの評価に留まらず、人間を理解しようと努める、より謙虚で、より真摯な姿勢そのものへとつながっていくのです。

脚注

[1] Goldberg, L. R. (1990). An alternative “description of personality”: The Big-Five factor structure. Journal of Personality and Social Psychology, 59(6), 1216–1229.

[2] Barrick, M. R., and Mount, M. K. (1991). The Big Five personality dimensions and job performance: A meta-analysis. Personnel Psychology, 44(1), 1–26.

[3] 信頼性と妥当性の詳細については当社コラムをご覧ください。

[4] Thorndike, E. L. (1920). A constant error in psychological ratings. Journal of Applied Psychology, 4(1), 25–29.

[5] Tversky, A., and Kahneman, D. (1974). Judgment under uncertainty: Heuristics and biases. Science, 185(4157), 1124–1131.


執筆者

伊達 洋駆 株式会社ビジネスリサーチラボ 代表取締役
神戸大学大学院経営学研究科 博士前期課程修了。修士(経営学)。2009年にLLPビジネスリサーチラボ、2011年に株式会社ビジネスリサーチラボを創業。以降、組織・人事領域を中心に、民間企業を対象にした調査・コンサルティング事業を展開。研究知と実践知の両方を活用した「アカデミックリサーチ」をコンセプトに、組織サーベイや人事データ分析のサービスを提供している。著書に『60分でわかる!心理的安全性 超入門』(技術評論社)や『現場でよくある課題への処方箋 人と組織の行動科学』(すばる舎)、『越境学習入門 組織を強くする「冒険人材」の育て方』(共著;日本能率協会マネジメントセンター)などがある。2022年に「日本の人事部 HRアワード2022」書籍部門 最優秀賞を受賞。東京大学大学院情報学環 特任研究員を兼務。

#伊達洋駆 #人事データ分析

アーカイブ

社内研修(統計分析・組織サーベイ等)
の相談も受け付けています