2025年10月17日
期待が現実を作る:面接バイアスの実態
採用活動において、面接は最も広く用いられている選考手法の一つです。面接では候補者の能力や適性を客観的に評価することが期待されているものの、実際の面接場面では面接官の無意識の偏見や先入観が判断に混入しているのではないかという疑問が長年にわたって提起されてきました。
人種や民族性にもとづくバイアスは、特に深刻な問題として認識されています。このバイアスは、単に面接官の個人的な差別意識から生じるものではありません。むしろ、人間の認知プロセスに深く根ざした現象であり、善意を持つ面接官であっても無意識のうちに陥ってしまう可能性があります。候補者の外見、名前、話し方といった表面的な特徴が、その人の能力や適性とは関係のない判断材料として機能することがあるのです。
こうしたバイアスは、個人の職業機会に影響を与えるだけでなく、社会全体の多様性や公正性にも関わる問題です。面接という短時間の相互作用の中で、どのようなメカニズムでバイアスが生まれ、それがどのような形で採用判断に影響するのかを理解することは、社会において重要な課題となっています。本コラムでは、面接場面における人種・民族バイアスの実態とそのメカニズムについて、実証研究の知見をもとに検討していきます。
最初の印象が質問態度も採否も左右する
採用面接の研究において、従来は面接官の最終的な判断の妥当性に焦点が当てられることが多く、面接という一連のプロセス全体を通じた検証は限られていました。しかし、面接は書類審査から最終判断に至るまでの連続的なプロセスであり、その各段階で形成される印象や偏見が次の段階に影響を与える可能性があります。
大手金融サービス企業における採用選考を対象とした研究では、面接プロセス全体にわたる一連の流れが分析されました[1]。この研究では、男性マネジャー34名が面接官として参加し、164名の候補者を面接するという実地調査が行われました。面接官は全員大学卒業者で、過去に一般的な面接研修を受けた経験を持つ、実際の採用業務に携わる人々でした。
研究の設計において特筆すべきは、面接前の書類審査段階から面接後の最終判断まで、各段階での面接官の印象や行動を測定した点です。面接官は書類情報をもとに事前の印象を形成し、その印象が面接中の質問パターンやリクルート行動、さらには最終的な採用判断にどのような影響を与えるかが追跡されました。
調査結果は、面接プロセスにおける自己成就的予言の存在を裏づけるものでした。面接官が書類段階で好印象を持った候補者に対しては、面接中により多くの時間をリクルート活動(会社や職務の魅力を伝える活動)に費やす傾向が確認されました。候補者が報告した面接時間の配分によると、好印象群では質問よりもリクルートに重点が置かれていました。
このような面接官の行動変化は、候補者側にも察知されていました。面接官が事前に好印象を持っていた候補者ほど、「面接官は自分を高く評価している」と感じる傾向が見られました。そしてこの感覚は、候補者の職務評価、企業評価、面接官評価のすべてを向上させる結果となりました。候補者が「歓迎されている」と感じることで、面接に対する態度や動機が向上し、結果的により良いパフォーマンスを発揮しやすくなったと考えられます。
面接官側の評価においても、事前の印象は予測因子として機能していました。書類段階で形成した印象と面接後のパフォーマンス評価の間には相関関係が見られ、面接は印象を修正する機会というよりも、既存の印象を確認する場として機能していることが明らかになりました。
面接官の因果帰属(成功や失敗の原因をどこに求めるか)にもバイアスが見られました。事前に好印象を持った候補者が良いパフォーマンスを見せた場合、面接官はその原因を候補者の能力や努力といった内部要因に帰属させる傾向がありました。一方、事前印象が芳しくなかった候補者については、たとえ良いパフォーマンスを見せても、それを外部的な要因に帰属させました。
最終的な採用判断においても、事前印象の影響は色濃く反映されました。書類段階でポジティブな印象を持たれた候補者の多くが面接後も高評価を維持した一方、ネガティブな印象を持たれた候補者ではあまり印象を改善できませんでした。面接がネガティブな印象を覆す機会として十分に機能していないことを示唆しています。
このプロセス全体を通じて見えてくるのは、面接官の認知と行動の二重の経路による影響です。認知的には、事前印象が情報処理の仕方を偏らせ、同じ発言でも異なって解釈される可能性があります。行動的には、面接官の非言語的態度や質問パターンが変化し、それが候補者のパフォーマンスに影響を与えます。
白人面接官の距離感が黒人候補者を萎縮させる
人種間の相互作用における非言語的コミュニケーションの役割に焦点を当てた研究が行われています。この研究は「自己成就的予言」の概念を、異人種間の面接場面に適用したものです。自己成就的予言とは、根拠のない予測や期待が、その期待を現実化させる行動を引き起こし、予測が的中してしまう現象を指します。
研究者たちは、この現象が黒人と白人の面接場面でどのように展開されるかを、二つの実験で検証しました[2]。第一実験では白人面接官の行動を観察し、第二実験ではその行動が候補者に与える影響を測定するという、段階的なアプローチが採用されました。
第一実験では、白人男子大学生15名を面接官役として招き、「グループ意思決定研究」という名目で実験に参加してもらいました。各面接官は、訓練を受けた白人と黒人の候補者役を一人ずつ面接することになりました。候補者役は実際には研究協力者であり、発言内容や態度は事前に統一されていました。面接官が接する候補者の「質」は人種以外のすべての要素において同一だったのです。
面接の様子は隠しカメラで撮影され、後に行動分析が行われました。分析対象となったのは、身体的近接性を表すイミディアシー行動(前屈み姿勢、アイコンタクトの頻度と持続時間、体の向きなど)、話し方の流暢性を示すスピーチエラーの回数、そして面接の持続時間でした。
結果、白人面接官は黒人候補者に対して、白人候補者と比べて明らかに距離を置いた態度を取っていました。イミディアシー指標で見ると、白人候補者への平均スコアが0.18だったのに対し、黒人候補者へは-0.26と大きく下回りました。面接官が無意識のうちに身体的距離を取り、視線を避け、体を逸らせていたことを意味します。
話し方においても違いが見られました。黒人候補者と面接する際、白人面接官はより多くのスピーチエラー(言い間違い、言いよどみ、不自然な間など)を犯していました。これは面接官自身の緊張や不安の表れと解釈されます。さらに、面接時間も短縮されており、早々に面接を切り上げようとする回避的な態度が見て取れました。
第二実験は、この知見をさらに発展させた設計となっていました。今度は白人男子大学生30名を候補者役として招き、訓練を受けた白人の面接官役が、第一実験で観察された二つの異なる行動パターンを意図的に再現しました。黒人が受けた「低イミディアシー条件」(距離を置く、視線を避ける、面接時間を短くするなど)と、白人が受けた「高イミディアシー条件」(親しみやすい、積極的なアイコンタクト、十分な時間をかけるなど)を実験的に操作したのです。
この設計により、面接官の行動パターンが候補者のパフォーマンスに与える影響を、人種という要因を排除して測定することが可能になりました。第三者による客観的なパフォーマンス評価、候補者自身の心理状態の自己報告、面接官に対する印象評価、そして候補者自身の非言語的行動の変化が測定されました。
結果は研究者たちの仮説を支持するものでした。低イミディアシー条件(つまり、黒人候補者が実際に受けた扱い)を受けた白人候補者は、高イミディアシー条件の候補者と比べて明らかに低いパフォーマンス評価を受けました。話し方がぎこちなくなり、より多くのスピーチエラーを犯し、全体的に緊張した様子を見せました。
候補者の主観的体験においても違いが見られました。低イミディアシー条件の候補者は、面接官を「不友好的で不適格」と評価し、面接全体に対して否定的な印象を抱きました。自分が歓迎されていない、評価されていないという感覚が、自信の低下や動機の減退につながったと考えられます。
候補者自身の非言語的行動にも変化が見られました。面接官から距離を置かれた候補者は、自らも身体的距離を取り、アイコンタクトを避けるようになりました。これは、面接官の否定的な態度を鏡のように映し返す反応として解釈できます。
民族的な名前と訛りが重なると面接評価が下がる
人種・民族差別は、露骨で明示的な形態から、より微妙で暗黙的な形態へと変化してきました。現在では、多くの組織で明確な差別は禁止されており、面接官たちも表面的には公正な評価を心がけています。しかし、このような環境においても、民族性を示唆する微細な手がかりが評価に影響を与える可能性があります。
21世紀初頭に行われた研究では、ヒスパニック系の名前とアクセントという二つの民族的手がかりが、面接評価にどのような影響を与えるかが検証されました[3]。この研究は、単一の手がかりではなく、複数の手がかりの相互作用に焦点を当てています。
実験参加者は、米国南東部の大学に在籍する経営学部生212名でした。平均年齢は22歳で、平均2.7年の職務経験を持つ、実際の採用場面に近い背景を持つ人々でした。民族構成は白人66%、アフリカ系18%、ヒスパニック11%という多様性を反映したものでした。
実験デザインは、名前(ヒスパニック系 vs. 非ヒスパニック系)とアクセント(ヒスパニック訛り vs. 標準英語)の2×2の完全無作為割当となっていました。候補者役を演じたのは同一の白人男性俳優であり、外見、履歴書、発言内容はすべて統一されていました。変化させたのは名前とアクセントのみでした。
名前の操作では、「Miguel Fernandez」と「Michael Fredrickson」という対照的な名前が使用されました。履歴書に記載されるとともに、面接動画の冒頭でもクレジット表示され、参加者の記憶に残るよう工夫されていました。アクセントについては、同じ俳優がヒスパニック訛りの英語と標準的な英語を使い分けて演技しました。
面接は10分間のビデオ形式で実施され、人事マネジャーへの応募という設定でした。参加者は面接官役として、候補者の特性判断、採用意思決定、そして自身の民族バイアス傾向などを評価しました。
操作チェックの結果、実験操作は意図通りに機能していました。ヒスパニック名とアクセントの組み合わせ条件では、100%の参加者がその候補者をヒスパニックと認識しました。アクセントの認識相関は0.79と高く、理解度も7段階で平均5.95と、聞き取りに支障がない水準でした。
分析の結果、名前とアクセントの交互作用が候補者特性判断に有意な影響を与えることが明らかになりました。興味深いのは、その影響のパターンです。ヒスパニック名にヒスパニック訛りが加わった場合、評価は最も低くなりました。しかし、ヒスパニック名でありながら標準的な英語を話す場合、評価は逆に最も高くなりました。
この結果は、期待違反という心理学的メカニズムで説明できます。ヒスパニック系の名前から参加者は特定の期待(おそらく訛りのある英語)を形成しますが、実際には流暢な標準英語を聞くことで、その期待が良い意味で裏切られます。この期待違反が、過剰な補正効果を生み、他の条件よりも高い評価につながったと考えられます。
一方、ヒスパニック名と訛りが重複した場合、両方の民族的手がかりが同じ方向に作用し、カテゴリー化がより鮮明になります。これによって、参加者の無意識下で否定的なステレオタイプが活性化され、評価の低下につながったと解釈されます。
現代型民族バイアス尺度の得点が高い参加者ほど、候補者特性判断と採用意思決定の両方において否定的な評価を下す傾向が見られました。これは、意識的には公正な評価を心がけていても、深層の偏見が微妙な形で評価に反映されることを示しています。
パス解析により、影響の経路も明確になりました。名前とアクセントの相互作用は、まず候補者特性の判断に影響を与え、その判断が採用意思決定に伝播するという二段階の構造が確認されました。民族的手がかりは直接的に採用判断を左右するのではなく、候補者の能力や性格に対する印象を媒介として間接的に影響するということです。
面接評価の人種差はあるが構造化で縮小
面接における人種・民族差に関する個別の研究が蓄積される中で、全体的な傾向を把握し、どのような要因が格差の大小に関わるかを系統的に整理する必要性が高まってきました。あるメタ分析は、1964年以降に発表された面接評価データを統合し、人種間格差の実態を定量的に明らかにしました[4]。
この研究では、31の研究から得られたデータが分析対象となりました。黒人候補者4,169名、白人候補者6,307名という大規模なサンプルに加え、15の研究ではヒスパニック系候補者1,200名のデータも含まれていました。
全体的な効果量を見ると、黒人–白人間では平均0.25、ヒスパニック–白人間では平均0.26という値が得られました。これは、少数派候補者が白人候補者よりも約0.25標準偏差分低く評価されていることを意味します。この値は、一般能力検査で観察される1標準偏差前後の人種差と比べると相当に小さく、実際の職務業績における人種差(0.3-0.4標準偏差)に近い水準でした。
重要な発見の一つは、面接の構造化レベルが人種差に与える影響です。低構造面接では黒人–白人差が0.32だったのに対し、高構造面接では0.23に縮小していました。ヒスパニック系についても同様の傾向が見られました。構造化面接とは、事前に決められた質問を一定の順序で行い、評価基準を明確に定めた面接形式を指します。
高構造面接の中でも、形式によって効果に違いがありました。シチュエーショナル面接(仮想的な状況に対する対応を問う形式)では効果量0.43と比較的大きな格差が残ったのに対し、行動記述面接(過去の具体的な行動事例を詳しく聞く形式)では0.22まで格差が縮小していました。この違いは、行動記述面接がより客観的で検証可能な情報に基づいているためと考えられます。
職務の複雑度も人種差に大きく影響していました。黒人について見ると、低複雑度の職務では効果量0.43と大きな格差があったものの、中複雑度では0.22、高複雑度では-0.09とわずかに黒人の方が高評価を受ける逆転現象まで見られました。ヒスパニック系でも同様の傾向があり、低複雑度0.54から高複雑度-0.23へと段階的に格差が縮小していました。
この現象の背景には、職務の高度化に伴う候補者プールの均質化があると考えられます。高度な専門職や管理職では、候補者がある程度選抜された集団となるため、人種や民族を超えて似たような能力レベルの人々が集まりやすくなります。結果、表面的な特徴よりも実質的な能力が評価の中心となり、格差が縮小するのでしょう。
面接と能力検査の相関(能力サチュレーション)も格差の大きさに関わっていました。面接が認知能力を強く測定している場合(相関0.30以上)、黒人–白人差は0.45まで拡大しました。これに対し、相関が0.30未満の場合は0.26にとどまりました。この結果は、面接が認知能力検査の代替として機能する場合、もともと存在する能力差がそのまま面接評価に反映されることを示しています。
応募集団に占める少数派の比率も興味深い影響を示しました。黒人候補者の比率が30%未満の場合、効果量は0.15と比較的小さかったものの、30%以上では0.41まで拡大していました。これは、少数派が多い環境では、むしろ人種や民族の違いが際立ちやすくなる可能性を示唆しています。
脚注
[1] Phillips, A. P., and Dipboye, R. L. (1989). Correlational tests of predictions from a process model of the interview. Journal of Applied Psychology, 74(1), 41-52.
[2] Word, C. O., Zanna, M. P., and Cooper, J. (1974). The nonverbal mediation of self-fulfilling prophecies in interracial interaction. Journal of Experimental Social Psychology, 10(1), 109-120.
[3] Purkiss, S. L. S., Perrewe, P. L., Gillespie, T. L., Mayes, B. T., and Ferris, G. R. (2006). Implicit sources of bias in employment interview judgments and decisions. Organizational Behavior and Human Decision Processes, 101(2), 152-167.
[4] Huffcutt, A. I., and Roth, P. L. (1998). Racial group differences in employment interview evaluations. Journal of Applied Psychology, 83(2), 179-189.
執筆者
伊達 洋駆 株式会社ビジネスリサーチラボ 代表取締役
神戸大学大学院経営学研究科 博士前期課程修了。修士(経営学)。2009年にLLPビジネスリサーチラボ、2011年に株式会社ビジネスリサーチラボを創業。以降、組織・人事領域を中心に、民間企業を対象にした調査・コンサルティング事業を展開。研究知と実践知の両方を活用した「アカデミックリサーチ」をコンセプトに、組織サーベイや人事データ分析のサービスを提供している。著書に『60分でわかる!心理的安全性 超入門』(技術評論社)や『現場でよくある課題への処方箋 人と組織の行動科学』(すばる舎)、『越境学習入門 組織を強くする「冒険人材」の育て方』(共著;日本能率協会マネジメントセンター)などがある。2022年に「日本の人事部 HRアワード2022」書籍部門 最優秀賞を受賞。東京大学大学院情報学環 特任研究員を兼務。