AI面接の表情分析は採用を改善するか?|3つの査読付き論文とEU AI Actが示すエビデンス
人事・採用31分で読めます

AI面接の表情分析は採用を改善するか? | 3つの査読付き論文とEU AI Actが示すエビデンス

ailead編集部

ailead編集部

AI面接ツールの導入が加速しています。経済産業省の調査によれば、企業の採用プロセスへのAI活用は年々拡大しており、「AIが候補者の表情を読み取って評価する」という機能を売りにするサービスも登場しました。

しかし、この「表情分析AI」は本当に採用の質を高めるのでしょうか。本記事では、3つの査読付き論文、業界最大手の方針転換、そしてEU AI Actの規制動向という3つの軸から、AI面接における表情分析のエビデンスを検証します。AI面接サービスの基本的な比較については「AI面接サービス比較|SHaiN・HireVue・harutaka・aileadの特徴と選び方」もあわせてご参照ください。

「表情分析AI」とは何か

表情分析AIとは、カメラ映像から候補者の表情の変化を読み取り、感情状態や性格特性を推定するAI技術です。面接中の回答時に現れる表情のパターンを解析し、「誠実さ」「熱意」「ストレス耐性」などの指標を数値化します。

この技術の理論的背景には、心理学者Paul Ekmanが1971年に提唱した基本表情理論があります。「喜び」「悲しみ」「怒り」「恐れ」「嫌悪」「驚き」という6つの感情は文化を問わず普遍的な表情パターンで表出される、という仮説です。AI面接ツールの表情分析は、この「表情と感情の1対1対応」を前提に設計されています。

しかし、この前提そのものが、近年の心理学研究で大きく揺らいでいます。以降のセクションでは、査読付き論文に基づくエビデンスを確認していきましょう。

候補者体験と採用ブランドへの影響

エビデンスの検証に入る前に、表情分析AIがもたらす「候補者体験」への影響を考えます。

AI面接ツールは候補者から見ると「AIに選別される」体験です。特に中途採用やハイクラス採用では、「自分の表情をAIが数値化している」という状況に対して心理的抵抗が生まれやすくなります。カメラの前で回答する際に不自然な表情を作ろうとしてしまい、本来の能力を発揮できないケースも指摘されています。

候補者がAI面接に不快感を抱けば、選考辞退率の上昇や口コミサイトでの評価低下につながります。人事・採用担当者が丁寧に設計した採用ブランドが、選考プロセスの1ステップで毀損されるリスクがあるのです。

一方、人間が面接官として対話し、AIは裏側で会話内容を構造化して面接官の判断を支援するアプローチでは、候補者は「人間に評価されている」という体験のまま面接を受けられます。

AIが選別するのではなく、AIが面接官を支援する。この設計思想の違いが、候補者体験を大きく左右します。

エビデンス1: 表情から感情を推定する科学的基盤は限定的

表情分析AIの最も根本的な問題は、「表情を読めば感情がわかる」という前提そのものにあります。

論文の要点

2019年、米国心理科学会(APS)の公式ジャーナル Psychological Science in the Public Interest に、表情と感情の関係を包括的に検証した大規模レビューが発表されました。

Barrett, Adolphs, Marsella, Martinez & Pollak(2019)による本レビューは、以下の重要な知見を報告しています。

  • 同じ感情でも人によって異なる表情が出る (再現性の問題)。怒りを感じていても、眉をひそめる人もいれば、無表情の人もいる
  • 同じ表情でも異なる感情を示しうる 。笑顔が「幸福」を意味するとは限らず、緊張や社交辞令の場合もある
  • 文化・文脈によって表情の意味が変わる (汎用性の問題)。表情の解釈は文化的背景や状況に強く依存する
著者らは「表情から感情を一義的に推定できる」という前提には十分な科学的裏付けがないと結論しています。

採用への含意

面接中の候補者の表情パターンから「誠実さ」や「熱意」を数値化するアプローチは、この科学的基盤の脆弱さの上に成り立っています。表情と内面の状態を結びつける確実な法則がない以上、数値化された結果の妥当性にも疑問が残ります。

参考として、米国運輸保安局(TSA)がかつて実施した「SPOT」プログラムの事例があります。空港で旅客の表情や振る舞いから脅威を検出しようとしたこのプログラムは、約10億ドルの投資にもかかわらず科学的に無効と判定され、廃止されました。「表情を読む」アプローチの限界を示す象徴的な事例です。

エビデンス2: AI動画面接は「印象」を予測し「職務成果」との関連は未確立

仮に表情分析の精度が高まったとしても、それが「採用に役立つ」かどうかは別の問題です。

論文の要点

Hickman, Bosch, Ng, Saef, Tay & Woo(2022)は、AI動画面接の妥当性を厳密に検証した研究を Journal of Applied Psychology に発表し、SIOP(産業・組織心理学会)2024年Jeanneret賞を受賞しました。

この研究の核心的な発見は以下の通りです。

  • AI動画面接のMLアルゴリズムは 「観察者が評価した性格特性」を予測する 。つまり「この人はこう見える」という印象を数値化できる
  • しかし、 「自己報告の性格特性」は予測しない 。候補者が自分をどう認識しているかとは乖離がある
  • 著者自身が「表情の視覚情報が意味のあるシグナルを追加しているかは疑問」と指摘している

採用への含意

この結果は、AI動画面接が行っているのは本質的に「印象の自動化」である可能性を示しています。つまり、AIが候補者を評価しているのではなく、「候補者がどう見えるか」を機械的にスコア化しているに過ぎません。

採用で本来測りたいのは「この候補者は入社後に活躍するか」です。しかし、「どう見えるか」と「実際にどうか」の間にギャップがある以上、表情や声のトーンの数値化だけでは職務パフォーマンスの予測に限界があります。

エビデンス3: 構造化面接が予測妥当性の最高水準

では、どのような採用手法が実際に「入社後の活躍」を予測できるのでしょうか。

論文の要点

Sackett, Zhang, Berry & Lievens(2022)は、APA(米国心理学会)の公式ジャーナル Journal of Applied Psychology に発表したメタ分析で、各選考手法の予測妥当性を再検証しました。

この研究で最も注目すべき結果は、選考手法ごとの予測妥当性の比較です。

  • 構造化面接の予測妥当性はρ=.42 。これは採用選考手法の中で最高水準の値
  • 非構造化面接の予測妥当性はρ=.19 。構造化面接の半分以下
  • 構造化面接は、GMA(一般知的能力)テスト(ρ=.31)やワークサンプルテスト(ρ=.33)をも上回る

採用への含意

構造化面接の予測妥当性ρ=.42は、採用手法の中で最高水準です。ここで言う「構造化面接」とは、すべての候補者に同じ質問を同じ順序で行い、事前に定めた評価基準に基づいてスコアリングする面接手法を指します。

このエビデンスが示すのは、採用AIが支援すべきは「候補者の表情を読む」ことではなく、「面接の会話内容を構造化する」ことだということです。質問の網羅性を確保し、評価基準を統一し、面接官ごとのバラつきを可視化する。こうした構造化のプロセスをAIで支援することが、エビデンスに基づく最適解です。

業界の転換点: HireVueの表情分析撤回

査読付き論文だけでなく、業界の動向もこのエビデンスを裏付けています。

AI面接の先駆者であるHireVueは、2019年11月に米国電子プライバシー情報センター(EPIC)からFTCへの苦情申立てを受けました。そして2021年1月19日、HireVueは表情分析機能の使用を中止したと公表しました。会社側は「自然言語処理の進歩により、視覚的分析の追加価値が小さくなった」と説明しています。

業界最大手のHireVue自身が「表情の視覚分析は不要」と判断したことは、このアプローチの妥当性を問い直す大きな転換点でした。現在のHireVueは音声・言語ベースの分析へ移行しています。

EU AI Actによる規制強化

科学的エビデンスに加え、法規制の面でも表情分析AIへの逆風が強まっています。

EU AI Actの適用タイムライン

EU AI Act(Regulation (EU) 2024/1689)は、以下のスケジュールで段階的に適用されています。

  • 2024年8月1日: EU AI Act発効
  • 2025年2月2日: 第5条(禁止実務)の適用開始
  • 2025年8月2日: 制裁条項(第99条)の適用開始

第5条: 職場での感情推定AIの禁止

第5条(1)(f)は、 職場および教育機関における感情推定AIの使用を禁止 しています。面接中の候補者の表情から感情状態を推定する設計のAIは、この条項に該当する可能性が高いとされています。

さらに、Recital 44では、EU自身が感情認識技術について「limited reliability(限定的な信頼性)」「lack of specificity(特異性の欠如)」「limited generalisability(限定的な汎用性)」と懸念を表明しています。これは前述のBarrett et al.(2019)が指摘した科学的課題とまさに重なるものです。

採用AI一般への規制(Annex III)

なお、感情推定の有無にかかわらず、採用プロセスに使用するAI全般はAnnex III 4(a)により「高リスクAI」に分類されます。データガバナンス、人的監視、透明性確保、バイアステストといった義務が課されます。

つまり、採用AIには2段階の規制がかかります。感情推定を伴うものは第5条により 禁止 、それ以外もAnnex IIIにより 高リスク規制 の対象です。

グローバル企業への影響

違反時の制裁金は、最大3,500万ユーロまたは全世界年間売上の7%(いずれか高い方)に設定されています。日本には現時点で同等の規制はありませんが、EUに事業展開する企業やグローバル企業にとって、この規制は無視できません。

「感情推定AIを使わない」ことが、グローバル企業にとってのコンプライアンス要件になりつつあります。

エビデンスが示す「科学的に正しい採用AI」のアプローチ

3つの査読付き論文、HireVueの方針転換、EU AI Actの規制動向。これらのエビデンスが一貫して指し示すのは、「表情分析ではなく構造化面接をAIで支援する」というアプローチです。

構造化面接 × AI支援の具体的な価値

エビデンスに基づく採用AIは、以下の3つの領域で面接官を支援します。

面接評価の標準化 。すべての候補者に対して同じ評価軸でスコアリングする仕組みを提供し、面接官ごとのバラつきを最小化します。

対話データの構造化 。面接中の発話内容をテキスト化し、質問のカバレッジや回答の深さを可視化します。候補者の「表情」ではなく「発言内容」に基づく分析です。

面接官の育成支援 。優秀な面接官がどのような質問をしているか、どのタイミングで深掘りしているかを可視化し、組織全体の面接力を高めます。

aileadのアプローチ

aileadは、この「会話の中身を構造化する」アプローチに特化した対話データAIプラットフォームです。Teams、Zoom、Google Meetなど既存のWeb会議ツール上で面接を自動録画・文字起こしし、AIが会話内容を構造化して面接官の意思決定を支援します。表情分析は行いません。

候補者は普段使っているWeb会議ツールでそのまま面接を受けるため、新しいツールの操作を覚える必要がありません。AIは面接官に見えない裏側で動作し、候補者体験を損なうことなく、構造化面接の実現を支援します。情報セキュリティに関してはISO/IEC 27001:2022を取得済みです。

よくある質問

AI面接の表情分析は科学的に有効ですか?

2019年に Psychological Science in the Public Interest 誌で発表されたBarrett et al.の大規模レビューでは、表情から感情を一義的・高精度に推定できるという科学的基盤は限定的であると結論しています。さらに、Hickman et al.(2022)のSIOP Jeanneret賞受賞論文でも、AI動画面接が予測するのは「観察者から見た印象」であり、実際の職務成果との関連はこの研究では確立されていないことが示されています。

HireVueはなぜ表情分析を廃止したのですか?

HireVueは2021年1月に表情分析機能の使用を停止しました。これは米国電子プライバシー情報センター(EPIC)によるFTC申立てなど外部からの批判と、表情分析の科学的妥当性に対する疑問の高まりを受けた判断です。現在は音声・言語ベースの分析に移行しています。

EU AI Actで表情分析はどう規制されますか?

2024年発効のEU AI Act第5条では、職場における感情認識AIの使用が禁止対象として明記されています。違反した場合、年間売上高の最大7%の制裁金が科されます。面接での表情分析はこの規制の対象となる可能性が高く、グローバル展開する企業にとっては法的リスクとなります。

表情分析を使わずにAIを採用プロセスに活用する方法は?

表情分析に頼らず、面接の「会話内容」を構造化するアプローチが注目されています。既存のWeb会議ツール上で面接を自動録画・文字起こしし、評価基準に基づく構造化されたフィードバックを提供する方法です。たとえばaileadは、このアプローチに特化しており、Teams/Zoom/Google Meet上で対話データを自動収集・構造化します。メタ分析で予測妥当性が実証されている構造化面接を、AIで支援する設計です。

まとめ

本記事では、AI面接における表情分析の科学的妥当性を3つの査読付き論文、業界動向、規制環境から検証しました。

Barrett et al.(2019)の大規模レビューは、表情から感情を推定する科学的基盤の限界を指摘しています。Hickman et al.(2022)は、AI動画面接が予測するのは「印象」であって「職務成果」との関連は未確立だと示しました。そしてSackett et al.(2022)のメタ分析は、構造化面接こそが予測妥当性最高の採用手法であることを確認しています。

HireVueの表情分析撤回とEU AI Actの規制強化は、これらの科学的知見と整合する業界・法制度の動きです。エビデンスに基づく採用AIとは、候補者の「表情」ではなく「会話の中身」を構造化するものです。

構造化面接のAI支援に興味がある方は、aileadの無料デモをお試しください。

参考文献

  1. Barrett, L. F., Adolphs, R., Marsella, S., Martinez, A. M., & Pollak, S. D. (2019). Emotional Expressions Reconsidered: Challenges to Inferring Emotion From Human Facial Movements. Psychological Science in the Public Interest, 20(1), 1-68. PubMed

  2. Hickman, L., Bosch, N., Ng, V., Saef, R., Tay, L., & Woo, S. E. (2022). Automated Video Interview Personality Assessments: Reliability, Validity, and Generalizability Investigations. Journal of Applied Psychology, 107(8), 1323-1351. doi:10.1037/apl0000695 PubMed

  3. Sackett, P. R., Zhang, C., Berry, C. M., & Lievens, F. (2022). Revisiting Meta-Analytic Estimates of Validity in Personnel Selection: Addressing Systematic Overcorrection for Restriction of Range. Journal of Applied Psychology, 107(11), 2040-2068. PubMed

  4. HireVue (2021). 表情分析の使用停止を公表(2021年1月19日)。Fortune報道

  5. European Parliament (2024). Regulation (EU) 2024/1689 (AI Act). 第5条(1)(f): 職場における感情推定AIの使用を禁止。Recital 44で科学的根拠の限定性に言及。AI Act Article 5

ailead編集部

ailead編集部

株式会社ailead

aileadの公式編集部です。営業DX・AI活用に関する情報を発信しています。

#AI面接#表情分析#構造化面接#EU AI Act#採用DX#人事・採用

ailead(エーアイリード)で商談・面談データを活用しませんか?

AIが商談を自動で記録・分析し、営業組織の生産性を向上させます