運用 Whisper × Claude API 打造面試官 AI。公開實現工程師專屬 5 軸評分之技術流程

株式會社 X-HACK 推出 AI 面試練習 Web 應用程式「Mentai」,結合 OpenAI Whisper API 的高精度語音辨識與 Anthropic Claude API 的 AI 回饋生成,實現了工程師面試專屬的 5 軸評分。Mentai 透過語音輸入解決了傳統模擬面試中評分標準模糊、練習記錄無法累積以及難以察覺「說話能力」問題的痛點,並將 AI 處理的等待時間融入面試體驗,未來將開發即時深度提問的「面試模式」。
product_launch|otherNQ 100/100出典:PR Times

📋 文章處理履歷

  • 📰 發表: 2026年4月9日 19:00
  • 🔍 收集: 2026年4月9日 10:30
  • 🤖 AI分析完成: 2026年4月18日 17:26(收集後222小時55分鐘)
株式會社 X-HACK(總公司:東京都品川區,代表董事:松田信介)提供專為工程師轉職設計的 AI 面試練習 Web 應用程式「Mentai」,繼日前服務發布後,將公開支援 Mentai 的技術架構,作為生成式 AI 實際應用案例。
透過結合 OpenAI Whisper API 的高精度語音辨識,以及 Anthropic Claude API 專為工程師面試設計的 AI 回饋生成,實現了僅靠「與 AI 聊天」無法達成的「AI 面試教練」體驗。
服務網址:https://mentai.recruit-hub.ai/

■ 僅靠 ChatGPT 說「請幫我練習面試」無法解決的課題
如今,只要對 ChatGPT 的語音模式說「請幫我練習面試」,就能輕鬆體驗模擬面試。然而,若將其用於工程師的面試準備,仍存在以下課題:

評分標準模糊:只會得到「回答得很好」這類通用評論,無法評估工程師招聘中重視的技術說明能力和具體性等要點。
\n練習記錄無法累積:無論練習多少次,都不會留下歷史記錄,無法得知自己是否有所進步。

難以察覺「說話能力」的課題:無法視覺化文字輸入時難以察覺的贅詞(「嗯…」「那個…」)過多,或邏輯崩潰等問題。

Mentai 透過結合語音辨識 AI 和 Claude API 的技術架構,解決了這些課題。

■ 為何堅持「語音」?
面試是「說話」的場合。即使在腦中思考好答案並以文字輸入,也未必能在實際面試中流暢表達。說出口時邏輯崩潰、時間分配不當、贅詞增多——這些都是不實際說出來就難以察覺的課題。

Mentai 堅持語音輸入的原因就在於此。透過用戶對著麥克風說話,提供無限接近實際面試的 AI 面試練習環境。

■ 技術流程:從語音到 AI 回饋的實現
在 Mentai 中,用戶以語音回答後,到收到回饋為止,會經過 3 個 AI 處理步驟。

【步驟 1:語音錄製(瀏覽器)】
在用戶的瀏覽器上使用 MediaRecorder API 錄製語音。無需安裝專用應用程式,僅在瀏覽器中即可運行。錄製期間會顯示波形動畫,讓用戶感受到「正在說話」的實感。

【步驟 2:語音辨識(OpenAI Whisper API)】
錄製的語音會傳送至伺服器,並由 OpenAI Whisper API 進行文字轉錄。

日語面試回答中頻繁出現專業術語(例如「微服務」、「CI/CD」、「Scrum」等)。通用語音辨識容易誤辨這些技術術語,而 Whisper API 能夠以高精度辨識它們。

在開發初期,曾出現「CI/CD」被辨識為片假名「シーアイシーディー」的問題,但透過將技術術語列表傳遞給 Whisper API 的 prompt 參數解決了。由於辨識精度會影響回饋品質,因此在語音辨識引擎的選擇上特別講究。

【步驟 3:AI 回饋生成(Anthropic Claude API)】
文字轉錄後的文本,連同問題內容和用戶的個人資料(職位、經驗水平、行業),會傳送至 Anthropic Claude API。

Claude API 承擔的並非僅僅是「批改」。它會根據工程師面試專屬的 5 個評估軸(技術說明能力、邏輯結構、具體性、表達能力、流暢度)進行評分,並生成優點和改進點的具體評論。

此外,它還會根據問題類別(技術課題類、自我介紹類、志願動機類等)自動調整各軸的評估權重,實現符合問題意圖的精確 AI 面試準備回饋。

■ 開發中追求的 UX 與評估設計

【將等待時間轉化為「面試間隔」的 UX 設計】
在 Mentai 中,AI 處理的等待時間被融入體驗中,視為「面試官思考的時間」。

在實際面試中,面試官聽完回答後也會有一段思考時間。Mentai 重現了這種「間隔」,透過顯示 AI 面試官「思考中」的點頭動畫,將 Whisper API 的語音辨識(平均 2~3 秒)和 Claude API 的回饋生成(平均 5~8 秒)合計約 10 秒的處理時間,轉化為自然的模擬面試體驗。

【符合工程師招聘現場的 5 軸評估設計】
Mentai 的 5 軸評估(技術說明能力、邏輯結構、具體性、表達能力、流暢度)是根據工程師面試經驗者的訪談設計的。

最初是 3 軸(技術能力、邏輯性、表達能力),但後來發現「結合數字和團隊規模的具體性」以及「贅詞少、回答節奏流暢」是決定錄取與否的關鍵點,因此擴展為 5 軸。

此外,透過根據問題類型自動調整「應重視技術說明能力的問題」和「考驗表達能力的問題」等評估權重,實現了非劃一性的回饋。

■ 技術堆疊

層次 技術 角色
前端 Next.js(TypeScript) UI、語音錄製、回饋顯示
後端 Ruby on Rails(API 模式) 業務邏輯、API
語音辨識 OpenAI Whisper API 語音→文本轉換
AI 評估 Anthropic Claude API 5 軸評分、回饋生成
基礎設施 AWS(ECS Fargate / RDS / CloudFront) 生產環境
認證 Supabase Auth 用戶認證

■ 未來的技術展望
目前用戶以一問一答的形式練習,但未來將利用 Claude API 的串流功能,開發 AI 根據回答內容即時生成深度提問的「面試模式」。目標是重現實際面試中感受到的「被追問的緊張感」。

此外,也已開始提供可將練習結果分享至 X(Twitter)的社群媒體連結功能。為符合工程師「想展示分數」的文化,可輕鬆分享 5 軸評分卡。此功能的詳細資訊將在下次新聞稿中再次介紹。
服務網址:https://mentai.recruit-hub.ai/

■ 公司概要
公司名稱 株式會社 X-HACK
所在地 東京都品川區東五反田 2-5-2 THE CASK GOTANDA 702
代表者 代表董事 松田信介
設立 2018 年 3 月
業務內容 生成式 AI/LLM 應用支援、AI 驅動型開發基礎設施設計與開發、IT 系統導入支援與委託開發
公司網站 https://x-hack.jp

■ 本案相關諮詢處
株式會社 X-HACK
負責人:豐田
電子郵件:support@mentai.recruit-hub.ai