運用 Whisper × Claude API 打造面試官 AI。公開實現工程師專屬 5 軸評分之技術流程

2026年4月9日

株式會社 X-HACK 推出 AI 面試練習 Web 應用程式「Mentai」，結合 OpenAI Whisper API 的高精度語音辨識與 Anthropic Claude API 的 AI 回饋生成，實現了工程師面試專屬的 5 軸評分。Mentai 透過語音輸入解決了傳統模擬面試中評分標準模糊、練習記錄無法累積以及難以察覺「說話能力」問題的痛點，並將 AI 處理的等待時間融入面試體驗，未來將開發即時深度提問的「面試模式」。

product_launch|otherNQ 100/100出典：PR Times

📋 文章處理履歷

📰 發表: 2026年4月9日 19:00
🔍 收集: 2026年4月9日 10:30
🤖 AI分析完成: 2026年4月18日 17:26（收集後222小時55分鐘）

株式會社 X-HACK（總公司：東京都品川區，代表董事：松田信介）提供專為工程師轉職設計的 AI 面試練習 Web 應用程式「Mentai」，繼日前服務發布後，將公開支援 Mentai 的技術架構，作為生成式 AI 實際應用案例。
透過結合 OpenAI Whisper API 的高精度語音辨識，以及 Anthropic Claude API 專為工程師面試設計的 AI 回饋生成，實現了僅靠「與 AI 聊天」無法達成的「AI 面試教練」體驗。
服務網址：https://mentai.recruit-hub.ai/

■ 僅靠 ChatGPT 說「請幫我練習面試」無法解決的課題
如今，只要對 ChatGPT 的語音模式說「請幫我練習面試」，就能輕鬆體驗模擬面試。然而，若將其用於工程師的面試準備，仍存在以下課題：

評分標準模糊：只會得到「回答得很好」這類通用評論，無法評估工程師招聘中重視的技術說明能力和具體性等要點。
\n練習記錄無法累積：無論練習多少次，都不會留下歷史記錄，無法得知自己是否有所進步。

難以察覺「說話能力」的課題：無法視覺化文字輸入時難以察覺的贅詞（「嗯…」「那個…」）過多，或邏輯崩潰等問題。

Mentai 透過結合語音辨識 AI 和 Claude API 的技術架構，解決了這些課題。

■ 為何堅持「語音」？
面試是「說話」的場合。即使在腦中思考好答案並以文字輸入，也未必能在實際面試中流暢表達。說出口時邏輯崩潰、時間分配不當、贅詞增多——這些都是不實際說出來就難以察覺的課題。

Mentai 堅持語音輸入的原因就在於此。透過用戶對著麥克風說話，提供無限接近實際面試的 AI 面試練習環境。

■ 技術流程：從語音到 AI 回饋的實現
在 Mentai 中，用戶以語音回答後，到收到回饋為止，會經過 3 個 AI 處理步驟。

【步驟 1：語音錄製（瀏覽器）】
在用戶的瀏覽器上使用 MediaRecorder API 錄製語音。無需安裝專用應用程式，僅在瀏覽器中即可運行。錄製期間會顯示波形動畫，讓用戶感受到「正在說話」的實感。

【步驟 2：語音辨識（OpenAI Whisper API）】
錄製的語音會傳送至伺服器，並由 OpenAI Whisper API 進行文字轉錄。

日語面試回答中頻繁出現專業術語（例如「微服務」、「CI/CD」、「Scrum」等）。通用語音辨識容易誤辨這些技術術語，而 Whisper API 能夠以高精度辨識它們。

在開發初期，曾出現「CI/CD」被辨識為片假名「シーアイシーディー」的問題，但透過將技術術語列表傳遞給 Whisper API 的 prompt 參數解決了。由於辨識精度會影響回饋品質，因此在語音辨識引擎的選擇上特別講究。

【步驟 3：AI 回饋生成（Anthropic Claude API）】
文字轉錄後的文本，連同問題內容和用戶的個人資料（職位、經驗水平、行業），會傳送至 Anthropic Claude API。

Claude API 承擔的並非僅僅是「批改」。它會根據工程師面試專屬的 5 個評估軸（技術說明能力、邏輯結構、具體性、表達能力、流暢度）進行評分，並生成優點和改進點的具體評論。

此外，它還會根據問題類別（技術課題類、自我介紹類、志願動機類等）自動調整各軸的評估權重，實現符合問題意圖的精確 AI 面試準備回饋。

■ 開發中追求的 UX 與評估設計

【將等待時間轉化為「面試間隔」的 UX 設計】
在 Mentai 中，AI 處理的等待時間被融入體驗中，視為「面試官思考的時間」。

在實際面試中，面試官聽完回答後也會有一段思考時間。Mentai 重現了這種「間隔」，透過顯示 AI 面試官「思考中」的點頭動畫，將 Whisper API 的語音辨識（平均 2～3 秒）和 Claude API 的回饋生成（平均 5～8 秒）合計約 10 秒的處理時間，轉化為自然的模擬面試體驗。

【符合工程師招聘現場的 5 軸評估設計】
Mentai 的 5 軸評估（技術說明能力、邏輯結構、具體性、表達能力、流暢度）是根據工程師面試經驗者的訪談設計的。

最初是 3 軸（技術能力、邏輯性、表達能力），但後來發現「結合數字和團隊規模的具體性」以及「贅詞少、回答節奏流暢」是決定錄取與否的關鍵點，因此擴展為 5 軸。

此外，透過根據問題類型自動調整「應重視技術說明能力的問題」和「考驗表達能力的問題」等評估權重，實現了非劃一性的回饋。

■ 技術堆疊

層次技術角色
前端 Next.js（TypeScript） UI、語音錄製、回饋顯示
後端 Ruby on Rails（API 模式）業務邏輯、API
語音辨識 OpenAI Whisper API 語音→文本轉換
AI 評估 Anthropic Claude API 5 軸評分、回饋生成
基礎設施 AWS（ECS Fargate / RDS / CloudFront）生產環境
認證 Supabase Auth 用戶認證

■ 未來的技術展望
目前用戶以一問一答的形式練習，但未來將利用 Claude API 的串流功能，開發 AI 根據回答內容即時生成深度提問的「面試模式」。目標是重現實際面試中感受到的「被追問的緊張感」。

此外，也已開始提供可將練習結果分享至 X（Twitter）的社群媒體連結功能。為符合工程師「想展示分數」的文化，可輕鬆分享 5 軸評分卡。此功能的詳細資訊將在下次新聞稿中再次介紹。
服務網址：https://mentai.recruit-hub.ai/

■ 公司概要
公司名稱株式會社 X-HACK
所在地東京都品川區東五反田 2-5-2 THE CASK GOTANDA 702
代表者代表董事松田信介
設立 2018 年 3 月
業務內容生成式 AI／LLM 應用支援、AI 驅動型開發基礎設施設計與開發、IT 系統導入支援與委託開發
公司網站 https://x-hack.jp

■ 本案相關諮詢處
株式會社 X-HACK
負責人：豐田
電子郵件：support@mentai.recruit-hub.ai

返回 Newsroom (30)