有多少員工能識破生成式AI的捏造(幻覺)?測量AI輸出驗證力將改變人才戰略

GTF株式會社發表了旨在測量生成式AI幻覺檢測能力的次世代批判性思考測試「GTF-CTPA」的Section C。作為一個在AI時代科學地評估並培育「懷疑AI輸出能力」的平台,GTF將支持企業的AI風險管理與人才戰略。
新製品NQ 84/100出典:PR Times

📋 文章處理履歷

  • 📰 發表: 2026年5月20日 22:27
  • 🔍 收集: 2026年5月20日 14:01
  • 🤖 AI分析完成: 2026年5月20日 14:06(收集後4分鐘)
隨著生成式AI在業務中的應用不斷發展,個人識別AI幻覺(錯誤輸出)能力的差異直接與企業風險掛鉤,若未經修正,可能導致重大的訴訟風險。GTF的次世代批判性思考評估測試「GTF-CTPA」中的Section C(情境分析)是一個實務對應型的測試區塊,直接測量檢測並修正AI輸出中五種類型幻覺的能力。

生成式AI會「捏造」事實。批判性思考(CT)能力將受到考驗,以驗證並審計這些捏造。

GTF代表合夥人 山中英嗣

「所謂AI素養,並非使用AI的技術,而是懷疑AI輸出的能力。因為生成式AI會『捏造』事實。當生成式AI收集相關資訊時,並不一定會從一開始就確保這些資訊的連貫性。GTF-CTPA的Section C透過對應五種幻覺類型的場景,直接測量在實際工作場景中的AI輸出驗證能力。」

關於GTF-CTPA測試

GTF Critical Thinking Performance Assessment是一個科學地測量AI時代所需「思考能力」的次世代批判性思考測試。

GTF-CTPA以選擇題與記述題的雙重形式,測量Facione(1990)APA Delphi Report所定義的全部六種CT技能。測試滿分100分,由六個部分組成,相較於知識的多寡,其創新的三個重點在於捕捉「思考的品質」。

第一,它是能夠以最細粒度測量AI輸出驗證能力的CT測試。在Section C中,要求測驗者檢測並指出AI生成文本中包含的幻覺(事實錯誤、數值捏造、偽造引用、邏輯跳躍、上下文脫節)。正如CHI 2025的最新研究(Lee et al., 2025)所示,因對AI的過度依賴導致思考力下降的現象,在六個層級中有五個已被廣泛確認。GTF-CTPA的設計正是為了正面對抗這種「認知卸載」。

第二,它是表現連動型的後設認知測量。Section E將計畫、監控、評估、自我修正這四個過程與實際任務執行連結進行測量。不採取類似傳統MAI(後設認知覺察量表)的自我報告形式,而是透過核對「思考結果」與「思考回顧」,精準掌握思考的自我監控能力。

第三,它是近轉移與遠轉移的診斷矩陣。Section D在業務場景(近轉移)與日常/社會場景(遠轉移)中應用CT技能,透過四象限診斷出該思考技能是「僅能在訓練場景使用」還是「隨處可用」。

此外,測量後還有「處方」。根據GTF-CTPA的診斷結果,透過投入對應弱點技能的六個處方型迷你模組(Facione 6技能×個別介入),實現「測量→培育→處方」的良性循環。不僅僅是測試,而是為每位受測者提供最佳的成長路徑——這正是GTF-CTPA的核心價值。

此測試的設計思想,支撐於二十多年來將CT充分活用於企業再生實務的現場,以及包括客戶在內的經營幹部與實習生的培育實績。

關於GTF Thinking Academy

GTF株式會社自2001年成立以來,以上市企業為中心,透過團隊派遣式的實務支援進行企業重組與再生作為核心業務,並累積了經營幹部與實習生的培育經驗。

GTF Thinking Academy將此實戰智慧系統化,提供「培訓(CT 4模組+AI思考設計)」、「測量(獨家開發測試 GTF-CTPA)」、「補強(處方型迷你模組)」一體化的日本首個批判性思考平台。該平台基於世界標準的學術證據(美國心理學會Delphi Report、Abrami統合分析等)進行設計。

常見問題

為什麼檢測AI幻覺很重要?

未經修正的AI輸出可能引發訴訟風險,對企業而言構成嚴重的經營威脅。

這與其他AI培訓有什麼不同?

不聚焦於「如何使用」,而是基於學術性的批判性思考,測量並強化對AI輸出「懷疑」的能力。

這項培訓的對象是誰?

對象涵蓋所有在實務中使用生成式AI的商業人士,包括上市公司的經營幹部與實習生。