Data Analytics Lab 發表生成式AI語音判定技術之研究成果

Data Analytics Lab 發表了與 Evixar 共同進行的生成式AI語音判定技術研究成果。該專案入選總務省假訊息防範計畫,旨在提升針對深偽等技術的檢測能力。
調査NQ 80/100出典:PR Times

📋 文章處理履歷

  • 📰 發表: 2026年4月9日 21:00
  • 🔍 收集: 2026年4月9日 12:30
  • 🤖 AI分析完成: 2026年4月20日 08:35(收集後260小時5分鐘)
Data Analytics Lab株式會社(總部:東京都中央區,代表董事:近藤 雅彦,以下簡稱「本公司」)宣布,已彙整關於生成式AI語音內容判定技術的研究成果。此為Evixar株式會社(以下簡稱「Evixar」)獲總務省「網際網路假・誤資訊等防範技術之開發與實證事業」採用的專案中,雙方共同進行之研究的一環。

本研究融合了Evixar的音訊信號處理技術與本公司的AI・數據分析技術,目的在於提升防範因生成式AI高度化而日益嚴重的假・誤資訊(如深偽等)的對策技術。

■ 研究成果概要
本研究中,我們重現並分析了生成式AI語音內容的特性,建置了用於判定合成語音的驗證數據以及AI模型的驗證環境。

■ 主要成果
① 建置支援多樣化語音生成模型的驗證平台
為了分析包含日語在內的合成語音,我們調查並比較了以下先進的語音生成模型:
・Tortoise
・XTTS(多語言對應模型)
・Qwen3-TTS
並針對多種生成方式進行了驗證。

特別是透過支援如XTTS等基於多語言及大規模學習的語音生成技術,我們在接近真實生成式AI環境的條件下進行了驗證。

② 合成語音數據的系統化生成與特徵擷取分析
在本研究中,我們實施了:
・合成語音數據生成條件的整理與系統化
・音訊信號(頻譜圖等)的解析
・提取與自然語音的結構性差異
並致力於定量掌握合成語音的特性。

藉此,我們致力於不依賴特定生成模型的通用判定技術的研發工作。

③ 利用深度學習驗證合成語音判定模型
關於生成語音的判定,我們:
・調查並驗證了深度學習模型
・建置學習用數據集
・整備判定準確度的評估流程
並在一定程度上確認了利用AI語音特有特徵之判定模型的有效性。

④ 透過音訊信號處理與AI的融合提升技術高度
在本研究中,我們將Evixar擁有的音訊信號處理技術與本公司的AI技術相結合,以支援強化Evixar的合成語音判定系統(EAF)的驗證工作。具體而言,我們:
・生成合成語音數據並驗證多樣化生成模型的運作
・透過音訊信號的特徵解析掌握合成語音與自然語音的差異
・使用深度學習模型驗證判定準確度並建置評估數據集
並致力於提供技術見解以提升EAF的判定準確度。

■ 本研究的定位
本研究是在Evixar株式會社主導並獲總務省事業採用的專案中推動,由該公司負責音訊信號處理及AI防範技術的開發,而本公司則負責數據設計、解析及驗證領域。

本公司特別負責:
・合成語音數據的生成與設計
・語音數據的解析與特徵擷取
・判定模型的驗證及評估平台的建置
並在此...