Data Analytics Lab 發表生成式AI語音判定技術之研究成果

2026年4月9日

Data Analytics Lab 發表了與 Evixar 共同進行的生成式AI語音判定技術研究成果。該專案入選總務省假訊息防範計畫，旨在提升針對深偽等技術的檢測能力。

📋 文章處理履歷

📰 發表: 2026年4月9日 21:00
🔍 收集: 2026年4月9日 12:30
🤖 AI分析完成: 2026年4月20日 08:35（收集後260小時5分鐘）

Data Analytics Lab株式會社（總部：東京都中央區，代表董事：近藤雅彦，以下簡稱「本公司」）宣布，已彙整關於生成式AI語音內容判定技術的研究成果。此為Evixar株式會社（以下簡稱「Evixar」）獲總務省「網際網路假・誤資訊等防範技術之開發與實證事業」採用的專案中，雙方共同進行之研究的一環。

本研究融合了Evixar的音訊信號處理技術與本公司的AI・數據分析技術，目的在於提升防範因生成式AI高度化而日益嚴重的假・誤資訊（如深偽等）的對策技術。

■ 研究成果概要
本研究中，我們重現並分析了生成式AI語音內容的特性，建置了用於判定合成語音的驗證數據以及AI模型的驗證環境。

■ 主要成果
① 建置支援多樣化語音生成模型的驗證平台
為了分析包含日語在內的合成語音，我們調查並比較了以下先進的語音生成模型：
・Tortoise
・XTTS（多語言對應模型）
・Qwen3-TTS
並針對多種生成方式進行了驗證。

特別是透過支援如XTTS等基於多語言及大規模學習的語音生成技術，我們在接近真實生成式AI環境的條件下進行了驗證。

② 合成語音數據的系統化生成與特徵擷取分析
在本研究中，我們實施了：
・合成語音數據生成條件的整理與系統化
・音訊信號（頻譜圖等）的解析
・提取與自然語音的結構性差異
並致力於定量掌握合成語音的特性。

藉此，我們致力於不依賴特定生成模型的通用判定技術的研發工作。

③ 利用深度學習驗證合成語音判定模型
關於生成語音的判定，我們：
・調查並驗證了深度學習模型
・建置學習用數據集
・整備判定準確度的評估流程
並在一定程度上確認了利用AI語音特有特徵之判定模型的有效性。

④ 透過音訊信號處理與AI的融合提升技術高度
在本研究中，我們將Evixar擁有的音訊信號處理技術與本公司的AI技術相結合，以支援強化Evixar的合成語音判定系統（EAF）的驗證工作。具體而言，我們：
・生成合成語音數據並驗證多樣化生成模型的運作
・透過音訊信號的特徵解析掌握合成語音與自然語音的差異
・使用深度學習模型驗證判定準確度並建置評估數據集
並致力於提供技術見解以提升EAF的判定準確度。

■ 本研究的定位
本研究是在Evixar株式會社主導並獲總務省事業採用的專案中推動，由該公司負責音訊信號處理及AI防範技術的開發，而本公司則負責數據設計、解析及驗證領域。

本公司特別負責：
・合成語音數據的生成與設計
・語音數據的解析與特徵擷取
・判定模型的驗證及評估平台的建置
並在此...

返回 Newsroom (6)