DubGuild 加入軟銀「AI Foundation for Startups (AIFS)」計畫
加速「語音原生基礎模型」的社會實施,跳過文字處理流程。
📋 文章處理履歷
- 📰 發表: 2026年4月2日 05:00
致力於語音互動 AI 基礎模型研發的 DubGuild, Inc.(總部:東京都文京區,代表取締役:大嶽 匡俊)宣布,正式加入軟銀公司(SoftBank Corp.)提供的創業支援計畫「AI Foundation for Startups (AIFS)」。透過參與此計畫,我們將加速開發僅透過語音學習的互動基礎模型,並推動其商業化進程。
參與 AIFS 的背景
近年來,隨著生成式 AI 的演進,語音 AI 領域備受矚目。然而,傳統的語音 AI 多半依賴「語音轉文字、進行語言處理、再生成語音」的結構。這種結構難以處理對話中的時間與情感資訊,例如附和(backchanneling)、互動時機、語音重疊、情感起伏以及對話中自然的「停頓」。這些要素在文字化過程中極易流失。
DubGuild 的技術特點
與依賴文字的傳統模型不同,DubGuild 正在開發一種直接從語音學習的基礎模型。透過這種方法,AI 可處理的資訊量大幅增加,實現了自然的附和回應、語音重疊處理、反映情感表達的語音生成、低延遲即時翻譯,以及保持對話時間結構的互動。這不僅僅是語音識別技術,而是能處理人類對話結構本身的「語音特化型基礎模型」。
未來展望
我們將利用 AIFS 提供的超大規模 GPU 計算基礎設施,進一步提升語音特化型基礎模型的性能。此外,我們將加強與企業及研究機構的合作,加速實證實驗與商業化進程。我們目標在 AI 語音配音、多語言即時翻譯及次世代語音互動領域,面向全球市場進行佈局。
代表致詞
代表取締役 大嶽 匡俊:「我們是認真地想要打破語言隔閡。現今世界上存在許多優秀的內容,但其中許多因語言障礙而無法獲得應有的評價。DubGuild 的目標是透過實現『不破壞世界觀的配音』之語音基礎技術,將所有在地內容傳遞給全世界。藉由參與 AIFS 的助力,我們將加速進化能直接理解語音的基礎模型,創造超越語言的體驗價值。」
參與 AIFS 的背景
近年來,隨著生成式 AI 的演進,語音 AI 領域備受矚目。然而,傳統的語音 AI 多半依賴「語音轉文字、進行語言處理、再生成語音」的結構。這種結構難以處理對話中的時間與情感資訊,例如附和(backchanneling)、互動時機、語音重疊、情感起伏以及對話中自然的「停頓」。這些要素在文字化過程中極易流失。
DubGuild 的技術特點
與依賴文字的傳統模型不同,DubGuild 正在開發一種直接從語音學習的基礎模型。透過這種方法,AI 可處理的資訊量大幅增加,實現了自然的附和回應、語音重疊處理、反映情感表達的語音生成、低延遲即時翻譯,以及保持對話時間結構的互動。這不僅僅是語音識別技術,而是能處理人類對話結構本身的「語音特化型基礎模型」。
未來展望
我們將利用 AIFS 提供的超大規模 GPU 計算基礎設施,進一步提升語音特化型基礎模型的性能。此外,我們將加強與企業及研究機構的合作,加速實證實驗與商業化進程。我們目標在 AI 語音配音、多語言即時翻譯及次世代語音互動領域,面向全球市場進行佈局。
代表致詞
代表取締役 大嶽 匡俊:「我們是認真地想要打破語言隔閡。現今世界上存在許多優秀的內容,但其中許多因語言障礙而無法獲得應有的評價。DubGuild 的目標是透過實現『不破壞世界觀的配音』之語音基礎技術,將所有在地內容傳遞給全世界。藉由參與 AIFS 的助力,我們將加速進化能直接理解語音的基礎模型,創造超越語言的體驗價值。」
常見問題
DubGuild 的技術有何創新之處?
與傳統語音 AI 不同,它直接從語音學習而非透過文字轉換,因此能保留情感與對話間隙,實現更自然的互動。
加入 AIFS 有什麼好處?
能夠使用軟銀的大規模 GPU 計算基礎設施,大幅提升模型優化與商業化的開發速度。
這項技術將應用於哪些領域?
將應用於 AI 語音配音、多語言即時翻譯及次世代語音互動,旨在突破語言障礙,推廣全球內容。