致力於語音互動 AI 基礎模型研發的 DubGuild, Inc.(總部:東京都文京區,代表取締役:大嶽 匡俊)宣布,正式加入軟銀公司(SoftBank Corp.)提供的創業支援計畫「AI Foundation for Startups (AIFS)」。透過參與此計畫,我們將加速開發僅透過語音學習的互動基礎模型,並推動其商業化進程。

參與 AIFS 的背景 近年來,隨著生成式 AI 的演進,語音 AI 領域備受矚目。然而,傳統的語音 AI 多半依賴「語音轉文字、進行語言處理、再生成語音」的結構。這種結構難以處理對話中的時間與情感資訊,例如附和(backchanneling)、互動時機、語音重疊、情感起伏以及對話中自然的「停頓」。這些要素在文字化過程中極易流失。

DubGuild 的技術特點 與依賴文字的傳統模型不同,DubGuild 正在開發一種直接從語音學習的基礎模型。透過這種方法,AI 可處理的資訊量大幅增加,實現了自然的附和回應、語音重疊處理、反映情感表達的語音生成、低延遲即時翻譯,以及保持對話時間結構的互動。這不僅僅是語音識別技術,而是能處理人類對話結構本身的「語音特化型基礎模型」。

未來展望 我們將利用 AIFS 提供的超大規模 GPU 計算基礎設施,進一步提升語音特化型基礎模型的性能。此外,我們將加強與企業及研究機構的合作,加速實證實驗與商業化進程。我們目標在 AI 語音配音、多語言即時翻譯及次世代語音互動領域,面向全球市場進行佈局。

代表致詞 代表取締役 大嶽 匡俊:「我們是認真地想要打破語言隔閡。現今世界上存在許多優秀的內容,但其中許多因語言障礙而無法獲得應有的評價。DubGuild 的目標是透過實現『不破壞世界觀的配音』之語音基礎技術,將所有在地內容傳遞給全世界。藉由參與 AIFS 的助力,我們將加速進化能直接理解語音的基礎模型,創造超越語言的體驗價值。」

FACT BOX · 重點整理

  • 來源:PR TIMES
  • 分類:partnership