Sansan 將國家計畫「GENIAC」開發的 AI 模型「Cello」導入旗下產品
Sansan, Inc. 已將透過國家計畫「GENIAC」開發的文件專用 AI 模型「Cello」整合至旗下服務「Contract One」與「Bill One」中。Cello 透過同時輸出文字與位置資訊,提升了資料化的精確度與處理速度。
📋 文章處理履歷
- 📰 發表: 2026年5月19日 20:00
- 🔍 收集: 2026年5月19日 11:31
- 🤖 AI分析完成: 2026年5月21日 15:48(收集後52小時16分鐘)
## Sansan 將國家計畫「GENIAC」開發的 AI 模型「Cello」導入旗下產品
致力於提供 AX(類比轉型)服務以改變工作方式的 Sansan, Inc. 宣布,已將其在經濟產業省與國立研究開發法人新能源產業技術綜合開發機構(NEDO)共同推動的計畫「GENIAC(Generative AI Accelerator Challenge)」中所開發的文件專用 AI 模型「Cello」導入旗下產品中。該計畫目的在於強化日本生成式 AI 的開發能力。
本模型已整合至公司旗下的合約管理服務「Contract One」與會計 AX 服務「Bill One」的資料處理流程中。此舉進一步提升了合約與發票等商業文件資料化的精確度與處理速度,有助於提升使用者的工作效率與勞動生產力。未來計畫將此模型擴展導入至商務資料庫「Sansan」等其他產品中。
### 關於文件專用 AI 模型「Cello」
「Cello」是 Sansan 在國家計畫「GENIAC」第三階段中構建的自有 AI 模型,該計畫旨在支援基礎生成式 AI 模型的開發。
Sansan 過去曾獨家開發「Viola」,這是一款多模態生成式 AI,能透過問答格式直接從文件圖像中擷取必要資訊。「Cello」是「Viola」的進階擴展模型。除了提取文字資訊外,它還具備同時輸出「位置資訊」的功能,能標示資訊在文件上的具體位置。透過此進化,AI 在處理資訊的同時能夠辨識作為回答依據的文字區域,從而建立檢測並排除 AI 幻覺(生成式 AI 的常見挑戰)的機制。這使得資料化過程能夠與 Sansan 的資料轉換規則高度一致,實現極高精確度的資料化。
此外,在資料處理流程中,「Cello」將過去分開處理的「文字資料化」與「項目識別與語意理解」工程進行了整合處理。這提升了整個資料管線的處理速度,實現更迅速的資料交付。
### 商務 AI 應用中的資料重要性與 Sansan 的努力
隨著生成式 AI 的普及,僅依賴公開資訊將難以產生競爭優勢。利用企業內部基於事實的「第一手資訊(Primary Information)」並將其投入 AI 應用,才是競爭優勢的源泉。然而,商業環境中 AI 的性能很大程度上取決於資料品質。由於 AI 將輸入資訊直接作為判斷基準,充滿雜訊的非結構化資料容易導致 AI 幻覺。因此,消除推測並準備好 AI 能準確處理的結構化資料至關重要。
Sansan 長期以來建立了結合機器學習 AI 技術、嚴格的資料轉換規則以及人工品質保證的獨特資料化體系。這種能夠從多樣化類比文件中建立極高準確度資料的運作基礎,已成為在 AI 普及時代公司強大的競爭優勢。此次導入的「Cello」正是將此長年耕耘的資料化運作提升至下一個階段的關鍵。
透過導入本模型,Sansan 將進一步提升企業生產力,並強化為了最大化 AI 應用而建構的高精確度資料庫基礎。
致力於提供 AX(類比轉型)服務以改變工作方式的 Sansan, Inc. 宣布,已將其在經濟產業省與國立研究開發法人新能源產業技術綜合開發機構(NEDO)共同推動的計畫「GENIAC(Generative AI Accelerator Challenge)」中所開發的文件專用 AI 模型「Cello」導入旗下產品中。該計畫目的在於強化日本生成式 AI 的開發能力。
本模型已整合至公司旗下的合約管理服務「Contract One」與會計 AX 服務「Bill One」的資料處理流程中。此舉進一步提升了合約與發票等商業文件資料化的精確度與處理速度,有助於提升使用者的工作效率與勞動生產力。未來計畫將此模型擴展導入至商務資料庫「Sansan」等其他產品中。
### 關於文件專用 AI 模型「Cello」
「Cello」是 Sansan 在國家計畫「GENIAC」第三階段中構建的自有 AI 模型,該計畫旨在支援基礎生成式 AI 模型的開發。
Sansan 過去曾獨家開發「Viola」,這是一款多模態生成式 AI,能透過問答格式直接從文件圖像中擷取必要資訊。「Cello」是「Viola」的進階擴展模型。除了提取文字資訊外,它還具備同時輸出「位置資訊」的功能,能標示資訊在文件上的具體位置。透過此進化,AI 在處理資訊的同時能夠辨識作為回答依據的文字區域,從而建立檢測並排除 AI 幻覺(生成式 AI 的常見挑戰)的機制。這使得資料化過程能夠與 Sansan 的資料轉換規則高度一致,實現極高精確度的資料化。
此外,在資料處理流程中,「Cello」將過去分開處理的「文字資料化」與「項目識別與語意理解」工程進行了整合處理。這提升了整個資料管線的處理速度,實現更迅速的資料交付。
### 商務 AI 應用中的資料重要性與 Sansan 的努力
隨著生成式 AI 的普及,僅依賴公開資訊將難以產生競爭優勢。利用企業內部基於事實的「第一手資訊(Primary Information)」並將其投入 AI 應用,才是競爭優勢的源泉。然而,商業環境中 AI 的性能很大程度上取決於資料品質。由於 AI 將輸入資訊直接作為判斷基準,充滿雜訊的非結構化資料容易導致 AI 幻覺。因此,消除推測並準備好 AI 能準確處理的結構化資料至關重要。
Sansan 長期以來建立了結合機器學習 AI 技術、嚴格的資料轉換規則以及人工品質保證的獨特資料化體系。這種能夠從多樣化類比文件中建立極高準確度資料的運作基礎,已成為在 AI 普及時代公司強大的競爭優勢。此次導入的「Cello」正是將此長年耕耘的資料化運作提升至下一個階段的關鍵。
透過導入本模型,Sansan 將進一步提升企業生產力,並強化為了最大化 AI 應用而建構的高精確度資料庫基礎。
常見問題
Sansan 的 Cello 是什麼?
透過 GENIAC 專案開發的文件專用高精度 AI 模型。
哪些產品使用了 Cello?
已導入於 Bill One 與 Contract One 的資料處理流程中。
Cello 的優勢為何?
透過同時處理文字與位置資訊,實現高精度且快速的資料萃取。