株式會社 Ricoh(社長執行役員:大山 晃)今日宣布,在經濟產業省與國立研究開發法人新能源產業技術綜合開發機構(NEDO)為強化國內生成式 AI 開發能力而實施的「GENIAC(Generative AI Accelerator Challenge)*1」計畫第三期中,已完成開發具備推理能力的多模態大型語言模型(以下稱推理 LMM)的基礎模型「Qwen3-VL-Ricoh-32B-20260227」。此模型能高精度地讀取包含圖表在內的各種文件,其特點是能透過多階段推理來理解複雜文件。 此外,Ricoh 將從即日起免費公開運用此模型開發技術所衍生的輕量級模型「Qwen3-VL-Ricoh-8B-20260227」。同時,Ricoh 自主開發、專門用於評估推理性能的基準測試工具*3,也預計在未來公開。 【公開網址】 https://huggingface.co/ricoh-ai/Qwen-3-VL-Ricoh-8B-20260227
1. 計畫背景與社會課題 大型多模態模型(LMM)是一種能夠同時處理文字、圖像、語音、影片等多種數據的 AI 技術。由於在螢幕截圖文字摘要、回答包含圖表的問題等各種任務中表現出高效率,因此作為能處理廣泛數據格式的 AI,其備受期待。 企業內部累積了發票、收據等交易資料,事業策略、計畫等經營資料,以及服務手冊、公司內部技術標準、品質管理標準等各式各樣的文件。這些文件不僅包含文字,還有圖、表格、圖像等,人們期待能有效利用這些文件來提升企業內部效率,並創造新的價值與創新。然而,也存在「文字搜尋無法獲得預期結果」、「僅有搜尋功能難以充分利用文件」等課題。 近年來,為應對勞動力減少所帶來的效率化工作方式、資深員工退休導致的技能傳承問題,以及外籍勞工增加所衍生的文件多語化需求,企業面臨著各種經營課題。在此背景下,利用 AI 高效活用企業內部知識的需求日益增加。
Ricoh 在 2024 年 8 月開始的 GENIAC 第二期計畫中,開發了擁有 700 億參數的 LMM,並免費公開了其基礎模型及自主開發的基準測試工具。此外,在 2026 年 1 月,Ricoh 開發了基於中國阿里巴巴雲開發提供的 LLM 系列「Qwen2.5-VL-32B-Instruct」的 320 億參數緊湊型 LMM。
2. 本次成果 在第三期計畫中,Ricoh 以「Qwen3-VL-32B-Instruct*4」為基礎,開發了能夠透過多階段推理高精度理解複雜文件的推理 LMM 基礎模型「Qwen3-VL-Ricoh-32B-20260227」。此模型透過強化學習*5 和課程學習*6 等學習方法的改進,能夠關聯並理解跨越多頁的圖表,即使面對閱讀難度較高的問題,也能生成高精度的回答。在強化學習方面,透過設定獨特的獎勵函數來提高學習效率,同時抑制過度擬合。在課程學習方面,則進行了難易度設定與學習節奏的優化。 透過這些努力,已確認其基準測試結果可與「Gemini2.5-Pro」等大型商用模型媲美(截至 2026 年 2 月 17 日)。為評估此模型的推理性能,Ricoh 開發了自主的基準測試工具。
FACT BOX · 重點整理
- 來源:PR TIMES
- 分類:新品
- 相關組織:経済産業省
- 原文日期:2026年2月27日 / 2024年8月
- 產品、服務:Qwen3-VL-Ricoh-32B-20260227 / Qwen3-VL-Ricoh-8B-20260227