GENIAC (Generative AI Accelerator Challenge) is a project led by the Ministry of Economy, Trade and Industry (METI) and the New Energy and Industrial Technology Development Organization (NEDO) in Japan, aimed at strengthening domestic generative AI development capabilities.

What is a Multimodal Large Language Model (LLM)?

A Multimodal LLM is an AI technology capable of simultaneously processing multiple types of data, such as text, images, audio, and video. This allows it to perform tasks that involve understanding and integrating information from various sources.

What is the main feature of Ricoh's new model, Qwen3-VL-Ricoh-32B-20260227?

The main feature is its 'reasoning capability,' enabling it to accurately understand diverse documents, including charts and diagrams, through multi-stage reasoning. It can associate information across multiple pages and answer complex questions.

What is the lightweight model being released?

Ricoh is releasing a lightweight model named 'Qwen3-VL-Ricoh-8B-20260227' free of charge. This model utilizes the technologies developed for the main model and is intended for wider accessibility.

Where can I access the lightweight model?

The lightweight model is available on Hugging Face at the following URL: https://huggingface.co/ricoh-ai/Qwen-3-VL-Ricoh-8B-20260227

Ricoh 在 GENIAC 第三期開發具備推理能力的多模態大型語言模型

發布 2026年3月30日 20:10 ・ 最後更新 2026年6月2日 13:01 ・閱讀約 3 分鐘・來源：PR TIMES

Ricoh 在 GENIAC 計畫中開發出擅長理解圖表的મલ્ટીમોડલ LLM，並免費釋出輕量級模型，同時也將發布基準測試工具。

株式會社 Ricoh（社長執行役員：大山晃）今日宣布，在經濟產業省與國立研究開發法人新能源產業技術綜合開發機構（NEDO）為強化國內生成式 AI 開發能力而實施的「GENIAC（Generative AI Accelerator Challenge）*1」計畫第三期中，已完成開發具備推理能力的多模態大型語言模型（以下稱推理 LMM）的基礎模型「Qwen3-VL-Ricoh-32B-20260227」。此模型能高精度地讀取包含圖表在內的各種文件，其特點是能透過多階段推理來理解複雜文件。此外，Ricoh 將從即日起免費公開運用此模型開發技術所衍生的輕量級模型「Qwen3-VL-Ricoh-8B-20260227」。同時，Ricoh 自主開發、專門用於評估推理性能的基準測試工具*3，也預計在未來公開。【公開網址】 https://huggingface.co/ricoh-ai/Qwen-3-VL-Ricoh-8B-20260227

1. 計畫背景與社會課題大型多模態模型（LMM）是一種能夠同時處理文字、圖像、語音、影片等多種數據的 AI 技術。由於在螢幕截圖文字摘要、回答包含圖表的問題等各種任務中表現出高效率，因此作為能處理廣泛數據格式的 AI，其備受期待。企業內部累積了發票、收據等交易資料，事業策略、計畫等經營資料，以及服務手冊、公司內部技術標準、品質管理標準等各式各樣的文件。這些文件不僅包含文字，還有圖、表格、圖像等，人們期待能有效利用這些文件來提升企業內部效率，並創造新的價值與創新。然而，也存在「文字搜尋無法獲得預期結果」、「僅有搜尋功能難以充分利用文件」等課題。近年來，為應對勞動力減少所帶來的效率化工作方式、資深員工退休導致的技能傳承問題，以及外籍勞工增加所衍生的文件多語化需求，企業面臨著各種經營課題。在此背景下，利用 AI 高效活用企業內部知識的需求日益增加。

Ricoh 在 2024 年 8 月開始的 GENIAC 第二期計畫中，開發了擁有 700 億參數的 LMM，並免費公開了其基礎模型及自主開發的基準測試工具。此外，在 2026 年 1 月，Ricoh 開發了基於中國阿里巴巴雲開發提供的 LLM 系列「Qwen2.5-VL-32B-Instruct」的 320 億參數緊湊型 LMM。

2. 本次成果在第三期計畫中，Ricoh 以「Qwen3-VL-32B-Instruct*4」為基礎，開發了能夠透過多階段推理高精度理解複雜文件的推理 LMM 基礎模型「Qwen3-VL-Ricoh-32B-20260227」。此模型透過強化學習*5 和課程學習*6 等學習方法的改進，能夠關聯並理解跨越多頁的圖表，即使面對閱讀難度較高的問題，也能生成高精度的回答。在強化學習方面，透過設定獨特的獎勵函數來提高學習效率，同時抑制過度擬合。在課程學習方面，則進行了難易度設定與學習節奏的優化。透過這些努力，已確認其基準測試結果可與「Gemini2.5-Pro」等大型商用模型媲美（截至 2026 年 2 月 17 日）。為評估此模型的推理性能，Ricoh 開發了自主的基準測試工具。

FACT BOX · 重點整理

來源：PR TIMES
分類：新品
相關組織：経済産業省
原文日期：2026年2月27日 / 2024年8月
產品、服務：Qwen3-VL-Ricoh-32B-20260227 / Qwen3-VL-Ricoh-8B-20260227

Ricoh 在 GENIAC 第三期開發具備推理能力的多模態大型語言模型

⚡ 三行看懂（重點）

FACT BOX · 重點整理

編輯、查證標準

常見問題

引用本文 — HOW TO CITE

AI 爬蟲實績 — AI CRAWLER ACTIVITY