提供自主研發的國產生成式AI基礎設施及面向企業的生成式AI服務的Stockmark株式會社(總部:東京都港區;代表取締役CEO:林 達;以下簡稱「本公司」)發布了「Stockmark-DocReasoner-Qwen2.5-VL-32B」文件閱讀基礎模型。該模型是在經濟產業省(METI)和新能量產業技術綜合開發機構(NEDO)推動的旨在強化日本生成式AI開發能力的「GENIAC」項目的第三階段支持下開發的。

本次開發的模型,充分利用了本公司在自主研發AI基礎模型方面的經驗,在32B(320億參數)這一中型模型中實現了抑制幻覺和精通日語/商業的特點。

這使得低成本的本地部署運行成為可能,而這是通用AI難以實現的。同時,由於能夠安全處理高度機密的企業數據而不必將其發送到外部,因此它是一個針對社會實踐優化的基礎模型,可在完全保護企業「數據主權」的同時,實現高速高精度的生成式AI環境。

**模型發布地點** **Stockmark-DocReasoner-Qwen2.5-VL-32B** https://huggingface.co/stockmark/Stockmark-DocReasoner-Qwen2.5-VL-32B

**關於「Stockmark-DocReasoner-Qwen2.5-VL-32B」** 「Stockmark-DocReasoner-Qwen2.5-VL-32B」是在開源模型「Qwen2.5-VL-32B-Instruct」的基礎上,對包含圖表和圖像的複雜商業文檔,以及以製造業為代表的、更複雜的文檔進行了豐富學習的多模態基礎模型。

該模型不僅在處理商業場景中常用的大量複雜文檔方面表現出色,而且還能夠閱讀包含製造業特有專業知識的文檔,如化學式和圖紙。

其性能超越了所採用的基礎模型「Qwen2.5-VL-32B-Instruct」以及在日本廣泛使用的「Qwen3-VL-32B-Instruct」。此外,透過實現「鏈式思維(Chain of Thought, CoT)」生成,即在回答複雜問題時,不一次性輸出最終答案,而是逐步生成導向回答的中間思考過程,使得生成式AI在商業場景中能夠被信賴地使用。

**「Stockmark-DocReasoner-Qwen2.5-VL-32B」的特點** 作為本模型的特點,我們採用了32B(320億參數)這一戰略性尺寸,以打破傳統大型模型面臨的「營運成本膨脹」與輕量級模型的「精度極限」這兩難局面。

32B與

FACT BOX · 重點整理

  • 來源:PR TIMES
  • 分類:新品
  • 產品、服務:Stockmark-DocReasoner-Qwen2.5-VL-32B