高速高精度專業化AI實現低成本本地部署:釋出針對社會實踐優化的文件閱讀AI基礎模型

Stockmark發布了「Stockmark-DocReasoner-Qwen2.5-VL-32B」,這是一個針對社會實踐優化的文件閱讀AI基礎模型,實現了低成本、高精度的本地部署運行,並保護數據主權。
新製品NQ 8/100出典:PR Times

📋 文章處理履歷

  • 📰 發表: 2026年4月8日 20:00
  • 🔍 收集: 2026年4月8日 11:31
  • 🤖 AI分析完成: 2026年4月20日 17:26(收集後293小時54分鐘)
提供自主研發的國產生成式AI基礎設施及面向企業的生成式AI服務的Stockmark株式會社(總部:東京都港區;代表取締役CEO:林 達;以下簡稱「本公司」)發布了「Stockmark-DocReasoner-Qwen2.5-VL-32B」文件閱讀基礎模型。該模型是在經濟產業省(METI)和新能量產業技術綜合開發機構(NEDO)推動的旨在強化日本生成式AI開發能力的「GENIAC」項目的第三階段支持下開發的。

本次開發的模型,充分利用了本公司在自主研發AI基礎模型方面的經驗,在32B(320億參數)這一中型模型中實現了抑制幻覺和精通日語/商業的特點。

這使得低成本的本地部署運行成為可能,而這是通用AI難以實現的。同時,由於能夠安全處理高度機密的企業數據而不必將其發送到外部,因此它是一個針對社會實踐優化的基礎模型,可在完全保護企業「數據主權」的同時,實現高速高精度的生成式AI環境。

**模型發布地點**
**Stockmark-DocReasoner-Qwen2.5-VL-32B**
https://huggingface.co/stockmark/Stockmark-DocReasoner-Qwen2.5-VL-32B


**關於「Stockmark-DocReasoner-Qwen2.5-VL-32B」**
「Stockmark-DocReasoner-Qwen2.5-VL-32B」是在開源模型「Qwen2.5-VL-32B-Instruct」的基礎上,對包含圖表和圖像的複雜商業文檔,以及以製造業為代表的、更複雜的文檔進行了豐富學習的多模態基礎模型。

該模型不僅在處理商業場景中常用的大量複雜文檔方面表現出色,而且還能夠閱讀包含製造業特有專業知識的文檔,如化學式和圖紙。

其性能超越了所採用的基礎模型「Qwen2.5-VL-32B-Instruct」以及在日本廣泛使用的「Qwen3-VL-32B-Instruct」。此外,透過實現「鏈式思維(Chain of Thought, CoT)」生成,即在回答複雜問題時,不一次性輸出最終答案,而是逐步生成導向回答的中間思考過程,使得生成式AI在商業場景中能夠被信賴地使用。

**「Stockmark-DocReasoner-Qwen2.5-VL-32B」的特點**
作為本模型的特點,我們採用了32B(320億參數)這一戰略性尺寸,以打破傳統大型模型面臨的「營運成本膨脹」與輕量級模型的「精度極限」這兩難局面。

32B與