Stockmark Inc. 贊助2026年度人工智慧學會全國大會(JSAI2026)金牌贊助商,發表驗證現有VLM在複雜文件理解方面極限的論文
Stockmark Inc. 將成為2026年度人工智慧學會全國大會(JSAI2026)的金牌贊助商,並將發表一篇驗證現有視覺語言模型(VLM)在理解複雜文件方面的極限的論文。該研究旨在探討AI能夠多精確地理解現實世界中複雜的文件。
📋 文章處理履歷
- 📰 發表: 2026年4月28日 22:00
- 🔍 收集: 2026年4月28日 13:31
- 🤖 AI分析完成: 2026年4月28日 15:24(收集後1小時52分鐘)
獨立開發國內生成式AI基礎平台並提供生成式AI服務的Stockmark股份有限公司(總公司:東京都港區,代表董事CEO:林 達,以下簡稱「本公司」),謹此宣布將金牌贊助於2026年6月舉辦的「2026年度人工智慧學會全國大會(第40屆,以下簡稱JSAI2026)」。
此外,在本大會上,本公司LLM組織的研究員高橋及會田將發表一篇關於針對農業日曆圖像的大規模視覺語言模型(VLM)基準測試的論文。
本研究並非旨在農業領域開展新業務,而是利用「栽培曆」——一種分析難度極高的文件代表,來驗證AI在多大程度上能精確理解現實社會中的複雜文件,這是一個跨產業的技術課題。本公司將利用從本研究中獲得的知識,應用於提升商業文件、規格書、圖紙、內部知識等結構化技術,以及支援企業AI BPR的基礎技術。
贊助背景
本公司秉持「重塑價值創造機制,推動人類進步」的使命,利用最尖端的自然語言處理技術和LLM等生成式AI技術進行產品開發及研究開發。目前,我們提供支援製造業研發現場的AI代理「Aconnect」和將複雜內部數據結構化為AI可利用形式的「SAT Agent Cockpit」,從而推動企業AI BPR(業務流程再造)。
匯集日本頂尖AI研究人員的人工智慧學會(JSAI),在日本AI技術的發展及其實際社會應用中扮演著極其重要的角色。為進一步活化和發展國內AI研究社群,本公司今年也將再次以金牌贊助商的身分參與。
發表論文:利用農業日曆驗證VLM極限
在本大會上,本公司的高橋及會田將發表關於「FiT-QA:栽培曆VQA基準測試 – 數據集建構與通用VLM的極限 –」的研究。
栽培曆是一種實用文件,將作物栽培相關的操作資訊,連同表格、圖表、照片、註釋及時間序列資訊,高密度地整合在一張紙上。與一般文件相比,它需要跨越多個領域來讀取資訊,並根據上下文進行綜合性推理,因此對於AI來說是極其難以理解的目標。
在本研究中,我們提出了針對這些栽培曆圖像的VQA(視覺問答)基準測試「FiT-QA(Figures and Tables Question Answering)」。FiT-QA由自動生成後經過人工編輯確認的easy-QA,以及為需要跨多領域綜合推理而人工創建的difficult-QA組成,收錄了347張圖像和1,152個問答對。使用高性能通用VLM進行評估的結果顯示,即使在easy-QA中仍存在錯誤回答,而difficult-QA中的正確回答則非常有限。
這澄清了將現有通用VLM直接應用於現實世界中複雜實用文件時的極限,並將FiT-QA作為未來模型開發和評估的實用基準測試發布。
發表會議詳情
・標題:FiT-QA:栽培曆VQA基準測試 – 數據集建構與通用VLM的極限
・發表者:高橋 洸丞、會田 勇斗(Stockmark股份有限公司)
宮脇 一輝、中川 菫、木村 泰知(小樽商科大學)
門脇 一真(株式會社日本總合研究所)
小林 曉雄、大友 將宏、石原 潤一、馬場 研太(農研機構 農業資訊研究中心)
・發表日期與時間:2026年6月9日(星期二)14:00〜15:30
・地點:Y會場(展覽廳AB-1)
・會議URL:https://pub.confit.atlas.jp/ja/event/jsai2026/presentation/2Yin-A-50
論文發表目的:從農業資料研究到商業文件分析
本次發表的「FiT-QA:栽培曆VQA基準測試」乍看之下是在農業領域進行的研究,這與本公司主要業務領域不同。然而,其底層的技術挑戰與本公司的業務緊密相關。
本公司至今為止,在研發和解決方案提供兩方面,都將「複雜文件的高度理解」作為一貫的重要主題。透過「Aconnect」和「SAT Agent Cockpit」,我們精確地結構化混雜表格、圖表、註釋的實用文件,並將其轉換為AI可利用的形式。
此外,在本大會上,本公司LLM組織的研究員高橋及會田將發表一篇關於針對農業日曆圖像的大規模視覺語言模型(VLM)基準測試的論文。
本研究並非旨在農業領域開展新業務,而是利用「栽培曆」——一種分析難度極高的文件代表,來驗證AI在多大程度上能精確理解現實社會中的複雜文件,這是一個跨產業的技術課題。本公司將利用從本研究中獲得的知識,應用於提升商業文件、規格書、圖紙、內部知識等結構化技術,以及支援企業AI BPR的基礎技術。
贊助背景
本公司秉持「重塑價值創造機制,推動人類進步」的使命,利用最尖端的自然語言處理技術和LLM等生成式AI技術進行產品開發及研究開發。目前,我們提供支援製造業研發現場的AI代理「Aconnect」和將複雜內部數據結構化為AI可利用形式的「SAT Agent Cockpit」,從而推動企業AI BPR(業務流程再造)。
匯集日本頂尖AI研究人員的人工智慧學會(JSAI),在日本AI技術的發展及其實際社會應用中扮演著極其重要的角色。為進一步活化和發展國內AI研究社群,本公司今年也將再次以金牌贊助商的身分參與。
發表論文:利用農業日曆驗證VLM極限
在本大會上,本公司的高橋及會田將發表關於「FiT-QA:栽培曆VQA基準測試 – 數據集建構與通用VLM的極限 –」的研究。
栽培曆是一種實用文件,將作物栽培相關的操作資訊,連同表格、圖表、照片、註釋及時間序列資訊,高密度地整合在一張紙上。與一般文件相比,它需要跨越多個領域來讀取資訊,並根據上下文進行綜合性推理,因此對於AI來說是極其難以理解的目標。
在本研究中,我們提出了針對這些栽培曆圖像的VQA(視覺問答)基準測試「FiT-QA(Figures and Tables Question Answering)」。FiT-QA由自動生成後經過人工編輯確認的easy-QA,以及為需要跨多領域綜合推理而人工創建的difficult-QA組成,收錄了347張圖像和1,152個問答對。使用高性能通用VLM進行評估的結果顯示,即使在easy-QA中仍存在錯誤回答,而difficult-QA中的正確回答則非常有限。
這澄清了將現有通用VLM直接應用於現實世界中複雜實用文件時的極限,並將FiT-QA作為未來模型開發和評估的實用基準測試發布。
發表會議詳情
・標題:FiT-QA:栽培曆VQA基準測試 – 數據集建構與通用VLM的極限
・發表者:高橋 洸丞、會田 勇斗(Stockmark股份有限公司)
宮脇 一輝、中川 菫、木村 泰知(小樽商科大學)
門脇 一真(株式會社日本總合研究所)
小林 曉雄、大友 將宏、石原 潤一、馬場 研太(農研機構 農業資訊研究中心)
・發表日期與時間:2026年6月9日(星期二)14:00〜15:30
・地點:Y會場(展覽廳AB-1)
・會議URL:https://pub.confit.atlas.jp/ja/event/jsai2026/presentation/2Yin-A-50
論文發表目的:從農業資料研究到商業文件分析
本次發表的「FiT-QA:栽培曆VQA基準測試」乍看之下是在農業領域進行的研究,這與本公司主要業務領域不同。然而,其底層的技術挑戰與本公司的業務緊密相關。
本公司至今為止,在研發和解決方案提供兩方面,都將「複雜文件的高度理解」作為一貫的重要主題。透過「Aconnect」和「SAT Agent Cockpit」,我們精確地結構化混雜表格、圖表、註釋的實用文件,並將其轉換為AI可利用的形式。