ZOZO研究所論文入選資訊檢索與推薦系統領域頂尖會議「SIGIR 2026」

2026年5月20日

ZOZO NEXT 的研發組織「ZOZO研究所」宣布，其關於時尚電商領域視覺語言模型評估基準的論文，獲頂尖會議「SIGIR 2026」採納。該研究強調了針對時尚電商實務選擇與運作適當 AI 模型的重要性。

📋 文章處理履歷

📰 發表: 2026年5月20日 21:00
🔍 收集: 2026年5月20日 12:31
🤖 AI分析完成: 2026年5月20日 12:41（收集後9分鐘）

ZOZO NEXT（總部：千葉縣千葉市，代表取締役CEO：澤田宏太郎）旗下的研發組織「ZOZO研究所」宣布，由其研究員撰寫的論文《Preliminary Study of an Evaluation Benchmark for Vision–Language Models in Fashion E-Commerce》（暫譯：時尚電商中視覺語言模型的評估基準設計與初步探討），獲選進入資訊檢索與推薦系統領域頂尖會議「SIGIR 2026」的 Industry Track。該研究成果由 ZOZO 研究所的研究員清水良太郎、Sai Towncan，以及來自株式会社ZOZO的櫻井詩音、清水悠揮等研究小組共同完成。

＜研究背景＞
近年來，能同時處理影像與文字的 AI（視覺語言模型）迅速發展，在時尚電商領域，其在商品資訊整理與搜尋等方面的應用備受期待。然而，AI 模型在不同任務與用法上各具優劣，針對具體用途選擇最佳模型至關重要。要準確選擇模型，則需要相應的評估基準。傳統的評估基準難以準確評估影像中時尚單品與穿搭的細節（如顏色、材質、風格），也難以達到商業實務所需的精度要求。

＜論文內容＞
本研究旨在探討如何評估並選擇適合時尚電商實務的視覺語言模型。研究將影像分為穿搭影像與商品影像兩類，並定義了五項具體任務：標籤標記、顏色判定、影像品質檢查、季節判定與材質判定。此外，還引入了衡量 AI 模型穩定性的機制，並比較多種模型的表現。結果顯示，不同任務適用的最佳模型各異，且高效能模型未必總是最佳選擇。因此，針對不同用途選擇模型並持續進行評估與運作極為重要。

＜未來展望＞
本研究建構了針對時尚電商實務任務的評估基準，並指出了 AI 模型選擇的重要性。未來，團隊將加強與株式会社ZOZO業務部門的合作，進一步優化評估基礎設施。除了提升評估方法的精準度與覆蓋面，團隊也將持續將應用範圍擴展至更多實務任務，推動支援 AI 模型導入與運作的機制建設。

常見問題

這項研究解決了什麼問題？

它解決了傳統AI評估方法難以判斷時尚材質與風格精準度的問題，實現了基於實際電商業務場景的最佳模型選擇。

為什麼模型選擇至關重要？

不同AI模型在各類任務上的擅長程度不同，且高性能模型未必總是實際業務的最優解，因此持續的評估與篩選至關重要。

SIGIR是什麼樣的會議？

它是資訊檢索與推薦系統領域全球最高等級的頂尖學術會議。

返回 Newsroom (135)