ZOZO研究所、情報検索・推薦システム分野のトップカンファレンス「SIGIR 2026」にて論文採択

株式会社ZOZO NEXTの研究開発組織「ZOZO研究所」は、ファッションECにおける視覚言語モデルの評価ベンチマークに関する論文が、トップカンファレンス「SIGIR 2026」に採択されたと発表した。本研究は、ファッションECの実務におけるAIモデルの適切な選定と運用の重要性を示唆するものである。
調査NQ 85/100出典:PR Times

📋 記事の処理履歴

  • 📰 発表: 2026年5月20日 21:00
  • 🔍 収集: 2026年5月20日 12:31
  • 🤖 AI分析完了: 2026年5月20日 12:41(収集から9分後)
株式会社ZOZO NEXT(本社:千葉県千葉市 代表取締役CEO:澤田 宏太郎)の研究開発組織「ZOZO研究所」は、当所研究員が執筆した論文「Preliminary Study of an Evaluation Benchmark for Vision–Language Models in Fashion E-Commerce」(邦題:ファッションECにおける視覚言語モデルの評価ベンチマークの設計と初期検討)が、情報検索・推薦システム分野のトップカンファレンス「SIGIR 2026」のIndustry Trackに採択されたことをお知らせします。本研究成果は、当所研究員の清水 良太郎、サイ タウンカン、株式会社ZOZOに所属する桜井 詩音、清水 悠揮らの研究グループによるものです。

<研究背景>
近年、画像とテキストの両方を扱えるAI(視覚言語モデル)が急速に進化し、ファッションECでも商品情報の整理や検索などへの活用が期待されています。一方で、AIモデルはタスクや使い方によって得意・不得意があり、用途ごとに最適なモデルを選定することが不可欠です。そして、適切にモデルを選定するためには、その性能を見極めるための評価ベンチマークが必要となります。従来の評価ベンチマークでは、画像上に写ったファッションアイテムやコーディネートの色や素材、スタイルといったファッション特有の細かな判断や、実務で求められる精度までは十分に評価できない課題がありました。

<論文内容>
本研究では、ファッションECの実務でAIを活用することを目的に、視覚言語モデルをどのように評価・選定すべきかを検証しています。コーディネート画像と商品画像の2種類に分け、タグ付け、色の判定、画像の品質チェック、着用シーズンの判定、素材の判定といった5つの具体的なタスクを定義しました。さらに、AIモデルの安定性を測定する仕組みを導入し、複数のAIモデルを比較検証しました。結果、タスクごとに最適なモデルが異なることや、高性能モデルが必ずしも最適とは限らないことが明らかになりました。AIモデルは用途ごとに選定し、継続的に評価しながら運用することが重要です。

<今後の展望>
本研究は、ファッションEC上の実務タスクに関する評価ベンチマークを構築し、AIモデル選定の重要性を示唆したものです。今後は、株式会社ZOZOの事業部門との連携を強化し、評価基盤の強化を進めます。評価手法の精度・網羅性を高めるとともに、新たな実務タスクへの適用範囲を広げ、AIモデルの導入・運用を支える仕組みづくりを推進してまいります。

よくある質問

この研究はどのような課題を解決しますか?

従来のAI評価手法では困難だった、ファッション特有の素材やスタイルの判断精度を実務ベースで評価し、最適なモデル選定を可能にします。

モデル選定が重要な理由は?

AIモデルはタスクやモデルによって得意・不得意があり、高性能モデルが必ずしも実務で最適とは限らないため、継続的な評価と選定が重要です。

SIGIRとはどのような会議ですか?

情報検索・推薦システム分野における世界最高峰のトップカンファレンスです。