FlashLabs株式会社(本社:東京都千代田区、代表取締役:細井 洋一、以下「FlashLabs」)が日本独占販売するAIルーティングゲートウェイ「OrcaRouter」が、LLMルーター評価のオープンプラットフォーム「RouterArena」において論文提出時点(2026年5月20日)の公開リーダーボードで第2位にランクインしたことを発表します。2026年5月20日の提出時点で、OrcaRouterは精度75.54%、Arenaスコア72.08を記録しました。
背景
AI活用が本格化する中、企業は200以上のLLMモデルから最適なモデルを選択する必要に迫られています。しかし、単一の高性能モデルをすべての処理に使用すると、定型処理にも高コストを支払い続けることになり、AI原価が急増します。一方、手作業でのモデル選択は、新モデルのリリースごとにルールが陳腐化し、保守負担が開発チームに残ります。
この課題を解決するため、OrcaRouterは「プロンプトごとの難易度判定」と「最適モデルへの自動ルーティング」を組み合わせた適応型推論ゲートウェイとして開発されました。今回のRouterArena第2位獲得は、この技術アプローチの有効性を客観的に証明するものとなります。
研究論文の概要
発表日: 2026年5月20日(水)
論文タイトル: OrcaRouter: A Production-Oriented LLM Router with Hybrid Offline–Online Learning(arXiv:2605.30736)
OrcaRouter-Adaptive の成績:
ランキング: 第2位(2026年5月20日提出時点)
精度: 1,000クエリあたり1.00米ドルのコストで75.54%
精度とコストを統合したArenaスコア: 72.08
比較対象: GPT-5、Microsoft Azure routers、その他主要LLMルーター
Arenaスコアは、精度と金銭的コストの両方を考慮した総合評価指標であり、OrcaRouterは高精度を維持しながら極めて低コストでの運用を実現していることが証明されました。
※RouterArenaはLLMルーターを包括的に評価・比較するための初のオープンプラットフォームです。新しいルーターが随時追加・更新される継続評価型のライブ・リーダーボードであり、順位は時期により変動します。最新の順位は公式リーダーボードをご確認ください。
OrcaRouterの技術的特徴
主要機能:
1. Embedding強化LinUCBバンディットアルゴリズム:
OrcaRouterは、コンテキスト・バンディット問題としてLLMルーティングを定式化し、Embedding強化LinUCB(Linear Upper Confidence Bound)アルゴリズムを採用しています。このアプローチにより、プロンプトとLLMの親和性を共有埋め込み空間で表現し、オフライン学習とオンライン学習を組み合わせた適応的なモデル選択を実現します。
2. ハイブリッドオフライン・オンライン学習:
オフラインの人間評価データとオンラインのバンディットフィードバックを統合することで、初期段階から高精度なルーティングを提供しつつ、実トラフィックから継続的に学習します。これにより、過学習を避けながら実環境に適応します。
3. スマートウォームアップ機能:
新規モデルや未知のプロンプトパターンに対しても、スマートウォームアップ機能により、探索と活用のバランスを最適化します。実トラフィックに適応しながら、品質を維持したまま段階的に最適化を進めます。
4. 200+モデルを1エンドポイントで統合:
OpenAI、Anthropic、Google、xAI、Meta、Mistral、DeepSeek、Alibaba、Moonshot、ByteDanceを含む15社以上、合計200以上のLLMへのAPI呼び出しを、ひとつのエンドポイント・ひとつのAPIキー・ひとつの請求書に統合します。
対応環境/URL:
OrcaRouter 公式サイト
OrcaRouter 公式ドキュメント
利用可能モデル例
Anthropic Claude Opus 4.8 API
OpenAI GPT 5.5 API
Gemini 3.5 Flash
MiniMax M3
DeepSeek V4 Pro API
Qwen3.7 Max
企業にもたらす価値
1. 高精度と低コストの両立:
RouterArenaでの第2位獲得が示すように、OrcaRouterは精度75.54%を維持しながら、極めて低コストでのルーティングを実現します。GPT-5やAzure routersと比較しても、同等以上の性能を大幅に低いコストで提供します。
2. 実トラフィックへの継続的適応:
Embedding強化LinUCBバンディットアルゴリズムにより、実際のトラフィックパターンから学習し、過学習を避けながら継続的に最適化します。新モデルのリリースや業務パターンの変化にも自動的に対応します。
3. 開発者体験の向上:
OpenAI互換のAPIにより、既存のコードを1行変更するだけで導入可能です。Base URLとAPIキーを書き換えるだけで、既存のOpenAI SDKコードは無改修で動作します。再設計も調達サイクルも書き直しも不要です。
技術的背景:コンテキスト・バンディット問題としてのLLMルーティング
従来のLLMルーティングは、事前に定義されたルールや静的な分類器に依存していました。しかし、この手法では新モデルのリリースや業務パターンの変化に対応できず、保守負担が増大します。
OrcaRouterは、LLMルーティングを「コンテキスト・バンディット問題」として定式化することで、この課題を解決しました。コンテキスト・バンディットは、強化学習の一種で、各プロンプト(コンテキスト)に対して最適なモデル(アーム)を選択する問題です。LinUCB(Linear Upper Confidence Bound)アルゴリズムは、探索と活用のバランスを取りながら、リアルタイムで最適なモデルを選択します。
さらに、OrcaRouterはプロンプトとLLMの埋め込み表現を活用することで、類似のプロンプトに対する学習を効率化し、未知のプロンプトに対しても高精度なルーティングを実現します。
今後の展開
FlashLabsは、OrcaRouterの日本市場での展開を加速し、企業のAI活用における「品質を守りながらコストを削減する」という課題解決を支援します。
RouterArenaでの継続的な評価を通じて、技術的優位性を維持しつつ、実トラフィックからのフィードバックを活用した継続的な改善を進めます。
代表コメント
FlashLabs株式会社 代表取締役 細井 洋一
「OrcaRouterがRouterArenaで第2位を獲得したことは、私たちの技術アプローチの1つの成果としてとらえ」
FACT BOX ・ 要点整理
- 出典:PR TIMES
- 分類:調査
- 関連組織:OpenAI / Anthropic / Google
- 製品・サービス:OrcaRouter