FlashLabs 股份有限公司(總公司:東京都千代田區,代表董事:細井洋一,以下簡稱「FlashLabs」)宣布,其於日本獨家銷售的 AI 路由閘道「OrcaRouter」在 LLM 路由器評估的開放平台「RouterArena」中,於論文提交時(2026年5月20日)的公開排行榜上獲得第二名。截至2026年5月20日提交時,OrcaRouter 記錄了 75.54% 的準確率和 72.08 的 Arena 分數。

背景

隨著 AI 應用正式化,企業面臨從超過 200 個 LLM 模型中選擇最佳模型的壓力。然而,對所有處理使用單一高性能模型,意味著即使是例行任務也需持續支付高成本,導致 AI 成本急劇增加。另一方面,手動選擇模型會隨著新模型的發布而使規則過時,為開發團隊留下維護負擔。

為了解決這個問題,OrcaRouter 被開發為一個結合「每個提示的難度判斷」和「自動路由至最佳模型」的自適應推理閘道。此次在 RouterArena 獲得第二名,客觀證明了此技術方法的有效性。

研究論文概要

發布日期:2026年5月20日(星期三)

論文標題:OrcaRouter: A Production-Oriented LLM Router with Hybrid Offline–Online Learning(arXiv:2605.30736)

OrcaRouter-Adaptive 的成績:

排名:第二名(截至2026年5月20日提交時)

準確率:每 1,000 次查詢成本 1.00 美元,準確率 75.54%

整合準確率與成本的 Arena 分數:72.08

比較對象:GPT-5、Microsoft Azure routers 及其他主要 LLM 路由器

Arena 分數是同時考慮準確率和金錢成本的綜合評估指標,證明 OrcaRouter 在維持高準確率的同時實現了極低的運營成本。

※RouterArena 是首個用於全面評估和比較 LLM 路由器的開放平台。這是一個持續評估的即時排行榜,會隨時添加和更新新的路由器,排名會隨時間變動。最新排名請參閱官方排行榜。

OrcaRouter 的技術特點

主要功能:

1. 嵌入增強 LinUCB 強盜演算法:

OrcaRouter 將 LLM 路由表述為上下文強盜問題,並採用嵌入增強 LinUCB(線性上限置信區間)演算法。這種方法在共享嵌入空間中表示提示與 LLM 的親和性,實現結合離線學習和在線學習的自適應模型選擇。

2. 混合離線/在線學習:

通過整合離線的人類評估數據和在線的強盜反饋,從初始階段就提供高精度路由,同時從實際流量中持續學習。這使其能夠在避免過度擬合的同時適應真實環境。

3. 智能預熱功能:

即使對於新模型或未知的提示模式,智能預熱功能也能優化探索與利用的平衡。它在適應實際流量的同時,逐步進行優化並維持品質。

4. 將 200 多個模型整合到一個端點:

將來自超過 15 家公司(包括 OpenAI、Anthropic、Google、xAI、Meta、Mistral、DeepSeek、Alibaba、Moonshot、ByteDance)的總計 200 多個 LLM 的 API 調用整合到一個端點、一個 API 金鑰和一張帳單中。

支援環境/URL:

OrcaRouter 官方網站

OrcaRouter 官方文件

可用模型範例

Anthropic Claude Opus 4.8 API

OpenAI GPT 5.5 API

Gemini 3.5 Flash

MiniMax M3

DeepSeek V4 Pro API

Qwen3.7 Max

為企業帶來的價值

1. 同時實現高精度與低成本:

正如在 RouterArena 獲得第二名所顯示的,OrcaRouter 在維持 75.54% 準確率的同時,實現了極低成本的路由。與 GPT-5 和 Azure routers 相比,它以顯著更低的成本提供同等或更優的性能。

2. 持續適應實際流量:

嵌入增強 LinUCB 強盜演算法從實際流量模式中學習,在避免過度擬合的同時持續優化。它能自動適應新模型的發布和業務模式的變化。

3. 提升開發者體驗:

憑藉與 OpenAI 相容的 API,只需更改一行現有代碼即可導入。只需重寫 Base URL 和 API 金鑰,現有的 OpenAI SDK 代碼即可無需修改地運行。無需重新設計、採購週期或重寫。

技術背景:將 LLM 路由視為上下文強盜問題

傳統的 LLM 路由依賴於預定義的規則或靜態分類器。然而,這種方法無法適應新模型的發布或業務模式的變化,導致維護負擔增加。

OrcaRouter 通過將 LLM 路由表述為「上下文強盜問題」解決了這個問題。上下文強盜是強化學習的一種,問題在於為每個提示(上下文)選擇最佳模型(手臂)。LinUCB(線性上限置信區間)演算法在平衡探索與利用的同時,即時選擇最佳模型。

此外,通過利用提示和 LLM 的嵌入表示,OrcaRouter 能有效學習相似提示,即使對於未知提示也能實現高精度路由。

未來發展

FlashLabs 將加速 OrcaRouter 在日本市場的部署,支援企業解決在 AI 應用中「在維持品質的同時降低成本」的挑戰。

透過在 RouterArena 上的持續評估,它將維持技術優勢,同時利用來自實際流量的回饋進行持續改進。

代表評論

FlashLabs 股份有限公司 代表董事 細井洋一

「OrcaRouter 在 RouterArena 獲得第二名,我們將其視為我們技術方法的一項成果。」

FACT BOX · 重點整理

  • 來源:PR TIMES
  • 分類:調查
  • 相關組織:OpenAI / Anthropic / Google
  • 原文日期2026年5月20日
  • 產品、服務:OrcaRouter