FlashLabs 股份有限公司(總公司:東京都千代田區,代表董事:細井洋一,以下簡稱「FlashLabs」)宣布,其於日本獨家銷售的 AI 路由閘道「OrcaRouter」在 LLM 路由器評估的開放平台「RouterArena」中,於論文提交時(2026年5月20日)的公開排行榜上獲得第二名。截至2026年5月20日提交時,OrcaRouter 記錄了 75.54% 的準確率和 72.08 的 Arena 分數。
背景
隨著 AI 應用正式化,企業面臨從超過 200 個 LLM 模型中選擇最佳模型的壓力。然而,對所有處理使用單一高性能模型,意味著即使是例行任務也需持續支付高成本,導致 AI 成本急劇增加。另一方面,手動選擇模型會隨著新模型的發布而使規則過時,為開發團隊留下維護負擔。
為了解決這個問題,OrcaRouter 被開發為一個結合「每個提示的難度判斷」和「自動路由至最佳模型」的自適應推理閘道。此次在 RouterArena 獲得第二名,客觀證明了此技術方法的有效性。
研究論文概要
發布日期:2026年5月20日(星期三)
論文標題:OrcaRouter: A Production-Oriented LLM Router with Hybrid Offline–Online Learning(arXiv:2605.30736)
OrcaRouter-Adaptive 的成績:
排名:第二名(截至2026年5月20日提交時)
準確率:每 1,000 次查詢成本 1.00 美元,準確率 75.54%
整合準確率與成本的 Arena 分數:72.08
比較對象:GPT-5、Microsoft Azure routers 及其他主要 LLM 路由器
Arena 分數是同時考慮準確率和金錢成本的綜合評估指標,證明 OrcaRouter 在維持高準確率的同時實現了極低的運營成本。
※RouterArena 是首個用於全面評估和比較 LLM 路由器的開放平台。這是一個持續評估的即時排行榜,會隨時添加和更新新的路由器,排名會隨時間變動。最新排名請參閱官方排行榜。
OrcaRouter 的技術特點
主要功能:
1. 嵌入增強 LinUCB 強盜演算法:
OrcaRouter 將 LLM 路由表述為上下文強盜問題,並採用嵌入增強 LinUCB(線性上限置信區間)演算法。這種方法在共享嵌入空間中表示提示與 LLM 的親和性,實現結合離線學習和在線學習的自適應模型選擇。
2. 混合離線/在線學習:
通過整合離線的人類評估數據和在線的強盜反饋,從初始階段就提供高精度路由,同時從實際流量中持續學習。這使其能夠在避免過度擬合的同時適應真實環境。
3. 智能預熱功能:
即使對於新模型或未知的提示模式,智能預熱功能也能優化探索與利用的平衡。它在適應實際流量的同時,逐步進行優化並維持品質。
4. 將 200 多個模型整合到一個端點:
將來自超過 15 家公司(包括 OpenAI、Anthropic、Google、xAI、Meta、Mistral、DeepSeek、Alibaba、Moonshot、ByteDance)的總計 200 多個 LLM 的 API 調用整合到一個端點、一個 API 金鑰和一張帳單中。
支援環境/URL:
OrcaRouter 官方網站
OrcaRouter 官方文件
可用模型範例
Anthropic Claude Opus 4.8 API
OpenAI GPT 5.5 API
Gemini 3.5 Flash
MiniMax M3
DeepSeek V4 Pro API
Qwen3.7 Max
為企業帶來的價值
1. 同時實現高精度與低成本:
正如在 RouterArena 獲得第二名所顯示的,OrcaRouter 在維持 75.54% 準確率的同時,實現了極低成本的路由。與 GPT-5 和 Azure routers 相比,它以顯著更低的成本提供同等或更優的性能。
2. 持續適應實際流量:
嵌入增強 LinUCB 強盜演算法從實際流量模式中學習,在避免過度擬合的同時持續優化。它能自動適應新模型的發布和業務模式的變化。
3. 提升開發者體驗:
憑藉與 OpenAI 相容的 API,只需更改一行現有代碼即可導入。只需重寫 Base URL 和 API 金鑰,現有的 OpenAI SDK 代碼即可無需修改地運行。無需重新設計、採購週期或重寫。
技術背景:將 LLM 路由視為上下文強盜問題
傳統的 LLM 路由依賴於預定義的規則或靜態分類器。然而,這種方法無法適應新模型的發布或業務模式的變化,導致維護負擔增加。
OrcaRouter 通過將 LLM 路由表述為「上下文強盜問題」解決了這個問題。上下文強盜是強化學習的一種,問題在於為每個提示(上下文)選擇最佳模型(手臂)。LinUCB(線性上限置信區間)演算法在平衡探索與利用的同時,即時選擇最佳模型。
此外,通過利用提示和 LLM 的嵌入表示,OrcaRouter 能有效學習相似提示,即使對於未知提示也能實現高精度路由。
未來發展
FlashLabs 將加速 OrcaRouter 在日本市場的部署,支援企業解決在 AI 應用中「在維持品質的同時降低成本」的挑戰。
透過在 RouterArena 上的持續評估,它將維持技術優勢,同時利用來自實際流量的回饋進行持續改進。
代表評論
FlashLabs 股份有限公司 代表董事 細井洋一
「OrcaRouter 在 RouterArena 獲得第二名,我們將其視為我們技術方法的一項成果。」
FACT BOX · 重點整理
- 來源:PR TIMES
- 分類:調查
- 相關組織:OpenAI / Anthropic / Google
- 原文日期:2026年5月20日
- 產品、服務:OrcaRouter