AI推論閘道器「OrcaRouter」整合高速LLM框架「SGLang」——實現200多個模型的統一存取與成本優化

Key facts

  • AI推論閘道器「OrcaRouter」整合高速LLM框架「SGLang」——實現200多個模型的統一存取與成本優化
  • FlashLabs宣布其AI推論閘道器「OrcaRouter」已整合高速LLM框架「SGLang」。SGLang開發者現可透過單一端點存取200多個AI模型,並在不犧牲品質的前提下,實現最高40%的成本節省。
  • Source: PR Times
  • Date: 2026年6月18日

Direct answer

FlashLabs宣布其AI推論閘道器「OrcaRouter」已整合高速LLM框架「SGLang」。SGLang開發者現可透過單一端點存取200多個AI模型,並在不犧牲品質的前提下,實現最高40%的成本節省。

Citation
AI推論閘道器「OrcaRouter」整合高速LLM框架「SGLang」——實現200多個模型的統一存取與成本優化 (2026年6月18日), PR Times
Source
PR Times
Date
2026年6月18日
FlashLabs宣布其AI推論閘道器「OrcaRouter」已整合高速LLM框架「SGLang」。SGLang開發者現可透過單一端點存取200多個AI模型,並在不犧牲品質的前提下,實現最高40%的成本節省。

📋 文章處理履歷

  • 📰 發表: 2026年6月18日 04:00
  • 🔍 收集: 2026年6月17日 19:18
  • 🤖 AI分析完成: 2026年6月19日 06:53(收集後35小時35分鐘)
FlashLabs股份有限公司(總部:日本東京都千代田區;代表董事:細井洋一;以下簡稱「FlashLabs」)宣布,由美國Continuum AI開發、FlashLabs在日本獨家銷售的AI推論閘道器「OrcaRouter」,現已支援LMSYS Org主導的高速LLM服務框架「SGLang」。此整合讓SGLang使用者無需大幅修改程式碼,即可統一存取200多個最新AI模型,並運用適應性路由功能,在維持品質的同時實現最高40%的成本削減。

背景與目標

到了2026年,企業的AI應用已從「單一模型使用」進化至「結合多個模型的高階代理工作流程」。此轉變帶來了新的挑戰:提升推論速度,以及優化日益增長的LLM使用成本。

由LMSYS Org開發的「SGLang」,作為新一代執行環境,其推論速度最高可達傳統框架的5倍,受到全球AI工程師的廣泛支持。另一方面,OrcaRouter是一款LLM閘道器,能根據提示詞難易度自動路由至最適模型,兼顧成本與品質。

此次整合融合了SGLang的卓越效能,以及OrcaRouter的彈性模型管理與成本優化功能,為企業級AI應用開發提供兼具速度、品質與成本效益的基礎設施環境。

整合概要

主要功能:

200+模型統一存取:透過SGLang介面,以單一端點連接OpenAI、Anthropic、Google、DeepSeek等主要模型。

適應型自動路由:以毫秒級速度判定提示詞難度,將例行任務自動導向低成本開放模型,高階推論則導向前沿模型。

代理防火牆與守護機制(Agent Firewall & Guardrails):在SGLang工作流程中透明套用個人資訊(PII)遮蔽與提示詞注入防護。

統一計費(Unified Billing):即使使用多個供應商,付款皆由OrcaRouter整合處理,代幣加價手續費為0%。

支援模型範例:

OrcaRouter Fable 5 Fusion API(模型詳情請見官網)

Anthropic Claude Opus 4.8 API

OpenAI GPT 5.5 API

Gemini 3.5 FlashAPI

MiniMax M3 API

DeepSeek V4 Pro API

Qwen3.7 Max API

Z.AI GLM5.2 API

企業價值

1. 開發速度大幅提升

在維持SGLang高速執行環境的同時,無需關注各模型API規格差異,即可立即試作與導入最新模型。

2. LLM支出最高減少40%

OrcaRouter會自動選擇「最適模型」,而非將所有請求送往最高性能模型,進而優化成本,同時不降低品質。

3. 企業級可靠性

透過「中斷式容錯(mid-stream failover)」技術,在供應商發生故障時自動切換至替代模型而不中斷串流,支援全年無休的穩定運作。

未來發展

FlashLabs將持續完善日文文件、提供SGLang環境的導入指南,並為企業客戶建置專用環境與SLA支援,協助日本企業順利導入OrcaRouter。未來也將持續支援結合自建基礎設施與AI閘道器的生產級AI優化方案。

代表評論

FlashLabs股份有限公司 代表董事 細井洋一

「SGLang是AI『執行速度』的遊戲規則改變者。當OrcaRouter的『智慧路由』與之結合,日本企業便能以最有效率的成本、最安全的方式,使用世界頂尖的AI智慧。我們將持續消除基礎設施的複雜性,讓開發者能專注於商業邏輯的創造。」

關於OrcaRouter

OrcaRouter是由美國AI研究機構Continuum AI開發、FlashLabs在日本獨家銷售的次世代AI推論閘道器。整合200多個LLM於單一端點,根據提示詞難度自動路由至最適模型。代幣零加價、導入僅需一行程式碼,並在同一閘道器內提供守護機制、監控與評估功能。

OrcaRouter官方網站

關於FlashLabs股份有限公司

FlashLabs是一家致力於自動化、最終實現自律化銷售與客戶體驗的AI應用研究實驗室。透過「人機協同AI(Human-AI Hybrid)」——融合機器的處理速度與精準度,以及人類的策略洞察力——為企業帶來超越傳統方法的成果。

公司名稱:FlashLabs股份有限公司

所在地:東京都千代田區

代表人:代表董事 細井洋一

事業內容:AI解決方案開發與銷售、AI閘道器「OrcaRouter」的提供

FlashLabs股份有限公司官方網站

關於Continuum AI

Continuum AI是一家美國AI企業,開發了OrcaRouter。透過適應型路由技術,提供橫跨多個LLM供應商的高效AI應用平台。

Continuum AI官方網站

本件相關聯絡窗口

FlashLabs股份有限公司 行銷部

聯絡人:小林光喜

Email:koki.kobayashi@myflashcloud.com

常見問題

OrcaRouter適合哪些企業?

適合使用多個LLM,或重視成本、可靠性與治理的企業。特別適用於金融、製造與客服產業。

導入需要多少工程?

使用SGLang的環境僅需修改一行設定,無需大幅變更現有程式碼,導入快速。

安全防護是否完善?

是。內建PII遮蔽、提示詞注入防禦、內容過濾等守護機制,符合企業級安全標準。

OrcaRouter的收費方式為何?

採用「零加價」模式,僅收取原廠代價,無額外手續費,並由OrcaRouter統一開單。

支援日語嗎?

支援。提供日語文件、日語客服與日語守護功能,全面支援日本企業導入。