FlashLabs推出OrcaRouter「Routing DSL」——以極低成本實現Fable 5等級推理智能,透過YAML+CEL描述的推理圖精準控制AI工作負載
FlashLabs為其AI推理閘道器OrcaRouter推出新功能「Routing DSL」,利用YAML與CEL宣告式設計推理圖,根據任務類型與難度自動選擇最佳LLM,以顯著更低的成本實現Fable 5等級的智能。
📋 文章處理履歷
- 📰 發表: 2026年6月15日 22:00
- 🔍 收集: 2026年6月16日 00:01(發表後2小時1分鐘)
- 🤖 AI分析完成: 2026年6月16日 00:12(收集後10分鐘)
FlashLabs股份有限公司(總部:東京都千代田區;代表董事:細井洋一;以下簡稱「FlashLabs」)宣布,為OrcaRouter——由美國Continuum AI開發、FlashLabs在日本獨家銷售的AI推理閘道器——推出新功能「Routing DSL」。Routing DSL是一種領域專用語言,可使用YAML與CEL(Common Expression Language)宣告式地描述推理圖。透過根據提示詞的難度與任務類型組合多個LLM,旨在以顯著更低的成本,實現以Anthropic Claude Fable 5為代表的前沿模型等級智能。
背景與目標
到了2026年,企業的AI應用正從「使用哪個模型」轉向「如何組合模型」。Anthropic的Claude Fable 5在Artificial Analysis Intelligence Index中獲得第一名(分數64.9),為推理智能設立了新基準。然而,能負擔持續使用此類高性能模型的工作負載仍屬有限。
多數實際運作的工作負載以簡單的提取、分類與格式化為主,持續使用Fable 5等前沿模型在成本上並不現實。另一方面,若全部改用低成本的開源模型,則在需要高度推理的場景中品質將受損。
「Routing DSL」將此類分流邏輯轉化為宣告式、可稽核、可版本控制的程式碼,提供代理時代生產環境所需的控制能力。開發者僅需一個YAML檔案,即可設計出「此類提示詞使用Fable 5等級模型,此類則使用高速低成本模型」的推理圖。
Routing DSL概要
上線日期:2026年6月15日(星期一)
取得方式:
文件:https://docs.orcarouter.ai/ja/routing/routing-dsl
管理介面:OrcaRouter儀表板 → Routing → Strategy → DSL
描述格式:YAML + CEL(Common Expression Language)
五種路由策略
Routing DSL可結合以下五種策略建構推理圖:
1. 按難度路由(Route by Difficulty)
自動判斷提示詞複雜度,將高階推理任務路由至Claude Opus或GPT-5.5等前沿模型,定型處理則交由DeepSeek V4 Pro或Qwen3.6等開源模型。
2. 按任務路由(Route by Task)
根據「程式碼生成」、「摘要」、「翻譯」、「資料提取」等任務類型選擇最佳模型。例如,程式碼使用Claude Sonnet,提取使用DeepSeek。
3. 多模型並行執行(Fan-out to Multiple Models)
將相同提示詞平行傳送至GPT-5.5、Claude Opus、Gemini 3.1 Pro等模型,再整合結果,實現超越單一模型的回應品質。
4. 回退與評判(Fallbacks & Judges)
自動評估模型回應,若品質低於標準則自動回退至其他模型,並支援回應生成過程中的中途切換。
5. 成本/延遲/品質最佳化(Optimize for Cost, Latency, or Quality)
於整個圖中套用「成本優先」、「速度優先」、「品質優先」等策略,以宣告式語法描述符合商業需求的最佳化方案。
詳細說明文章連結
企業價值
1. 以低成本實現Fable 5等級推理
不依賴單一前沿模型,而是以圖形結構組合多個模型,以顯著更低的成本實現與Fable 5匹敵的智能輸出。無需對所有提示詞使用最高價模型。
2. 宣告式設定大幅降低營運負擔
透過YAML進行宣告式設定,無需硬編碼if/else邏輯,也無需因模型更新而修改程式碼。新模型發布時,僅需修改YAML中的一行,即可反映至整個推理圖。
3. 維持透明性與稽核性
Routing DSL建構的推理圖之決策依據,皆可於每筆請求中可視化。透過儀表板與回應標頭,可完整追蹤「哪個提示詞路由至哪個模型」、「在何種條件下觸發回退」。
技術特點
Routing DSL的路由條件以CEL撰寫,可實現如下表達:
prompt.difficulty >= 0.8 → 前沿模型
prompt.task_type == "code_generation" → 程式碼專用模型
response.quality_score < 0.7 → 自動回退
cost_budget.monthly_remaining > 100 → 成本限制路由
Routing DSL整合OrcaRouter既有功能,包含基於LinUCB情境多臂賭博機的適應性路由、中段串流切換、以及超過200個可用模型陣容。
可用模型範例
Anthropic Claude Opus 4.8 API
OpenAI GPT 5.5 API
Gemini 3.5 Flash
MiniMax M3
DeepSeek V4 Pro API
Qwen3.7 Max
未來發展
OrcaRouter未來將公開以Routing DSL建構的推理圖範本庫,促進社群共享最佳實踐。也計畫強化效能分析功能,並新增透過A/B測試自動優化路由策略的功能。
代表評論
FlashLabs股份有限公司 代表董事 細井洋一
「Fable 5是目前最聰明的AI模型之一。然而,以Fable 5處理企業所有生產環境請求,無論在成本或現實性上都不是正確選擇。我們透過Routing DSL,實現了高難度推理使用最佳模型、定型處理使用成本最佳化模型的世界——而此組合的設計圖可用YAML宣告。我們將持續進化OrcaRouter,作為讓日本企業無懼成本、安心使用頂尖AI的基礎平台。」
背景與目標
到了2026年,企業的AI應用正從「使用哪個模型」轉向「如何組合模型」。Anthropic的Claude Fable 5在Artificial Analysis Intelligence Index中獲得第一名(分數64.9),為推理智能設立了新基準。然而,能負擔持續使用此類高性能模型的工作負載仍屬有限。
多數實際運作的工作負載以簡單的提取、分類與格式化為主,持續使用Fable 5等前沿模型在成本上並不現實。另一方面,若全部改用低成本的開源模型,則在需要高度推理的場景中品質將受損。
「Routing DSL」將此類分流邏輯轉化為宣告式、可稽核、可版本控制的程式碼,提供代理時代生產環境所需的控制能力。開發者僅需一個YAML檔案,即可設計出「此類提示詞使用Fable 5等級模型,此類則使用高速低成本模型」的推理圖。
Routing DSL概要
上線日期:2026年6月15日(星期一)
取得方式:
文件:https://docs.orcarouter.ai/ja/routing/routing-dsl
管理介面:OrcaRouter儀表板 → Routing → Strategy → DSL
描述格式:YAML + CEL(Common Expression Language)
五種路由策略
Routing DSL可結合以下五種策略建構推理圖:
1. 按難度路由(Route by Difficulty)
自動判斷提示詞複雜度,將高階推理任務路由至Claude Opus或GPT-5.5等前沿模型,定型處理則交由DeepSeek V4 Pro或Qwen3.6等開源模型。
2. 按任務路由(Route by Task)
根據「程式碼生成」、「摘要」、「翻譯」、「資料提取」等任務類型選擇最佳模型。例如,程式碼使用Claude Sonnet,提取使用DeepSeek。
3. 多模型並行執行(Fan-out to Multiple Models)
將相同提示詞平行傳送至GPT-5.5、Claude Opus、Gemini 3.1 Pro等模型,再整合結果,實現超越單一模型的回應品質。
4. 回退與評判(Fallbacks & Judges)
自動評估模型回應,若品質低於標準則自動回退至其他模型,並支援回應生成過程中的中途切換。
5. 成本/延遲/品質最佳化(Optimize for Cost, Latency, or Quality)
於整個圖中套用「成本優先」、「速度優先」、「品質優先」等策略,以宣告式語法描述符合商業需求的最佳化方案。
詳細說明文章連結
企業價值
1. 以低成本實現Fable 5等級推理
不依賴單一前沿模型,而是以圖形結構組合多個模型,以顯著更低的成本實現與Fable 5匹敵的智能輸出。無需對所有提示詞使用最高價模型。
2. 宣告式設定大幅降低營運負擔
透過YAML進行宣告式設定,無需硬編碼if/else邏輯,也無需因模型更新而修改程式碼。新模型發布時,僅需修改YAML中的一行,即可反映至整個推理圖。
3. 維持透明性與稽核性
Routing DSL建構的推理圖之決策依據,皆可於每筆請求中可視化。透過儀表板與回應標頭,可完整追蹤「哪個提示詞路由至哪個模型」、「在何種條件下觸發回退」。
技術特點
Routing DSL的路由條件以CEL撰寫,可實現如下表達:
prompt.difficulty >= 0.8 → 前沿模型
prompt.task_type == "code_generation" → 程式碼專用模型
response.quality_score < 0.7 → 自動回退
cost_budget.monthly_remaining > 100 → 成本限制路由
Routing DSL整合OrcaRouter既有功能,包含基於LinUCB情境多臂賭博機的適應性路由、中段串流切換、以及超過200個可用模型陣容。
可用模型範例
Anthropic Claude Opus 4.8 API
OpenAI GPT 5.5 API
Gemini 3.5 Flash
MiniMax M3
DeepSeek V4 Pro API
Qwen3.7 Max
未來發展
OrcaRouter未來將公開以Routing DSL建構的推理圖範本庫,促進社群共享最佳實踐。也計畫強化效能分析功能,並新增透過A/B測試自動優化路由策略的功能。
代表評論
FlashLabs股份有限公司 代表董事 細井洋一
「Fable 5是目前最聰明的AI模型之一。然而,以Fable 5處理企業所有生產環境請求,無論在成本或現實性上都不是正確選擇。我們透過Routing DSL,實現了高難度推理使用最佳模型、定型處理使用成本最佳化模型的世界——而此組合的設計圖可用YAML宣告。我們將持續進化OrcaRouter,作為讓日本企業無懼成本、安心使用頂尖AI的基礎平台。」
常見問題
Routing DSL非開發者能使用嗎?
主要面向開發者,但AI管理者可使用模板設定。未來將推出GUI介面。
現有用戶使用Routing DSL要加價嗎?
不用,Routing DSL已包含在現有方案中,可直接於儀表板啟用。
CEL語法在哪裡學習?
官方文件提供教學與範例,有開發經驗者一小時內即可掌握。