OrcaRouter以75%折扣提供DeepSeek V4 Pro API,加速企業AI代理工作流程成本最佳化

FlashLabs株式會社宣布,於其合作夥伴Continuum AI提供的「OrcaRouter」中,以一般價格75%的折扣提供DeepSeek V4 Pro API。透過評估提示詞難度進行自動路由,在維持品質的同時,顯著降低了企業AI代理營運的成本。
新製品NQ 83/100出典:PR Times

📋 文章處理履歷

  • 📰 發表: 2026年5月26日 03:30
  • 🔍 收集: 2026年5月25日 19:01
  • 🤖 AI分析完成: 2026年5月26日 05:41(收集後10小時39分鐘)
FlashLabs株式會社(總部:東京都千代田區,代表取締役:細井洋一)宣布,將於其合作夥伴Continuum AI提供的「OrcaRouter」中,以75%的折扣價格提供DeepSeek V4 Pro API。此舉將有效降低企業AI代理工作流程的營運成本,進一步加速企業的AI應用。

■ 背景與目的

2026年是企業AI代理工作流程全面普及的轉捩點。根據Gartner的預測,到2026年底,40%的企業應用程式將內建AI代理,AI代理型工作流程正逐漸成為業務自動化的新標準。

另一方面,LLM(大型語言模型)的營運成本已成為企業面臨的新興管理課題,這項成本會隨著產品的成長而不斷增加。目前的現狀是,許多企業為了確保品質,將所有處理任務都交給高效能模型,導致即使是那些本不需要高效能模型的例行性任務,企業也必須持續支付高昂的費用。

針對此一課題,OrcaRouter提供了一套解決方案:透過評估每個提示詞(prompt)的難度,將複雜的推理任務自動路由至前沿模型(Frontier Models),而例行性處理任務則交給高效能的開源模型。這套機制能在確保品質的同時,將LLM支出降低約40%。

此次,隨著DeepSeek官方宣布V4 Pro API降價75%,OrcaRouter也同步跟進,以同等優惠價格提供服務,進一步推動企業AI代理工作流程的普及。

■ OrcaRouter與DeepSeek V4 Pro API 75%折扣方案概要

價格:

- DeepSeek V4 Pro API:輸入$0.14/M tokens,輸出$0.28/M tokens(一般價格的75%折扣)

- 額外代幣加價:0%(與供應商公開價格相同)

主要功能:

- 提示詞難度判定(<1ms)及最佳模型自動路由

- 採用LinUCB Contextual Bandit演算法的學習型路由

- 請求層級的數據視覺化(判定依據、模型、供應商、價格)

- 透過中流切換(Mid-stream switching)保證99.99%的運行時間

- 支援OpenAI相容API,只需一行程式碼即可導入

支援模型:

- DeepSeek V4 Pro API

- Anthropic Claude Opus 4.7 API

- OpenAI GPT 5.5 API

- 透過單一端點(Endpoint)提供其他200多種模型

■ 為企業帶來的價值

1. 顯著降低成本

對於每月LLM使用量達1萬美元的企業,每年可省下約47,700美元的成本(投資回收期不到1天)。使用DeepSeek V4 Pro,與傳統方式相比,可節省75%的成本。

2. 在維持品質的前提下進行最佳化

透過自動判定提示詞難度,例行性處理任務(約佔65%)將由開源模型以約1/15的成本進行處理,而高難度推理任務(約佔35%)則由前沿模型處理。這樣能在完全不犧牲品質的情況下,實現成本最佳化。

3. 完全透明化

代幣計費完全比照供應商的公開價格(0%加價)。系統會針對每次請求將判定依據、模型、供應商及價格視覺化,確保具備良好的可稽核性。

4. 企業級的可靠性

透過中流切換功能,即使供應商發生故障,系統也能自動進行故障轉移(Failover)。在維持代理迴圈(Agent loop)狀態的同時,確保高達99.99%的運行時間。

5. 立即導入

採用OpenAI相容API,現有程式碼只需修改一行即可。無論是導入還是退回,成本都極低,方便企業從測試階段無縫過渡到正式生產環境。

■ 支援企業AI代理工作流程

OrcaRouter在設計上針對企業AI代理工作流程進行了深度最佳化。

代理工作流程的特徵:

- 例行性處理(如萃取、分類、格式化、簡易摘要等)與進階處理(如多步驟推理、長文本上下文、程式碼生成等)混合存在。

- 需要即時的決策與適應能力。

- 多個代理之間需要協同運作。

OrcaRouter進行的最佳化:

- 針對單一提示詞進行難度判定,並自動選擇最佳模型。

- 從執行結果中學習,持續提升路由的精準度。

- 在進行故障轉移時,維持代理的狀態。

這些功能讓企業能更安心地將AI代理部署到正式生產環境中,加速從業務自動化邁向自主化的進程。

護欄(Guardrail)與安全措施

透過在抵達模型前於閘道器(Gateway)層面實施正式運作所需的安全管控,能有效滿足企業正式生產環境對安全性的要求。

常見問題

OrcaRouterで提供開始された新しいAPIの価格は?

DeepSeek V4 Pro APIが入力$0.14/M tokens、出力$0.28/M tokensで提供されます(通常価格の75%割引)。トークン上乗せは0%です。

OrcaRouterの主なコスト削減の仕組みは?

プロンプトの難易度を自動判定し、定型処理(約65%)は安価なオープンモデルへ、複雑な推論(約35%)は高性能なフロンティアモデルへ自動ルーティングします。

どのくらいのコスト削減効果が見込めますか?

月1万ドル規模のLLM利用の場合、年間約47,700ドルの削減が見込めます。DeepSeek V4 Pro利用で従来比75%のコスト削減が可能です。

既存のシステムへの導入は簡単ですか?

OpenAI互換APIを提供しているため、既存コードの変更は1行のみで済み、即座に導入可能です。

障害時の対応や信頼性はどうなっていますか?

ミッドストリーム切り替えによる自動フェイルオーバー機能を備え、エージェントループの状態を維持しながら99.99%の稼働率を保証します。