OrcaRouter以75%折扣提供DeepSeek V4 Pro API，加速企業AI代理工作流程成本最佳化

Q: OrcaRouterで提供開始された新しいAPIの価格は？

DeepSeek V4 Pro APIが入力$0.14/M tokens、出力$0.28/M tokensで提供されます（通常価格の75%割引）。トークン上乗せは0%です。

Q: OrcaRouterの主なコスト削減の仕組みは？

プロンプトの難易度を自動判定し、定型処理（約65%）は安価なオープンモデルへ、複雑な推論（約35%）は高性能なフロンティアモデルへ自動ルーティングします。

Q: どのくらいのコスト削減効果が見込めますか？

月1万ドル規模のLLM利用の場合、年間約47,700ドルの削減が見込めます。DeepSeek V4 Pro利用で従来比75%のコスト削減が可能です。

Q: 既存のシステムへの導入は簡単ですか？

OpenAI互換APIを提供しているため、既存コードの変更は1行のみで済み、即座に導入可能です。

Q: 障害時の対応や信頼性はどうなっていますか？

ミッドストリーム切り替えによる自動フェイルオーバー機能を備え、エージェントループの状態を維持しながら99.99%の稼働率を保証します。

2026年5月26日

FlashLabs株式會社宣布，於其合作夥伴Continuum AI提供的「OrcaRouter」中，以一般價格75%的折扣提供DeepSeek V4 Pro API。透過評估提示詞難度進行自動路由，在維持品質的同時，顯著降低了企業AI代理營運的成本。

新製品NQ 83/100出典：PR Times

📋 文章處理履歷

📰 發表: 2026年5月26日 03:30
🔍 收集: 2026年5月25日 19:01
🤖 AI分析完成: 2026年5月26日 05:41（收集後10小時39分鐘）

FlashLabs株式會社（總部：東京都千代田區，代表取締役：細井洋一）宣布，將於其合作夥伴Continuum AI提供的「OrcaRouter」中，以75%的折扣價格提供DeepSeek V4 Pro API。此舉將有效降低企業AI代理工作流程的營運成本，進一步加速企業的AI應用。

■ 背景與目的

2026年是企業AI代理工作流程全面普及的轉捩點。根據Gartner的預測，到2026年底，40%的企業應用程式將內建AI代理，AI代理型工作流程正逐漸成為業務自動化的新標準。

另一方面，LLM（大型語言模型）的營運成本已成為企業面臨的新興管理課題，這項成本會隨著產品的成長而不斷增加。目前的現狀是，許多企業為了確保品質，將所有處理任務都交給高效能模型，導致即使是那些本不需要高效能模型的例行性任務，企業也必須持續支付高昂的費用。

針對此一課題，OrcaRouter提供了一套解決方案：透過評估每個提示詞（prompt）的難度，將複雜的推理任務自動路由至前沿模型（Frontier Models），而例行性處理任務則交給高效能的開源模型。這套機制能在確保品質的同時，將LLM支出降低約40%。

此次，隨著DeepSeek官方宣布V4 Pro API降價75%，OrcaRouter也同步跟進，以同等優惠價格提供服務，進一步推動企業AI代理工作流程的普及。

■ OrcaRouter與DeepSeek V4 Pro API 75%折扣方案概要

價格：

- DeepSeek V4 Pro API：輸入$0.14/M tokens，輸出$0.28/M tokens（一般價格的75%折扣）

- 額外代幣加價：0%（與供應商公開價格相同）

主要功能：

- 提示詞難度判定（<1ms）及最佳模型自動路由

- 採用LinUCB Contextual Bandit演算法的學習型路由

- 請求層級的數據視覺化（判定依據、模型、供應商、價格）

- 透過中流切換（Mid-stream switching）保證99.99%的運行時間

- 支援OpenAI相容API，只需一行程式碼即可導入

支援模型：

- DeepSeek V4 Pro API

- Anthropic Claude Opus 4.7 API

- OpenAI GPT 5.5 API

- 透過單一端點（Endpoint）提供其他200多種模型

■ 為企業帶來的價值

1. 顯著降低成本

對於每月LLM使用量達1萬美元的企業，每年可省下約47,700美元的成本（投資回收期不到1天）。使用DeepSeek V4 Pro，與傳統方式相比，可節省75%的成本。

2. 在維持品質的前提下進行最佳化

透過自動判定提示詞難度，例行性處理任務（約佔65%）將由開源模型以約1/15的成本進行處理，而高難度推理任務（約佔35%）則由前沿模型處理。這樣能在完全不犧牲品質的情況下，實現成本最佳化。

3. 完全透明化

代幣計費完全比照供應商的公開價格（0%加價）。系統會針對每次請求將判定依據、模型、供應商及價格視覺化，確保具備良好的可稽核性。

4. 企業級的可靠性

透過中流切換功能，即使供應商發生故障，系統也能自動進行故障轉移（Failover）。在維持代理迴圈（Agent loop）狀態的同時，確保高達99.99%的運行時間。

5. 立即導入

採用OpenAI相容API，現有程式碼只需修改一行即可。無論是導入還是退回，成本都極低，方便企業從測試階段無縫過渡到正式生產環境。

■ 支援企業AI代理工作流程

OrcaRouter在設計上針對企業AI代理工作流程進行了深度最佳化。

代理工作流程的特徵：

- 例行性處理（如萃取、分類、格式化、簡易摘要等）與進階處理（如多步驟推理、長文本上下文、程式碼生成等）混合存在。

- 需要即時的決策與適應能力。

- 多個代理之間需要協同運作。

OrcaRouter進行的最佳化：

- 針對單一提示詞進行難度判定，並自動選擇最佳模型。

- 從執行結果中學習，持續提升路由的精準度。

- 在進行故障轉移時，維持代理的狀態。

這些功能讓企業能更安心地將AI代理部署到正式生產環境中，加速從業務自動化邁向自主化的進程。

護欄（Guardrail）與安全措施

透過在抵達模型前於閘道器（Gateway）層面實施正式運作所需的安全管控，能有效滿足企業正式生產環境對安全性的要求。

常見問題

OrcaRouterで提供開始された新しいAPIの価格は？

DeepSeek V4 Pro APIが入力$0.14/M tokens、出力$0.28/M tokensで提供されます（通常価格の75%割引）。トークン上乗せは0%です。

OrcaRouterの主なコスト削減の仕組みは？

プロンプトの難易度を自動判定し、定型処理（約65%）は安価なオープンモデルへ、複雑な推論（約35%）は高性能なフロンティアモデルへ自動ルーティングします。

どのくらいのコスト削減効果が見込めますか？

月1万ドル規模のLLM利用の場合、年間約47,700ドルの削減が見込めます。DeepSeek V4 Pro利用で従来比75%のコスト削減が可能です。

既存のシステムへの導入は簡単ですか？

OpenAI互換APIを提供しているため、既存コードの変更は1行のみで済み、即座に導入可能です。

障害時の対応や信頼性はどうなっていますか？

ミッドストリーム切り替えによる自動フェイルオーバー機能を備え、エージェントループの状態を維持しながら99.99%の稼働率を保証します。

返回 Newsroom (43)