OrcaRouter、DeepSeek V4 Pro APIを75%割引価格で提供開始 ― エンタープライズAIエージェントワークフローのコスト最適化を加速

FlashLabs株式会社は、提携先Continuum AIが提供する「OrcaRouter」にて、DeepSeek V4 Pro APIを通常価格の75%割引(入力$0.14/M tokens、出力$0.28/M tokens)で提供開始した。プロンプト難易度を判定して自動ルーティングを行うことで、エンタープライズAIエージェントの運用において品質を保ちながら劇的なコスト削減を実現する。
新製品NQ 83/100出典:PR Times

📋 記事の処理履歴

  • 📰 発表: 2026年5月26日 03:30
  • 🔍 収集: 2026年5月25日 19:01
  • 🤖 AI分析完了: 2026年5月26日 05:41(収集から10時間39分後)
FlashLabs株式会社(本社:東京都千代田区、代表取締役:細井 洋一)は、提携先のContinuum AIが提供する「OrcaRouter」において、DeepSeek V4 Pro APIを75%割引価格で提供開始することを発表いたします。これにより、エンタープライズAIエージェントワークフローの運用コスト削減を実現し、企業のAI活用を加速します。

■背景・狙い

2026年は、エンタープライズAIエージェントワークフローが本格普及する転換点を迎えています。Gartnerの予測によれば、2026年末までに企業アプリケーションの40%がAIエージェントを組み込むとされており、AIエージェント型ワークフローは業務自動化の新たな標準となりつつあります。

一方で、LLM(大規模言語モデル)の運用コストは、プロダクト成長とともに増え続ける新しい原価として企業の経営課題となっています。多くの企業が、すべての処理を高性能モデルに投げることで品質を確保する一方、本来そこまで高性能モデルを必要としない定型処理にも高単価を払い続けている現状があります。

この課題に対し、OrcaRouterはプロンプトごとに難易度を判定し、難しい推論はフロンティアモデルへ、定型処理は高性能なオープンモデルへ自動ルーティングすることで、品質を守りながらLLM支出を約40%削減する仕組みを提供してきました。

今回、DeepSeek社が公式にV4 Pro APIの75%割引を発表したことを受け、OrcaRouterも同価格での提供を開始し、エンタープライズAIエージェントワークフローの普及をさらに加速させます。

■OrcaRouterとDeepSeek V4 Pro API 75%割引の概要

価格:

DeepSeek V4 Pro API: 入力$0.14/M tokens、出力$0.28/M tokens(通常価格の75%割引)

トークン上乗せ: 0%(プロバイダー公開価格と同額)

主要機能:

プロンプト難易度判定(<1ms)による最適モデル自動ルーティング

LinUCBコンテキスト・バンディットによる学習型ルーティング

リクエスト単位の可視化(判定根拠、モデル、プロバイダー、価格)

ミッドストリーム切り替えによる99.99%稼働率保証

OpenAI互換API、1行で導入可能

対応モデル:

DeepSeek V4 Pro API

Anthropic Claude Opus 4.7 API

OpenAI GPT 5.5 API

その他200+モデルを1エンドポイントで提供

■企業にもたらす価値

1. 劇的なコスト削減

月1万ドル規模のLLM利用で年間約$47,700のコスト削減を実現(回収期間1日未満)。DeepSeek V4 Pro利用で従来比75%のコスト削減が可能です。

2. 品質を保った最適化

プロンプト難易度を自動判定し、定型処理(約65%)はオープンモデルで約1/15のコストで処理、高度な推論(約35%)はフロンティアモデルで処理することで、品質を一切損なわずにコストを最適化します。

3. 完全な透明性

トークン課金はプロバイダー公開価格と同額(上乗せ0%)。リクエスト単位で判定根拠、モデル、プロバイダー、価格を可視化し、監査性を確保します。

4. エンタープライズ対応の信頼性

ミッドストリーム切り替えによりプロバイダー障害時も自動フェイルオーバー。エージェントループの状態を維持しながら99.99%の稼働率を実現します。

5. 即座の導入

OpenAI互換APIにより、既存コードの変更は1行のみ。導入も切り戻しも低コストで、検証から本番まで進めやすい設計です。

■エンタープライズAIエージェントワークフローへの対応

OrcaRouterは、エンタープライズAIエージェントワークフローに最適化された設計となっています。

エージェントワークフローの特徴:

定型処理(抽出・分類・整形・簡易要約など)と高度な処理(多段推論・長文コンテキスト・コード生成など)が混在

リアルタイムでの意思決定と適応が必要

複数のエージェントが協調して動作

OrcaRouterが行う最適化:

プロンプト単位で難易度を判定し、最適なモデルを自動選択

実行結果から学習し、ルーティング精度を継続改善

エージェントの状態を維持しながらフェイルオーバー

これにより、企業は安心してAIエージェントを本番環境に展開し、業務自動化から自律化への道を加速できます。

ガードレール・セキュリティへの取り組み

本番運用に必要なセキュリティ統制を、モデル到達前にゲートウェイで適用することにより、エンタープライズ本番環境で求められる要件に対応しています。

よくある質問

OrcaRouterで提供開始された新しいAPIの価格は?

DeepSeek V4 Pro APIが入力$0.14/M tokens、出力$0.28/M tokensで提供されます(通常価格の75%割引)。トークン上乗せは0%です。

OrcaRouterの主なコスト削減の仕組みは?

プロンプトの難易度を自動判定し、定型処理(約65%)は安価なオープンモデルへ、複雑な推論(約35%)は高性能なフロンティアモデルへ自動ルーティングします。

どのくらいのコスト削減効果が見込めますか?

月1万ドル規模のLLM利用の場合、年間約47,700ドルの削減が見込めます。DeepSeek V4 Pro利用で従来比75%のコスト削減が可能です。

既存のシステムへの導入は簡単ですか?

OpenAI互換APIを提供しているため、既存コードの変更は1行のみで済み、即座に導入可能です。

障害時の対応や信頼性はどうなっていますか?

ミッドストリーム切り替えによる自動フェイルオーバー機能を備え、エージェントループの状態を維持しながら99.99%の稼働率を保証します。