OrcaRouter 支援次世代 AI 模型「MiniMax M3」API:超長文本處理速度提升 15.6 倍,支援 100 萬 Token 加速企業 AI 應用

FlashLabs 株式會社於 2026 年 6 月 1 日起,在 LLM 路由閘道「OrcaRouter」中支援 MiniMax 的次世代 AI 模型「MiniMax M3」。透過 MSA 技術實現 100 萬 Token 的上下文處理,並提升 15.6 倍速度,協助企業優化 AI 應用效能。
techNQ 53/100出典:PR Times

📋 文章處理履歷

  • 📰 發表: 2026年6月2日 01:50
  • 🔍 收集: 2026年6月1日 17:05
  • 🤖 AI分析完成: 2026年6月1日 17:10(收集後4分鐘)
FlashLabs 株式會社(總部:東京都千代田區,代表取締役:細井洋一)宣布,自 2026 年 6 月 1 日(週一)起,於合作夥伴 Continuum AI 提供的 LLM 路由閘道「OrcaRouter」中,正式支援 MiniMax 公司的次世代 AI 模型「MiniMax M3」。MiniMax M3 採用獨家的「MiniMax Sparse Attention (MSA)」技術,實現了高達 100 萬 Token(保證最低 512K)的上下文視窗。相較於前代模型,處理速度提升了 15.6 倍,大幅增強了在代理工作流(Agent Workflow)與程式編寫輔助方面的效能。

背景與目標
隨著企業 AI 應用的普及,對於大規模文件處理、整個程式碼庫分析以及長時間代理執行等需要超長上下文的業務需求急劇增加。然而,傳統 AI 模型受限於上下文視窗,必須將文件分割處理,導致處理速度下降與成本增加。

特別是在法律文件全文分析、大規模程式碼重構以及跨文件資訊提取等企業領域,對於 100 萬 Token 規模的上下文處理需求日益增長。此外,當 AI 代理自主執行任務時,若要維持長時間的推理過程,超長上下文的高速處理至關重要。

FlashLabs 透過 OrcaRouter 提供超過 200 種 AI 模型的存取權限,此次新增 MiniMax M3 API,將能為需要超長上下文處理的企業用例提供更快速且具成本效益的解決方案。

MiniMax M3 概覽
價格:可透過 OrcaRouter 使用(Token 加價 0%)。詳細價格資訊請參閱 OrcaRouter 官方網站。
主要功能:超長上下文處理(最大 100 萬 Token)、稀疏注意力技術 (MSA)、先進的程式編寫效能、代理工作流優化、原生多模態支援。

為企業帶來的價值
1. 大規模文件處理效率化:無需分割,即可一次處理數百頁文件。
2. 程式碼庫全域分析與重構:一次讀取數萬行程式碼,進行依賴關係分析與錯誤檢測。
3. AI 代理長時間執行:在維持 100 萬 Token 上下文的狀態下,支援數小時的代理執行。

技術特色:稀疏注意力技術的創新
MiniMax M3 的最大特色在於自主研發的「MiniMax Sparse Attention (MSA)」技術。透過大幅降低計算量,相較於前代模型 (MiniMax M2.7),預填充速度提升 9.7 倍,解碼速度提升 15.6 倍,並將推理成本降低至約 1/20。

與 OrcaRouter 整合的綜效
OrcaRouter 是一個能根據提示詞難度自動路由至最佳 AI 模型的平台。透過加入 MiniMax M3,企業可針對常規處理、超長上下文處理及複雜推理進行優化,預計可降低約 40% 的 LLM 支出。

防護欄與安全功能
OrcaRouter 整合了 8 種防護欄功能,包括 PII Shield(個人資訊保護)、Secrets & API Keys(認證資訊保護)、Prompt Injection 防禦及品牌安全性等,強化企業生產環境的控管。

未來展望
FlashLabs 將持續迅速提供最新的 AI 模型,並強化企業領域所需的超長上下文處理與多模態支援等功能。

常見問題

企業使用 OrcaRouter 的主要優勢為何?

透過自動路由與安全防護機制,企業能在確保合規與成本效益的前提下,靈活運用多種尖端 AI 模型。