阿賈塔公司將「RAG+AI聊天機器人」回應速度提升約1.9倍——公開60人同時存取、最嚴苛條件下的實測數據與測量方法

Key facts

  • 阿賈塔公司將「RAG+AI聊天機器人」回應速度提升約1.9倍——公開60人同時存取、最嚴苛條件下的實測數據與測量方法
  • 總部位於日本群馬縣富岡市的阿賈塔公司宣布,其內部文件AI搜尋服務「RAG+AI聊天機器人」的回應處理速度已提升約1.9倍。公司同時公開在60名使用者同時連續存取的嚴峻條件下所測得的性能數據,並詳述測量方式。本服務採用全棧自營模式,確保資料不出內網,並實現供應的持續性。
  • Source: PR Times
  • Date: 2026年6月17日

Direct answer

總部位於日本群馬縣富岡市的阿賈塔公司宣布,其內部文件AI搜尋服務「RAG+AI聊天機器人」的回應處理速度已提升約1.9倍。公司同時公開在60名使用者同時連續存取的嚴峻條件下所測得的性能數據,並詳述測量方式。本服務採用全棧自營模式,確保資料不出內網,並實現供應的持續性。

Citation
阿賈塔公司將「RAG+AI聊天機器人」回應速度提升約1.9倍——公開60人同時存取、最嚴苛條件下的實測數據與測量方法 (2026年6月17日), PR Times
Source
PR Times
Date
2026年6月17日
總部位於日本群馬縣富岡市的阿賈塔公司宣布,其內部文件AI搜尋服務「RAG+AI聊天機器人」的回應處理速度已提升約1.9倍。公司同時公開在60名使用者同時連續存取的嚴峻條件下所測得的性能數據,並詳述測量方式。本服務採用全棧自營模式,確保資料不出內網,並實現供應的持續性。

📋 文章處理履歷

  • 📰 發表: 2026年6月17日 20:03
  • 🔍 收集: 2026年6月17日 11:17
  • 🤖 AI分析完成: 2026年6月17日 11:37(收集後20分鐘)
總部位於日本群馬縣富岡市的阿賈塔股份有限公司(代表取締役:勅使河原有佑)宣布,針對自2026年5月起提供的內部文件AI搜尋服務「RAG+AI聊天機器人」,透過在搜尋結果再排序處理中應用FP8量化等性能優化技術,將回應處理速度提升約1.9倍。同時,公司公開在60名使用者於同一瞬間持續存取的嚴苛條件下所測得的回應性能數據,並同步說明測量方法。

本服務在2026年5月發布時所公布的預期設計性能,現已透過實際測量加以驗證,並進一步實現效能提升。服務價格維持不變。

■ 為何公開「最嚴苛條件下的實測值」?

AI服務的回應速度通常僅公布理想條件下的標稱值,導致企業在實際擁擠時段的效能表現難以預期——這正是導入企業的主要擔憂之一。

本公司刻意在「所有人同時且持續發送請求」的人工最惡劣條件下進行測量,並將數值連同測量條件與方法一併公開。實際使用環境在原理上不可能比此條件更嚴峻。換言之,此數值接近「最低保障的實力值」。

■ 實測結果(60人同時、最大負載、自社測量)

同時存取人數|回應啟動中位數|回應啟動平均|回應啟動95百分位

30人同時:386毫秒|460毫秒|827毫秒

60人同時:560毫秒|1,015毫秒|3,314毫秒

測量條件:所有客戶端於同一瞬間持續發送提問的封閉迴路方式。各條件均進行60秒×多次實測,記載其中位數。全測量過程錯誤率為0%。

在使用者較少時段或單獨使用時,回應啟動中位數約為0.15秒,使用者感受近乎即時開始回答。

回答品質方面,在符合提問指南的評估中,有效回答率達96%(共25題中24題合理,其中符合指南提問達95.7%),超越原定92%的目標。

測量工具規格與原始測量數據,可作為技術文件提供給評估中的企業客戶。

回答顯示速度(實測)

指回應啟動後,回答文字逐漸顯示的速度。若快於人類默讀速度(每秒約15至20字),使用者將感受「無需等待即可閱讀」。

本公司實測顯示,回答以每秒約60至101字的速度顯示(為默讀速度的約4至6倍),單獨使用時更可達每秒500字以上。即使在多人同時使用的擁擠時段,仍能維持超越人類閱讀速度的節奏,使文章流暢不中斷地顯示。

■ 效能提升內容

本次加速來自兩項獨立改善:

① 再排序處理加速(約2倍)
在搜尋結果再排序處理(精確調整文件與提問關聯度的排序)中,應用FP8量化(8位元浮點運算),並在獨家精度驗證方法下,將處理速度提升約2倍(63毫秒 → 29毫秒)。應用前後,已透過實測確認回答品質相當。

② 推論引擎更新(生成速度提升約1.9倍、回應啟動縮短17%)
採用最新世代推論引擎,將AI模型運算針對資料中心GPU世代進行最佳化。此舉使首次回應時間(回應啟動/TTFT)較以往縮短約17%(單獨使用時:178毫秒 → 148毫秒),回答文字生成速度亦提升約1.9倍(280字/秒 → 524字/秒)。

本服務由本公司自主營運AI模型、搜尋引擎、資料庫至伺服器等全層級,因此能持續進行深層次性能優化,並將成果無償回饋予客戶。

本次效能提升的技術背景(如推論引擎最佳化、投機性解碼穩定化等),已於同日發布技術人員專用詳解文章。→ https://zenn.dev/articles/0a3af1960fba0d/edit

■ 「想用的AI,可能某天突然無法使用」——供應持續性的視角

透過雲端提供的外部AI服務,可能因供應商政策變更、法規制度調整或合約重新審查等使用者無法掌控的因素,於某日突然無法使用。若企業核心業務依賴此類AI,將面臨技術性能以外的「能否持續使用」之延續性風險。

阿賈塔公司的RAG+AI聊天機器人,在此點上具備結構性優勢。

本服務使用採用Apache License 2.0的開放權重AI模型,模型權重由本公司持有並運作於富岡再生能源資料中心內的封閉環境中。

因不依賴特定廠商的伺服器或API,遠端中止服務在原理上不可能。一旦導入,AI不會因外部因素而「被切斷」。

在確保資料不外洩的「資訊主權」之外,更實現服務本身不中斷的「供應持續性」。

■ 以太陽能自發電資料中心運作、資料不出內網的AI

本服務運作於本公司自有的資料中心環境,並運用環境省「零排放化・韌性強化促進事業」計畫推動再生能源供電。結合場內太陽能發電站與大容量蓄電池,最大限度利用再生能源電力。封閉式設計於自營GPU伺服器上完成,確保客戶資料不會傳送至外部雲端。

此為兼顧資料安全與降低環境負荷的永續AI應用基礎。

■ 未來亦將持續提升精準度與速度

本公司自主營運AI模型、搜尋引擎、資料庫至伺服器等全層級。此垂直整合架構使我們無需等待特定元件更新,即可自主持續優化搜尋精準度、回答品質與回應速度。

回答精準度:持續調校文件前處理、搜尋、再排序等各階段,追求更高有效回答率。

回應速度與Token生成速度:持續進行量化與推論路徑最佳化,不侷限於本次提升,將持續推進改善。

上述改善成果,將盡可能無償提供予現有客戶。

性能並非「導入時的固定值」,而是越用越好——這正是本服務的目標。

■ 費用與提供條件(維持不變,效能提升部分免費回饋)

基本費用:每月40,000日圓(未稅),無初期費用(兩年合約)

包含最多100MB文件資料的RAG化處理

1帳號=1人同時使用(可內部共享,可購買多帳號)

無Token數(文字量、回答長度)限制

常見問題

阿賈塔的AI真的不會將資料外洩嗎?

是的。模型與資料完全在富岡市自營資料中心內運作,絕不外傳。

60人同時存取時的回應速度是多少?

回應啟動中位數為560毫秒,95%請求可在3.3秒內啟動。

這個AI會像雲端服務一樣突然無法使用嗎?

不會。因使用自有模型與基礎設施,不會因外部因素導致服務中斷。

導入需要初期費用嗎?

不需要。簽訂兩年合約即免初期費用,月費4萬日圓(未稅)起。

回答的準確度如何?

根據指南評估,96%回答有效,超越原定92%目標。