株式会社アガタ、「RAG+AIチャットボット」の応答速度を約1.9倍に高速化 — 60名同時アクセス・最悪条件での実測値と測定方法を公開

Key facts

  • 株式会社アガタ、「RAG+AIチャットボット」の応答速度を約1.9倍に高速化 — 60名同時アクセス・最悪条件での実測値と測定方法を公開
  • 群馬県富岡市に本社を置く株式会社アガタは、自社提供の社内文書AI検索サービス「RAG+AIチャットボット」の応答速度を約1.9倍に高速化したことを発表しました。60名が同時にアクセスする最悪条件下でも安定した性能を実測で確認し、その測定方法とともに公開しています。全レイヤーを自社で運用する閉域型設計により、データの外部送信ゼロと供給の継続性を両立しています。
  • Source: PR Times
  • Date: 2026年6月17日

Direct answer

群馬県富岡市に本社を置く株式会社アガタは、自社提供の社内文書AI検索サービス「RAG+AIチャットボット」の応答速度を約1.9倍に高速化したことを発表しました。60名が同時にアクセスする最悪条件下でも安定した性能を実測で確認し、その測定方法とともに公開しています。全レイヤーを自社で運用する閉域型設計により、データの外部送信ゼロと供給の継続性を両立しています。

Citation
株式会社アガタ、「RAG+AIチャットボット」の応答速度を約1.9倍に高速化 — 60名同時アクセス・最悪条件での実測値と測定方法を公開 (2026年6月17日), PR Times
Source
PR Times
Date
2026年6月17日
群馬県富岡市に本社を置く株式会社アガタは、自社提供の社内文書AI検索サービス「RAG+AIチャットボット」の応答速度を約1.9倍に高速化したことを発表しました。60名が同時にアクセスする最悪条件下でも安定した性能を実測で確認し、その測定方法とともに公開しています。全レイヤーを自社で運用する閉域型設計により、データの外部送信ゼロと供給の継続性を両立しています。

📋 記事の処理履歴

  • 📰 発表: 2026年6月17日 20:03
  • 🔍 収集: 2026年6月17日 11:17
  • 🤖 AI分析完了: 2026年6月17日 11:37(収集から20分後)
群馬県富岡市に本社を置く株式会社アガタ(代表取締役:勅使河原有佑)は、2026年5月より 提供中の社内文書AI検索サービス「RAG+AIチャットボット」について、検索結果の再ランク 処理へのFP8量子化適用などの性能改善により応答処理を約1.9倍に高速化したことを発表します。 あわせて、60名が同一瞬間にアクセスし続けるという厳しい条件下での応答性能の実測値を、測定方法とともに公開します。

サービス提供開始時(2026年5月発表)には想定設計値としてお伝えしていた応答性能を、 今回、実測によって裏付けるとともに、さらなる高速化を実現しました。料金は据え置きです。

■ なぜ「最も厳しい条件の実測値」を公開するのか

AIサービスの応答速度は、好条件下での公称値が示されることが一般的で、実際の混雑時に どこまで遅くなるのかは導入してみないと分からない——これが導入企業の不安要素の一つでした。

当社は、全利用者が同一瞬間にリクエストを送信し続ける「人工的な最悪条件」であえて測定し、 その数値を測定条件・測定方法とともに公開します。実際のご利用環境がこの条件より厳しくなる ことは原理的にありません。つまり本数値は「最低保証に近い実力値」です。

■ 実測結果(60名同時・最大負荷・自社測定)

同時アクセス数応答開始 中央値応答開始 平均応答開始 95パーセンタイル

30名同時386 ms460 ms827 ms

60名同時560 ms1,015 ms3,314 ms

測定条件: 全クライアントが同一瞬間に質問を送信し続ける閉ループ方式。各条件とも 60秒間×複数回実測し、その中央値を記載。全測定を通じてエラー率0%。

利用者が少ない時間帯や単独利用時の応答開始は中央値0.15秒前後であり、 体感としてはほぼ瞬時に回答が始まります。

回答品質は、質問ガイドライン準拠の評価において回答有効率96%(全25問中24問が 妥当、うちガイドライン準拠質問では95.7%)を確認し、目標の92%を上回りました。

測定ツールの仕様・測定生データは、ご検討中の企業様に技術資料として開示可能です。

回答が表示される速さ(実測)

応答が始まったあと、回答文が書き出されていく速さです。人が黙読する速度(毎秒およそ 15〜20文字程度)を上回れば、「待たされずに読める」体感になります。

当社の実測では、回答は毎秒およそ60〜101文字(黙読の約4〜6倍の速さ)で表示され、 単独利用時には毎秒500文字以上に達します。多人数が同時に利用する 混雑時でも、人が読む速度を上回るペースを保ち、文章が途切れずに流れるように表示されます。

■ 高速化の内容

今回の高速化は、2つの独立した改善によるものです。

① 再ランク処理の高速化(約2倍) 検索結果の再ランク処理(質問と文書の関連度を精密に並べ替える処理)に、 FP8量子化(8ビット浮動小数点演算)を独自の精度検証手法のもとで適用し、 再ランク処理速度を約2倍に高速化しました(63ms → 29ms)。 適用にあたっては、量子化前後で回答品質が同等であることを実測により確認しています。

② 推論エンジンの更新(生成速度約1.9倍・応答開始17%短縮) 推論基盤に最新世代の推論エンジンを採用し、AIモデルの演算を データセンターのGPU世代に合わせて最適化しました。これにより、最初の回答が 返り始めるまでの時間(応答開始 / TTFT)が従来比約17%短縮(単独利用時: 178ms → 148ms)され、回答が書き出される速さも約1.9倍(280文字/秒 → 524文字/秒) に向上しています。

本サービスは、AIモデル・検索エンジン・データベース・サーバーまで全レイヤーを 自社で運用しているため、このような深いレベルでの性能改善を継続的に実施し、 追加費用なくお客様に還元できます。

なお、今回の高速化を実現した技術的背景(推論エンジンの最適化・投機的デコードの 安定化など)については、技術者向けの詳細記事を同日公開しています。→ https://zenn.dev/articles/0a3af1960fba0d/edit

■ 「使いたいAIが、ある日突然使えなくなる」かもしれない — 供給継続という視点

クラウド経由で提供される外部のAIサービスは、提供企業の方針変更、規制や制度の変化、 契約条件の見直しなど、利用する側ではコントロールできない事情によって、ある日 利用できなくなる可能性をつねに抱えています。業務の根幹をそうしたAIに依存している場合、 それは技術的な性能とは別の、「使い続けられるか」という継続性のリスクになります。

株式会社アガタのRAG+AIチャットボットは、この点に構造的に強い設計です。

利用するのは Apache License 2.0 のオープンウェイトAIモデル。モデルの重みを 当社が富岡再エネデータセンター内に保有し、同センターの閉域で動作させます。

特定ベンダーのサーバーやAPIに依存しないため、遠隔から提供を止められることが 原理的にありません。 いったん導入したAIは、外部の都合で「切られる」ことがありません。

データを外に出さない「情報主権」に加え、サービスそのものが止まらない 「供給の継続性」を確保します。

■ 太陽光自家発電のデータセンターで動く、データを外に出さないAI

本サービスは、環境省プロジェクトの「ゼロエミッション化・レジリエンス強化促進事業」を 利用した再エネ電源活用の自社所有データセンター環境で稼働しています。敷地内の太陽光発電所と大容量蓄電池を 組み合わせ、再生可能エネルギー由来の電力を最大限活用。自社GPUサーバー上で完結する 閉鎖型設計により、お客様のデータが外部クラウドへ送信されることはありません。

データセキュリティと環境負荷低減を両立した、持続可能なAI活用基盤です。

■ 今後も、精度と速度を高め続けます

当社は、AIモデル・検索エンジン・データベース・サーバーまで全レイヤーを自社で 運用しています。この垂直統合により、特定の部品の更新を待つことなく、検索精度・ 回答品質・応答速度のいずれについても、当社の判断で継続的に改善を重ねていける ことが強みです。

回答精度: 文書の前処理・検索・再ランクの各段を継続的にチューニングし、 回答有効率のさらなる向上を目指します。

応答速度・トークン生成速度: 量子化や推論経路の最適化を継続し、今回の高速化に とどまらず、さらなる改善を進めます。

これらの改善成果は、可能な限り追加費用なく、既存のお客様にも還元してまいります。

性能は「導入時点の固定値」ではなく、使い続けるほど良くなっていく——そうした サービスを目指します。

■ 料金・提供条件(変更なし・性能向上分は据え置きで還元)

基本料金: 40,000円/月(税抜)、初期費用ゼロ(2年契約)

最大100MBまでの文書データRAG化込み

1アカウント=同時利用1名(社内共有可・複数アカウント取得可)

トークン数(文字量・回答長)の制限はありませ

よくある質問

アガタのAIは本当にデータを外部に送信しないのですか?

はい。モデルとデータは富岡市の自社データセンター内で完結しており、一切外部に送信されません。

60名同時アクセス時の応答速度はどのくらいですか?

応答開始の中央値は560ミリ秒、95%のリクエストが3.3秒以内に開始されます。

このAIはクラウドサービスのように突然使えなくなることはありますか?

いいえ。自社所有モデルとインフラのため、外部の都合でサービスが停止することはありません。

導入にかかる初期費用はありますか?

ありません。2年契約で初期費用はゼロ、月額4万円(税抜)からご利用いただけます。

回答の正確さはどの程度ですか?

ガイドラインに基づく評価で96%の回答が有効とされ、目標を上回る精度を実現しています。