理光免費公開自主研發的防護欄（Safeguard）模型

2026年5月20日

理光公司在 Hugging Face 免費公開了「Llama-Ricoh-SafeGuard-20260520」，該模型內建自主開發的防護欄功能，可檢測大型語言模型（LLM）的有害輸入與輸出。

📋 文章處理履歷

📰 發表: 2026年5月20日 20:10
🔍 收集: 2026年5月20日 11:31
🤖 AI分析完成: 2026年5月22日 05:22（收集後41小時50分鐘）

理光公司（Ricoh）正式免費公開了「Llama-Ricoh-SafeGuard-20260520」，這是一項內建自主開發防護欄功能的大型語言模型（LLM），旨在檢測有害資訊的輸入與輸出。

此模型基於 Meta Platforms 的「Meta-Llama-3.1-8B」，並進一步優化日語能力的「Llama-3.1-Swallow-8B-Instruct-v0.5」開發而成。透過理光獨有的量化技術，實現了模型的小型化與輕量化。過去該模型僅包含於「RICOH 本地端 LLM 入門套件」中提供給客戶，此次為進一步促進生成式 AI 的安全使用，決定全面免費公開。

該模型透過監控輸入的提示詞與 LLM 生成的回答，能夠基於暴力、犯罪、歧視等 14 種分類標籤，精準偵測並阻擋不當或有害的內容。

常見問題

リコーが無償公開したセーフガードモデルとは何ですか？

大規模言語モデルに対する有害情報の入出力を検知・ブロックするガードレール機能を組み込んだ「Llama-Ricoh-SafeGuard-20260520」です。

どのモデルをベースに開発されましたか？

Meta社が提供する「Meta-Llama-3.1-8B」の日本語性能を向上させた「Llama-3.1-Swallow-8B-Instruct-v0.5」をベースに開発されています。

有害情報の検知対象にはどのようなものがありますか？

暴力、犯罪、差別、プライバシー侵害など14種類のラベルに分類されたデータで学習しており、不適切または有害な内容を検出可能です。

公開先はどこですか？

Hugging Face（https://huggingface.co/ricoh-ai/Llama-Ricoh-SafeGuard-20260520）にて無償公開されています。

開発の背景は？

生成AIの社会実装が進む中、安全な利活用への課題に対し、リコーが社内プロジェクトとして2024年10月から開発・実装に取り組んできた成果を社会へ還元する狙いがあります。

返回 Newsroom (27)