理光免費公開自主研發的防護欄(Safeguard)模型

理光公司在 Hugging Face 免費公開了「Llama-Ricoh-SafeGuard-20260520」,該模型內建自主開發的防護欄功能,可檢測大型語言模型(LLM)的有害輸入與輸出。
新製品NQ 90/100出典:PR Times

📋 文章處理履歷

  • 📰 發表: 2026年5月20日 20:10
  • 🔍 收集: 2026年5月20日 11:31
  • 🤖 AI分析完成: 2026年5月22日 05:22(收集後41小時50分鐘)
理光公司(Ricoh)正式免費公開了「Llama-Ricoh-SafeGuard-20260520」,這是一項內建自主開發防護欄功能的大型語言模型(LLM),旨在檢測有害資訊的輸入與輸出。

此模型基於 Meta Platforms 的「Meta-Llama-3.1-8B」,並進一步優化日語能力的「Llama-3.1-Swallow-8B-Instruct-v0.5」開發而成。透過理光獨有的量化技術,實現了模型的小型化與輕量化。過去該模型僅包含於「RICOH 本地端 LLM 入門套件」中提供給客戶,此次為進一步促進生成式 AI 的安全使用,決定全面免費公開。

該模型透過監控輸入的提示詞與 LLM 生成的回答,能夠基於暴力、犯罪、歧視等 14 種分類標籤,精準偵測並阻擋不當或有害的內容。

常見問題

理光無償公開的安全模型是什麼?

這是整合了檢測和阻擋大規模語言模型有害信息輸入輸出的防護功能的「Llama-Ricoh-SafeGuard-20260520」。

基於哪個模型開發的?

基於Meta公司提供的「Meta-Llama-3.1-8B」,改進了日語性能的「Llama-3.1-Swallow-8B-Instruct-v0.5」。

有害信息的檢測對象有哪些?

學習了分類為暴力、犯罪、歧視、隱私侵犯等14種標籤的數據,能夠檢測不適當或有害的內容。

公開在哪裡?

在Hugging Face(https://huggingface.co/ricoh-ai/Llama-Ricoh-SafeGuard-20260520)無償公開。

開發的背景是什麼?

隨著生成AI的社會應用不斷推進,為了應對安全使用方面的挑戰,理光自2024年10月起作為內部項目開始開發和實施,旨在將成果回饋社會。