在防衛裝備廳5年型研究(Type S)中獲得AA評價 —— 利用強化學習模糊測試技術取得超乎預期的成果
Ricerca Security在防衛裝備廳的研究計畫中,開發了利用強化學習的模糊測試技術,並發現了26個零日漏洞,榮獲「AA」評價。
📋 文章處理履歷
- 📰 發表: 2026年4月14日 22:19
- 🔍 收集: 2026年4月14日 14:01
- 🤖 AI分析完成: 2026年4月19日 16:25(收集後122小時23分鐘)
Ricerca Security株式會社宣布,其在日本防衛裝備廳「安全保障技術研究推進制度」下實施的為期5年的研究專案已結束,並獲得了最終評價為「AA(超出預期的成果)」。
在本研究中,我們開發了利用強化學習的漏洞檢測技術,並在實際軟體中發現了大量零日漏洞,在學術和實用兩方面均取得了成果。此成果有望為網路安全領域的漏洞發現高度化以及提升關鍵基礎設施的安全性做出貢獻。
在防衛裝備廳的大型研究制度(Type S)中獲得AA評價
Ricerca Security株式會社在防衛裝備廳實施的「安全保障技術研究推進制度」中,被採納為Type S(大規模・長期研究框架)的研究專案「使用強化學習的環境適應型模糊測試系統之提案」(2020年度至2024年度)已結束,並獲得了最終評價「AA(超出預期的成果)」。
該制度旨在創造有助於國家安全的先進技術之競爭性研究制度,尤其是Type S針對的是長期且具挑戰性的研發框架。
背景:日益複雜的網路攻擊與漏洞發現的極限
近年來,軟體漏洞已成為影響國家安全與社會基礎設施的重大問題。特別是尚未存在修補程式的「零日漏洞」,其危害容易擴大,因此需要迅速被發現。
另一方面,傳統的漏洞發現方法存在以下挑戰:
- 難以選擇最佳的搜尋方法
- 難以判斷大量被發現缺陷的嚴重程度
- 難以應用於物聯網(IoT)設備等實際環境
研究成果:確立基於強化學習的次世代模糊測試技術
在本研究中,為了提高模糊測試中的搜尋效率並擴大應用範圍,我們開發了利用強化學習的模糊測試技術及相關基礎設施。
主要成果如下:
綜合模糊測試框架「fuzzuf」的開發
我們開發了能夠綜合處理多種模糊測試演算法的框架「fuzzuf」。
在該框架中,能夠在同一平台上執行、比較和結合13種現有的模糊測試演算法(AFL、libFuzzer、VUzzer等)。
相關:網路安全新創公司Ricerca Security將國產模糊測試框架「fuzzuf」開源化,有助於提升漏洞檢測效率。
使用強化學習的模糊測試最佳化方法之探討
為提高模糊測試中的搜尋效率,我們探討了使用強化學習的最佳化方法。
具體而言,我們提出並實作了:
- 最佳化突變操作應用順序與頻率的方法(SLOPT)
- 動態切換多種模糊測試演算法的方法
並對每種方法的性能進行了評估。
針對實際軟體的漏洞發現
將提出之方法應用於實際軟體的結果,我們發現了:
- 總共26個零日漏洞
- 其中17個已註冊為CVE
- 5個被評估為嚴重漏洞
從而確認了其在實際環境中的有效性。
崩潰原因分析與威脅度評估方法的開發
針對模糊測試產生的大量崩潰,我們進行了:
- 開發用於比較與驗證根本原因定位方法的平台(RCABench)
- 設計評估漏洞威脅程度的指標
評估結果證實,對於已知漏洞,能夠以等同或高於人工分析的精準度進行威脅度評估。
針對IoT設備的模糊測試方法擴展
針對如IoT設備等難以取得內部結構的環境,我們提出了「結合靜態分析結果與通訊回應的覆蓋率估計方法(Shepherd)」,並確認其準確度較現有方法有所提升。
評估結果:評價為「超出預期的成果」
在防衛裝備廳的最終評價中,本研究的綜合評價為「AA(超出預期的成果)」。
在評價中,確認了以下成果:
- 構建了可整合多種模糊測試演算法的框架
- 強化學習...
在本研究中,我們開發了利用強化學習的漏洞檢測技術,並在實際軟體中發現了大量零日漏洞,在學術和實用兩方面均取得了成果。此成果有望為網路安全領域的漏洞發現高度化以及提升關鍵基礎設施的安全性做出貢獻。
在防衛裝備廳的大型研究制度(Type S)中獲得AA評價
Ricerca Security株式會社在防衛裝備廳實施的「安全保障技術研究推進制度」中,被採納為Type S(大規模・長期研究框架)的研究專案「使用強化學習的環境適應型模糊測試系統之提案」(2020年度至2024年度)已結束,並獲得了最終評價「AA(超出預期的成果)」。
該制度旨在創造有助於國家安全的先進技術之競爭性研究制度,尤其是Type S針對的是長期且具挑戰性的研發框架。
背景:日益複雜的網路攻擊與漏洞發現的極限
近年來,軟體漏洞已成為影響國家安全與社會基礎設施的重大問題。特別是尚未存在修補程式的「零日漏洞」,其危害容易擴大,因此需要迅速被發現。
另一方面,傳統的漏洞發現方法存在以下挑戰:
- 難以選擇最佳的搜尋方法
- 難以判斷大量被發現缺陷的嚴重程度
- 難以應用於物聯網(IoT)設備等實際環境
研究成果:確立基於強化學習的次世代模糊測試技術
在本研究中,為了提高模糊測試中的搜尋效率並擴大應用範圍,我們開發了利用強化學習的模糊測試技術及相關基礎設施。
主要成果如下:
綜合模糊測試框架「fuzzuf」的開發
我們開發了能夠綜合處理多種模糊測試演算法的框架「fuzzuf」。
在該框架中,能夠在同一平台上執行、比較和結合13種現有的模糊測試演算法(AFL、libFuzzer、VUzzer等)。
相關:網路安全新創公司Ricerca Security將國產模糊測試框架「fuzzuf」開源化,有助於提升漏洞檢測效率。
使用強化學習的模糊測試最佳化方法之探討
為提高模糊測試中的搜尋效率,我們探討了使用強化學習的最佳化方法。
具體而言,我們提出並實作了:
- 最佳化突變操作應用順序與頻率的方法(SLOPT)
- 動態切換多種模糊測試演算法的方法
並對每種方法的性能進行了評估。
針對實際軟體的漏洞發現
將提出之方法應用於實際軟體的結果,我們發現了:
- 總共26個零日漏洞
- 其中17個已註冊為CVE
- 5個被評估為嚴重漏洞
從而確認了其在實際環境中的有效性。
崩潰原因分析與威脅度評估方法的開發
針對模糊測試產生的大量崩潰,我們進行了:
- 開發用於比較與驗證根本原因定位方法的平台(RCABench)
- 設計評估漏洞威脅程度的指標
評估結果證實,對於已知漏洞,能夠以等同或高於人工分析的精準度進行威脅度評估。
針對IoT設備的模糊測試方法擴展
針對如IoT設備等難以取得內部結構的環境,我們提出了「結合靜態分析結果與通訊回應的覆蓋率估計方法(Shepherd)」,並確認其準確度較現有方法有所提升。
評估結果:評價為「超出預期的成果」
在防衛裝備廳的最終評價中,本研究的綜合評價為「AA(超出預期的成果)」。
在評價中,確認了以下成果:
- 構建了可整合多種模糊測試演算法的框架
- 強化學習...