提供事件管理解決方案的 PagerDuty 株式会社(總公司:東京都港區,代表取締役社長:山根伸行,以下簡稱:PagerDuty)公開了導入 PagerDuty 的株式会社 NTT DOCOMO(總公司:東京都千代田區,以下簡稱:NTT DOCOMO)的案例。
株式会社 NTT DOCOMO 自 2020 年導入以來,目前已將 PagerDuty 作為橫跨多項服務與系統的「事件管理基礎」進行運用。該公司組織性地建立了預防客戶影響的「主動式(先發制人型)維運」,實現了 DevOps 體制的進一步高度化。
導入當時的課題與導入成效
NTT DOCOMO 負責多種不同服務的開發與維運。在 2020 年導入 PagerDuty 之前,組織整體從多個監控工具發出的警報每月合計高達 10,000 件,減少雜訊成為當務之急。當時存在許多依賴個人經驗的聯繫與深夜呼叫,提升維運效率與減輕應對負擔成為了重大課題。
導入 PagerDuty 後,透過活用 AI 與規則引擎,將不必要的警報從每月 10,000 件大幅削減至 1,000 件,實現了「應關注資訊」的明確化。此外,透過建立自動呼叫適當負責人的機制,將初動時間從數小時劇烈縮短至「3 分鐘」。結果,每月減少了 40 小時處理非關鍵業務的時間,並轉變為無需將監控業務外包給外部監控中心(NOC)的體制。
從 5 年持續改善中誕生的「3 大進化」
在此之後的 5 年間,透過持續改善,該公司實現了以下的「3 大進化」。
・ 提升可視性與部門間協作:建立了可在單一畫面上橫向俯瞰多項服務狀況的體制。不僅是 IT 部門,同時也向業務部門發送通知,實現了迅速的資訊共享。
・ 流程標準化與知識整合:將「異常檢測、確認(ACK)、筆記記載」的流程規則化。在 PagerDuty 上累積過去的類似案例與應對方針作為知識庫,消除了對個人的依賴。
・ 徹底落實「主動式維運」:將通知嚴格區分為「警報(緊急)」與「警告(預警)」,在警告階段於當日內進行處置,確立了預防客戶影響顯現的機制。
未來展望
NTT DOCOMO 正著眼於活用 AI 與自動化技術的「次世代維運」。未來目標是實現 AI 學習過去的應對紀錄,自動進行狀況總結、原因分析,甚至提出最佳應對方針的世界。方針在於建立一套體制,將從事件檢測到定位的過程交給以 PagerDuty 為核心的機器處理,而人類則能專注於「對客戶的引導」與「業務風險判斷」等高度決策。
※案例詳情請見此處。
關於 PagerDuty
PagerDuty, Inc.(NYSE:PD)作為數位維運管理的全球領導者,透過 PagerDuty Operations Cloud 協助大規模 IT 維運業務的效率化。PagerDuty Operations Cloud 是一個整合了事件管理、AIOps、自動化與客戶服務維運,且具備靈活性與擴充性的平台。採用 Operations Cloud 後,企業能降低維運障礙的風險與成本,並透過提升創新速度來增加收益。超過半數的財星 500 大企業與近 70% 的財星 100 大企業,皆將 PagerDuty 作為現代企業不可或缺的基礎設施使用。日本地區的客戶案例請見此處。
FACT BOX · 重點整理
- 來源:PR TIMES
- 分類:新聞