障害管理
しょうがいかんり
ネットワークやシステムに障害が発生した際に、障害の検知・切分け・原因特定・復旧を行う一連のプロセス。稼働統計の収集・分析を通じて、障害の予防や迅速な対応を図る。
ネットワーク > ネットワーク管理
関連キーワードの用語
SG稼働統計
ネットワークやシステムの稼働状況を定量的に記録・集計したデータ。障害発生率、応答時間、トラフィック量などを収集し、障害の傾向分析やキャパシティ計画に活用する。
SGヒューマンエラー
人間の誤操作や判断ミスによって引き起こされる障害や事故。システムの信頼性を脅かす要因の一つであり、フールプルーフやフェールセーフなどの設計で対策する。
IPヒューマンインザループ
HITLとも略される。AIシステムの意思決定プロセスに人間の判断を組み込む仕組み。AIの出力を人間がレビュー・修正することで、精度向上や倫理的な問題の回避を図る。
IPDevOps
開発(Development)と運用(Operations)が連携・協力し、システムの開発からリリース、運用までを迅速かつ頻繁に行うための考え方や文化。自動化ツールやCI/CDパイプラインの活用が特徴。
IPデッドロック
複数のトランザクションが互いに相手がロックしている資源の解放を待ち合い、どちらも処理を進められなくなる状態。検出した場合は一方のトランザクションを強制終了して解消する。
FEDevOps
開発チーム(Dev)と運用チーム(Ops)が連携し、迅速かつ柔軟にソフトウェア開発を行う手法・文化。継続的インテグレーション(CI)、継続的デリバリー(CD)、継続的デプロイなどのプラクティスを通じて、リリースサイクルを短縮する。