障害切り分け
Fault Isolation
しょうがいきりわけ
障害の発生箇所を特定するために、ネットワーク、サーバ、アプリケーション、データベースなどの各層を順に確認して原因箇所を絞り込む診断作業。迅速な復旧のために体系的な手順が重要である。
システム運用管理 > 障害対応と復旧
関連キーワードの用語
NWICMP(Internet Control Message Protocol)
IPネットワークにおけるエラー通知や診断を行うプロトコル。pingコマンドで使用されるEcho Request/Replyや、到達不能通知(Destination Unreachable)、経路変更通知(Redirect)等のメッセージタイプを持つ。
NWtraceroute
宛先までの経路上にある各ルータを特定するネットワーク診断コマンド。TTLを1から順に増加させたパケットを送信し、各ルータからのICMP Time Exceededメッセージにより経路と遅延時間を調査する。障害箇所の特定に活用される。
NWping
ICMPのEcho Request/Echo Replyを使用して、ネットワーク上のホストとの疎通確認を行うコマンド。応答時間(RTT)やパケットロス率を測定できる。ネットワーク障害の最も基本的な診断ツール。
ES自己診断機能(BIST)
システムが自身のハードウェアやソフトウェアの健全性を自動的に検査する機能。電源投入時の初期診断(POST)、定期的なランタイム診断がある。CPUレジスタ、ROM/RAMチェック、ペリフェラル動作確認などを実施し、故障の早期検出を行う。