参考ページ:CLUSTERPRO X 4.0 for Windows リファレンスガイド
P1074~「システム監視リソースを理解する」
本記事では上記リファレンスガイドに沿って、「CLUSTERPRO X System Resource Agent」について紹介します。
Contents
CLUSTERPRO X System Resource Agent とは
CLUSTERPRO X System Resource Agentとは、以下の機能をもつ製品を指します。
CLUSTERPRO X System Resource Agent製品につきましては以下のモニタリソースに利用する際に必要なライセンスとなります。
・システム監視リソース
CLUSTERPRO X System Resource Agent 製品が登録されていない場合は、上記監視リソースを利用することが出来ません。
NEC サポート より
System Resource Agent が無いとどうなる
System Resource Agent が無い場合、OS やハードウェアのステータスに基づいたフェイルオーバが発生しません。例えば、「メモリ使用率が継続的に90%以上を超えている」という状況において、通常の CLUSTERPRO X のみではメモリ使用率を検出できないため、フェイルオーバが発生しません。
つまり、System Resource Agent があれば「ハートビートの途絶から生じるフェイルオーバ」よりも早い段階で回復動作を実行出来るようになります。
System Resource Agent が監視しているもの
監視しているのは以下の4つです。
- プロセス
- CPU
- メモリ
- ディスク
System Resource Agent については、実際にシステム監視リソースの設定画面を見ると理解が早いかと思います。
システム監視リソースの設定画面は以下のようになっています。
Alert Service との組み合わせ
Alert Service でメール通報設定を行っていれば、System Resource Agent の異常時に以下のようなメールが届くようになります。
Message: 監視 sraw1 は異常を検出しました。 (11 : system resource 異常を検出しました)
Type :rm
ID :1509
Host :tp-cluster-sv02
Date :2019/12/24 17:29:35.269
一体何の異常を検知したのか
メールで通報してくれるのはありがたいんですが、デフォルトの状態だとCPU異常なのかメモリ異常なのか、一体何の監視で異常を検知したのかがわかりません。
確認方法として、Cluster WebUI の上部バーからログがダウンロードできるので、「alert」フォルダ内の「alertlog.alt」をテキストで確認する方法ががあります。
ただし、毎回ログをダウンロードして中身を確認するのは明らかに非効率の為、メールにエラー内容を含める方法をご紹介します。
System Resource Agent(sra)のエラー内容をメール本文に含める方法
まず、WebManager のクラスタのプロパティから「アラートサービス」タブを選択し、「アラート通報設定を有効にする」にチェックを入れ、その横にある「編集」をクリックします。
「追加」をクリックします。
カテゴリを「System Resource Agent」、モジュールタイプを「sra」、イベントIDを「20358」にしてください。
そして送信先として「WebManager AlertLog」、「Mail Report」、「EventLog(DisableOnly)」にチェックを入れ、「OK」をクリックします。
同様にイベントID「20359」と「20360」を作成します。
最終的には以下のように3つがある状態になります。
こうすればどのシステムリソースが異常なのかがメールでわかるので便利です。