機能紹介

監視機能詳細

  • 対応製品:
  • クラウド版
  • スタンダード版

ログ詳細

監視の観点 監視説明
テキストログの監視 ログの監視を行います。正規表現キーワードを用いた詳細な監視が可能です。

・Logキーワード監視との違い
Logキーワード監視ではawkというコマンドを用い監視をおこなっています。対してログ詳細監視では 対象機器側にperlソースを置き、その実行結果を監視する方式を取っているため、Logキーワード監視 に比べ、高速、大容量のログにも対応可能となっています。また、設定内容もより詳細に設定が 可能になっています。

・設定方法
対象機器側の監視をおこないたいログファイル(テキストベースである必要があります)のフルパス を「ファイルパス」に設定します。
このとき、様々なルールでログファイルを指定できます。詳しくは画面上の注意点をご覧下さい。 次に、「ローテートの判定方法」を設定します。通常はinodeでの判断で問題ありません。inodeでの判断が できない場合はファイルサイズでの判断を使用して下さい。
次の「正規表現キーワード」では、実際にログ内に現れる検知したいキーワードを設定します。 表記方法等については画面の注意事項、記述例等をご覧下さい。
ご注意いただきたい点としましては、タグに関しては英数文字のみの入力となっておりますのでご注意下さい。 また、このタグは置き換え文字列「_ERRMSG_」内に表記されますので、アラート時の判断等にご利用下さい。

「その他の判定」では、ログサイズでの判定、ログ行数での判定、ログの増加での判定等の設定が可能です。 特に上記の判定が必要でない場合は設定する必要はありません。

「復旧アクション設定」では、エラー状態からの復旧方法を選択することが出来ます。 「手動で復旧を行う」(アラート発生後、現在アラート情報画面等から手動で復旧ボタンが押下されるまで、エラー状態のままとなります。)か、「自動で復旧させる」(アラート発生後、次回以降の監視時にエラー条件にマッチするログが存在しなければ、その時点で自動的に復旧となります。)のどちらかを選択可能です。

また、手動復旧の場合、アラートを検知したあとは画面上はアラート状態が継続されますが、 監視は継続しておこなわれており、内部的には復旧している場合があります。 そのためアクションの動作が画面上と違ってしまう場合がありますので、 手動復旧の場合は「アクション実行回数」を「制限なし※」にして頂くか、アクションの実行をしないように して頂き、運用してください。※「制限なし」は連続で300回までです。

次の「グラフ設定」ですが、グラフに現れるプロットデータのタイトルをつける事が可能です。 また、ここにプロットされるデータに関してはカスタマイズが可能です。 詳しくは画面上の「監視結果のグラフプロットについて」をご覧下さい。

「監視対象ログ行数制限」では監視対象ログ行数を制限することで、突発的に大量にログが出力された場合に監視がタイムアウトするのを防ぐことが出来ます。 但し、ここで設定したログ行数以上のログが存在した場合、超えた分のログの検知は次回以降の監視に回されますのでご注意下さい。

※上記すべての設定を終えた最後に、「プログラムの対象機器への設定&テスト実行 」のリンクを必ずクリックして 下さい。また、設定の変更をおこなった場合も、上記のリンクをクリックする必要がありますのでご注意下さい。

・通知レベル「N」について
通知レベルは「A(アラート)、W(ワーニング)、N(通知なし)」の3種類あります。 このうち通知レベルNのみ、今までの使用方法が違いますのでご注意下さい。 この通知レベルは主に、「通知はおこなう必要は無いが、検知した行数の把握のみしたい」場合か、 「検知した行数でのアラートを出したい」場合等に使用して下さい。


障害の判断

  • 35秒以内に応答が無かった場合
  • 接続エラーが発生した場合
  • 設定した条件に一致した場合
  • 他詳しくは「全体設定→エラーコード一覧」内の「LGM-xxxx」のエラー内容を参照して下さい。

その他特徴

  • 分類:内部監視
  • 監視テスト:実行不可能
  • リカバリ確認モードへの移行:不可能
  • グラフ:レスポンスタイムグラフ、P1〜P4グラフ
  • 対応OS:「全体設定 > 監視モジュール一覧」画面に記載
  • 「リスト→内部監視履歴」にエラー時に検知したログを保存

■まとめ機能について   本製品の監視は内部監視、外部監視という種別があります。内部監視の仕組みは監視間隔が同一の場合まとめて監視をおこなう(一回のログインで、複数の監視をおこなう)という仕組みとなっております。 これは対象機器に対する負荷の軽減をおこなうための機能となります。 ※上記の仕様のため、同一機器の内部監視の同時刻での監視はおこなう内部監視の最大のタイムアウト秒が参照され、実行されます。運用上問題無いようであれば同一機器の内部監視のタイムアウト秒は揃える事をお勧めします。 ※linux,unix系では約35秒のタイムアウトとなっております。値の変更はできません。 ※内部監視で同一IP上に対して一度におこなえる上限監視数は32個となっております。 ※ログ詳細監視等で複数個の監視をおこなった際にタイムアウトエラーが頻発するような場合、指定時間監視を 利用し、対象機器の内部監視の実行時間をずらす事によりタイムアウトエラーが軽減される事があります。 また、対象機器単位で接続エラー等の同一のエラーが同時期に発生した場合、内部監視のエラーアクションはまとめられ実行されます。 これは接続エラー時に大量のメールアクション等が起きないようにするための機能となります。 上記のエラーのアクションのまとめ機能は製品出荷時はONの状態となっていますが、エラーのアクションをまとめたく無い場合、マネージャサーバ上で以下のようにクーロン情報を編集することでエラーアクションをまとめなくなります。 クーロン情報の一行目に下記例のように「CLARICE_ONEBYONE=1」と記述して頂くと、エラーアクションのまとめ機能が働かなくなります。   ​※クラリスユーザーはclとして記述していますので読み替えて実行してください。

crontab -u cl -l

# DO NOT EDIT THIS FILE - edit the master and reinstall.

# (/tmp/crontab.28134 installed on Tue Oct 6 15:17:52 2009)

CLARICE_ONEBYONE=1

0,10,20,30,40,50 * * * * $HOME/bin/dispatch >> log/lastlog.dispatch 2>&1

0,10,20,30,40,50 * * * * $HOME/bin/rrdreport >> log/lastlog.rrdreport 2>&1

・・・・

  check_blチャット監視は単独でおこなわれるため、上記まとめ機能は働きません。  

 

※対象機器の構成、及びに対象ログのサイズ等によっては監視がおこなえない場合があります。
※ローテートされたログが圧縮されていた場合、圧縮された内容を閲覧するようなコマンド(usr/bin/bzcat等)を用い、監視をおこなえる場合があります。実際に解凍するようなコマンドを用いてしまうとログがなくなってしまいますので 十分注意して設定をおこなって下さい。
※この監視は対象機器のログインユーザーのHOMEディレクトリ直下に「.xxxxxxxxxx.pl」(xはランダム)というファイル(perlプログラム)を設置し、そのプログラムを実行し監視を行います。
※設定内容を変更した場合は「プログラムの対象機器への設定」を必ず実行して下さい。
※ログ詳細監視はデフォルトでは検知した結果を先頭行50件、行末50件のみを取得するように設定されています。 この値を変更する必要がある場合、対象機器側に環境変数(CL2016_MAXL)を追加する必要があります。

追加方法例(bashの場合)
・ 対象機器側にクラリスで設定している接続ユーザーでログインします。
・ ログイン後、「cd ;vi .bash_profile」として、「.bash_profile」を編集します。

if [ -f ~/.bashrc ]; then
. ~/.bashrc
fi

# User specific environment and startup programs
#Unset USERNAME
export CL2016_MAXL=5000 ←この行を追加

上記「CL2016_MAXL」に設定された値(上記の場合5000)が最大取得総件数となりますので、この場合は先頭2500件、 行末2500件を取得するような動きとなります。

この設定は監視設定をおこなう前に設定する必要があります。監視設定後に上記値を変更した場合、対象のログ 詳細監視設定の「>>プログラムの対象機器への設定&テスト実行」をクリックし、設置プログラムの更新をおこなう必要があります。

 

対応OS

ポイント数 対応OS
RH WIN Sol AIX FreeBSD etc ESXi
1 × × ×
監視機能一覧に戻る