Logキーワード

2019年1月1日 2019年11月19日

hasegawa

ログ内のキーワードを監視します。機器にログインし、指定されたログ内に設定されたキーワードの発生についての監視が可能です。
この監視では、指定したファイルに設定したキーワードが現れるかどうかを監視します。ログに現れる一定のキーワードを監視したい場合等で使用する事が可能です。
※クラリスユーザーが読めるテキスト形式のログであればどんなログでも監視可能です。

設定方法

｢ログ設定｣の部分に、監視をおこないたいログファイルのフルパスを入力します。（例：/log/err.log）
「ワーニング閾値」には、監視対象のログファイルのサイズでワーニングを発生させたいログ全体のサイズを入力します。（デフォルトは500Mbyteです。）次の「アラート閾値」も同様に、アラートを発生させたいログ全体のサイズを入力します。特にサイズでアラートを発生させない場合はデフォルトのままで構いません。
｢ログ増加判定｣では、ログが増加していない場合にアラートを発生させたい場合は「ログが増加していない場合はエラーとし、アラートを発生させる。」をチェックして下さい。それ以外の場合はデフォルトのままで問題ありません。
「監視対象行設定」は、「自動」と「手動（ローテート対応）」「手動」を選ぶ事が可能です。
「自動」の場合、自動で監視する行を更新します。（例：最初の監視で200行あるログを監視し、次の監視をおこなった際に250行ログがあった場合は増加した50行を監視対象とします。次の監視対象は250行目以降のログとなります。）
「手動」の場合は、監視対象とする行を固定する事が可能です。（例：手動で100行で固定にしていた場合、常に100行目以降のログを監視対象とします。）「手動（ローテート）」の場合は、監視対象とする行を固定する事が可能ですが、ログファイルがローテート等をされていた場合に、設定された行数以前も監視対象行として障害を検知します。（例：手動で100行で固定にしていた場合にログファイルがローテートされた場合、100行以前も監視対象となります。）
※「自動」にしている場合は、例でいうと200行目を監視した時点でチェック対象のキーワードがあり、アラートが発生した場合に、次の監視では200行目以降が監視対象なので、アラートは発生しない（復旧）という状態になります。「手動」の場合は、ユーザーが設定を変更しない限りは常にアラートが発生している状態となります。
「ログキーワードチェック設定」は、実際にチェックしたいキーワードを正規表現の記述で入力します。画面上に例があるので、参考にし、設定をおこなって下さい。
※マルチバイト（日本語等）をキーワードにする場合は、その下にあるツールでヘキサコードに変更し、設定をおこなって下さい。別画面で変換、復元が可能です。
「エラー判定方法」では、キーワードが一致した場合にエラーとするのか、一致しない場合にエラーとするのかを選ぶ事が出来ます。
「グラフ設定」では、グラフのタイトルをつける事が可能です。

障害の判断

35秒以内に応答が無かった場合
接続エラーが発生した場合
設定した条件に一致した場合
その他、「エラーコード一覧」のエラー内容を参照して下さい。

その他特徴

分類：内部監視
監視テスト：実行不可能
リカバリ確認モードへの移行：不可能
グラフ：レスポンスタイムグラフ、ログファイル行数グラフ、エラー行数グラフ

対応OS

ポイント数：1

RH	WIN	Sol	AIX	Free BSD	vm	AWS	Azure	etc
○	×	○	○	○	×	×	×	×

監視の種類: 内部監視

監視項目: ログ監視

本製品の監視は内部監視、外部監視という種別があります。内部監視の仕組みは監視間隔が同一の場合まとめて監視をおこなう（一回のログインで、複数の監視をおこなう）という仕組みとなっております。これは対象機器に対する負荷の軽減をおこなうための機能となります。

※上記の仕様のため、同一機器の内部監視の同時刻での監視はおこなう内部監視の最大のタイムアウト秒が参照され、実行されます。運用上問題無いようであれば同一機器の内部監視のタイムアウト秒は揃える事をお勧めします。

※linux,unix系では約35秒のタイムアウトとなっております。値の変更はできません。

※内部監視で同一IP上に対して一度におこなえる上限監視数は32個となっております。

※ログ詳細監視等で複数個の監視をおこなった際にタイムアウトエラーが頻発するような場合、指定時間監視を利用し、対象機器の内部監視の実行時間をずらす事によりタイムアウトエラーが軽減される事があります。また、対象機器単位で接続エラー等の同一のエラーが同時期に発生した場合、内部監視のエラーアクションはまとめられ実行されます。これは接続エラー時に大量のメールアクション等が起きないようにするための機能となります。上記のエラーのアクションのまとめ機能は製品出荷時はONの状態となっていますが、エラーのアクションをまとめたく無い場合、マネージャサーバ上で以下のようにクーロン情報を編集することでエラーアクションをまとめなくなります。クーロン情報の一行目に下記例のように「CLARICE_ONEBYONE=1」と記述して頂くと、エラーアクションのまとめ機能が働かなくなります。

※クラリスユーザーはclとして記述していますので読み替えて実行してください。

crontab -u cl -l
# DO NOT EDIT THIS FILE - edit the master and reinstall.
# (/tmp/crontab.28134 installed on Tue Oct 6 15:17:52 2009)
CLARICE_ONEBYONE=1
0,10,20,30,40,50 * * * * $HOME/bin/dispatch >> log/lastlog.dispatch 2>&1
0,10,20,30,40,50 * * * * $HOME/bin/rrdreport >> log/lastlog.rrdreport 2>&1
・・・・

※チャット監視は単独でおこなわれるため、上記まとめ機能は働きません。

Logキーワード

設定方法

障害の判断

その他特徴

対応OS

Winトラフィック

MySQL