ソニーペイメントサービス株式会社様
隠れたエラーを検知するユーザー目線の監視とは?
オンプレミスとクラウドを掛け合わせた監視手法でアラート信頼度向上
インタビュー:IT部門 システム管理部長 小池 信夫
IT部門 システム管理部 システム管理課 統括課長 赤羽 朝陽
IT部門 システム管理部 システム管理課 課長 曽根 裕貴
導入理由オンプレミスとクラウドを掛け合わせて実現した
ユーザービリティ監視
まず、はじめにパトロールクラリスを導入した理由についてお聞きしてもよろしいでしょうか?
小池:弊社はクレジットカード決済を中心とした決済代行サービス 「e-SCOTT」を運営しており、多くの加盟店様、エンドユーザ様にご利用いただいております。皆様の生活には欠かすことが出来ない、重要な社会基盤です。当然、そのサービスが正常に稼働しているかを常に監視し、障害を即座に検知・対応する必要があります。
システム監視ツールは様々利用していますが、その一つとしてパトロールクラリスを選定した一番の理由としては、オンプレミス版とクラウド版の両方の提供がされている点になります。
導入当時、コムスクエアさんはオンプレミス版のパトロールクラリスのみのご提供でクラウド版はなかったのですが、弊社の要望をお伝えしたところ、弊社専用のクラウド環境にパトロールクラリスを構築頂き、クラウド版のパトロールクラリスとして提供いただいたという背景もあり、そういった柔軟な対応も評価しております。
▲ソニーペイメントサービスが運営する決済代行サービス 「e-SCOTT」
ご評価ありがとうございます。
なぜ、オンプレミス版とクラウド版の両方の利用が必要だったのでしょうか?
赤羽:導入時の一番の目的はユーザービリティ監視(ユーザー目線での監視)を行うことでした。
パトロールクラリスの導入当初、弊社のシステムは全てオンプレシステムとなっており、データセンター内に全ての機器が設置されていました。システム障害が発生した際に、弊社システム内部に異常があるのか、それとも外部、例えば弊社システムと加盟店様やカード会社様との間の回線に異常があるのか、それを即座に判断する必要がありました。
そのため、データセンター内からはアプライアンス版のパトロールクラリスで監視を行い、データセンターの外部からはクラウド版のパトロールクラリスで監視を行うこととしました。
パトロールクラリスを導入する前も、プロセス監視やシステムリソース監視といったシステム的な監視は当然行ってはおりました。
しかし、それ以外での「加盟店様から発行される取引情報へのレスポンスに異常がないか」などといった、ユーザー目線での監視を行いたいと判断したため導入に至りました。
ユーザービリティ監視についてどのようなことを行っているのかを具体的に教えていただけますか?
パトロールクラリスから弊社システムに対し、一定の間隔でテストリクエストを発行しています。そのテストリクエストがエラーとなった場合、メール通知をさせ、異常を検知するという仕組みです。パトロールクラリスは、テストリクエストに対しどのようなレスポンスが返戻されたらエラーとするか、監視間隔、通知メールの件名など、細かく設定できるのが非常に有効と考えています。
弊社は外部サービス、例えばDNSアウトソースサービスなども利用をしているのですが、それに対する監視でも利用をしています。
導入効果監視の信頼度が格段に向上
導入後の効果としてはいかがだったでしょうか?
赤羽:監視の信頼度が各段に向上したと感じています。他の監視ツールと比較し、お客様への影響という目線でより速やかに異常を検知してくれる、という印象です。他ツールが正常と判断していても、パトロールクラリスからアラートがあがってくることにより、「もしかしたら何処かがおかしいかも」と、調査を開始することが出来ます。
そのため、弊社内でパトロールクラリスは最も信頼できる監視ツールと言えます。
例えば、アプリケーションリリースをした際に、リリース後プロセスは正常に稼働しているように見えるが、稼働検証で取引情報がエラーとなってしまう、といった事象が発生することがあります。
プロセス監視のみだとあくまでプロセスの起動・停止しか検知することができず、ユーザー視点での挙動エラーといった事態の発生を検知することは出来ません。
ですが、パトロールクラリスの場合、先ほどご説明したユーザービリティ監視を行っておりますので、問題を未然に特定し、原因となっているアプリケーションのロジックを改善することができるようになりました。
その他使っている監視項目はありますか?
赤羽:コーポレートサイトのURL階層監視やFTPサイト、外部DNS、外部メールサーバーのSMTP監視など、さまざまな分野をパトロールクラリスで監視しています。
弊社のサポートのご利用状況についてもお聞きしてよろしいでしょうか?
赤羽:使わせていただいております。
新規の設定を入れたい場合や設定がうまくいかない場合にサポートにお問い合わせさせていただいており、迅速に回答頂いておりますので、満足しております。
また、ツールの使い方などの通常サポート以外の部分で困った際に、営業さんに直接ご相談させていただくこともあるのですが、非常に手厚く、ここまで対応してくれるベンダーさんは他にいないと思います。
具体的にはどのようなご相談を頂いたのでしょうか?
曽根:つい最近、AWS上のパケットキャプチャ取得対応を独自オプションとして提供いただきました。
現在は「e-SCOTT」の一部はAWS上で稼働をしています。このシステムに向けてURL監視を行っているのですが、稀に「タイムアウトが発生しました」という監視結果が返ってくることがあります。
システム的には問題が発生していないことは判っているのですが、弊社はビジネスの性質上、可用性をとても重視しており、小さなアラートも見過ごすことが出来ません。原因究明の為にAWSに直接問い合わせをする際に、AWS側からパケットキャプチャの提供を依頼されることがあり、このパケットキャプチャを定期収集するオプションサービスをご提供いただきました。
展望管理機能活用による運用の更なるブラッシュアップ
最後にパトロールクラリスへの要望をお聞かせください
赤羽:開発面では特にございません。
一方、お恥ずかしい話ながらパトロールクラリスの管理機能面(マップ機能やレポート機能など)でまだまだ使いこなせていない部分がございます。
今後、活用していきたいと思っておりますので、もしそういった活用方法のTIPSやトレーニングメニューなどがあればご提供いただければと考えております。