監視一次対応サービスとは?
監視一次対応サービスはハートビーツのトレーニングされたエンジニアによる24時間365日の有人監視サービスと、手順書に基づく一次対応を提供します。お客様が運営、管理しているホームページ、サーバを安定して運用するためには、サーバの状況変化、障害発生を早期に検知し、対応を開始することが大切となります。
サーバ運用の
プロが対応
経験豊富なサーバ技術者が様々なノウハウを提供しお客様のお問い合わせにも素早くお答えします。
障害の早期検知、
早期復旧が可能
24時間365日有人監視体制で、万が一のシステムダウンを最小限に
監視項目策定、
対応手順作成も
おまかせ
導入前の環境調査から監視項目の策定、一次対応手順の作成までハートビーツにおまかせください
詳細項目
監視仕様書作成 | システムに合わせ、監視項目・閾値の策定、およびトラブル発生時の一次対応手順を作成します。 |
---|---|
24時間365日システム監視&通知 | ハートビーツが管理する監視システム(2拠点)より監視を行います。障害を検知した際はメールにて通知されます。 |
トラブル発生時の一次対応 | 監視仕様書に定めた内容に基づき、一次対応を行います。トレーニングを受けたエンジニアが対応に当たります。 |
トラブル発生時の緊急電話連絡 | 連絡先リストに架電し、3順して不達の場合メール報告致します。 ・リスト数:1つ(※複数の部門へのご連絡などはできません) ・登録連絡先数:10件程度(※ご相談ください) |
トラブル発生時のベンダ問い合わせ代行 | クラウド事業者やデータセンター、各保守ベンダ窓口への問合せを代行致します。 |
対応報告 | 障害一次対応完了後、障害発生状況、原因、対応内容、電話連絡実施状況などをまとめてメールにてご連絡致します。 |
監視設定変更 | 監視設定変更作業を行います。アクセス状況やアラート発報状況に応じて、監視閾値変更、監視項目追加・削除のご提案を差し上げます。 |
システム改善提案 | トラブル発生原因、対策について障害対応にあたったエンジニアがベストエフォートでご提案致します。 |
監視仕様
有人体制 | 障害検知時、ハートビーツ監視担当者が即時に現象を確認し、正確な状況判断を的確に行います |
---|---|
監視拠点 | 弊社データセンター 2拠点 (別回線キャリア利用)※非同期 経路障害などによる誤検知にも対応しています |
監視間隔時間 | 3分間隔 |
監視方法 | 監視システムからサーバにアクセス、値を取得し障害を検知いたします。 値が取得できない場合もアラートが発生するため、監視対象サーバが完全に停止するような障害時でもアラートメールは送信されます。 監視ツールはNagiosとなります |
情報共有 | 弊社でメーリングリストを作成し、お客様担当者、監視担当者を登録し情報共有いたします |
障害通知 | 監視システムが障害を検知し、アラートメールがメーリングリスト宛に送信されます。 障害回復時はリカバリーメールが送信されます |
対応報告 | 監視担当者がアラートに対する対応報告をメーリングリスト宛に送信します |
一次対応例
障害確認 | 一次対応手順 |
---|---|
ホームページが表示されない | Webサービスの再起動 |
DBサーバに接続ができない | スタンバイサーバへの切り替え |
サーバへの疎通が確認されない | サーバ再起動 ※物理機器の場合はiDCへ電話にて依頼 |
ディスクの使用量が80%を超えた | ディスク容量を圧迫しているファイル、ディレクトリを確認し、指示により削除または圧縮 |
システムログに"Error"の文字列が出力された | 該当ログを抜粋し、ご連絡 |
独自プラグインにて事象を検知 | お客様作成スクリプトの起動、ログの確認 |
障害確認と一次対応手順 | |
---|---|
ホームページが表示されない | Webサービスの再起動 |
DBサーバに接続ができない | スタンバイサーバへの切り替え |
サーバへの疎通が確認されない | サーバ再起動 ※物理機器の場合はiDCへ電話にて依頼 |
ディスクの使用量が80%を超えた | ディスク容量を圧迫しているファイル、ディレクトリを確認し、指示により削除または圧縮 |
システムログに"Error"の文字列が出力された | 該当ログを抜粋し、ご連絡 |
独自プラグインにて事象を検知 | お客様作成スクリプトの起動、ログの確認 |
対応システムの
準備について
※お客様環境によってご相談させていただきます。お気軽にお問い合わせください。
-
監視エージェントのインストール
各サーバに監視エージェントのインストールが必要となります。
-
弊社監視システム拠点IPアドレスからの接続許可
弊社監視システムより監視通信をさせるため、弊社監視システム拠点のIPアドレスからの、 SSH接続用ポートおよび監視用ポートへの接続を許可していいただく必要があります。
-
障害確認、一次対応作業のためのアカウント発行
一次対応作業を行う場合は、監視担当者用アカウントに作業内容に応じた権限をいただく必要があります。
-
サーバ設置不要
弊社が管理する監視システムを使用するため、弊社監視システムからの監視を実行するために新たにサーバをご用意いただく必要はありません。
監視項目一覧
ネットワーク監視 | PING | 経路上の遅延、サーバダウンを検知 |
---|---|---|
サービス稼働監視 | HTTP | ホームページの表示遅延、表示不可を検知 | HTTPS | HTTPSホームページの表示遅延、表示不可を検知 | POP | 110番ポートの接続遅延、接続不可を検知 | SMTP | 25(または587)番ポートの接続遅延、接続不可を検知 | FTP | 21番ポートの接続遅延、接続不可を検知 | SSH/TELNET | 22(または23)番ポートの接続不可を検知 | その他ポート監視 | 指定ポートの接続遅延、接続不可を検知 |
リソース監視 | ロードアベレージ | サーバの負荷上昇を検知 | SWAP使用率 | SWAP使用率上昇を検知 | DISK使用率 | ハードディスク残容量の減少を検知 | ログインユーザ数 | サーバへログインしている人数の増加を検知 | プロセス総数 | 稼働プロセスの増加や、プロセスの多重起動などを検知 | ゾンビプロセス数 | 不要プロセスの残存を検知 | その他リソース監視 | ご要望のリソース変化を検知 |
その他 | システムログ | サーバログ(/var/log/messages)の指定文字列検知 | アプリケーションログ | Apacheログの指定文字列を検知 | データベース接続 | WEBサーバからDBサーバへの接続を検知 | その他ご希望の監視 | 監視プラグインを作成し、障害現象を検知 |
通常対応フロー
基本対応フロー
- 3分間隔で監視を行うため、障害の早期発見が可能です。
- 障害が継続するようであれば、仕様書に基づき作業を行います。
導入後の体制
監視サービス開始までの基本フロー
サービスレベル目標(SLO)
監視一次対応サービス及びフルマネージドサービスのSLOは以下のとおりとなります。
アラートメール受信から対応開始までの時間 | 10分以内 |
---|---|
サービス提供時間 | 24時間365日 |
前提条件 | このSLOはハートビーツの監視一次対応サービス(フルマネージドサービスのうち監視一次対応サービス相当部分)のハートビーツ担当作業分を対象とします |
SLOの対象 | 両社合意のもと締結した監視仕様書に基づく |
サービスレベル目標(SLO)対象外
- サーバやネットワークの性能に起因する予見不可の事象
- クラウドサービス・ネットワーク・電力など、ハートビーツ以外の事業者が提供するサービスに起因する障害
- 利用しているソフトウェアやアプリケーションの不具合など、お客様の環境・作業に起因する事象
- 地震などの天災や、紛争・戦争など不可抗力に起因する事象
- 不注意または故意による不正行為や、DoS/DDoSなどの攻撃に起因する事象
活用方法(ユースケース)
【導入例】企業広報部
企業サイトを制作したけど、サーバ運用できるエンジニアが社内にいない。困ったらサーバを再起動するという現状...もっとちゃんと運用したい!
・監視一次対応 WEB1台
サービスご利用にあたってのご注意事項
-
契約期間
・契約期間は定価でのご利用、年間契約割引適用でのご利用により変更となります。お問合せください。
・契約期間があらかじめ決まっている場合にはご相談ください。
・契約期間中に、監視対象サービス終了などが発生した場合には、残存期間分の費用をお支払いただきます。
-
契約書
・監視一次対応サービス、フルマネージドサービスにつきましては契約書を締結いたします。
-
支払いサイト
・監視一次対応サービス、フルマネージドサービスにつきましては、月末締翌月末払いと一括先払いとをお選びいただけます。
・月額費用につきましては、サービス開始日から日割り計算(1ヶ月を30日とする)となります。
-
免責事項・その他
・監視サービスは障害を早期に検知し対応を行うものとなります。障害を発生させないことを保証するものではございません。
・手順書に基づく対応にて復旧をしない場合は、電話連絡となりますのでご了承ください。
・監視システムからのアクセスに対するアクセス解析などの対応はお客様作業となります。