監視一次対応サービス

監視一次対応サービスとは?

監視一次対応サービスとは?

監視一次対応サービスはハートビーツのトレーニングされたエンジニアによる24時間365日の有人監視サービスと、手順書に基づく一次対応を提供します。お客様が運営、管理しているホームページ、サーバを安定して運用するためには、サーバの状況変化、障害発生を早期に検知し、対応を開始することが大切となります。

サーバ運用の
プロが対応

経験豊富なサーバ技術者が様々なノウハウを提供しお客様のお問い合わせにも素早くお答えします。

障害の早期検知、
早期復旧が可能

24時間365日有人監視体制で、万が一のシステムダウンを最小限に

監視項目策定、
対応手順作成も
おまかせ

導入前の環境調査から監視項目の策定、一次対応手順の作成までハートビーツにおまかせください

詳細項目

監視仕様書作成システムに合わせ、監視項目・閾値の策定、およびトラブル発生時の一次対応手順を作成します。
24時間365日システム監視&通知ハートビーツが管理する監視システム(2拠点)より監視を行います。障害を検知した際はメールにて通知されます。
トラブル発生時の一次対応監視仕様書に定めた内容に基づき、一次対応を行います。トレーニングを受けたエンジニアが対応に当たります。
トラブル発生時の緊急電話連絡連絡先リストに架電し、3順して不達の場合メール報告致します。
・リスト数:1つ(※複数の部門へのご連絡などはできません)
・登録連絡先数:10件程度(※ご相談ください
トラブル発生時のベンダ問い合わせ代行クラウド事業者やデータセンター、各保守ベンダ窓口への問合せを代行致します。
対応報告障害一次対応完了後、障害発生状況、原因、対応内容、電話連絡実施状況などをまとめてメールにてご連絡致します。
監視設定変更監視設定変更作業を行います。アクセス状況やアラート発報状況に応じて、監視閾値変更、監視項目追加・削除のご提案を差し上げます。
システム改善提案トラブル発生原因、対策について障害対応にあたったエンジニアがベストエフォートでご提案致します。

監視仕様

有人体制障害検知時、ハートビーツ監視担当者が即時に現象を確認し、正確な状況判断を的確に行います
監視拠点弊社データセンター 2拠点 (別回線キャリア利用)※非同期
経路障害などによる誤検知にも対応しています
監視間隔時間3分間隔
監視方法監視システムからサーバにアクセス、値を取得し障害を検知いたします。
値が取得できない場合もアラートが発生するため、監視対象サーバが完全に停止するような障害時でもアラートメールは送信されます。
監視ツールはNagiosとなります
情報共有弊社でメーリングリストを作成し、お客様担当者、監視担当者を登録し情報共有いたします
障害通知監視システムが障害を検知し、アラートメールがメーリングリスト宛に送信されます。
障害回復時はリカバリーメールが送信されます
対応報告監視担当者がアラートに対する対応報告をメーリングリスト宛に送信します

一次対応例

障害確認一次対応手順
ホームページが表示されないWebサービスの再起動
DBサーバに接続ができないスタンバイサーバへの切り替え
サーバへの疎通が確認されないサーバ再起動 ※物理機器の場合はiDCへ電話にて依頼
ディスクの使用量が80%を超えたディスク容量を圧迫しているファイル、ディレクトリを確認し、指示により削除または圧縮
システムログに"Error"の文字列が出力された該当ログを抜粋し、ご連絡
独自プラグインにて事象を検知お客様作成スクリプトの起動、ログの確認
障害確認と一次対応手順
ホームページが表示されないWebサービスの再起動
DBサーバに接続ができないスタンバイサーバへの切り替え
サーバへの疎通が確認されないサーバ再起動 ※物理機器の場合はiDCへ電話にて依頼
ディスクの使用量が80%を超えたディスク容量を圧迫しているファイル、ディレクトリを確認し、指示により削除または圧縮
システムログに"Error"の文字列が出力された該当ログを抜粋し、ご連絡
独自プラグインにて事象を検知お客様作成スクリプトの起動、ログの確認

対応システムの
準備について


監視項目一覧

ネットワーク監視PING経路上の遅延、サーバダウンを検知
サービス稼働監視HTTPホームページの表示遅延、表示不可を検知
HTTPSHTTPSホームページの表示遅延、表示不可を検知
POP110番ポートの接続遅延、接続不可を検知
SMTP25(または587)番ポートの接続遅延、接続不可を検知
FTP21番ポートの接続遅延、接続不可を検知
SSH/TELNET22(または23)番ポートの接続不可を検知
その他ポート監視指定ポートの接続遅延、接続不可を検知
リソース監視ロードアベレージサーバの負荷上昇を検知
SWAP使用率SWAP使用率上昇を検知
DISK使用率ハードディスク残容量の減少を検知
ログインユーザ数サーバへログインしている人数の増加を検知
プロセス総数稼働プロセスの増加や、プロセスの多重起動などを検知
ゾンビプロセス数不要プロセスの残存を検知
その他リソース監視ご要望のリソース変化を検知
その他システムログサーバログ(/var/log/messages)の指定文字列検知
アプリケーションログApacheログの指定文字列を検知
データベース接続WEBサーバからDBサーバへの接続を検知
その他ご希望の監視監視プラグインを作成し、障害現象を検知

通常対応フロー

基本対応フロー


通常対応フロー

導入後の体制

導入後の体制

監視サービス開始までの基本フロー

監視サービス開始までの基本フロー


サービスレベル目標(SLO)

監視一次対応サービス及びマネージドサービスのSLOは以下のとおりとなります。

アラートメール受信から対応開始までの時間10分以内
サービス提供時間24時間365日
前提条件このSLOはハートビーツの監視一次対応サービス(マネージドサービスのうち監視一次対応サービス相当部分)のハートビーツ担当作業分を対象とします
SLOの対象両社合意のもと締結した監視仕様書に基づく

サービスレベル目標(SLO)対象外


活用方法(ユースケース)

【導入例】企業広報部

企業サイトを制作したけど、サーバ運用できるエンジニアが社内にいない。困ったらサーバを再起動するという現状...もっとちゃんと運用したい!

・監視一次対応 WEB1台


サービスご利用にあたってのご注意事項


その他のサービスサービス一覧

監視一次対応サービス

マネージドサービス

サーバ設計・構築/
その他オプションサービス

クラウド移転・
導入支援

セキュリティ導入・
運用代行

インフラ診断
コンサルテイング

脆弱性診断

インフラエンジニアway
インフラエンジニア勉強会hbstudy