監視の最近のブログ記事

こんにちはCTOの馬場です。 今回は弊社で実際に運用している『ちょっと珍しい監視項目』を紹介します。

こんにちは、滝澤です。

みなさん、提供しているサービスの外形監視を行っていますか。 DNSレコードの変更ミスやドメイン名の失効などを起因とする障害に早く気づけるようになっていますか。

ということで、今回は外形監視におけるフルリゾルバー(キャッシュDNSサーバー)のキャッシュ保持期間について考えてみます。

その昔hbstudyで @kazuho さんは言いました

「監視は継続的なテストである」

というわけでこんにちはCTOの馬場です。 今回は弊社で実際に適用しているテストケースを紹介します。

こんにちは。CTOの馬場です。

ログをもとに自動的にブラックリストを運用できる Fail2ban というソフトウェアがあります。

とても便利で弊社でもよく使っているのですが、ひとつ大きな落とし穴がありました。 今回は年末年始を安心して迎えるための、fail2banのbugfixについての小ネタです。

こんにちは。斎藤です。

前回につづき、当社で実践しているITインフラ構築・運用の自動化やコード化のお話になります。今回は、hb-acns(あくねす、といいます)といって、当社の監視・メトリック取得設定の自動化を行う内製のシステムについてご紹介します。

※最後にお知らせがあります

TL;DR

  • データセンタ・IaaS事業者が入り乱れている中で、既存ツールで自動化するのが難しかった。また、既存業務をできる限り維持したい。そこで内製した。
  • hb-acns は軽量なエージェントとサーバで構成される。そのうえで、既存の監視システムに設定を自動登録できるシステムとなっている。
  • 監視設定時間が1/10に短縮されるなど、大きな導入効果が得られた。
  • Issue, PRベースで開発を進めることで、利用者が自分のツールとして理解し、利用するようになり、そして改善に協力してもらえた。