HEARTBEATS

運用技術の最近のブログ記事

こんにちは。エンジニアリングチームの照井です。初めてインフラエンジニアwayに投稿します。

Cloud Operator Days Tokyo 2022 というイベントにおいて、「文書作成ソフトからの脱却 ~Markdownによるアラート対応手順書CI/CD~」という題名で「社内ドキュメント作成の自動化」について動画登壇させていただきました。このイベントではハートビーツがゴールドスポンサーとなっております。

なお、登壇動画はイベントページにて2022/06/27より公開されております。

こんにちは。技術開発室の小嶋です。

技術開発室運用技術開発チームが担当している hbdesk というプロダクトにおいて、GKE (Google Kubernetes Engine)クラスタのアップグレード通知を設定する機会がありましたので紹介します。

GKE (Google Kubernetes Engine)は、Google社のパブリッククラウドサービスであるGCP (Google Cloud Platform)上で提供されているKubernetesのマネージド・サービスです。

          

クラウドと可用性

   

こんにちは、技術開発室の滝澤です。 今回はクラウドと可用性についてのポエムを書いてみたいと思います。

まとめを最初に書くと次のようになります。

  • 原則としては、ゾーン冗長構成にすることで可用性は向上する。
  • クラウド事業者側のソフトウェアのバグやヒューマンエラーなどが原因の障害ではゾーン冗長構成でも回避できない場合がある。
  • マルチリージョン構成やマルチクラウド構成は本当にそのレベルの可用性が必要かどうかを検討する。

こんにちは、滝澤です。

今回は"The ETTO Principle"(効率-徹底性トレードオフ原則)について紹介します。ここでは「ETTO原則」と呼ぶことにしましょう。 ETTO原則はレジリエンス・エンジニアリングで著名なエリック・ホルナゲル氏(Erik Hollnagel)が提唱したもので、効率性(Efficiency)と徹底性(Thoroughness)はトレードオフの関係にあるというものです。 これは、元々は安全に関する分野での話ではあるのですが、IT分野においても無縁というわけではありません。そのあたりの話を紹介します。

本記事を3行でまとめると次のようになります。

  • ETTO原則により効率性と徹底性はトレードオフの関係にある。
  • ITシステムの運用の例として作業手順書作成の例を示し、効率性と徹底性のバランスを考える必要があることを示した。
  • システム障害と根本原因分析について紹介し、根本原因分析を徹底的に行うのが難しいということを示した。

こんにちは。CTOの馬場( @netmarkjp )です。

新年らしい仕事をしてみよう、ということで、 現時点と今後のエンジニア界隈の展望をまとめました。

毎月やっている社内勉強会でも話しましたが、 自社の今後の戦略について考えるネタにするのと、 直近で SRE NEXT 2020 などのイベントがあり、 エンジニアとしてのポジショニングや振る舞いについて考える機会が多そうなので、 そのベースラインとして整理したという意図もあります。

観測範囲や観測者の立ち位置によってわたしと全く異なる見解になる方もいると思うので、 ぜひ情報交換させてください。

株式会社ハートビーツの技術情報やイベント情報などをお届けする公式ブログです。