ビースタイル様
求めるレベルにマッチした高品質なサーバー管理
社内エンジニアの求めるレベルにマッチする高品質な管理サービス
ハートビーツ
マネージドサービスを導入されている「しゅふJOB」はどのような経緯で生まれたのでしょうか。
お客様
私たちは2002年に、パートタイム型人材派遣サービス(現在の「しゅふJOBスタッフィング」)を開始し、2010年から主婦に特化した全国版の求人メディアをスタートをさせ、それが現在の「しゅふJOB」になります。派遣サービスのWebサイトは派遣登録を促すのが目的で、サイト自体が収益を生むものではありませんが、求人メディアの場合は求人情報を掲載いただくことがビジネスになります。そのため、弊社のサービスにおいて「しゅふJOB」は、もっとも高いサービスレベルや信頼性が求められるWebメディアだと認識しています。
ハートビーツ
弊社がサーバー管理を担当する以前はどのような体制だったのでしょうか。
お客様
求人メディア事業の拡大にともなって売り上げも伸び、規模相応のサービスレベルが必要だという認識が強まったのが2017年〜2018年ごろです。そこで社員初のインフラエンジニアとして、現在社内のインフラを担当が者が入社しました。その結果、監視や障害対応も社内でできるようにはなりましたが、「自分たちが支えなければ誰がやる」というコミットが強いエンジニアが多いものですから、トラブルがあると休日でも夜間でも四六時中仕事をしてしまいがちなんですよね。ただ、組織を預かるマネージャーとしては、個人に負荷が偏り過ぎる状態は改善しなければならないし、エンジニアの健康管理という観点でも、やはり健全ではないと思っていました。
ハートビーツ
まさに「健康経営」の視点ですね。
お客様
そこを何とかしたいと、監視や一次対応をお任せできる会社を探すことになりましたがミスマッチがあってあまりうまくいかなかったのです。環境構築におけるレビュアーとしての期待もあったのですが、質問を投げたときに「それは分かってる」という回答が割と多かったようなんですね。社内のエンジニアが求めているレベルとマッチングしなかったというか。
ハートビーツ
スキルマッチする会社を探すなかで、弊社にご相談いただいたと。
お客様
状況が変わらなかったので改めて探そうということになり、それで相談させてもらいました。ハートビーツさんと最初にお会いして話したときに「同じような状況のお客さまで、弊社のサービスを導入いただくことが多いんです」というのを聞いて、「まさにそのパターンだ!」と(笑)。それで期待を持ってハートビーツさんのマネージドサービスへ切り替えたわけです。
提案が的確で、返事は「それでいきましょう」の一言で済む
ハートビーツ
切り替えの決め手となったポイントは、どのようなことだったのでしょうか。
お客様
一次対応だけでなく、その後の二次対応も受け持ってもらうことで、「発生する障害の数を減らして速やかにサービス復旧できるようになれば、私たちだけではなくハートビーツさん側の対応工数も減る」という状況に変えられたのが大きかったと思います。「パートナーとして双方が共に、いい方向に向かっていける」、エコシステムのような契約だと感じられたのが決め手でした。結果としては、総合的な対応をお願いできるマネージドサービスをお願いしてよかったと思います。
ハートビーツ
現場を預かるエンジニアの視点から、改善された点などがありましたら教えてください。
お客様
障害が起きたときに、私の方からアクションを起こす前に、ハートビーツさんの側からさまざまな提案をいただけるので、私の負荷が減って楽になりました。提案の内容もほぼ最適解なので、「それでいきましょう」とすぐにジャッジできます。こちらからの相談に対してもフレキシブルに対応してくれています。「Nginxのconfigでこういうことをしたい」と相談したら、細かく設定方法を調査してくれるだけでなく、ハートビーツさん側の環境で実装テストしたあと、当社の環境で実装したのですが、うまくいかずハートビーツさんに当社の環境にログインしてもらって設定をサポートしていただいたこともありました。
ハートビーツ
スキルがお眼鏡にかなってお役に立てているようで、こちらもうれしいです。
お客様
ついこの間も、夜間にアラートがあって、ハートビーツさんからお電話をいただいたことがありました。ある閾値の設定を変えたことを共有漏れしていたのですが、夜中にその設定変更が原因でアラートが飛びまして、「しまった、共有し忘れた、大丈夫かな」と思っていたときに…。ハートビーツさんから「変更されたと思うので閾値を変えていいですか」とご連絡をいただき「はい、お願いします」の一言で、コンソールに入らずに電話1本でできたので大変助かりました。ハートビーツさんにお願いするようになってから、障害時にサーバーに入ったり、コンソールに入る回数は本当に減りましたね。いち早く状況を教えてくれるので、該当のログを見て解決方法を考えることに時間を使えるようになって、調査の工数が減ったのが大きいと思います。
インフラのトラブル対応が減り、開発の遅延もなくなる
ハートビーツ
障害対応の初動において、重要なのはどのような点だとお考えでしょうか。
お客様
サーバーの管理をしていると、毎日同じようなことも起きますが、さまざまな要因が複合的に絡まって初めて見るトラブルだったり、同じように見えてもシチュエーションによって判断が変わってきたりするもので、その都度「どこを調査すべきか」という勘所が求められます。対応の方針が決まる調査という重要なポイントを、手分けできるのがいいところだと思います。オペレーターが対応以前の工程に対しても能動的に動いてくれる会社やプランは、あまりないのではないでしょうか。
ハートビーツ
コミュニケーションの面ではご満足いただけているでしょうか?
お客様
基本的にはSlackとプロジェクト管理ツールを使って依頼をしています。頻繁にやり取りが発生するタスクについては、Slackで対応してもらっています。社内でも日常的にSlackを使っているため、ハートビーツさんともシームレスに連絡できるのは便利ですし、反応もすごく早いのではかどりますね。コミュニケーションの小さなストレスが軽減されて、トータルの作業時間や障害復旧からの回復時間も短くなりました。
ハートビーツ
管理以外の面で、弊社に管理をお任せいただくことで変化したことはありましたか?
お客様
もし、現在の状況で社内のスタッフだけでサーバーの管理を行うとなると、人手が足りず、以前のように他の部署で開発に当たっているエンジニアたちの手を借りざるを得なくなるでしょう。開発とサーバー管理との同時並行は無理なことで、開発の手が止まってしまいます。トラブル対応で1〜2週間、開発が遅れるとその開発の効果を享受できる時期も遅れてしまうので、混乱は大きかったでしょうね。
以前はインフラのトラブルが原因で、事業部の開発スケジュールを調整したことが何度かあった覚えがありますが、最近はインフラのトラブルによる開発遅延はなくなりましたね。
例えばゲームだったら、万が一アクセスできないときは「明日にログインしようか」と思うこともあるかもしれませんが、求人情報を探そうと思ったタイミングに、サーバー障害で閲覧できなかったりすると、すぐに競合他社のサイトに行ってしまうはずです。特に、初めてサイトを訪問される方に安定したレスポンスを返すことは、非常に重要だと思っています。インフラ周りは、ハートビーツさんのおかげで「仮に何かトラブルがあっても大丈夫」という安心感がありますね。
最後に一言
河村さん
ビースタイル様
「しゅふJOB」を利用される主婦の方は、1日中非常に忙しく過ごすなかでの、本当に貴重な空き時間を使って働く先を探されていると思います。もしその時間でこれから働く会社と接点を持てなかったら、かけがえのない仕事に出会うきっかけを失ってしまう可能性だってあります。だからこそ「サービスレベルを高めること」とともに、「いつでも安定して利用できること」は、私たちが想像する以上に大切なことだと捉えています。「しゅふJOB」にいつアクセスされても、安心して仕事を探せるよい出会いを主婦の方へ提供する場となるよう、ハートビーツさんとともにインフラの安定性に力を注いでいきたいと思います。
いつでもユーザーが利用できる状態にサービスを保ち続けるためには、インフラエンジニアの役割は欠かすことができません。インフラエンジニアがもし倒れてしまったら、それがもとで障害が発生してしまったら、ユーザーにとっても会社にとっても大変な影響が出ます。20歳代の半ばから、ずっとインフラエンジニアとして仕事を続けてそろそろ40歳になり、若いころは夜通しでサービスの稼働を守れましたが、今では「自分の心と体の健康を守ることがすなわち、サービスを守ることだ」という意識が強くなりました。お願いできるところはハートビーツさんにお任せして、自分も開発者も健やかに仕事できる環境づくりに注力していきたいと思っています。
河村 喬樹(かわむら たかき)
Tech&Marketing本部 システム基盤ユニット ユニット長 / インフラエンジニア