顧客影響に気づけるアラート設計と原因特定が素早くできるSREへ ヤプリが乗り越えてきた監視運用の失敗と改善

     
この動画を視聴するには参加登録が必要です。
このイベントに参加申し込み
(参加無料)

2022年1月、ヤプリは累計1億ダウンロードを実現しました。ユーザーに愛されるサービスであり続けるため、ヤプリのSREチームでは年間200回以上のアップデートを乗り越えながら、フロントエンドまで含めたパフォーマンス改善を可能にする監視モデルを模索してきました。
顧客影響に直接気づくためのアラートの再設計や、アラート以降どのようにして効果的に原因特定を行うかなどインシデント対応と改善を継続。また、事業拡大やトランザクションの拡大に依存しないコスト構造をもつ監視ツールの選定や、スクリプト化したブラウザ監視による擬似ユーザー行動を組み込んだサービスレベル監視の実現など、ヤプリの
SRE が取り組んできた苦労話を聞いてください。ヤプリの取り組みをよりよく理解するために、セッションの前半ではNew Relicから前提知識を解説します。

望月 真仁
株式会社ヤプリ
SREグループ マネージャー

株式会社ヤプリのSRE、当初はQAエンジニアとしてジョインした後にSREに転向、現在はSRE/IT(情シス)の運営を行いながらインフラセキュリティ・社内情報セキュリティ両面の強化を推進中。

佐々木 千枝
New Relic 株式会社
オブザーバビリティ技術本部 部長

外資系ハードウェアベンダーおよびソフトウェアベンダーを経て現職。お客様のITシステムを運用していた経験を生かし、お客様が長期的に幸せになるソリューションの提供を日々心がけている。得意分野は仮想化技術(コンテナ含む)とクラウド。