Yahoo! JAPAN クラウドプラットフォーム本部では、サービスが開発に集中できる基盤を提供することをミッションに、多数のPFを運用しています。
安定した基盤を提供し続けるためには、事故に対して現場だけでなく組織としても対策を講じていく必要があります。
本セッションでは、運用者が避けて通ることのできない「事故」について組織としてどう向き合ってきたのか、2年間の取り組みと成果を紹介いたします。
ヤフー株式会社所属。オークション、ショッピング運用を経て、Private PaaSチームSREマネージャーとなる。現在はScrumMasterとしての活動を軸に、チームマネジメントや組織の事故対策、カオスエンジニアリング推進など取組中。
ヤフー株式会社所属。広告システム開発、Private PaaS開発及びPOを経て、現在はKaaS (Kubernetes as a Service) のSRE。
KaaSをはじめ、ヤフークラウドプラットフォーム領域における事故削減の取り組みを推進している。趣味はドライブ。クラウドでもドライブでも安全運転に努めている。