SRE課の飯野です。
去る2023/9/29(金)、『SRE NEXT 2023』が開催されました。
弊社SRE課からも6名が現地参加し、熱量あふれるたくさんのセッションを肌で体感してきました。
本ブログでは、SRE NEXT参加後にメンバーで実施した感想戦の内容をお届けします。
目次
SRE NEXTとは?
SREに関わるトピックを扱う日本国内の大型カンファレンスです。
今年は約3年半ぶりにオフラインでも開催され(オンライン配信もありのハイブリッド方式)、東京・九段下の九段会館テラスにて行われました。
信頼性に関するプラクティスに深い関心を持つエンジニアのためのカンファレンスです。 同じくコミュニティベースのSRE勉強会である「SRE Lounge」のメンバーが中心となり運営・開催されます。
SRE NEXT 2023は「Interactivity」「Diversity」「Empathy」という3つの価値観を掲げ、「双方向性のある意見交換の場にすること」「スタートアップから大企業まで、幅広い業種・領域・フェーズでのSRE Practice の実践を集約すること」「ビジネスサイド含めSRE以外の職責も含めて裾野を広げること」を意識して運営していき、より多様なSREの実践が普及することを目指します。
(公式サイトより)
トータル1,000名を超える申込があり、オフライン参加の申込も220名ほどいらっしゃったようです。
大盛況なのが伺えますね。
当日の様子
タイムテーブル
基調講演がオープニングとエンディング枠でそれぞれ40分、それ以外のセッションは3トラック同時開催で各20分ずつ行われました。
また、ランチ休憩後にはオフライン会場限定でパネルディスカッションが開催されていました。
弊社のSRE課からは6名が参加しましたが、各人が興味のあるセッションをそれぞれ選択して拝聴しました。
もちろん重複したセッションもありますが、チームとしてのインプットの量がすさまじいですね!
閉会式のあとには懇親会が行われ、美味しいお酒と食事をいただきつつ、参加者の方々と交流することができました。
セッションを聴いたあの人やあの人とお話ができちゃうなんて!
感想戦やってみよう
さて、SRE NEXTに参加した熱が冷めやらぬうちに、後日さっそく感想戦を実施してみました。
実施するにあたって、事前に用意したフォーマットは下記です。
# 印象に残ったセッション ## タイトル ## 登壇者情報 ## スライド ## セッション概要 - セッションの内容を簡潔に ## 共有したい点、感想等 - どんな点に共感したか、疑問に思ったこと等 --- # 今後実施/挑戦したいこと - 参加してみてアクションを起こしたくなったものが何かあれば # 全体を通しての感想 - 率直な感想をご自由に
それぞれが印象に残ったセッションを選択し、セッション概要と共有したい点/感想等を事前にまとめてもらいました。
以下、実際にまとめてもらった感想戦の内容を一部ご紹介します。
(※各感想の冒頭に記載しているSRE課メンバーの二つ名は課のみんなで考えました)
カラオケでマイクを離さないのに唄わないUの感想
増え続ける公開アプリケーションへの悪意あるアクセス。多層防御を取り入れるSRE活動
セッション概要
共有したい点、感想等
- アプリ脳の自分からすると、具体的なセキュリティ対策のイメージがドッと増えた
- 他社のセキュリティ評価の観点を得られた
- セキュリティ評価上のベンチマークにしたいくらいの資料
今後実施/挑戦したいこと
- セキュリティに関して考えるときには上記で列挙されている観点は検討に入れていきたい
- 基調講演「信頼性目標とシステムアーキテクチャー」後半で話されていたレベルのことを主体的に話せるレベルまで解像度を上げたい
- 「Runbookに何を書き、どのようにアラートを振り分けるか?」にあったRunbookを「運用する」という観点でのアラート体制整備は取り入れるべき
全体を通しての感想
- SREも突き詰めるとツラミ解決部隊なので、意外と共感できない部分とかもあり、概念自体の難解さと不定形さをあらためて認識した
- 面白い話ほど視座が高くて、今の自分には抽象度が高すぎた
- エンジニア経験が少ない自分には、具体性の高い経験談チックな話が理解しやすく、他社の現場目線を知ることができて非常に面白かった
アイドルと設計をこよなく愛する課内の先生Iの感想
エンタープライズ企業でのSRE立ち上げ挑戦の際に意識した事と気付き、現在地とこれから
セッション概要
- イオングループ子会社でのSREチーム創設と現在までの歩みを紹介(やってきたこと、意識したこと、しくじり事例)
共有したい点、感想等
- 目指すべきSREチームとしての方向性が我らと同じだと感じた
- その上で実績を積み上げているので、先人のマインドとしてとても参考になった
やっていくにあたり ・組織に変化を起こすのは常に1人の行動から ・小さく始める ・重要なところから ・条件的にやりやすいところから ・満点は不可能 ・人が関わる以上、タイミングが必要な場合もある。準備をしながら機会を伺う ・正論はときに人を傷つける
意識したこと ・意思決定者へ目指す方向を共有する ・説明よりも動くものを用意する ・有益なものであれば乗ってくる ・コミュニケーション ・オープンに話せる場を作っておく ・同じ目標を持つ状況を作り出し、協力する ・障害対応や有事の取り組みには、積極的に参加する ・同じ目的・目標に向かって進む機会を増やす ・短期的であればヒーロー的行動は効果的 ・結局は信頼関係が大事。相手の役に立つ事を積み上げる
今後実施/挑戦したいこと
- 成果物のデモ会の実施
- 不定期のラジオをSRE課が主体となって開催
- 開発チームの領域でも、手を動かす部分を臆せず巻き取れるようになりたい
全体を通しての感想
- 上記のセッション以外にも参考になったセッションがたくさんあった
- 特にリクルートの近藤さんのセッションでは開発チームを巻き込むSRE活動を紹介してくれていたので、真似できることはやりたい
バカンス中もプールサイドでコーディングする課長Mの感想
勘に頼らず原因を見つけるためのオブザーバビリティ
セッション概要
- オブザーバビリティの導入によってトラブルシュートの属人化を改善した事例を紹介
共有したい点、感想等
- オブザーバビリティの基本をしっかりと解説しておりそもそもの概念が理解しやすい
- トラブルシュートでは特定メンバー頼りになりがちだが、個人の勘ではなくデータを元に対応可能な状態を目指すという考えはどこの会社でも今後必要になっていくものと考える
今後実施/挑戦したいこと
- コンテナ化が目下の目標だがオブザーバビリティ基盤の構築もしっかりと進めていきたい
- そもそも基盤があれば解決するものではなく、全エンジニアがオブザーバビリティの必要性を正しく認識する必要がある、そのための啓蒙活動は進めたい
全体を通しての感想
- 競合他社と比較して自社の立ち位置を客観視出来たのは良かった
- 現状を改善するための取り組みをしっかりと進めたいと思う
最近肩凝りに苦しむパパさんエンジニアIの感想
Warningアラートを放置しない!アラート駆動でログやメトリックを自動収集する仕組みによる恩恵
セッション概要
本来アラートは「人間が即座にアクションを起こす」もの。 Warningは「これから重要な問題がおきそう」という扱いだが、 現実的に Slackにひっそりと流されてたりして、実際には「人間の行動が起きない」しかも「結構な数が出る」 → 結果、オオカミ少年と化し、役に立たなくなる。 そしてハインリッヒの法則に従い、一定の潜伏期間を経て大爆発する
アラートの調査=人力=トイルが含まれる可能性が高い 「Warningアラートの調査はトイルになりがち」 アラート発生 →WebHook →危ないかどうかの初期判断情報を集めるAPPを作ってみたら良かった!
共有したい点、感想等
- 「Warningはトイルです」と言われ、確かに!と思った。
- ラクスと状況が似ているし、インフラ出身なので、「コレは使える!」とピンと来る感じがあった
今後実施/挑戦したいこと
- オブザーバビリティの導入
- ページャのモダナイズ
全体を通しての感想
- 開発の決済者(マネジメント層)もぜひ視聴してほしいイベントだった
- 他社と比較し、"検討" や "課題感" ではなくとりあえず "実践" してみないと、と感じた
- Googleの山口さんも言っていたが、 SRE NEXT 2021で各社起案していたものが2023では実践レベルに
- 他社と比較すると、意思決定が遅い気がする
- 組織全体のマインドを変えないと、他社との差がより開いてしまう
- オブザーバビリティを導入したいという想いがより強くなった
- ビジネスの可視化は当然これの先にある、予測に基づいた設計をしていかないと
- 可観測性が低いことが一因となって意思決定のスピードも遅くなっているのでは
- k8sのアップデート戦略等、モダナイズの設計や方向性は他社とあまり外れておらず一安心
ビールと肉を愛する姉御エンジニアIの感想
開発者とともに作る Site Reliability Engineering
セッション概要
- SREを開発者と”ともに”実現するための事例紹介
- かつてはSREがやることはSREだけで決めていたが、それが本当に必要な作業だったのか?という疑問から行動を変えた
- 開発者からFBを得ることに注力し、以下に取り組む
- サーベイの実施、取り組みの共有、チームに入る
- 上記は組織マネジメントを狙って実施したものだったが、結果話す場のデザインを行ったことによりふりかえりや挑戦/サポートの文化が定着した
共有したい点、感想等
- 開発チーム向けのサーベイの実施や、進めているPJの共有等、取り組んでいるものがおおよそ(正解は別にないけど)同じだったので自信になった
- 困っている人の声が集まる状態にして、さくっと助けてあげる感じの文化がとてもよい(まさに信頼貯金)
- 開発チームへの期待値を明示して、開発チーム自身がやりたいと思っていることは支援をしてあげるという立ち位置もよき
- 「ここからここまでしかやらない」という線引きじゃないところがよき
- 開発チーム⇄SREの留学も行われてるそうで、お互いのプロセスを体験するのもよい取り組み
- マネージャーも兼務するらしい
- 総じてエモかった
今後実施/挑戦したいこと
- SREのロードマップにある「文化醸成」は地道な種まき(仕掛け)と関係構築の賜物だと思うので、モダナイズやトイル削減といった具体的なものを進めつつ、広く信頼関係を構築していきたい
- 開発組織に仲間を見つける
全体を通しての感想
- SREイベントに参加したの初めてだったので、そもそもの心構え的なものが学べて豊作
- ポジション的なところもあって、狙って組織作りのセッションを選んでたけど、どの組織も課題は同じっぽかった
- 結論SREは総合格闘技だし何より信頼関係の構築=対話が大事
マウンテンデューばっかり飲んでる新米CKAのSの感想
QAと共に築く、機能性を通じた信頼性担保への取り組み
セッション概要
- 新規プロジェクトに携わる中でQAチームと協力し、機能性を担保するためにSREとしてどのように関わり、信頼性向上に取り組んだか
共有したい点、感想等
- コミュニケーションとコラボレーションが大切
- 信頼性の担保と同じくらいコミュニケーションとコラボレーションは大切
- 必要性があれば仕組み作りが大切
- 結局は日々のちょっとしたコミュニケーションの継続がコラボレーションにつながる
- 印象に残った取り組み
今後実施/挑戦したいこと
- 社内のイベント等に参加してコラボレーションを増やしていきたい
- 些細な手助けを心がけて信頼貯金を貯めていきたい
- もちろん手助けするには知識も必要なため継続的に学習する
- もっとフランクにコミュニケーションを取っていきたい
全体を通しての感想
- 基調講演の「信頼性は会話です」が響いた
- 普段から会話していない人と信頼関係は築かないよなと感じた
総括
以上、『SRE NEXT 2023』に参加したメンバーの感想戦の内容をご紹介しました。
セッションを聴いただけではなく、同じ熱量を感じた状態でチームメンバーと感想を共有し合えた点は組織としてよい刺激になったと思います。
ラクスのSRE文化はまだまだ発展途上ですが、他社の皆さまがこれまで取り組まれてきた事例を聞いて、自分たちの進むべき方向性や価値観を再確認できたのはとても大きな収穫でした。
わたし個人としてはオフラインでのイベント参加がコロナ以降初めてだったので、会場の雰囲気を久しぶりに生で味わえてとてもよい機会になりました。(イベントの醍醐味はやはり懇親会!!)
スタッフの皆さま、登壇者の皆さま、企画運営本当にお疲れ様でした。そしてありがとうございました!
最後に、唯一撮っていた懇親会のお寿司の写真を添えておきます。
来年のSRE NEXTも今から楽しみですね!