はじめまして。楽楽精算のインフラのマネージャーを務めている永易です。
楽楽精算のインフラチームの組織体系について、現在までと今後についてをお話させていただきます。
チームの紹介
チームのミッション
楽楽精算のインフラを適切なコストで安定させる
お客様に楽楽精算を安心して利用していただくために、インフラチームとして安定したサービスの提供を責務としています。 一方、企業として利益を確保する事も必要であり、サービス品質とコスト(売上原価)のバランスを大切にしてます。
チーム体制と役割
現在の楽楽精算インフラメンバーは5人で構成されており、キャリアに合わせてメインの業務を保守運用担当と設計担当に分けています。
具体的な業務内容の内訳としては以下になります。
メンバーのキャリアに合わせて少しずつ設計を担当する領域を増やし、経験を積ませることで思考力や行動力を向上させます。
チームの文化
私たちのチームは、主体的な問題提起をし、改善提案を行うメンバーで構成されています。
楽楽精算は年間成長率(CAGR)30%を超える売上を何年も続けており、2024年3月期には144億4600万を達成しました。 この目まぐるしい成長に伴い、サービスの拡大とともにインフラ規模も拡大してます。大規模なサービスには多角的な視野と技術的な工夫が必要であり、人員の増加を最小限に抑えながらも組織の安定を図るために、メンバーのコンピテンシー(主に思考力、行動力)の成長が重要です。
以下に、当チームのメンバーに求められる具体的なコンピテンシーの一例を示します。
- 全体を俯瞰する視点を持つ : システム全体を把握し、数年後を予測して問題を多角的に捉えること
- 類似事象のチェック : 類似事象の分析を通じて、根本原因の特定と解決に繋げる
- 根本原因の深堀り : 問題の根本原因を追求し、再発防止策を考える
これらのコンピテンシーを通じて、「何故その仕事を行うのかを考え、行動できる組織」を目指してます。
取り組み事例
設計分野では、サーバにインストールされているOSの保守終了に伴い、新しいOSへリプレイスする事が作業として多いですが、それ以外に直近1年以内に取り組んできた事例を紹介します。
オブジェクトストレージのリプレイス
楽楽精算はオンプレミス環境でオブジェクトストレージを構築して利用しています。法的要件である「電子帳簿保存法」や「インボイス制度」の導入に伴い、1顧客あたりのオブジェクトストレージの利用量が急増しました。
その結果、「費用コスト」「サーバ増設コスト」が年間成長率(CAGR)を大きく上回る事が予想されました。
売上に対する原価の大幅な増加による利益低下を懸念し、「増設が簡単」で「ラック収容率が高い」オブジェクトストレージの調査を始めました。
具体的なアクションは以下になります。
- 要件定義
- 見積取得
- コスト試算
- 新オブジェクトストレージの技術検証結果から切り替え可能か判断
- 社内報告とリプレイススケジュール調整
現状コストが高い原因を洗い出し、コスト配分の高い課題を解決すれば全体的に問題が解決する方針で要件定義を進めました(パレートの法則)。
結果として、AWSのS3を使うよりも安く、10年後の年間コストが既存環境より数億円のコスト削減が達成し、可用性や性能も向上しました。
楽楽精算のインターネット通信で利用される帯域の増加対策
楽楽精算のサービス拡大に伴い、現在契約しているデータセンターのネットワーク回線プランの帯域では数年後に不足することが予想されました。安定したサービス提供のために帯域を確保しつつ、コストバランスを取るためにデータセンター業者に相談を開始しました。
- 現在契約しているデータセンター拠点、および別拠点のネットワーク契約プランを調査
- 3年後までのラック発注数を予測したフォーキャスト資料の作成
- データセンター業者への提案と交渉
- 交渉結果を次年度の予算に反映
課題として、現在契約しているデータセンターには、楽楽精算を安定してサービス提供できるネットワーク帯域契約プランが存在しませんでした。そのため、データセンター業者と協力し、双方にメリットのあるプランを策定する必要がありました。
結果として、新しいプランを策定してもらい、帯域単価コストの削減に成功しました。この成功により、データセンター業者のメンバーと楽楽精算のインフラチームとの交流が続いています。
今後の展望
昨今のサイバー攻撃の増加に伴い、私たちはセキュリティ対応を強化しています。また、昨年、AWSのEKS環境を用いてKubernetesやコンテナ技術をメンバーの一部が習得しました。これらの技術をチーム全体で汎用的に活用できるようにするため、適切な環境と時間を提供し、技術力を生かした設計に取り組んでいます。これにより、運用の効率化や原価の削減を進めています。
これらの技術の積み重ねを通じて、より大規模なネットワーク設計に繋げ、大規模災害対策への道筋を確立していきます。