オペレーションと開発者の間の緊張関係を解く

歴史的に見て、オペレーション(Ops)と開発者の間には自然な緊張関係がありました。 オペレーションの使命は、システムを安定して稼働させることです。 ほとんどのシステムでは、システムに何も変更がなければ、過去と同じように動作する傾向があります。 しかし、開発者は通常、システムの使用量を増やすことにインセンティブを得ており、それは良い意味でも悪い意味でも、より多くの機能を提供することを意味します。 新しい機能は、システムに急激な変化をもたらし、システムにある程度の不安定さとリスクをもたらします。 このような相反するインセンティブにより、2つのチームの間には計り知れないほどの緊張感が生まれます。その結果、オペレーションはマシンへのアクセスを禁止し、オペレーションに関連したことを自由に行うことができなくなりました。 なぜなら、新しいサービスを立ち上げるためには常にインフラが必要であり、新しいインフラを立ち上げるには他のチームとの深い協力が必要だからです。 このような緊張関係は好ましくなく、エンジニアリングチーム内に分裂を生み、2つのチームがお互いに助け合おうとしないため、進展が見られません。これでは、生産性が低下するだけでなく、最終的には社員の幸福度も低下し、社員が辞めていくことになります。 私がエンジニアリングリーダーとしての任期中に学んだことは、「従業員を幸せにしたいなら、彼らの生産性を高めなければならない」ということです。 幸せとは、他のエンジニアリングチームと仲良くし、文化を統一することであり、分裂的な文化を作ることではありません。

"With Great Power Comes Great Responsibility"

チームとしては、運用担当者や開発者だけでなく、全員が本番に投入するソフトウェアに責任を持っています。 つまり、運用担当者と開発者が共通の目標を持てるようなインセンティブ構造を構築しなければなりません。 Devopsは人によって様々な意味を持っていますが、私たちShareThis にとっては、オペレーション、開発、QAの機能領域の間に高いオーバーラップがあることを意味しています。 そのため、開発者が本番環境に変更を加える権限を得るためには、自分の行動に責任を持たなければなりません。 だからこそ、何かあったときのために、開発者はオンコール体制を整えておくことが重要だと考えています。 開発者は、自分のコードが予期せぬ問題を引き起こしたときに警告されることがどのようなものかを経験する必要があります。これにより、オフタイムの問題解決の負担を、オペレーションや単一のチームだけではなく、チーム全体で共有することができます。

SLAとSLA手当

最も重要な活動の一つは、サービスのSLAを定義することです。 これは、お客様、開発者、運用担当者に対して、システムの安定性に対する期待を定義するものです。 しかし、100%のアップタイムを目標にすることは、動きが遅すぎて十分なリスクを取っていないことを意味します。 スタートアップ企業は、計算されたリスクを取り、迅速に行動することが重要です。 リスクをより定量的に把握するために、私たちはSLAの許容値を使用しています。 SLA値から1を引くことで、リスク許容度を算出することができます。 例えば、99.9%のアップタイムSLAであれば、次のように1 - 0.999 = 0.001でSLA許容量を計算できます。 これは、合意されたアップタイムを使い切る前に、サイトに43mのダウンタイムが発生する可能性があることを意味します。 この方法を使えば、SLA許容値を超えない限り、開発者は好きなだけ頻繁にデプロイすることができます。 SLAに抵触した場合は、新機能をデプロイすることはできず、代わりにチームは安定性に注力する必要があります。 そのためには、自動化されたテストとモニタリングに重点を置き、アプリケーションが本番環境で問題を起こさないことを確認する必要があります。 また、スピードとリスク許容度のバランスを取ることで、事前に合意することができます。 オフィス全体では、異常があればすぐに表示されるダッシュボードを構築し、SLA違反を起こす前に変更を元に戻すことができるようにしています。

結果

DevOps文化の中で仕事をするようになってからは、チーム間のコラボレーションが劇的に増え、生産性も向上しました。 開発から本番までのアプリケーションのトータルオーナーシップがチーム全体に浸透し、サーバーやインフラを数週間ではなく数秒で立ち上げることができるようになりました。 お客様にとっては、新機能やサービスの安定性を意味します。 社内のステークホルダーにとっては、予測可能なタイムラインを意味します。最も重要なのは、私たちのチームにとって、この変化はオーナーシップと生産性を感じさせるものだということです。

このような職場環境に興味をお持ちの方は、採用情報ページをご覧ください。
https://sharethis.com/careers/

についてShareThis

ShareThis は、2007年以来、ソーシャルシェア、インタレスト、インテントのデータを統合することで、グローバルなデジタル行動の力を引き出してきました。300万以上のグローバルドメインにおける消費者の行動をもとに、ShareThis は、実際のデジタルデスティネーションにおける実際の人々の行動をリアルタイムに観察しています。

ニュースレターを購読する

最新のニュース、ヒント、アップデートを入手する

登録

関連コンテンツ