これからは、コレ!旬なIT技術やこれから主流となりつつあるIT技術に関する情報をご紹介します。

2021年03月01日

企業のデジタル変革推進に求められる新しいIT運用管理
~サイト信頼性エンジニアリング(SRE)~

Site Reliability Engineering(SRE)とは

Site Reliability Engineering(SRE)とはサイト信頼性エンジニアリングのことでGoogle社が提唱している言葉です。従来の手作業による企業のITシステムの運用をプログラミングやツールを利用して自動化させ、ITシステムの信頼性を向上させる運用のアプローチです。

従来の運用とSREの違い

企業内のITシステム運用は従来からも行っている作業でしょう。ではなぜ、今SREがここまで注目されているのでしょうか。それは企業のデジタル変革(DX)の推進により、従来のような必要な機能をすべて盛り込んだ大きなITシステムを、よりメンテナンス性のしやすい小さなITシステムの集合へと変革すること(マイクロサービス化)が重要になっているからです。ITシステムをマイクロサービス化することで、例えば変更をかけたいときに全体ではなく、小さなサービスに焦点をあて変更をかけられるという利点があるなど、用途や目的ごとに、柔軟性の高いアプリケーション開発が可能となりますが、それに反して従来の大きな運用体制では対応が困難になってきます。下記に従来の運用とSREで異なる点を挙げました。

従来のITシステムとDX時代のITシステム
図1:従来のITシステムとDX時代のITシステム

従来の運用方法

  • システム規模が大きくなるほどシステム運用者の増員が必要になる
  • 運用作業が煩雑化し、オペレーションミスが発生する可能性がある
  • 増員により担当者間のコミュニケーションコストが発生する
  • システムの安定性をより重視することで新機能を積極的に実装しない
  • 日々の運用業務に時間を追われ、新技術の探求や業務改善など生産性の高い時間が少ない

SRE

  • 運用をプログラムで自動化することによりシステム規模に応じた増員が不要となる
  • プログラムによる運用により、オペレーションミス発生の可能性が低い
  • 標準化した手順により信頼性が一定に保たれる
  • 運用作業にかかる時間が減ったことにより、生産性を向上させる取り組みに時間を利用できる

従来の運用とSRE
図2:従来の運用とSRE

SREの実践例

例えば、システムの構成管理をExcelに手順や設定するパラメータを記述して行っている場合、手作業となるためミスが発生しやすくなり、手間もかかります。さらにはシステムを変更した後、Excelに反映しなければならず、それを忘れたために現在のシステム状況と一致しないという問題も発生するでしょう。これらの問題に対して、構成管理情報をコードとして管理することで、システムとExcelの情報との不一致を回避できます。さらにコードをシステムに適用させれば設定を変更できるため、現在の情報をExcelに反映させるという手作業も発生しません。他にも、障害を検知するためだけにシステムを監視するのではなく、システムの信頼性向上に向けての情報収集という観点でシステムを監視し、今後のシステム改善に利用する方法などがあります。

※:サーバー運用の概念を変える!Infrastructure as Code
https://www.kobelcosys.co.jp/column/itwords/292/

SREの今後

SREを実践することで、システムの運用担当者は、システムの可用性やパフォーマンスの向上、運用作業の標準化、新技術の探求といった生産性の高い業務ができるようになるでしょう。これにより、企業にとっては競争力強化や企業価値への向上にも繋げることができます。今後、DX推進に向けてSREはますます求められていくでしょう。

2021年3月

ITの可能性が満載のメルマガを、お客様への想いと共にお届けします!

Kobelco Systems Letter を購読