AWS Resilience Hub の Fault Injection Service 統合が CloudFormation によるデプロイではなくなっていた

AWS Resilience Hub の Fault Injection Service 統合が CloudFormation によるデプロイではなくなっていた

Clock Icon2025.01.22

いわさです。

AWS Resilience Hub ではアーキテクチャに関する耐障害向上レコメンデーション以外に「オペレーションに関するレコメンデーション」を受けることが出来ます。
それらのレコメンデーションは、アラームや SOP(Standard Operating Procedure:標準作業手順書)、故障注入実験テンプレートなどが存在しています。

このうち、故障注入実験テンプレートの実体は Fault Injection Service の実験テンプレートを指しています。
私の認識ではこれまで各オペレーションレコメンデーションの推奨事項をデプロイする際には Resilience Hub から CloudFormation テンプレート経由でデプロイされる認識だったのですが、今朝確認してみたところ直接 FIS 実験テンプレートを作成出来るようになっていました。いつからだろう。

2 ヶ月ほど前に Resilience Hub の Black Belt が公開されていたのですが、そちらのキャプチャでは CloudFormation でデプロイする画面になっているので割と最近なのかもしれないです。

7A8C6D1B-3383-4F85-B178-D10FD9FDE9EE.png
AWS Resilience Hub Part 2 (実践編)【AWS Black Belt】 - YouTube より

ということで今回こちらの機能を使って実験テンプレートをデプロイし、レジリエンススコアが向上される様子を観察してみたので紹介します。

故障注入実験テンプレートに関するレコメンデーションを発生させる

FIS 実験テンプレートのレコメンドは使っている AWS サービスに依存して発生します。
例えば S3 のみのワークロードだと実験テンプレートのレコメンドはされないので、今回はシンプルに EC2 をワークロードに含めるようにしました。

0BC3C1DA-F8AB-412E-A593-48F14F31E3B5.png

アセスメントを実施しレコメンデーションを確認してみましょう。
アラームや SOP についてはこれまでと同様に「CloudFormation テンプレートを作成」ボタンが表示されます。これで推奨事項をデプロイする形ですね。

42AA46FB-0517-4C51-8F5D-7C9B481F7ABB.png

故障注入実験についてもレコメンデーションが生成されていました。
ただし、アラームや SOP と異なり CloudFormation テンプレートを作成ボタンが無いのですよ。これです。

3B10D6F8-7BF3-4FB2-A884-23D95932EB60.png

ここで各アクションのリンクをクリックして推奨される実験の詳細画面に遷移出来ます。こちらを確認してみましょう。
見てみると「実験を開始する」ボタンが設置されています。これがおそらく新しいデプロイ方法なのかな。押してみましょう。

02469CEF-F52C-44C2-B081-846F96C6BF14.png

そうすると、AWS FIS コンソールに遷移し、実験テンプレート作成画面が開かれています。
CloudFormation ではなくてそのまま実験テンプレートを作成する感じですね。この機能、うまく統合されているようでして、対象のアクションやターゲットインスタンスなどは Resilience Hub の情報を引き継いでいます。なので基本的には入力値を変更せずにポチポチと次へボタンを押すだけで、対象アプリケーション用の実験テンプレートが作成出来ます。

78C77314-E0A2-4501-922A-B4894C769E22.png

確認してみると、こんな感じでターゲット EC2 が自動で指定されていることが確認できますね。

3C0DBCFB-F4F4-424D-B248-A918B673DBF3.png

いくつか実験を行った後に再評価を行ってみました。これだけでアセスメント範囲に入ってくるのかな。

28C15118-AC76-4985-B940-6E277C311FDE.png

確認してみるとステータスが実装済みとなっていました。
ただ、上から3つの実験テンプレートを実装したのですよね。「aws:ec2:reboot-instances」についてはなぜか未実装のままでした。ちょっとこれは原因わからず。なんどか実験と再評価を行って経過を観察してみたいと思います。

642B4A5B-4506-4E86-8F3E-BB9D038E5CC9.png

なお、11 月のアップデートで概要タブのレジリエンススコアのチャート描画周りがアップデートされわかりやすくなったというアップデートがあったようです。[1]ちょっとリッチになっていました。
こちらのチャートでも、先程実装した実験テンプレートに基づいてレジリエンススコアの改善が確認出来ました。

EDB5E196-2B54-4767-BCEB-ACBC1F36DD18.png

さいごに

本日は AWS Resilience Hub の Fault Injection Service 統合が CloudFormation によるデプロイではなくなっていたので、(おそらく)新しいデプロイ方法を試してみました。

余計な CloudFormation スタックなしで、かつ Resilience Hub からシームレスに値が引き継がれる形で作成出来るので使いやすくなってました。
Resiience Hub どうなるのかなと思っていたのですが、最近も結構細かいアップデート入っていてちょっと安心しました。

脚注
  1. Document history for the AWS Resilience Hub User Guide - AWS Resilience Hub ↩︎

Share this article

facebook logohatena logotwitter logo

© Classmethod, Inc. All rights reserved.