[アップデート] Amazon EC2 Capacity Blocks for ML 最大予約期間の拡大と予約期間の延長が可能になりました
機械学習の需要増加に伴い GPU の確保が課題となっています。EC2 Capacity Blocks for ML はこの課題を解決する GPU インスタンスの利用を事前予約できるサービスです。2024 年 11 月のアップデート内容をまとめました。
今回のアップデート内容
- 予約期間が最大 182 日まで伸びた
- 予約から最短 30 分で利用開始が可能に
- 期限 1 時間前までなら期間延長に対応
EC2 Capacity Blocks for ML とは
EC2 Capacity Blocks for ML は、主に機械学習ワークロード向けに需要の高い GPU や、AWS が開発した機械学習向けのチップ(AWS Trainuim)のインスタンスの利用を事前予約できるサービスです。
詳細は以下のブログを参照ください。
最大予約期間の拡大
1 日単位で 14 日まで、7 日単位で最大 182 日間の予約ができるようになりました。約 6 か月の長期間 GPU インスタンスを確保できます。従来は 7 日単位では 28 日間の予約が最大でした。1 日単位の最大予約期間には変更ありません。
1 年間フル稼働させるなら RI 購入がキャパシティ予約とコスト削減を同時に実現できます。ですが、GPU 需要の高まる昨今、数週間の利用予定であれば EC2 Capacity Blocks for ML の出番です。
予約から最短30分で利用可能に
予約枠の利用開始日が 30 分後になりました。
今は 11 月 30 日 6 時 58 分 です。ちょうど 30 分後の 7 時 28 分から利用開始と表示されています。
最小期間の 1 日を指定した予約なのに 13 時間しか利用できません。理由は、予約の終了時間が一律 20:30(JST)に設定されているためです。
Capacity Blocks end at 11:30AM Coordinated Universal Time (UTC).
Capacity Blocks for ML - Amazon Elastic Compute Cloud
別の AZ では 1 日指定でも今日の 20 時 30 分には停止できなく、明日の 20 時 30 分まで予約枠を確保することになりました。どうやら予約枠の調整で 24 時間にも満たないで終了するか、次のタイミングの 20 時 30 分にまわされるケースがあるようです。予約するときにしっかり確認しましょう。
予約枠を延長可能に
予約枠を終了時刻の 1 時間前までなら期間延長ができるようになりました。従来は延長不可で仮にトレーニング途中だったとしても終了時刻の 30 分前からインスタンスの終了処理が開始されました。事前に正確な期間見積もりが必要でしたが、その点については救済措置が用意されました。
ただし、延長可能かは予約枠に空きがあることと、Capacity Blocks for ML の延長分の費用を前払いが終了時刻の 35 分前までに間に合うことが条件です。
おわりに
LLM のファインチューニングなどで GPU を使う予定があるときには事前に予約しておくのはいかがでしょうか。注意事項は Capacity Blocks for ML は需要と供給のバランスをみてインスタンスの価格を決定するため、オンデマンド利用費より安いこともあれば高くなることもあります。