Claude CodeはAWSを管理する権限を取得し、その後AIが完全に2つのウェブサイトとそのデータベースを削除しました
アレクセイ・グリゴリエフは、Amazon Web Services(AWS)にサイトを移行した開発者です。インフラ管理にはTerraformを使用し、AnthropicのClaude Codeエージェントに頼りましたが、事故の原因はエージェントの誤動作ではなく、人為的要因でした。
何が起きたか
1. アレクセイはサイトと別サービスを一つのクラウドインフラに統合しようとしました。設定数は減らしたものの、ミスリスクは増大しました。
2. Terraformでサーバー・ネットワーク・ロードバランサー・データベースの作成/削除を自動化することに決めました。プランには必要な全リソースが含まれていました。
3. アレクセイはClaude Codeにプラン適用を依頼しましたが、現在の構成を記述したstateファイルをアップロードしませんでした。AIはサイト用コンテナを作成する指示のみ実行し、途中でユーザーがプロセスを停止させました。
4. stateが欠如していたためリソースが重複し始め、アレクセイは重複を削除した後にstateファイルをアップロードしました。エージェントは余分なオブジェクトを削除し続けると仮定し、状態を開きました。
5. Claude Codeは`terraform destroy`をstateファイルに従って実行しましたが、そのファイルには既存のAWSデータベースが記載されていました。その結果、両サイトとそのデータ(2.5年分のログ+スナップショット)が削除されました。
結果
- 2.5年間分の全データベースを失う。
- データ復旧のためにAmazonサポートへ連絡する必要がある。
24時間以内にAWSサポートは必要なオブジェクトをすべて復元しました。
インシデント後のアレクセイの対策
1. 定期的な確認:データベース状態の監視を設定。
2. 削除防止:TerraformとAWS設定に保護機構を導入。
3. stateファイルの保存:ローカルディスクではなくS3安全ストレージへ移動。
4. 自己管理削除:今後はすべての破壊操作を開発者自身が実行し、AIエージェントに完全依存しない。
結論
事故は人為的ミス(stateファイル未アップロードと重複リソース管理の誤解)によるものであり、Claude Codeの欠陥ではありませんでした。アレクセイは将来のリスクを最小化する対策を講じ、Terraform作業でAIに完全依存しない方針へ転換しました。
コメント (0)
感想を共有してください。礼儀正しく、話題に沿ってお願いします。
コメントするにはログイン