NEWS (2)
ニュース
2026/6/26
2000人がAIに「秘密を漏らせ」と6000通のメール攻撃→突破ゼロ!AIの守りを試した実験がすごいんだ——てんびん丸が整理するんだ
エンジニアのFernando Irarrázavalさんが2026年6月、自作のAIアシスタント『Fiu』にメールを送って秘密ファイル『secrets.env』を漏らせたら勝ち、という公開ハッキング実験を行ったよ。2000人以上が集まって6000通以上の“だましメール”を送ったのに、突破された回数はゼロ。なりすまし・緊急事態のフリ・多言語・4分で20連射……あの手この手でも、AI(Claude Opus 4.6)はたった数行の指示で守り切ったんだ。途中でGmailが一時停止したり、API費用が500ドルを超えたりのハプニングも。AIに“悪い命令”を吹き込む「プロンプトインジェクション」って何?AIってそんなに簡単に騙されないの?を、てんびん丸が初心者向けにやさしく整理するよ。
2026/6/7
ChatGPTに『ロックダウンモード』が来たよ!Webやファイルに仕込まれた“ワナの命令”を無視する、プロンプトインジェクション対策の新機能なんだ
OpenAIが2026年6月5日(現地時間)、ChatGPTにセキュリティ機能『ロックダウンモード(Lockdown Mode)』を追加。Webページやアップロードしたファイルに埋め込まれた“不正な指示”を無視し、AIが本来のユーザー指示だけに従うようにする仕組みなんだ。プロンプトインジェクションによる情報漏えいを防ぐのが狙いで、Free・Go・Plus・Pro・Business・Enterpriseで使える。代わりにWebブラウジング(キャッシュ閲覧のみ)・Deep Research・Agent Mode・Canvasのネットワーク機能は一部制限される。“AIを使い倒す時代の安全装置”の意味を、てんびん丸が初心者向けに整理するよ。