TAG

#プロンプトインジェクション

このタグが付いた記事 2本 News 2本

NEWS (2)

ニュース

2026/6/26

2000人がAIに「秘密を漏らせ」と6000通のメール攻撃→突破ゼロ！AIの守りを試した実験がすごいんだ——てんびん丸が整理するんだ

エンジニアのFernando Irarrázavalさんが2026年6月、自作のAIアシスタント『Fiu』にメールを送って秘密ファイル『secrets.env』を漏らせたら勝ち、という公開ハッキング実験を行ったよ。2000人以上が集まって6000通以上の“だましメール”を送ったのに、突破された回数はゼロ。なりすまし・緊急事態のフリ・多言語・4分で20連射……あの手この手でも、AI（Claude Opus 4.6）はたった数行の指示で守り切ったんだ。途中でGmailが一時停止したり、API費用が500ドルを超えたりのハプニングも。AIに“悪い命令”を吹き込む「プロンプトインジェクション」って何？AIってそんなに簡単に騙されないの？を、てんびん丸が初心者向けにやさしく整理するよ。

2026/6/7

ChatGPTに『ロックダウンモード』が来たよ！Webやファイルに仕込まれた“ワナの命令”を無視する、プロンプトインジェクション対策の新機能なんだ

OpenAIが2026年6月5日（現地時間）、ChatGPTにセキュリティ機能『ロックダウンモード（Lockdown Mode）』を追加。Webページやアップロードしたファイルに埋め込まれた“不正な指示”を無視し、AIが本来のユーザー指示だけに従うようにする仕組みなんだ。プロンプトインジェクションによる情報漏えいを防ぐのが狙いで、Free・Go・Plus・Pro・Business・Enterpriseで使える。代わりにWebブラウジング（キャッシュ閲覧のみ）・Deep Research・Agent Mode・Canvasのネットワーク機能は一部制限される。“AIを使い倒す時代の安全装置”の意味を、てんびん丸が初心者向けに整理するよ。