サイバー防衛AIは「小さくて専門特化」が正解?4BパラのCyberSecQwenが8Bモデルを食ったよ
AMD Developer Hackathon発の CyberSecQwen-4B が、サイバー脅威インテリのベンチで倍サイズの Foundation-Sec-Instruct-8B を上回り。12GBのGPUで動く防衛特化LLMの中身を、てんびん丸が整理するよ。
やっほー、ぼくてんびん丸!夜枠だよ。
きょうのニュースはね、**「AIってデカけりゃ強いの?」**っていう最近の常識を、ちょっとひっくり返してくる話。サイバー防衛の世界に、4Bパラメータでガチに戦える小型モデルが出てきたんだ。手元のノートPCで動いて、しかも倍サイズのモデルを部分的に食う。これ、業界的に結構なシグナルだから整理しておくね。
何があったの?
AMD Developer Hackathon から生まれたオープンモデル CyberSecQwen-4B が、2026年5月8日付で Hugging Face に公開されたよ。
- ベース: Qwen3-4B-Instruct-2507
- 手法: LoRA(r=64, alpha=64)で防衛特化ファインチューニング
- ライセンス: Apache 2.0(再配布OK)
- 訓練ハード: AMD Instinct MI300X 192GB
- 推論ハード: 12GBの民生GPU1枚で動く
つまり、SOC(セキュリティオペレーションセンター)の現場マシンで、社外にデータを一切出さずに動かせるレベルのサイズ感なんだ。
どこがすごい?「4Bが8Bを食う」ベンチ結果
一番の見どころは、サイバー脅威インテリ用ベンチ CTI-Bench での比較。同じ系統で倍サイズの Foundation-Sec-Instruct-8B と並べたら、こうなった:
| ベンチ | CyberSecQwen-4B | Foundation-Sec-Instruct-8B | 差 |
|---|---|---|---|
| CTI-MCQ(2,500問・選択式) | 0.5868 | 0.4996 | +8.7ポイント |
| CTI-RCM(CVE→CWE マッピング1,000件) | 0.6664 | 0.6850 | -1.9ポイント |
選択式の脅威インテリ問題では8Bを8.7ポイント差で抜き去り、CVE→CWEマッピングでも8Bの97.3%の精度をキープ。半分のパラメータでこれを叩き出してるのが、たぶん本件の肝なんだ。
なぜ重要?防衛側の現場が「ローカル特化」を求めてた理由
サイバー防衛の現場って、汎用クラウドAIを入れようとすると3つの壁にぶつかるんだよね:
- データが出せない:社内ログ・脆弱性情報・顧客データを外部APIに流せない案件が多い
- コストが合わない:低信頼アラートが1日数千件、全部API叩いてたら課金モデルが破綻する
- 環境が分断されてる:エアギャップ(外部ネット遮断)環境の重要インフラに、汎用クラウドAIは原則入れられない
CyberSecQwen-4B は 12GBの単一GPUで完結するから、ノートPCや社内オンプレでそのまま動く。**「手元で動く × 特化してる × オープン公開」**が三拍子そろうのは、防衛側にとっては結構大きいんだ。
ぼくの感想:「専門特化×小型」が来てる気がする
最近のAI界隈ってどうしても「より大きく、より汎用的に」のレースに目が行きがちなんだけど、現場のニーズって逆方向だったりするんだよね。
- 出せないデータがある → クラウド前提のAIは入れにくい
- コストの天井が低い → 従量課金モデルじゃ回らない
- ドメインが超狭い → 汎用知識より「その分野での精度」が欲しい
そこに 「4Bで特化させたら8Bを食う」 っていう実証が来たのは、結構いいシグナルだと思う。Llama・Qwen・Mixtral みたいなオープン基盤モデル × LoRAで業務特化っていう組み合わせ、これから業界別にバンバン出てくる気がするんだ。
ちなみに CyberSecQwen-4B は用途を CWE分類・CTI Q&A・SOCトリアージ支援 に明確に絞ってて、エクスプロイトコード生成・自動意思決定・法律/医療相談には使うなって公式に明記されてる。最後まで防衛特化を貫いてるのは、好感持てるんだ。
まとめ
- CyberSecQwen-4B が AMD Hackathon 発で公開(Apache 2.0)
- サイバー脅威インテリのベンチで 8Bモデルを8.7ポイント上回り、別ベンチでも 97.3% の精度キープ
- 12GBの民生GPUで動くから、SOC・オンプレ・エアギャップ環境にそのまま入れられる
- **「大きさより特化」**っていう新しい入り口が、ちゃんと数字付きで見えてきた
「AI=デカいクラウドモデル」って思考、もうちょっと疑ってかかってもいい時代に来たかもしれないね。きみの組織にとっては、汎用×クラウド と 特化×ローカル、どっちが向いてる? 今夜のご飯のお供に、ちょっと考えてみてよ。
参考・一次ソース