News 2026年5月9日

サイバー防衛AIは「小さくて専門特化」が正解？4BパラのCyberSecQwenが8Bモデルを食ったよ

AMD Developer Hackathon発の CyberSecQwen-4B が、サイバー脅威インテリのベンチで倍サイズの Foundation-Sec-Instruct-8B を上回り。12GBのGPUで動く防衛特化LLMの中身を、てんびん丸が整理するよ。

Seiya Yagashiro

Editor-in-Chief, ai-garage

#AI #サイバーセキュリティ #オープンモデル

サイバー防衛AIは「小さくて専門特化」が正解？4BパラのCyberSecQwenが8Bモデルを食ったよ

やっほー、ぼくてんびん丸！夜枠だよ。

きょうのニュースはね、**「AIってデカけりゃ強いの？」**っていう最近の常識を、ちょっとひっくり返してくる話。サイバー防衛の世界に、4Bパラメータでガチに戦える小型モデルが出てきたんだ。手元のノートPCで動いて、しかも倍サイズのモデルを部分的に食う。これ、業界的に結構なシグナルだから整理しておくね。

何があったの？

AMD Developer Hackathon から生まれたオープンモデル CyberSecQwen-4B が、2026年5月8日付で Hugging Face に公開されたよ。

ベース： Qwen3-4B-Instruct-2507
手法： LoRA（r=64, alpha=64）で防衛特化ファインチューニング
ライセンス： Apache 2.0（再配布OK）
訓練ハード： AMD Instinct MI300X 192GB
推論ハード： 12GBの民生GPU1枚で動く

つまり、SOC（セキュリティオペレーションセンター）の現場マシンで、社外にデータを一切出さずに動かせるレベルのサイズ感なんだ。

どこがすごい？「4Bが8Bを食う」ベンチ結果

一番の見どころは、サイバー脅威インテリ用ベンチ CTI-Bench での比較。同じ系統で倍サイズの Foundation-Sec-Instruct-8B と並べたら、こうなった：

ベンチ	CyberSecQwen-4B	Foundation-Sec-Instruct-8B	差
CTI-MCQ（2,500問・選択式）	0.5868	0.4996	+8.7ポイント
CTI-RCM（CVE→CWE マッピング1,000件）	0.6664	0.6850	-1.9ポイント

選択式の脅威インテリ問題では8Bを8.7ポイント差で抜き去り、CVE→CWEマッピングでも8Bの97.3%の精度をキープ。半分のパラメータでこれを叩き出してるのが、たぶん本件の肝なんだ。

なぜ重要？防衛側の現場が「ローカル特化」を求めてた理由

サイバー防衛の現場って、汎用クラウドAIを入れようとすると3つの壁にぶつかるんだよね：

データが出せない：社内ログ・脆弱性情報・顧客データを外部APIに流せない案件が多い
コストが合わない：低信頼アラートが1日数千件、全部API叩いてたら課金モデルが破綻する
環境が分断されてる：エアギャップ（外部ネット遮断）環境の重要インフラに、汎用クラウドAIは原則入れられない

CyberSecQwen-4B は 12GBの単一GPUで完結するから、ノートPCや社内オンプレでそのまま動く。**「手元で動く × 特化してる × オープン公開」**が三拍子そろうのは、防衛側にとっては結構大きいんだ。

ぼくの感想：「専門特化×小型」が来てる気がする

最近のAI界隈ってどうしても「より大きく、より汎用的に」のレースに目が行きがちなんだけど、現場のニーズって逆方向だったりするんだよね。

出せないデータがある → クラウド前提のAIは入れにくい
コストの天井が低い → 従量課金モデルじゃ回らない
ドメインが超狭い → 汎用知識より「その分野での精度」が欲しい

そこに 「4Bで特化させたら8Bを食う」 っていう実証が来たのは、結構いいシグナルだと思う。Llama・Qwen・Mixtral みたいなオープン基盤モデル × LoRAで業務特化っていう組み合わせ、これから業界別にバンバン出てくる気がするんだ。

ちなみに CyberSecQwen-4B は用途を CWE分類・CTI Q&A・SOCトリアージ支援 に明確に絞ってて、エクスプロイトコード生成・自動意思決定・法律/医療相談には使うなって公式に明記されてる。最後まで防衛特化を貫いてるのは、好感持てるんだ。

まとめ

CyberSecQwen-4B が AMD Hackathon 発で公開（Apache 2.0）
サイバー脅威インテリのベンチで 8Bモデルを8.7ポイント上回り、別ベンチでも 97.3% の精度キープ
12GBの民生GPUで動くから、SOC・オンプレ・エアギャップ環境にそのまま入れられる
**「大きさより特化」**っていう新しい入り口が、ちゃんと数字付きで見えてきた

「AI＝デカいクラウドモデル」って思考、もうちょっと疑ってかかってもいい時代に来たかもしれないね。きみの組織にとっては、汎用×クラウドと特化×ローカル、どっちが向いてる？ 今夜のご飯のお供に、ちょっと考えてみてよ。

参考・一次ソース

→ 一次ソース