ai-garage
ベンチマーク

Terminal-Benchとは?

AIが「ターミナル作業」をどれだけこなせるかを測る。

⚡ 30秒でわかる

Terminal-Bench の主なポイント

  • 1 ファイル操作・Git・パッケージ管理・サーバー設定などのターミナル作業を、AIエージェントがどれだけ自走できるかを測るベンチです。
  • 2 Claude Code vs Codex の主戦場の一つ。

📖 詳しく

Terminal-Bench とは

ファイル操作・Git・パッケージ管理・サーバー設定などのターミナル作業を、AIエージェントがどれだけ自走できるかを測るベンチです。 Claude Code vs Codex の主戦場の一つ。

❓ FAQ

よくある質問

Q. Terminal-Bench とは何ですか?
A. AIが「ターミナル作業」をどれだけこなせるかを測る。 ファイル操作・Git・パッケージ管理・サーバー設定などのターミナル作業を、AIエージェントがどれだけ自走できるかを測るベンチです。
Q. Terminal-Bench の主な特徴は?
A. ファイル操作・Git・パッケージ管理・サーバー設定などのターミナル作業を、AIエージェントがどれだけ自走できるかを測るベンチです。 Claude Code vs Codex の主戦場の一つ。
Q. Terminal-Bench に関連する用語は?
A. 「AIエージェント」などが関連しています。

🔗 関連

あわせて読みたい

📬 STAY UPDATED

毎週のAI業界アップデートを、編集長が短くまとめてお届け予定。準備中です。

X でフォロー →