ベンチマーク
Terminal-Benchとは?
AIが「ターミナル作業」をどれだけこなせるかを測る。
⚡ 30秒でわかる
Terminal-Bench の主なポイント
- 1 ファイル操作・Git・パッケージ管理・サーバー設定などのターミナル作業を、AIエージェントがどれだけ自走できるかを測るベンチです。
- 2 Claude Code vs Codex の主戦場の一つ。
📖 詳しく
Terminal-Bench とは
ファイル操作・Git・パッケージ管理・サーバー設定などのターミナル作業を、AIエージェントがどれだけ自走できるかを測るベンチです。
Claude Code vs Codex の主戦場の一つ。
❓ FAQ
よくある質問
- Q. Terminal-Bench とは何ですか?
- A. AIが「ターミナル作業」をどれだけこなせるかを測る。 ファイル操作・Git・パッケージ管理・サーバー設定などのターミナル作業を、AIエージェントがどれだけ自走できるかを測るベンチです。
- Q. Terminal-Bench の主な特徴は?
- A. ファイル操作・Git・パッケージ管理・サーバー設定などのターミナル作業を、AIエージェントがどれだけ自走できるかを測るベンチです。 Claude Code vs Codex の主戦場の一つ。
- Q. Terminal-Bench に関連する用語は?
- A. 「AIエージェント」などが関連しています。