LLM
SFT(教師あり微調整)とは?
別名: Supervised Fine-Tuning
正解付きのデータで追加学習させる工程。
⚡ 30秒でわかる
SFT(教師あり微調整) の主なポイント
- 1 「この質問にはこう答えてほしい」というペアデータを用意して、それでモデルを追加学習させる方式です。
- 2 RLHF の前段階としてよく行われ、ファインチューニングの基本形にあたります。
📖 詳しく
SFT(教師あり微調整) とは
「この質問にはこう答えてほしい」というペアデータを用意して、それでモデルを追加学習させる方式です。
RLHF の前段階としてよく行われ、ファインチューニングの基本形にあたります。
❓ FAQ
よくある質問
- Q. SFT(教師あり微調整) とは何ですか?
- A. 正解付きのデータで追加学習させる工程。 「この質問にはこう答えてほしい」というペアデータを用意して、それでモデルを追加学習させる方式です。
- Q. SFT(教師あり微調整) の主な特徴は?
- A. 「この質問にはこう答えてほしい」というペアデータを用意して、それでモデルを追加学習させる方式です。 RLHF の前段階としてよく行われ、ファインチューニングの基本形にあたります。
- Q. SFT(教師あり微調整) に関連する用語は?
- A. 「RLHF」、「ファインチューニング」などが関連しています。
- Q. SFT(教師あり微調整) の別名は?
- A. Supervised Fine-Tuning とも呼ばれます。