home/categories/machine-learning/aws-solutions-library-samples-guidance-for-claude-code-with-amazon-bedrock-assets-claude-code-plugins-plugins-ml-training-skills-grpo-finetuning-skill-md
machine-learningdata-ai

grpo-finetuning

Implement GRPO (Group Relative Policy Optimization) fine-tuning for vision-language models on small datasets. Use when SFT underperforms or training data is limited (<1000 examples).

aws-solutions-library-samples
maintainer
aws-solutions-library-samples
আপডেট হয়েছে 1/27/2026
স্টার
225
ফর্ক
86
quick start

Installation and usage

Implement GRPO (Group Relative Policy Optimization) fine-tuning for vision-language models on small datasets. Use when SFT underperforms or training data is limited (<1000 examples).

ইনস্টলেশন
$ install --globalskills.sh
ব্যবহার

ইনস্টল করার পর, টার্মিনালে নিচের কমান্ড চালিয়ে আপনি এই স্কিল ব্যবহার করতে পারবেন:

skills use grpo-finetuning