H. Zhang

ROSE: A Reward-Oriented Data Selection Framework for LLM Task-Specific Instruction Tuning featured image

Large Language Models

ROSE: A Reward-Oriented Data Selection Framework for LLM Task-Specific Instruction Tuning

Reward-oriented data selection for task-specific LLM instruction tuning.

y.-wu

• Nov 1, 2025 • 1 min read