YUYI YANG's picture

3

YUYI YANG

yyuyi

·

yyuyi

AI & ML interests

None yet

Recent Activity

upvoted a paper 8 days ago

Small RL Controller, Large Language Model: RL-Guided Adaptive Sampling for Test-Time Scaling

upvoted a paper 22 days ago

You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories

upvoted a paper 23 days ago

Process Rewards with Learned Reliability

View all activity

Organizations

None yet

upvoted a paper 8 days ago

Small RL Controller, Large Language Model: RL-Guided Adaptive Sampling for Test-Time Scaling

Paper • 2606.03102 • Published 10 days ago • 14

upvoted a paper 22 days ago

You Only Need Minimal RLVR Training: Extrapolating LLMs via Rank-1 Trajectories

Paper • 2605.21468 • Published 23 days ago • 50

upvoted a paper 23 days ago

Process Rewards with Learned Reliability

Paper • 2605.15529 • Published 28 days ago • 53