charliezhang

Clockz

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 4 days ago

The Physics of Multi-Turn Long-Horizon Planning: From Pre-training to Post-training via Single- and Multi-Teacher On-Policy Agentic Distillation

upvoted a paper about 1 month ago

The Verification Horizon: No Silver Bullet for Coding Agent Rewards

upvoted a paper about 2 months ago

RULE: Reinforcement UnLEarning Achieves Forget-Retain Pareto Optimality

View all activity

Organizations

Papers 2

arxiv:2606.05405

arxiv:2512.07783

models 0

None public yet

datasets 0

None public yet