Langlin Huang

shrango

3 21 2

https://shrango.github.io/

AI & ML interests

LLM Reasoning, Machine Translation

Recent Activity

updated a model about 1 hour ago

shrango/qwen3-4b-base-taco-grpo-lorem-shaping

published a model about 1 hour ago

shrango/qwen3-4b-base-taco-grpo-lorem-shaping

updated a model about 1 hour ago

shrango/qwen3-4b-base-taco-grpo-lorem

View all activity

Organizations

updated a model about 1 hour ago

shrango/qwen3-4b-base-taco-grpo-lorem-shaping

Text Generation • 4B • Updated about 1 hour ago

published a model about 1 hour ago

shrango/qwen3-4b-base-taco-grpo-lorem-shaping

Text Generation • 4B • Updated about 1 hour ago

updated a model about 1 hour ago

shrango/qwen3-4b-base-taco-grpo-lorem

Text Generation • 4B • Updated about 1 hour ago

published a model about 1 hour ago

shrango/qwen3-4b-base-taco-grpo-lorem

Text Generation • 4B • Updated about 1 hour ago

updated a model about 1 hour ago

shrango/qwen3-4b-base-taco-grpo-naive

Text Generation • 4B • Updated about 1 hour ago

published a model about 1 hour ago

shrango/qwen3-4b-base-taco-grpo-naive

Text Generation • 4B • Updated about 1 hour ago

updated a model about 1 hour ago

shrango/qwen3-4b-base-taco-grpo-baseline

Text Generation • 4B • Updated about 1 hour ago

published a model about 1 hour ago

shrango/qwen3-4b-base-taco-grpo-baseline

Text Generation • 4B • Updated about 1 hour ago

commented a paper 12 days ago

Your Teacher Can't Help You Here: Combating Supervision Fidelity Decay in On-Policy Distillation

Paper • 2605.30833 • Published May 29 •

updated a collection 30 days ago

LoPE

Collection

LoPE experiment checkpoints (global_step_200) • 19 items • Updated 30 days ago

Langlin Huang

AI & ML interests

Recent Activity

Organizations

shrango's activity