🔄 In a Training Loop

Urro

urroxyz

82 691 98

https://urro.xyz/

urroxyz

AI & ML interests

computational linguistics major 🤖🔎🔠 i am autistic. if i come off rude, i probably didn't mean to. please feel free to ask me for clarification.

Recent Activity

liked a dataset about 14 hours ago

kernelmachine/open-license-corpus

upvoted a paper about 16 hours ago

GRPO, Dr. GRPO, and DAPO Are Three Operations on One Number: The Group-Standard-Deviation Identity

updated a collection about 16 hours ago

WTF GENIUS PAPERS

View all activity

Organizations

upvoted 5 papers about 16 hours ago

GRPO, Dr. GRPO, and DAPO Are Three Operations on One Number: The Group-Standard-Deviation Identity

Paper • 2607.00152 • Published 6 days ago • 5

WARP: Weight-Space Analysis for Recovering Training Data Portfolios

Paper • 2607.01686 • Published 4 days ago • 5

Denser neq Better: Limits of On-Policy Self-Distillation for Continual Post-Training

Paper • 2607.01763 • Published 4 days ago • 5

DuoMem: Towards Capable On-Device Memory Agents via Dual-Space Distillation

Paper • 2606.29961 • Published 7 days ago • 6

Morphing into Hybrid Attention Models

Paper • 2606.30562 • Published 7 days ago • 37

upvoted 7 papers 4 days ago

ReFreeKV: Towards Threshold-Free KV Cache Compression

Paper • 2502.16886 • Published 10 days ago • 47

BlockPilot: Instance-Adaptive Policy Learning for Diffusion-based Speculative Decoding

Paper • 2606.31315 • Published 6 days ago • 73

Multi-Block Diffusion Language Models

Paper • 2606.29215 • Published 6 days ago • 33

Reinforcement Learning with Metacognitive Feedback Elicits Faithful Uncertainty Expression in LLMs

Paper • 2606.32032 • Published 6 days ago • 22

AsyncOPD: How Stale Can On-Policy Distillation Be?

Paper • 2606.24143 • Published 13 days ago • 29

MOPD: Multi-Teacher On-Policy Distillation for Capability Integration in LLM Post-Training

Paper • 2606.30406 • Published 7 days ago • 13

DOPD: Dual On-policy Distillation

Paper • 2606.30626 • Published 7 days ago • 94

upvoted 3 papers 5 days ago

JetSpec: Breaking the Scaling Ceiling of Speculative Decoding with Parallel Tree Drafting

Paper • 2606.18394 • Published 11 days ago • 35

Information-Aware KV Cache Compression for Long Reasoning

Paper • 2606.26875 • Published 11 days ago • 11

Simplified Sparse Attention via Gist Tokens

Paper • 2604.20920 • Published 10 days ago • 5

upvoted 2 papers 6 days ago

The Tatoxa System for Text Detoxification in Low-Resource Languages: The Case of Tatar

Paper • 2606.26015 • Published 12 days ago • 10

Formalizing Latent Thoughts: Four Axioms of Thought Representation in LLMs

Paper • 2606.27378 • Published May 7 • 58

upvoted a paper 8 days ago

Discretizing Reward Models

Paper • 2606.21795 • Published 17 days ago • 17

upvoted a changelog 8 days ago

Hugging Face Changelog

Share your feedback with us

9 days ago

• 114

upvoted a paper 8 days ago

CODI: Compressing Chain-of-Thought into Continuous Space via Self-Distillation

Paper • 2502.21074 • Published Feb 28, 2025 • 5

Urro

AI & ML interests

Recent Activity

Organizations

urroxyz's activity

Share your feedback with us