10 9

E Sanchez

esanchez43

AI & ML interests

None yet

Recent Activity

upvoted a paper 5 days ago

RationalRewards: Reasoning Rewards Scale Visual Generation Both Training and Test Time

liked a model 7 days ago

tencent/HY-Embodied-0.5

liked a dataset 9 days ago

FreedomIntelligence/medical-o1-reasoning-SFT

View all activity

Organizations

None yet

upvoted a paper 5 days ago

RationalRewards: Reasoning Rewards Scale Visual Generation Both Training and Test Time

Paper • 2604.11626 • Published 9 days ago • 100

liked a model 7 days ago

tencent/HY-Embodied-0.5

Image-Text-to-Text • 4B • Updated 7 days ago • 2.04k • 896

liked a dataset 9 days ago

FreedomIntelligence/medical-o1-reasoning-SFT

Viewer • Updated Apr 22, 2025 • 90.1k • 7.74k • 1.09k

upvoted 2 papers 9 days ago

SkillClaw: Let Skills Evolve Collectively with Agentic Evolver

Paper • 2604.08377 • Published 13 days ago • 282

Faithful GRPO: Improving Visual Spatial Reasoning in Multimodal Language Models via Constrained Policy Optimization

Paper • 2604.08476 • Published 12 days ago • 8

liked a model 12 days ago

openbmb/VoxCPM2

Text-to-Speech • Updated 6 days ago • 72.9k • 1.2k

liked a model 13 days ago

mistralai/Mistral-7B-Instruct-v0.2

Text Generation • 7B • Updated Jul 24, 2025 • 2.01M • • 3.13k

upvoted a paper 14 days ago

GrandCode: Achieving Grandmaster Level in Competitive Programming via Agentic Reinforcement Learning

Paper • 2604.02721 • Published 19 days ago • 363

liked a model 17 days ago

tencent/HY-OmniWeaving

Image-to-Video • Updated 4 days ago • 259

liked a dataset 18 days ago

daaxila/twitter-xiaogualu7-2026.02.21-2025173711356387780-dDiqhFDk36Aa7Pk3-part1

Viewer • Updated 18 days ago • 1 • 79 • 1

upvoted a paper 19 days ago

CARLA-Air: Fly Drones Inside a CARLA World -- A Unified Infrastructure for Air-Ground Embodied Intelligence

Paper • 2603.28032 • Published 23 days ago • 340

liked a dataset 20 days ago

HuggingFaceH4/ultrachat_200k

Viewer • Updated Oct 16, 2024 • 515k • 45.5k • 691

liked a model 21 days ago

Neuralog/GLM-OCR-GGUF

0.9B • Updated 21 days ago • 305 • 1

liked a dataset 28 days ago

OpenMOSS-Team/OmniAction

Updated 25 days ago • 46.9k • 279

upvoted 2 papers about 1 month ago

Demystifing Video Reasoning

Paper • 2603.16870 • Published Mar 17 • 369

Bootstrapping Exploration with Group-Level Natural Language Feedback in Reinforcement Learning

Paper • 2603.04597 • Published Mar 4 • 210

upvoted 3 papers about 2 months ago

Heterogeneous Agent Collaborative Reinforcement Learning

Paper • 2603.02604 • Published Mar 3 • 194

VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training

Paper • 2602.10693 • Published Feb 11 • 220

A Very Big Video Reasoning Suite

Paper • 2602.20159 • Published Feb 23 • 519

E Sanchez

AI & ML interests

Recent Activity

Organizations

esanchez43's activity