12 11

yyx

RuggingHace

AI & ML interests

None yet

Recent Activity

upvoted an article 28 days ago

Custom Kernels for All from Codex and Claude

liked a model 28 days ago

MiniMaxAI/MiniMax-M2.5

upvoted an article about 1 month ago

Training Design for Text-to-Image Models: Lessons from Ablations

View all activity

Organizations

None yet

liked a model 28 days ago

MiniMaxAI/MiniMax-M2.5

Text Generation • 229B • Updated 3 days ago • 493k • • 1.18k

liked a model 2 months ago

MiniMaxAI/MiniMax-M2.1

Text Generation • 229B • Updated 29 days ago • 58.1k • • 1.27k

liked a Space 4 months ago

Scaling FineWeb to 1000+ languages: Step 1: finding signal in 100s of evaluation tasks

📝

Evaluate multilingual models using FineTasks

liked a model 4 months ago

bigscience/bloom

Text Generation • 176B • Updated Jul 28, 2023 • 6.85k • 4.99k

liked 2 Spaces 4 months ago

FineWeb: decanting the web for the finest text data at scale

🍷

1.31k

Generate a curated web‑text dataset for LLM training

The Smol Training Playbook

📚

3.04k

The secrets to building world-class LLMs

liked a model 5 months ago

MiniMaxAI/MiniMax-M2

Text Generation • 229B • Updated Dec 23, 2025 • 198k • • 1.49k

liked a model 8 months ago

RedHatAI/quantization

Updated Jul 27, 2025 • 6

liked a Space 11 months ago

The Ultra-Scale Playbook

🌌

3.74k

The ultimate guide to training LLM on large GPU Clusters

liked a model about 1 year ago

deepseek-ai/DeepSeek-R1-Distill-Qwen-32B

Text Generation • 33B • Updated Feb 24, 2025 • 961k • • 1.53k

liked a model about 2 years ago

meta-llama/Llama-2-70b

Text Generation • Updated Apr 17, 2024 • 8 • 538

yyx