Quentin Gallouédec's picture

In a Training Loop 🔄

Quentin Gallouédec PRO

qgallouedec

huggingface

·

AI & ML interests

None yet

Recent Activity

upvoted an article about 12 hours ago

Harness, Scaffold, and the AI Agent Terms Worth Getting Right

new activity 1 day ago

trl-internal-testing/tiny-VoxtralForConditionalGeneration:Upload VoxtralForConditionalGeneration

new activity 1 day ago

trl-internal-testing/tiny-VoxtralForConditionalGeneration:Upload VoxtralForConditionalGeneration

View all activity

Organizations

qgallouedec 's datasets 85

qgallouedec/test-grpo-vlm-log-completions

Viewer • Updated Mar 20 • 435 • 160

qgallouedec/llama_star_formatted

Viewer • Updated Feb 21 • 7.21k • 25

qgallouedec/deepmath-completions-logs2

Viewer • Updated Jan 22 • 48 • 62

qgallouedec/deepmath-completions-logs

Viewer • Updated Jan 13 • 232 • 522 • 1

qgallouedec/Dolci-Think-DPO-7B

Viewer • Updated Nov 28, 2025 • 150k • 35

qgallouedec/biogrid_qa

Viewer • Updated Nov 18, 2025 • 59.4k • 686

qgallouedec/human_gene_interaction_qa_v2

Viewer • Updated Nov 18, 2025 • 79.2k • 37

qgallouedec/human_gene_interaction_qa

Viewer • Updated Nov 17, 2025 • 1.84M • 27

qgallouedec/biogrid

Viewer • Updated Nov 17, 2025 • 2.82M • 327

qgallouedec/trl-metrics

Viewer • Updated Oct 7, 2025 • 148k • 94 • 1

qgallouedec/rick

Viewer • Updated Sep 11, 2025 • 1.18k • 15

qgallouedec/OpenMathReasoning

Viewer • Updated Sep 10, 2025 • 10k • 25

qgallouedec/math-lvl3to5-8k

Viewer • Updated Aug 22, 2025 • 8.52k • 25

qgallouedec/svg

Viewer • Updated Aug 2, 2025 • 900 • 11 • 1

qgallouedec/rick-physics-grpo

Viewer • Updated May 22, 2025 • 1.79k • 34 • 1

qgallouedec/rick-science

Viewer • Updated May 16, 2025 • 1.18k • 27 • 3

qgallouedec/physics-problems

Viewer • Updated May 10, 2025 • 247 • 51

qgallouedec/rick-teaches-math

Viewer • Updated May 10, 2025 • 6.8k • 20

qgallouedec/DAPO-Math-17k-Processed-Scored

Viewer • Updated Apr 29, 2025 • 16.4k • 64 • 3

qgallouedec/prm800k

Viewer • Updated Dec 17, 2024 • 41.2k • 51 • 3

qgallouedec/ultrafeedback-prompt

Viewer • Updated Sep 9, 2024 • 60.9k • 83

qgallouedec/ultrafeedback-gpt-3.5-turbo-helpfulness

Viewer • Updated Sep 9, 2024 • 16.6k • 22

qgallouedec/lm-human-preferences-descriptiveness

Viewer • Updated Sep 9, 2024 • 6.26k • 28

qgallouedec/lm-human-preferences-sentiment

Viewer • Updated Sep 9, 2024 • 6.26k • 68

qgallouedec/tldr-preference

Viewer • Updated Sep 9, 2024 • 179k • 15

qgallouedec/tldr

Viewer • Updated Sep 9, 2024 • 130k • 93

qgallouedec/hh-rlhf-helpful-base

Viewer • Updated Sep 5, 2024 • 46.2k • 17

qgallouedec/hh-rlhf-helpful-base-trl-style

Viewer • Updated Sep 5, 2024 • 46.2k • 265

qgallouedec/suap_essentials

Viewer • Updated Aug 6, 2024 • 30 • 18

qgallouedec/qa_suap

Viewer • Updated Jul 14, 2024 • 270 • 20