holilab

holi-lab

AI & ML interests

None yet

Recent Activity

upvoted a paper about 9 hours ago

Your Language Model is Its Own Critic: Reinforcement Learning with Value Estimation from Actor's Internal States

upvoted a paper about 14 hours ago

KL for a KL: On-Policy Distillation with Control Variate Baseline

updated a dataset 6 days ago

holi-lab/visual_persuasion

View all activity

Organizations

None yet

upvoted a paper about 9 hours ago

Your Language Model is Its Own Critic: Reinforcement Learning with Value Estimation from Actor's Internal States

Paper • 2605.07579 • Published 4 days ago • 12

upvoted a paper about 14 hours ago

KL for a KL: On-Policy Distillation with Control Variate Baseline

Paper • 2605.07865 • Published 4 days ago • 13

updated a dataset 6 days ago

holi-lab/visual_persuasion

Viewer • Updated 6 days ago • 11.4k • 13

published a dataset 6 days ago

holi-lab/visual_persuasion

Viewer • Updated 6 days ago • 11.4k • 13

updated a dataset 19 days ago

holi-lab/ReCAP_datatset

Viewer • Updated 19 days ago • 4.41k • 140

upvoted 3 papers 19 days ago

published a dataset 22 days ago

holi-lab/ReCAP_datatset

Viewer • Updated 19 days ago • 4.41k • 140

updated a model about 1 month ago

holi-lab/qwen-2.5-1.5b-multiwoz-finetuned_fp16

Text Generation • 2B • Updated Apr 6 • 36

published a model about 1 month ago

holi-lab/qwen-2.5-1.5b-multiwoz-finetuned_fp16

Text Generation • 2B • Updated Apr 6 • 36

updated a model about 1 month ago

holi-lab/qwen-2.5-1.5b-multiwoz-finetuned

Text Generation • 2B • Updated Apr 6 • 40

published a model about 1 month ago

holi-lab/qwen-2.5-1.5b-multiwoz-finetuned

Text Generation • 2B • Updated Apr 6 • 40

updated a model 5 months ago

holi-lab/qwen-2.5-7b-multiwoz-finetuned

Text Generation • 8B • Updated Dec 25, 2025 • 7

published a model 5 months ago

holi-lab/qwen-2.5-7b-multiwoz-finetuned

Text Generation • 8B • Updated Dec 25, 2025 • 7

updated a model 5 months ago

holi-lab/qwen-2.5-3b-multiwoz-finetuned

Text Generation • 3B • Updated Dec 25, 2025 • 33

published a model 5 months ago

holi-lab/qwen-2.5-3b-multiwoz-finetuned

Text Generation • 3B • Updated Dec 25, 2025 • 33

updated a model 5 months ago

holi-lab/llama-3.2-3b-multiwoz-finetuned

Text Generation • 3B • Updated Dec 25, 2025 • 3

published a model 5 months ago

holi-lab/llama-3.2-3b-multiwoz-finetuned

Text Generation • 3B • Updated Dec 25, 2025 • 3

updated a model 5 months ago

holi-lab/diffuGem

Updated Dec 9, 2025

holilab

AI & ML interests

Recent Activity

Organizations

holi-lab's activity