Quickpanda's picture

3 6

Quickpanda

Quickpanda

·

AI & ML interests

None yet

Recent Activity

updated a collection about 15 hours ago

upvoted a paper 13 days ago

Emergent temporal abstractions in autoregressive models enable hierarchical reinforcement learning

upvoted a paper 9 months ago

A Minimalist Approach to LLM Reasoning: from Rejection Sampling to Reinforce

View all activity

Organizations

None yet

Collections 1

models 2

Quickpanda/deepcoder-14b-preview-awq

15B • Updated Apr 14, 2025 • 2 • 2

Quickpanda/deepseek-14b-sft-dpo4-awq

15B • Updated Apr 13, 2025 • 1

datasets 0

None public yet