Roman Malygin's picture

Roman Malygin

splusminusx

·

AI & ML interests

None yet

Organizations

None yet

splusminusx 's models 19

splusminusx/SmolLM2-FT-MyDataset

Text Generation • 0.1B • Updated Sep 13, 2025 • 1

splusminusx/SmolLM2-FT-ORPO

Text Generation • 0.1B • Updated Sep 5, 2025 • 1

splusminusx/SmolLM2-FT-DPO

Text Generation • 0.1B • Updated Aug 31, 2025 • 1

splusminusx/Starling-LM-7B-beta-GGUF

7B • Updated Mar 31, 2024 • 9

splusminusx/a2c-PandaReachDense-v2

Reinforcement Learning • Updated Jan 21, 2024

splusminusx/rl_course_vizdoom_health_gathering_supreme

Reinforcement Learning • Updated Apr 14, 2023

splusminusx/ppo-CartPole-v1-unit-8

Updated Apr 14, 2023

splusminusx/LunarLander-v2-unit-8

Reinforcement Learning • Updated Apr 14, 2023

splusminusx/poca-SoccerTwos

Reinforcement Learning • Updated Apr 5, 2023

splusminusx/a2c-AntBulletEnv-v0

Reinforcement Learning • Updated Mar 17, 2023

splusminusx/ppo-Pyramids

Reinforcement Learning • Updated Mar 17, 2023 • 19

splusminusx/ppo-SnowballTarget

Reinforcement Learning • Updated Mar 17, 2023

splusminusx/Reinforce-PixelCopter

Reinforcement Learning • Updated Feb 21, 2023

splusminusx/Reinforce-CartPole-v1

Reinforcement Learning • Updated Feb 20, 2023

splusminusx/dqn-SpaceInvadersNoFrameskip-v4

Reinforcement Learning • Updated Feb 5, 2023

splusminusx/q-Taxi-v3

Reinforcement Learning • Updated Jan 22, 2023

splusminusx/q-FrozenLake-v1-4x4-noSlippery

Reinforcement Learning • Updated Jan 22, 2023

splusminusx/ppo-Huggy

Reinforcement Learning • Updated Jan 21, 2023

splusminusx/ppo-LunarLander-v2

Reinforcement Learning • Updated Jan 19, 2023