Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

nm-research updated a model about 3 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw-qwen235b-instruct-bs16-v2-ckpt8

nm-research published a model about 3 hours ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw-qwen235b-instruct-bs16-v2-ckpt8

ChibuUkachi updated a model about 4 hours ago

inference-optimization/tmp-qwen-mod

View all activity

inference-optimization 's models 249

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw-qwen235b-instruct-bs16-v2-ckpt8

2B • Updated about 3 hours ago

inference-optimization/tmp-qwen-mod

Updated about 4 hours ago

inference-optimization/Qwen3.5-397B-A17B-FP8-dynamic-mtp-head

Image-Text-to-Text • 404B • Updated about 10 hours ago

inference-optimization/DeepSeek-V4-Pro-0.5B-A0.37B-NVFP4-FP8

0.4B • Updated about 24 hours ago • 112

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw-qwen235b-instruct-bs16-v2-ckpt7

2B • Updated about 24 hours ago • 11

inference-optimization/DeepSeek-V4-Pro-0.5B-A0.37B

Text Generation • 0.5B • Updated 1 day ago • 41

inference-optimization/temporary-3-layer-Qwen3-VL-1.0B-A0.4B-Instruct

Image-Text-to-Text • 1B • Updated 1 day ago • 15

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw-qwen235b-instruct-bs16-v2-ckpt6

2B • Updated 1 day ago • 10

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.muon-qwen235b-instruct-bs16-v2-ckpt0

2B • Updated 1 day ago • 11

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.muon-qwen235b-instruct-bs16-v2-ckpt8

2B • Updated 1 day ago • 15

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw-qwen235b-instruct-bs16-v2-ckpt5

2B • Updated 1 day ago • 2

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw-qwen235b-instruct-bs16-v2-ckpt4

2B • Updated 1 day ago • 10

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw-qwen235b-instruct-bs16-v2-ckpt3

2B • Updated 1 day ago • 1

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw-qwen235b-instruct-bs16-v2-ckpt2

2B • Updated 1 day ago • 10

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw-qwen235b-instruct-bs16-v2-ckpt1

2B • Updated 1 day ago • 1

inference-optimization/qwen3-test-model-123

Updated 1 day ago

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.adamw-qwen235b-instruct-bs16-v2-ckpt0

2B • Updated 2 days ago • 1

inference-optimization/Inkling-0.6B-A0.6B

Image-Text-to-Text • 0.6B • Updated 3 days ago • 1.35k • 1

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab-qwen235b-instruct-bs16-ckpt7

2B • Updated 3 days ago • 16

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab-qwen235b-instruct-bs16-ckpt6

2B • Updated 3 days ago • 15

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.muon-qwen235b-instruct-bs16-ckpt5

2B • Updated 3 days ago • 18

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.muon-qwen235b-instruct-bs16-ckpt4

2B • Updated 3 days ago • 18

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.muon-qwen235b-instruct-bs16-ckpt3

2B • Updated 3 days ago • 15

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.muon-qwen235b-instruct-bs16-ckpt2

2B • Updated 3 days ago • 17

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.muon-qwen235b-instruct-bs16-ckpt1

2B • Updated 3 days ago • 16

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab.muon-qwen235b-instruct-bs16-ckpt0

2B • Updated 3 days ago • 18

inference-optimization/Inkling-0.6B-A0.6B-NVFP4-FP8

0.6B • Updated 4 days ago • 115

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab-qwen235b-instruct-bs16-ckpt5

2B • Updated 4 days ago • 15

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab-qwen235b-instruct-bs16-ckpt4

2B • Updated 5 days ago • 20

inference-optimization/Qwen3-8B-speculator.dflash.swa.dpace.fullvocab-qwen235b-instruct-bs16-ckpt3

2B • Updated 5 days ago • 20