8.83 GB

Ctrl+K

1 contributor

History: 2 commits

autoprogrammer

Upload sdar_4b_multi_block_causal-final

9d1da8f verified 1 day ago

.gitattributes

1.52 kB
initial commit 1 day ago
README.md

1.35 kB
Upload sdar_4b_multi_block_causal-final 1 day ago
added_tokens.json

729 Bytes
Upload sdar_4b_multi_block_causal-final 1 day ago
all_results.json

260 Bytes
Upload sdar_4b_multi_block_causal-final 1 day ago
chat_template.jinja

4.12 kB
Upload sdar_4b_multi_block_causal-final 1 day ago
config.json

1.13 kB
Upload sdar_4b_multi_block_causal-final 1 day ago
configuration_sdar.py

11.2 kB
Upload sdar_4b_multi_block_causal-final 1 day ago
fused_linear_diffusion_cross_entropy.py

23.8 kB
Upload sdar_4b_multi_block_causal-final 1 day ago
generation_config.json

214 Bytes
Upload sdar_4b_multi_block_causal-final 1 day ago
merges.txt

1.67 MB
Upload sdar_4b_multi_block_causal-final 1 day ago
model-00001-of-00002.safetensors

4.97 GB
xet

Upload sdar_4b_multi_block_causal-final 1 day ago
model-00002-of-00002.safetensors

3.86 GB
xet

Upload sdar_4b_multi_block_causal-final 1 day ago
model.safetensors.index.json

32.9 kB
Upload sdar_4b_multi_block_causal-final 1 day ago
modeling_sdar.py

67.3 kB
Upload sdar_4b_multi_block_causal-final 1 day ago
special_tokens_map.json

774 Bytes
Upload sdar_4b_multi_block_causal-final 1 day ago
tokenization_qwen2.py

14 kB
Upload sdar_4b_multi_block_causal-final 1 day ago
tokenizer_config.json

5.76 kB
Upload sdar_4b_multi_block_causal-final 1 day ago
train_results.json

260 Bytes
Upload sdar_4b_multi_block_causal-final 1 day ago
trainer_log.jsonl

13.7 kB
Upload sdar_4b_multi_block_causal-final 1 day ago
trainer_state.json

13.1 kB
Upload sdar_4b_multi_block_causal-final 1 day ago
training_args.bin
Detected Pickle imports (14)
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "torch.bfloat16",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig",
- "accelerate.state.PartialState",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_utils.SchedulerType",
- "transformers.integrations.deepspeed.HfDeepSpeedConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "llamafactory.hparams.training_args.TrainingArguments",
- "transformers.trainer_utils.SaveStrategy",
- "torch.device",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.HubStrategy",
- "transformers.training_args.OptimizerNames"
How to fix it?
7.89 kB
xet

Upload sdar_4b_multi_block_causal-final 1 day ago
training_loss.png

37.6 kB
Upload sdar_4b_multi_block_causal-final 1 day ago
vocab.json

3.38 MB
Upload sdar_4b_multi_block_causal-final 1 day ago

Detected Pickle imports (14)