argilla
/

SmolLM2-360M-synthetic-concise-reasoning

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Metrics Training metrics Community

SmolLM2-360M-synthetic-concise-reasoning

1.45 GB

1 contributor

History: 5 commits

davidberenstein1957's picture

davidberenstein1957

Update README.md

b203186 verified 10 months ago

runs
End of training 10 months ago
.gitattributes

1.52 kB

initial commit 10 months ago
README.md

1.65 kB

Update README.md 10 months ago
config.json

802 Bytes

End of training 10 months ago
generation_config.json

137 Bytes

End of training 10 months ago
merges.txt

466 kB

End of training 10 months ago
model.safetensors

1.45 GB
xet

End of training 10 months ago
special_tokens_map.json

565 Bytes

End of training 10 months ago
tokenizer.json

3.52 MB

End of training 10 months ago
tokenizer_config.json

3.62 kB

End of training 10 months ago
training_args.bin
Detected Pickle imports (10)
- "torch.device",
- "trl.trainer.sft_config.SFTConfig",
- "transformers.training_args.OptimizerNames",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_utils.HubStrategy",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.SaveStrategy",
- "transformers.trainer_utils.SchedulerType",
- "accelerate.state.PartialState",
- "transformers.trainer_utils.IntervalStrategy"
How to fix it?
5.62 kB
xet

End of training 10 months ago
vocab.json

801 kB

End of training 10 months ago