neuralmagic
/

Meta-Llama-3-70B-Instruct-quantized.w8a8

Text Generation

text-generation-inference

8-bit precision

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3-70B-Instruct-quantized.w8a8

Commit History

Updated compression_config to quantization_config

e52ae34
verified

mgoin commited on Oct 9, 2024

Update README.md

9547f54
verified

alexmarques commited on Jul 18, 2024

Update README.md

7081ae4
verified

alexmarques commited on Jul 18, 2024

Create README.md

f978f64
verified

alexmarques commited on Jul 18, 2024

Upload folder using huggingface_hub

c85d356
verified

alexmarques commited on Jul 14, 2024

initial commit

3633bf7
verified

alexmarques commited on Jul 14, 2024