neuralmagic
/

Meta-Llama-3.1-70B-Instruct-quantized.w8a16

Text Generation

text-generation-inference

Inference Endpoints

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3.1-70B-Instruct-quantized.w8a16

Commit History

Update README.md

b6c9b9c
verified

alexmarques commited on Jul 31, 2024

Update README.md

c085fe9
verified

alexmarques commited on Jul 30, 2024

Update README.md

17984c5
verified

alexmarques commited on Jul 30, 2024

Create README.md

dc44c57
verified

alexmarques commited on Jul 29, 2024

Upload folder using huggingface_hub

3d7e3dc
verified

alexmarques commited on Jul 24, 2024

initial commit

a18f683
verified

alexmarques commited on Jul 24, 2024