cszhzleo
/

Meta-Llama-3.1-8B-Instruct-nc2-bs1-token4096-neuron-220

Model card Files Files and versions Community

cszhzleo commited on Sep 25, 2024

Commit

decb4b1

·

verified ·

1 Parent(s): 6dbfd9d

Update README.md

Files changed (1) hide show

README.md +10 -3

README.md CHANGED Viewed

@@ -1,13 +1,20 @@
 ---
 license: mit
 ---
-export
 ```
 optimum-cli export neuron  --model NousResearch/Meta-Llama-3.1-8B-Instruct --batch_size 1 --sequence_length 4096 --num_cores 2 --auto_cast_type fp16  ./models-hf/NousResearch/Meta-Llama-3.1-8B-Instruct
 ```
-run
 ```
 docker run -it --name llama-31 --rm \
    -p 8080:80 \
@@ -26,7 +33,7 @@ docker run -it --name llama-31 --rm \
 ```
-test
 ```
 curl 127.0.0.1:8080/generate     -X POST     -d '{"inputs":"What is Deep Learning?","parameters":{"max_new_tokens":20}}'     -H 'Content-Type: application/json'
 ```

 ---
 license: mit
 ---
+### environment
+optimum-neuron  0.0.25.dev0
+neuron 2.20.0
+transformers-neuronx  0.12.313
+transformers    4.43.2
+### export
 ```
 optimum-cli export neuron  --model NousResearch/Meta-Llama-3.1-8B-Instruct --batch_size 1 --sequence_length 4096 --num_cores 2 --auto_cast_type fp16  ./models-hf/NousResearch/Meta-Llama-3.1-8B-Instruct
 ```
+### run
 ```
 docker run -it --name llama-31 --rm \
    -p 8080:80 \
 ```
+### test
 ```
 curl 127.0.0.1:8080/generate     -X POST     -d '{"inputs":"What is Deep Learning?","parameters":{"max_new_tokens":20}}'     -H 'Content-Type: application/json'
 ```