TJUNLP
/

FuxiTranyu-8B

Text Generation

Model card Files Files and versions Community

hrsun15 commited on Aug 14, 2024

Commit

1d5dd4e

·

verified ·

1 Parent(s): da0abcc

Update README.md

Files changed (1) hide show

README.md +4 -5

README.md CHANGED Viewed

@@ -10,7 +10,7 @@ FuxiTranyu-8B is an **open-source** **multilingual large language model** traine
 FuxiTranyu supports 43 natural languages (Arabic, Bengali, Bulgarian, Burmese, Catalan, Chinese, Czech, Dutch, English, Filipino, Finnish, French, German, Greek, Hebrew, Hindi, Hungarian, Indonesian, Italian, Japanese, Kazakh, Khmer, Korean, Kurdish, Kyrgyz, Lao, Malay, Persian, Polish, Portuguese, Romanian, Russian, Spanish, Swedish, Tamil, Tajik, Thai, Turkish, Turkmen, Ukrainian, Urdu, Uzbek, and Vietnamese) and cover 16 programming languages (Java, JavaScript, Python, PHP, C, C++, C#, TypeScript, Go, SQL, Rust, Ruby, Scala, Lua, Assembly, and Visual Basic).
-More details on the data collection & processing, pretraining and fine-tuning of FuxiTranyu can be found in the technical report.
 In addition to the base model and its checkpoints, we also release two instruction-tuned variants: SFT version at [here](https://huggingface.co/TJUNLP/FuxiTranyu-8B-Instruct), and DPO version at [here](https://huggingface.co/TJUNLP/FuxiTranyu-8B-Chat).
 ## Usage
@@ -42,12 +42,11 @@ model = AutoModelForCausalLM.from_pretrained(model_path, device_map="auto", torc
 ## Citation info
 ```bibtex
-@misc{FuxiTranyu8B,
       title={FuxiTranyu: A Multilingual Large Language Model Trained with Balanced Data},
       author={Haoran Sun, Renren Jin, Shaoyang Xu, Leiyu Pan, Supryadi, Menglong Cui, Jiangcun Du, Yikun Lei, Lei Yang, Ling Shi, Juesi Xiao, Shaolin Zhu, and Deyi Xiong},
       year={2024},
-      eprint={2408},
-      archivePrefix={arXiv},
-      primaryClass={cs.CL}
 }
 ```

 FuxiTranyu supports 43 natural languages (Arabic, Bengali, Bulgarian, Burmese, Catalan, Chinese, Czech, Dutch, English, Filipino, Finnish, French, German, Greek, Hebrew, Hindi, Hungarian, Indonesian, Italian, Japanese, Kazakh, Khmer, Korean, Kurdish, Kyrgyz, Lao, Malay, Persian, Polish, Portuguese, Romanian, Russian, Spanish, Swedish, Tamil, Tajik, Thai, Turkish, Turkmen, Ukrainian, Urdu, Uzbek, and Vietnamese) and cover 16 programming languages (Java, JavaScript, Python, PHP, C, C++, C#, TypeScript, Go, SQL, Rust, Ruby, Scala, Lua, Assembly, and Visual Basic).
+More details on the data collection & processing, pretraining and fine-tuning of FuxiTranyu can be found in the [technical report](https://arxiv.org/abs/2408.06273).
 In addition to the base model and its checkpoints, we also release two instruction-tuned variants: SFT version at [here](https://huggingface.co/TJUNLP/FuxiTranyu-8B-Instruct), and DPO version at [here](https://huggingface.co/TJUNLP/FuxiTranyu-8B-Chat).
 ## Usage
 ## Citation info
 ```bibtex
+@article{FuxiTranyu8B,
       title={FuxiTranyu: A Multilingual Large Language Model Trained with Balanced Data},
       author={Haoran Sun, Renren Jin, Shaoyang Xu, Leiyu Pan, Supryadi, Menglong Cui, Jiangcun Du, Yikun Lei, Lei Yang, Ling Shi, Juesi Xiao, Shaolin Zhu, and Deyi Xiong},
+      journal={arxiv preprint arXiv:2408.06273},
       year={2024},
+      url={https://arxiv.org/abs/2408.06273}
 }
 ```