Remek
/

Llama-3-8B-Omnibus-1-PL-v01-INSTRUCT-GGUF

Text Generation

Inference Endpoints

Model card Files Files and versions Community

Remek commited on Apr 22, 2024

Commit

21df202

·

verified ·

1 Parent(s): e2b9343

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -40,7 +40,7 @@ Uwaga!
 * Model NIE jest CENZUROWANY. To wersja do zabawy. Nie została ujarzmiona.
 * Model będzie dalej rozwijany ponieważ eksperymentuję z a. kolejnymi wersjami datasetu, b. model jest świetną bazą do testowania różnych technik finetunowania (LoRA, QLoRA; DPO, ORPO itd.)
 * Udostępniłem go spontanicznie by użytkownicy mogli go używać i sprawdzać jakość Llama 3 ale w kontekście języka polskiego.
-* Po informacji, że baza była trenowana na 15T tokenów (tylko 5% nie angielskich) uznałem, że to świetna baza do finetuningu. Być może lekkie dotrenowanie modelu za pomocą contingued-pretraining da jeszcze większy uzysk.
 ### Sposób kodowania nazwy modelu
 * Nazwa modelu bazowego: Llama-3-8B

 * Model NIE jest CENZUROWANY. To wersja do zabawy. Nie została ujarzmiona.
 * Model będzie dalej rozwijany ponieważ eksperymentuję z a. kolejnymi wersjami datasetu, b. model jest świetną bazą do testowania różnych technik finetunowania (LoRA, QLoRA; DPO, ORPO itd.)
 * Udostępniłem go spontanicznie by użytkownicy mogli go używać i sprawdzać jakość Llama 3 ale w kontekście języka polskiego.
+* Po informacji, że baza była trenowana na 15T tokenów (tylko 5% nie angielskich) uznałem, że to świetny model do finetuningu. Być może lekkie dotrenowanie modelu za pomocą contingued-pretraining da jeszcze większy uzysk.
 ### Sposób kodowania nazwy modelu
 * Nazwa modelu bazowego: Llama-3-8B