LLM-HW3
Collection
Коллекция моделей, дообученных с помощью низкоранговых адаптаций на задачу классификации сентимента твита
•
3 items
•
Updated
Модель TinyLlama/TinyLlama-1.1B-Chat-v1.0 дообученная на датасете cardiffnlp/tweet_eval, задача классификации сентимента твита, вывести одно из трех слов -
negative, neutral, positive.
Модель дообучалась при помощи QLoRA.
8load_in_4bit=Truebnb_4bit_quant_type="nf4"bnb_4bit_compute_dtype=torch.float16lora_alpha=4lora_dropout=0.0bias="none"task_type="CAUSAL_LM"num_train_epochs=1per_device_train_batch_size=32gradient_accumulation_steps=1warmup_steps=100group_by_length=Truelr_scheduler_type="cosine"fp16=Truelearning_rate=2e-4weight_decay=1e-3F1=0.18
Base model
TinyLlama/TinyLlama-1.1B-Chat-v1.0