Commits · Dovakiins/qwerrwe

add qwen2-72b fsdp example (#1696)

00ac302
unverified

winglian commited on Jun 7, 2024

Create phi3-ft-fsdp.yml (#1580)

a82a711
unverified

aaditya commited on Jun 4, 2024

Phi-3 conversation format, example training script and perplexity metric (#1582)

cf64284
unverified

roborovski

winglian commited on Jun 4, 2024

fix lint issue that snuck through (#1665)

f5febc7
unverified

winglian commited on May 28, 2024

Fix Lora config error for Llama3 (#1659)

230e0ac
unverified

oaishi commited on May 28, 2024

Generalizing the chat_template prompt strategy (#1660) [skip ci]

cc11c6b
unverified

Keith Stevens commited on May 28, 2024

Fix Google Colab notebook 2024-05 (#1662) [skip ci]

5f91064
unverified

Maciek commited on May 28, 2024

Update tiny-llama qlora.yml addressing eval packing error (#1638)

84bb806
unverified

Jaydeep Thik commited on May 22, 2024

update outputs path so that we can mount workspace to /workspace/data (#1623)

4fde300
unverified

winglian commited on May 15, 2024

Add ORPO example and e2e test (#1572)

98c25e1
unverified

tokestermw commited on Apr 27, 2024

fix(yml): update llama-3 config (#1543) [skip ci]

0e8f340
unverified

Nanobit commited on Apr 19, 2024

fix broken linting (#1541)

c10563c
unverified

winglian commited on Apr 19, 2024

Adding Llama-3 qlora (#1536)

37c037c
unverified

aaditya commited on Apr 18, 2024

llama-3 examples (#1537)

15f7910
unverified

winglian commited on Apr 18, 2024

Create mixtral_22.yml (#1514) [skip ci]

0eadfc8
unverified

Atlas commited on Apr 17, 2024

DBRX Model Support (#1462)

132eb74
unverified

winglian commited on Apr 12, 2024

Fix the wrong adapter in qwen2-moe-qlora example (#1501) [skip ci]

7f17eff
unverified

MaziyarPanahi commited on Apr 9, 2024

LISA (#1469)

0ddfb24
unverified

winglian

tmm1 commited on Apr 1, 2024

qwen2_moe support w multipack (#1455)

6086be8
unverified

winglian commited on Mar 29, 2024

fix some of the edge cases for Jamba (#1452)

05b398a
unverified

winglian commited on Mar 29, 2024

Jamba (#1451)

02af082
unverified

winglian commited on Mar 29, 2024

turn sample_packing on for training (#1438) [skip ci]

c19d060
unverified

satpalsr commited on Mar 26, 2024

chore(config): refactor old mistral config (#1435)

f1ebaa0
unverified

Nanobit commited on Mar 25, 2024

strip out hacky qlora-fsdp workarounds now that qlora-fsdp fixes are upstreamed (#1428)

2a1589f
unverified

winglian commited on Mar 21, 2024

Fix Gemma 7b qlora.yml (#1405)

6366b0c
unverified

rasbt commited on Mar 14, 2024

Train parameters exclusively in specific ranges (#1390)

05bcc9e
unverified

seungduk commited on Mar 14, 2024

FDSP + QLoRA (#1378)

9b6ee83
unverified

winglian commited on Mar 8, 2024

add starcoder2 (#1349)

e0f1895
unverified

ehartford

winglian

Nanobit commited on Mar 6, 2024

Update tinyllama lora.yml to fix eval packing issue (#1362)

8984bf1
unverified

rasbt commited on Mar 5, 2024

chore: enable sample_packing for Gemma (#1351)

170d4d7
unverified

Nanobit commited on Mar 2, 2024

Mps mistral lora (#1292) [skip ci]

0f6af36
unverified

Maxime

Nanobit

winglian commited on Feb 27, 2024

Add StableLM 2 Example Scripts (#1327) [skip ci]

f30d062
unverified

ncoop57 commited on Feb 26, 2024

multipack for gemma (#1313)

2752d5f
unverified

winglian commited on Feb 22, 2024

Adding Google's gemma Model (#1312)

9e300ac
unverified

aaditya commited on Feb 21, 2024

Add instructions for playing with qlora model to colab example (#1290)

6ab69ec
unverified

Jared Palmer

Nanobit JohanWork commited on Feb 21, 2024

fix(examples): remove is_*_derived as it's parsed automatically (#1297)

a7a9a14
unverified

Nanobit commited on Feb 21, 2024

Add seq2seq eval benchmark callback (#1274)

5a5d474
unverified

LeonardoEmili commited on Feb 13, 2024

Add MPS support (#1264)

fac2d98
unverified

Maxime

winglian commited on Feb 12, 2024

lock pytorch (#1247) [skip ci]

1c7ed26
unverified

JohanWork commited on Feb 6, 2024

Pretrain transforms (#1261)

c7cf381
unverified

winglian commited on Feb 6, 2024

Peft lotfq (#1222)

4cb7900
unverified

winglian commited on Jan 28, 2024

Update qlora.yml - remove `max_packed_sequence_len` (#1210) [skip ci]

5407ddd
unverified

7flash commited on Jan 26, 2024

add colab example (#1196) [skip ci]

ee0b5f6
unverified

JohanWork commited on Jan 25, 2024

Mixtral fixes 20240124 (#1192) [skip ci]

54d2ac1
unverified

winglian commited on Jan 24, 2024

Phi2 multipack (#1173)

814aee6
unverified

winglian commited on Jan 23, 2024

Fine-Tuning Mistral-7b for Real-World Chatbot Applications Using Axolotl (Lora used) (#1155)

cc25039
unverified

Tilemachos Chatzipapas twenty8th

winglian commited on Jan 23, 2024

Falcon embeddings (#1149) [skip docker]

e799e08
unverified

winglian commited on Jan 23, 2024

set fp16 to false if bf16, update bf16: auto in example YAMLs (#1122) [skip ci]

782b6a4
unverified

winglian

Nanobit commited on Jan 22, 2024

Add shifted sparse attention (#973) [skip-ci]

1d70f24
unverified

jrc joecummings

winglian commited on Jan 18, 2024

pin model_revision for phi2 (#1123)

c1b741d
unverified

winglian commited on Jan 14, 2024

Commit History

add qwen2-72b fsdp example (#1696) 00ac302 unverified

Create phi3-ft-fsdp.yml (#1580) a82a711 unverified

Phi-3 conversation format, example training script and perplexity metric (#1582) cf64284 unverified

fix lint issue that snuck through (#1665) f5febc7 unverified

Fix Lora config error for Llama3 (#1659) 230e0ac unverified

Generalizing the chat_template prompt strategy (#1660) [skip ci] cc11c6b unverified

Fix Google Colab notebook 2024-05 (#1662) [skip ci] 5f91064 unverified

Update tiny-llama qlora.yml addressing eval packing error (#1638) 84bb806 unverified

update outputs path so that we can mount workspace to /workspace/data (#1623) 4fde300 unverified

Add ORPO example and e2e test (#1572) 98c25e1 unverified

fix(yml): update llama-3 config (#1543) [skip ci] 0e8f340 unverified

fix broken linting (#1541) c10563c unverified

Adding Llama-3 qlora (#1536) 37c037c unverified

llama-3 examples (#1537) 15f7910 unverified

Create mixtral_22.yml (#1514) [skip ci] 0eadfc8 unverified

DBRX Model Support (#1462) 132eb74 unverified

Fix the wrong adapter in qwen2-moe-qlora example (#1501) [skip ci] 7f17eff unverified

LISA (#1469) 0ddfb24 unverified

qwen2_moe support w multipack (#1455) 6086be8 unverified

fix some of the edge cases for Jamba (#1452) 05b398a unverified

Jamba (#1451) 02af082 unverified

turn sample_packing on for training (#1438) [skip ci] c19d060 unverified

chore(config): refactor old mistral config (#1435) f1ebaa0 unverified

strip out hacky qlora-fsdp workarounds now that qlora-fsdp fixes are upstreamed (#1428) 2a1589f unverified

Fix Gemma 7b qlora.yml (#1405) 6366b0c unverified

Train parameters exclusively in specific ranges (#1390) 05bcc9e unverified

FDSP + QLoRA (#1378) 9b6ee83 unverified

add starcoder2 (#1349) e0f1895 unverified

Update tinyllama lora.yml to fix eval packing issue (#1362) 8984bf1 unverified

chore: enable sample_packing for Gemma (#1351) 170d4d7 unverified

Mps mistral lora (#1292) [skip ci] 0f6af36 unverified

Add StableLM 2 Example Scripts (#1327) [skip ci] f30d062 unverified

multipack for gemma (#1313) 2752d5f unverified

Adding Google's gemma Model (#1312) 9e300ac unverified

Add instructions for playing with qlora model to colab example (#1290) 6ab69ec unverified

fix(examples): remove is_*_derived as it's parsed automatically (#1297) a7a9a14 unverified

Add seq2seq eval benchmark callback (#1274) 5a5d474 unverified

Add MPS support (#1264) fac2d98 unverified

lock pytorch (#1247) [skip ci] 1c7ed26 unverified

Pretrain transforms (#1261) c7cf381 unverified

Peft lotfq (#1222) 4cb7900 unverified

Update qlora.yml - remove `max_packed_sequence_len` (#1210) [skip ci] 5407ddd unverified

add colab example (#1196) [skip ci] ee0b5f6 unverified

Mixtral fixes 20240124 (#1192) [skip ci] 54d2ac1 unverified

Phi2 multipack (#1173) 814aee6 unverified

Fine-Tuning Mistral-7b for Real-World Chatbot Applications Using Axolotl (Lora used) (#1155) cc25039 unverified

Falcon embeddings (#1149) [skip docker] e799e08 unverified

set fp16 to false if bf16, update bf16: auto in example YAMLs (#1122) [skip ci] 782b6a4 unverified

Add shifted sparse attention (#973) [skip-ci] 1d70f24 unverified

pin model_revision for phi2 (#1123) c1b741d unverified

add qwen2-72b fsdp example (#1696)

00ac302
unverified

Create phi3-ft-fsdp.yml (#1580)

a82a711
unverified

Phi-3 conversation format, example training script and perplexity metric (#1582)

cf64284
unverified

fix lint issue that snuck through (#1665)

f5febc7
unverified

Fix Lora config error for Llama3 (#1659)

230e0ac
unverified

Generalizing the chat_template prompt strategy (#1660) [skip ci]

cc11c6b
unverified

Fix Google Colab notebook 2024-05 (#1662) [skip ci]

5f91064
unverified

Update tiny-llama qlora.yml addressing eval packing error (#1638)

84bb806
unverified

update outputs path so that we can mount workspace to /workspace/data (#1623)

4fde300
unverified

Add ORPO example and e2e test (#1572)

98c25e1
unverified

fix(yml): update llama-3 config (#1543) [skip ci]

0e8f340
unverified

fix broken linting (#1541)

c10563c
unverified

Adding Llama-3 qlora (#1536)

37c037c
unverified

llama-3 examples (#1537)

15f7910
unverified

Create mixtral_22.yml (#1514) [skip ci]

0eadfc8
unverified

DBRX Model Support (#1462)

132eb74
unverified

Fix the wrong adapter in qwen2-moe-qlora example (#1501) [skip ci]

7f17eff
unverified

LISA (#1469)

0ddfb24
unverified

qwen2_moe support w multipack (#1455)

6086be8
unverified

fix some of the edge cases for Jamba (#1452)

05b398a
unverified

Jamba (#1451)

02af082
unverified

turn sample_packing on for training (#1438) [skip ci]

c19d060
unverified

chore(config): refactor old mistral config (#1435)

f1ebaa0
unverified

strip out hacky qlora-fsdp workarounds now that qlora-fsdp fixes are upstreamed (#1428)

2a1589f
unverified

Fix Gemma 7b qlora.yml (#1405)

6366b0c
unverified

Train parameters exclusively in specific ranges (#1390)

05bcc9e
unverified

FDSP + QLoRA (#1378)

9b6ee83
unverified

add starcoder2 (#1349)

e0f1895
unverified

Update tinyllama lora.yml to fix eval packing issue (#1362)

8984bf1
unverified

chore: enable sample_packing for Gemma (#1351)

170d4d7
unverified

Mps mistral lora (#1292) [skip ci]

0f6af36
unverified

Add StableLM 2 Example Scripts (#1327) [skip ci]

f30d062
unverified

multipack for gemma (#1313)

2752d5f
unverified

Adding Google's gemma Model (#1312)

9e300ac
unverified

Add instructions for playing with qlora model to colab example (#1290)

6ab69ec
unverified

fix(examples): remove is_*_derived as it's parsed automatically (#1297)

a7a9a14
unverified

Add seq2seq eval benchmark callback (#1274)

5a5d474
unverified

Add MPS support (#1264)

fac2d98
unverified

lock pytorch (#1247) [skip ci]

1c7ed26
unverified

Pretrain transforms (#1261)

c7cf381
unverified

Peft lotfq (#1222)

4cb7900
unverified

Update qlora.yml - remove `max_packed_sequence_len` (#1210) [skip ci]

5407ddd
unverified

add colab example (#1196) [skip ci]

ee0b5f6
unverified

Mixtral fixes 20240124 (#1192) [skip ci]

54d2ac1
unverified

Phi2 multipack (#1173)

814aee6
unverified

Fine-Tuning Mistral-7b for Real-World Chatbot Applications Using Axolotl (Lora used) (#1155)

cc25039
unverified

Falcon embeddings (#1149) [skip docker]

e799e08
unverified

set fp16 to false if bf16, update bf16: auto in example YAMLs (#1122) [skip ci]

782b6a4
unverified

Add shifted sparse attention (#973) [skip-ci]

1d70f24
unverified

pin model_revision for phi2 (#1123)

c1b741d
unverified