martimfasantos
/

tinyllama-1.1b-sum-dpo-qlora

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

tinyllama-1.1b-sum-dpo-qlora

Commit History

Training in progress, step 1000

28b023f
verified

martimfasantos commited on May 9, 2024

Training in progress, step 900

f637d86
verified

martimfasantos commited on May 9, 2024

Training in progress, step 800

5254e6a
verified

martimfasantos commited on May 9, 2024

Training in progress, step 700

07a752d
verified

martimfasantos commited on May 9, 2024

Training in progress, step 600

8945cbd
verified

martimfasantos commited on May 9, 2024

Training in progress, step 500

731e704
verified

martimfasantos commited on May 9, 2024

Training in progress, step 400

1db3fd4
verified

martimfasantos commited on May 9, 2024

Training in progress, step 300

53c90f2
verified

martimfasantos commited on May 9, 2024

Training in progress, step 200

3b70df4
verified

martimfasantos commited on May 9, 2024

Training in progress, step 100

fe47e4b
verified

martimfasantos commited on May 9, 2024

initial commit

e349552
verified

martimfasantos commited on May 9, 2024