swinv2-tiny-patch4-window8-256-OT / trainer_state.json

End of training

39ca2be verified 3 months ago

12.6 kB

	{
	"best_metric": 0.8225806451612904,
	"best_model_checkpoint": "swinv2-tiny-patch4-window8-256-OT\\checkpoint-176",
	"epoch": 36.36363636363637,
	"eval_steps": 500,
	"global_step": 200,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.91,
	"eval_accuracy": 0.08064516129032258,
	"eval_loss": 8.843916893005371,
	"eval_runtime": 2.8151,
	"eval_samples_per_second": 22.024,
	"eval_steps_per_second": 1.421,
	"step": 5
	},
	{
	"epoch": 1.82,
	"learning_rate": 7.5e-05,
	"loss": 8.7922,
	"step": 10
	},
	{
	"epoch": 2.0,
	"eval_accuracy": 0.08064516129032258,
	"eval_loss": 8.001582145690918,
	"eval_runtime": 2.1045,
	"eval_samples_per_second": 29.461,
	"eval_steps_per_second": 1.901,
	"step": 11
	},
	{
	"epoch": 2.91,
	"eval_accuracy": 0.08064516129032258,
	"eval_loss": 6.000851154327393,
	"eval_runtime": 2.0735,
	"eval_samples_per_second": 29.901,
	"eval_steps_per_second": 1.929,
	"step": 16
	},
	{
	"epoch": 3.64,
	"learning_rate": 0.00015,
	"loss": 6.5264,
	"step": 20
	},
	{
	"epoch": 4.0,
	"eval_accuracy": 0.08064516129032258,
	"eval_loss": 2.7431113719940186,
	"eval_runtime": 2.1035,
	"eval_samples_per_second": 29.475,
	"eval_steps_per_second": 1.902,
	"step": 22
	},
	{
	"epoch": 4.91,
	"eval_accuracy": 0.45161290322580644,
	"eval_loss": 1.3018240928649902,
	"eval_runtime": 2.0906,
	"eval_samples_per_second": 29.656,
	"eval_steps_per_second": 1.913,
	"step": 27
	},
	{
	"epoch": 5.45,
	"learning_rate": 0.00014166666666666665,
	"loss": 2.16,
	"step": 30
	},
	{
	"epoch": 6.0,
	"eval_accuracy": 0.45161290322580644,
	"eval_loss": 1.2696114778518677,
	"eval_runtime": 2.0785,
	"eval_samples_per_second": 29.829,
	"eval_steps_per_second": 1.924,
	"step": 33
	},
	{
	"epoch": 6.91,
	"eval_accuracy": 0.45161290322580644,
	"eval_loss": 1.2057440280914307,
	"eval_runtime": 2.5671,
	"eval_samples_per_second": 24.152,
	"eval_steps_per_second": 1.558,
	"step": 38
	},
	{
	"epoch": 7.27,
	"learning_rate": 0.0001333333333333333,
	"loss": 1.2876,
	"step": 40
	},
	{
	"epoch": 8.0,
	"eval_accuracy": 0.45161290322580644,
	"eval_loss": 1.2157402038574219,
	"eval_runtime": 2.1295,
	"eval_samples_per_second": 29.115,
	"eval_steps_per_second": 1.878,
	"step": 44
	},
	{
	"epoch": 8.91,
	"eval_accuracy": 0.45161290322580644,
	"eval_loss": 1.245875597000122,
	"eval_runtime": 2.141,
	"eval_samples_per_second": 28.958,
	"eval_steps_per_second": 1.868,
	"step": 49
	},
	{
	"epoch": 9.09,
	"learning_rate": 0.000125,
	"loss": 1.2456,
	"step": 50
	},
	{
	"epoch": 10.0,
	"eval_accuracy": 0.45161290322580644,
	"eval_loss": 1.210959792137146,
	"eval_runtime": 2.181,
	"eval_samples_per_second": 28.427,
	"eval_steps_per_second": 1.834,
	"step": 55
	},
	{
	"epoch": 10.91,
	"learning_rate": 0.00011666666666666665,
	"loss": 1.1901,
	"step": 60
	},
	{
	"epoch": 10.91,
	"eval_accuracy": 0.45161290322580644,
	"eval_loss": 1.1861207485198975,
	"eval_runtime": 2.094,
	"eval_samples_per_second": 29.608,
	"eval_steps_per_second": 1.91,
	"step": 60
	},
	{
	"epoch": 12.0,
	"eval_accuracy": 0.46774193548387094,
	"eval_loss": 1.0847262144088745,
	"eval_runtime": 2.212,
	"eval_samples_per_second": 28.028,
	"eval_steps_per_second": 1.808,
	"step": 66
	},
	{
	"epoch": 12.73,
	"learning_rate": 0.00010833333333333333,
	"loss": 1.0665,
	"step": 70
	},
	{
	"epoch": 12.91,
	"eval_accuracy": 0.46774193548387094,
	"eval_loss": 1.0943629741668701,
	"eval_runtime": 2.08,
	"eval_samples_per_second": 29.808,
	"eval_steps_per_second": 1.923,
	"step": 71
	},
	{
	"epoch": 14.0,
	"eval_accuracy": 0.46774193548387094,
	"eval_loss": 1.1853879690170288,
	"eval_runtime": 2.093,
	"eval_samples_per_second": 29.623,
	"eval_steps_per_second": 1.911,
	"step": 77
	},
	{
	"epoch": 14.55,
	"learning_rate": 9.999999999999999e-05,
	"loss": 1.033,
	"step": 80
	},
	{
	"epoch": 14.91,
	"eval_accuracy": 0.5,
	"eval_loss": 1.025220274925232,
	"eval_runtime": 2.4167,
	"eval_samples_per_second": 25.655,
	"eval_steps_per_second": 1.655,
	"step": 82
	},
	{
	"epoch": 16.0,
	"eval_accuracy": 0.5161290322580645,
	"eval_loss": 1.216417908668518,
	"eval_runtime": 2.2296,
	"eval_samples_per_second": 27.808,
	"eval_steps_per_second": 1.794,
	"step": 88
	},
	{
	"epoch": 16.36,
	"learning_rate": 9.166666666666667e-05,
	"loss": 1.0323,
	"step": 90
	},
	{
	"epoch": 16.91,
	"eval_accuracy": 0.5,
	"eval_loss": 1.0642980337142944,
	"eval_runtime": 2.199,
	"eval_samples_per_second": 28.194,
	"eval_steps_per_second": 1.819,
	"step": 93
	},
	{
	"epoch": 18.0,
	"eval_accuracy": 0.6612903225806451,
	"eval_loss": 0.9802310466766357,
	"eval_runtime": 2.1395,
	"eval_samples_per_second": 28.979,
	"eval_steps_per_second": 1.87,
	"step": 99
	},
	{
	"epoch": 18.18,
	"learning_rate": 8.333333333333333e-05,
	"loss": 0.9329,
	"step": 100
	},
	{
	"epoch": 18.91,
	"eval_accuracy": 0.5967741935483871,
	"eval_loss": 0.9474769830703735,
	"eval_runtime": 2.179,
	"eval_samples_per_second": 28.453,
	"eval_steps_per_second": 1.836,
	"step": 104
	},
	{
	"epoch": 20.0,
	"learning_rate": 7.5e-05,
	"loss": 0.8619,
	"step": 110
	},
	{
	"epoch": 20.0,
	"eval_accuracy": 0.6451612903225806,
	"eval_loss": 0.9114610552787781,
	"eval_runtime": 2.125,
	"eval_samples_per_second": 29.176,
	"eval_steps_per_second": 1.882,
	"step": 110
	},
	{
	"epoch": 20.91,
	"eval_accuracy": 0.6451612903225806,
	"eval_loss": 0.8893528580665588,
	"eval_runtime": 2.2755,
	"eval_samples_per_second": 27.246,
	"eval_steps_per_second": 1.758,
	"step": 115
	},
	{
	"epoch": 21.82,
	"learning_rate": 6.666666666666666e-05,
	"loss": 0.8019,
	"step": 120
	},
	{
	"epoch": 22.0,
	"eval_accuracy": 0.6935483870967742,
	"eval_loss": 0.8276461958885193,
	"eval_runtime": 2.182,
	"eval_samples_per_second": 28.414,
	"eval_steps_per_second": 1.833,
	"step": 121
	},
	{
	"epoch": 22.91,
	"eval_accuracy": 0.6774193548387096,
	"eval_loss": 0.8156123757362366,
	"eval_runtime": 2.1835,
	"eval_samples_per_second": 28.394,
	"eval_steps_per_second": 1.832,
	"step": 126
	},
	{
	"epoch": 23.64,
	"learning_rate": 5.8333333333333326e-05,
	"loss": 0.7675,
	"step": 130
	},
	{
	"epoch": 24.0,
	"eval_accuracy": 0.6290322580645161,
	"eval_loss": 0.7928251624107361,
	"eval_runtime": 2.7367,
	"eval_samples_per_second": 22.655,
	"eval_steps_per_second": 1.462,
	"step": 132
	},
	{
	"epoch": 24.91,
	"eval_accuracy": 0.7419354838709677,
	"eval_loss": 0.7163397669792175,
	"eval_runtime": 2.3511,
	"eval_samples_per_second": 26.371,
	"eval_steps_per_second": 1.701,
	"step": 137
	},
	{
	"epoch": 25.45,
	"learning_rate": 4.9999999999999996e-05,
	"loss": 0.6762,
	"step": 140
	},
	{
	"epoch": 26.0,
	"eval_accuracy": 0.6774193548387096,
	"eval_loss": 0.7387820482254028,
	"eval_runtime": 2.261,
	"eval_samples_per_second": 27.421,
	"eval_steps_per_second": 1.769,
	"step": 143
	},
	{
	"epoch": 26.91,
	"eval_accuracy": 0.7580645161290323,
	"eval_loss": 0.6518718004226685,
	"eval_runtime": 2.2715,
	"eval_samples_per_second": 27.294,
	"eval_steps_per_second": 1.761,
	"step": 148
	},
	{
	"epoch": 27.27,
	"learning_rate": 4.1666666666666665e-05,
	"loss": 0.6771,
	"step": 150
	},
	{
	"epoch": 28.0,
	"eval_accuracy": 0.7419354838709677,
	"eval_loss": 0.6709696054458618,
	"eval_runtime": 2.6851,
	"eval_samples_per_second": 23.09,
	"eval_steps_per_second": 1.49,
	"step": 154
	},
	{
	"epoch": 28.91,
	"eval_accuracy": 0.7580645161290323,
	"eval_loss": 0.6073653697967529,
	"eval_runtime": 2.3635,
	"eval_samples_per_second": 26.232,
	"eval_steps_per_second": 1.692,
	"step": 159
	},
	{
	"epoch": 29.09,
	"learning_rate": 3.333333333333333e-05,
	"loss": 0.6424,
	"step": 160
	},
	{
	"epoch": 30.0,
	"eval_accuracy": 0.7258064516129032,
	"eval_loss": 0.672946035861969,
	"eval_runtime": 2.2598,
	"eval_samples_per_second": 27.436,
	"eval_steps_per_second": 1.77,
	"step": 165
	},
	{
	"epoch": 30.91,
	"learning_rate": 2.4999999999999998e-05,
	"loss": 0.6139,
	"step": 170
	},
	{
	"epoch": 30.91,
	"eval_accuracy": 0.7903225806451613,
	"eval_loss": 0.5744480490684509,
	"eval_runtime": 2.189,
	"eval_samples_per_second": 28.323,
	"eval_steps_per_second": 1.827,
	"step": 170
	},
	{
	"epoch": 32.0,
	"eval_accuracy": 0.8225806451612904,
	"eval_loss": 0.6192476749420166,
	"eval_runtime": 2.142,
	"eval_samples_per_second": 28.945,
	"eval_steps_per_second": 1.867,
	"step": 176
	},
	{
	"epoch": 32.73,
	"learning_rate": 1.6666666666666664e-05,
	"loss": 0.5713,
	"step": 180
	},
	{
	"epoch": 32.91,
	"eval_accuracy": 0.7903225806451613,
	"eval_loss": 0.6452686190605164,
	"eval_runtime": 2.1495,
	"eval_samples_per_second": 28.844,
	"eval_steps_per_second": 1.861,
	"step": 181
	},
	{
	"epoch": 34.0,
	"eval_accuracy": 0.7903225806451613,
	"eval_loss": 0.6392035484313965,
	"eval_runtime": 2.1965,
	"eval_samples_per_second": 28.226,
	"eval_steps_per_second": 1.821,
	"step": 187
	},
	{
	"epoch": 34.55,
	"learning_rate": 8.333333333333332e-06,
	"loss": 0.5462,
	"step": 190
	},
	{
	"epoch": 34.91,
	"eval_accuracy": 0.8225806451612904,
	"eval_loss": 0.5955818295478821,
	"eval_runtime": 2.247,
	"eval_samples_per_second": 27.592,
	"eval_steps_per_second": 1.78,
	"step": 192
	},
	{
	"epoch": 36.0,
	"eval_accuracy": 0.8225806451612904,
	"eval_loss": 0.5892814993858337,
	"eval_runtime": 2.5326,
	"eval_samples_per_second": 24.481,
	"eval_steps_per_second": 1.579,
	"step": 198
	},
	{
	"epoch": 36.36,
	"learning_rate": 0.0,
	"loss": 0.5393,
	"step": 200
	},
	{
	"epoch": 36.36,
	"eval_accuracy": 0.8225806451612904,
	"eval_loss": 0.5898378491401672,
	"eval_runtime": 2.2395,
	"eval_samples_per_second": 27.685,
	"eval_steps_per_second": 1.786,
	"step": 200
	},
	{
	"epoch": 36.36,
	"step": 200,
	"total_flos": 4.141200256480051e+17,
	"train_loss": 1.5982162952423096,
	"train_runtime": 635.1405,
	"train_samples_per_second": 22.042,
	"train_steps_per_second": 0.315
	}
	],
	"logging_steps": 10,
	"max_steps": 200,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 40,
	"save_steps": 500,
	"total_flos": 4.141200256480051e+17,
	"train_batch_size": 16,
	"trial_name": null,
	"trial_params": null
	}