{
  "best_metric": 28.696460806301626,
  "best_model_checkpoint": "./whisper-tiny-hi/checkpoint-45000",
  "epoch": 14.46952886316128,
  "eval_steps": 5000,
  "global_step": 45000,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 0.06431902235086026,
      "grad_norm": 4.596249103546143,
      "learning_rate": 2.0000000000000003e-06,
      "loss": 1.7191,
      "step": 200
    },
    {
      "epoch": 0.12863804470172052,
      "grad_norm": 3.4318807125091553,
      "learning_rate": 4.000000000000001e-06,
      "loss": 0.9245,
      "step": 400
    },
    {
      "epoch": 0.1929570670525808,
      "grad_norm": 3.58982253074646,
      "learning_rate": 6e-06,
      "loss": 0.6853,
      "step": 600
    },
    {
      "epoch": 0.25727608940344104,
      "grad_norm": 3.402555227279663,
      "learning_rate": 8.000000000000001e-06,
      "loss": 0.5814,
      "step": 800
    },
    {
      "epoch": 0.32159511175430133,
      "grad_norm": 3.178177833557129,
      "learning_rate": 1e-05,
      "loss": 0.5202,
      "step": 1000
    },
    {
      "epoch": 0.3859141341051616,
      "grad_norm": 3.04317569732666,
      "learning_rate": 9.96730957829356e-06,
      "loss": 0.4719,
      "step": 1200
    },
    {
      "epoch": 0.45023315645602185,
      "grad_norm": 3.090500831604004,
      "learning_rate": 9.93461915658712e-06,
      "loss": 0.4444,
      "step": 1400
    },
    {
      "epoch": 0.5145521788068821,
      "grad_norm": 3.2675209045410156,
      "learning_rate": 9.90192873488068e-06,
      "loss": 0.4275,
      "step": 1600
    },
    {
      "epoch": 0.5788712011577424,
      "grad_norm": 2.859715223312378,
      "learning_rate": 9.869238313174241e-06,
      "loss": 0.4076,
      "step": 1800
    },
    {
      "epoch": 0.6431902235086027,
      "grad_norm": 2.6303207874298096,
      "learning_rate": 9.836547891467801e-06,
      "loss": 0.3917,
      "step": 2000
    },
    {
      "epoch": 0.707509245859463,
      "grad_norm": 3.0497164726257324,
      "learning_rate": 9.804020921869893e-06,
      "loss": 0.381,
      "step": 2200
    },
    {
      "epoch": 0.7718282682103232,
      "grad_norm": 2.6169981956481934,
      "learning_rate": 9.771330500163453e-06,
      "loss": 0.3719,
      "step": 2400
    },
    {
      "epoch": 0.8361472905611834,
      "grad_norm": 2.708853006362915,
      "learning_rate": 9.738640078457014e-06,
      "loss": 0.3635,
      "step": 2600
    },
    {
      "epoch": 0.9004663129120437,
      "grad_norm": 2.8617489337921143,
      "learning_rate": 9.705949656750572e-06,
      "loss": 0.354,
      "step": 2800
    },
    {
      "epoch": 0.964785335262904,
      "grad_norm": 2.758882999420166,
      "learning_rate": 9.673259235044132e-06,
      "loss": 0.3474,
      "step": 3000
    },
    {
      "epoch": 1.0289435600578871,
      "grad_norm": 2.680941343307495,
      "learning_rate": 9.640568813337693e-06,
      "loss": 0.3395,
      "step": 3200
    },
    {
      "epoch": 1.0932625824087474,
      "grad_norm": 2.918921709060669,
      "learning_rate": 9.607878391631253e-06,
      "loss": 0.3299,
      "step": 3400
    },
    {
      "epoch": 1.1575816047596077,
      "grad_norm": 2.6285266876220703,
      "learning_rate": 9.575187969924813e-06,
      "loss": 0.3231,
      "step": 3600
    },
    {
      "epoch": 1.221900627110468,
      "grad_norm": 2.9504473209381104,
      "learning_rate": 9.542497548218372e-06,
      "loss": 0.3217,
      "step": 3800
    },
    {
      "epoch": 1.2862196494613283,
      "grad_norm": 2.8353495597839355,
      "learning_rate": 9.509807126511932e-06,
      "loss": 0.32,
      "step": 4000
    },
    {
      "epoch": 1.3505386718121883,
      "grad_norm": 2.4936184883117676,
      "learning_rate": 9.477280156914024e-06,
      "loss": 0.3141,
      "step": 4200
    },
    {
      "epoch": 1.4148576941630489,
      "grad_norm": 2.6884140968322754,
      "learning_rate": 9.444589735207586e-06,
      "loss": 0.3086,
      "step": 4400
    },
    {
      "epoch": 1.479176716513909,
      "grad_norm": 2.8961310386657715,
      "learning_rate": 9.411899313501145e-06,
      "loss": 0.308,
      "step": 4600
    },
    {
      "epoch": 1.5434957388647692,
      "grad_norm": 2.5737783908843994,
      "learning_rate": 9.379208891794705e-06,
      "loss": 0.3019,
      "step": 4800
    },
    {
      "epoch": 1.6078147612156295,
      "grad_norm": 2.5709033012390137,
      "learning_rate": 9.346518470088265e-06,
      "loss": 0.2974,
      "step": 5000
    },
    {
      "epoch": 1.6078147612156295,
      "eval_loss": 0.2771373987197876,
      "eval_runtime": 5695.1238,
      "eval_samples_per_second": 5.115,
      "eval_steps_per_second": 0.639,
      "eval_wer": 36.94923502637938,
      "step": 5000
    },
    {
      "epoch": 1.6721337835664898,
      "grad_norm": 2.3421154022216797,
      "learning_rate": 9.313828048381824e-06,
      "loss": 0.2959,
      "step": 5200
    },
    {
      "epoch": 1.73645280591735,
      "grad_norm": 2.662564277648926,
      "learning_rate": 9.281137626675386e-06,
      "loss": 0.2941,
      "step": 5400
    },
    {
      "epoch": 1.8007718282682104,
      "grad_norm": 2.4682416915893555,
      "learning_rate": 9.248447204968944e-06,
      "loss": 0.2932,
      "step": 5600
    },
    {
      "epoch": 1.8650908506190707,
      "grad_norm": 2.6210873126983643,
      "learning_rate": 9.215756783262505e-06,
      "loss": 0.2895,
      "step": 5800
    },
    {
      "epoch": 1.9294098729699307,
      "grad_norm": 2.6296238899230957,
      "learning_rate": 9.183066361556065e-06,
      "loss": 0.286,
      "step": 6000
    },
    {
      "epoch": 1.9937288953207912,
      "grad_norm": 2.486929178237915,
      "learning_rate": 9.150539391958157e-06,
      "loss": 0.2846,
      "step": 6200
    },
    {
      "epoch": 2.0578871201157742,
      "grad_norm": 2.202758550643921,
      "learning_rate": 9.117848970251717e-06,
      "loss": 0.2754,
      "step": 6400
    },
    {
      "epoch": 2.1222061424666343,
      "grad_norm": 2.4207451343536377,
      "learning_rate": 9.085158548545276e-06,
      "loss": 0.2745,
      "step": 6600
    },
    {
      "epoch": 2.186525164817495,
      "grad_norm": 2.1694822311401367,
      "learning_rate": 9.052468126838838e-06,
      "loss": 0.2732,
      "step": 6800
    },
    {
      "epoch": 2.250844187168355,
      "grad_norm": 2.7656798362731934,
      "learning_rate": 9.019777705132396e-06,
      "loss": 0.2709,
      "step": 7000
    },
    {
      "epoch": 2.3151632095192154,
      "grad_norm": 2.2421224117279053,
      "learning_rate": 8.987087283425957e-06,
      "loss": 0.2691,
      "step": 7200
    },
    {
      "epoch": 2.3794822318700755,
      "grad_norm": 2.469956874847412,
      "learning_rate": 8.954396861719517e-06,
      "loss": 0.268,
      "step": 7400
    },
    {
      "epoch": 2.443801254220936,
      "grad_norm": 2.4373421669006348,
      "learning_rate": 8.921706440013077e-06,
      "loss": 0.2656,
      "step": 7600
    },
    {
      "epoch": 2.508120276571796,
      "grad_norm": 2.5110926628112793,
      "learning_rate": 8.889016018306636e-06,
      "loss": 0.2668,
      "step": 7800
    },
    {
      "epoch": 2.5724392989226565,
      "grad_norm": 2.559202194213867,
      "learning_rate": 8.856325596600198e-06,
      "loss": 0.2623,
      "step": 8000
    },
    {
      "epoch": 2.6367583212735166,
      "grad_norm": 2.6701242923736572,
      "learning_rate": 8.82379862700229e-06,
      "loss": 0.2642,
      "step": 8200
    },
    {
      "epoch": 2.7010773436243767,
      "grad_norm": 2.3247900009155273,
      "learning_rate": 8.791108205295848e-06,
      "loss": 0.2621,
      "step": 8400
    },
    {
      "epoch": 2.765396365975237,
      "grad_norm": 2.2806427478790283,
      "learning_rate": 8.75841778358941e-06,
      "loss": 0.2601,
      "step": 8600
    },
    {
      "epoch": 2.8297153883260977,
      "grad_norm": 2.487159013748169,
      "learning_rate": 8.725727361882969e-06,
      "loss": 0.2596,
      "step": 8800
    },
    {
      "epoch": 2.8940344106769578,
      "grad_norm": 2.2094194889068604,
      "learning_rate": 8.693036940176529e-06,
      "loss": 0.2587,
      "step": 9000
    },
    {
      "epoch": 2.958353433027818,
      "grad_norm": 2.349698781967163,
      "learning_rate": 8.660346518470088e-06,
      "loss": 0.2569,
      "step": 9200
    },
    {
      "epoch": 3.0225116578228013,
      "grad_norm": 2.1951253414154053,
      "learning_rate": 8.62765609676365e-06,
      "loss": 0.2507,
      "step": 9400
    },
    {
      "epoch": 3.0868306801736614,
      "grad_norm": 2.2560884952545166,
      "learning_rate": 8.594965675057208e-06,
      "loss": 0.2469,
      "step": 9600
    },
    {
      "epoch": 3.1511497025245214,
      "grad_norm": 2.3260977268218994,
      "learning_rate": 8.562275253350769e-06,
      "loss": 0.2457,
      "step": 9800
    },
    {
      "epoch": 3.215468724875382,
      "grad_norm": 2.318385601043701,
      "learning_rate": 8.529584831644329e-06,
      "loss": 0.2463,
      "step": 10000
    },
    {
      "epoch": 3.215468724875382,
      "eval_loss": 0.23996804654598236,
      "eval_runtime": 5706.3154,
      "eval_samples_per_second": 5.105,
      "eval_steps_per_second": 0.638,
      "eval_wer": 33.16859977100777,
      "step": 10000
    },
    {
      "epoch": 3.279787747226242,
      "grad_norm": 2.278331756591797,
      "learning_rate": 8.496894409937889e-06,
      "loss": 0.2471,
      "step": 10200
    },
    {
      "epoch": 3.3441067695771025,
      "grad_norm": 2.1796886920928955,
      "learning_rate": 8.46436744033998e-06,
      "loss": 0.244,
      "step": 10400
    },
    {
      "epoch": 3.4084257919279626,
      "grad_norm": 2.3623690605163574,
      "learning_rate": 8.43167701863354e-06,
      "loss": 0.2453,
      "step": 10600
    },
    {
      "epoch": 3.472744814278823,
      "grad_norm": 2.242501974105835,
      "learning_rate": 8.398986596927102e-06,
      "loss": 0.2436,
      "step": 10800
    },
    {
      "epoch": 3.537063836629683,
      "grad_norm": 2.4463303089141846,
      "learning_rate": 8.366296175220661e-06,
      "loss": 0.244,
      "step": 11000
    },
    {
      "epoch": 3.6013828589805437,
      "grad_norm": 2.387897253036499,
      "learning_rate": 8.333605753514221e-06,
      "loss": 0.2436,
      "step": 11200
    },
    {
      "epoch": 3.6657018813314037,
      "grad_norm": 2.386038303375244,
      "learning_rate": 8.30091533180778e-06,
      "loss": 0.2431,
      "step": 11400
    },
    {
      "epoch": 3.730020903682264,
      "grad_norm": 2.2631173133850098,
      "learning_rate": 8.26822491010134e-06,
      "loss": 0.2399,
      "step": 11600
    },
    {
      "epoch": 3.7943399260331243,
      "grad_norm": 2.458087921142578,
      "learning_rate": 8.2355344883949e-06,
      "loss": 0.2409,
      "step": 11800
    },
    {
      "epoch": 3.858658948383985,
      "grad_norm": 2.400782585144043,
      "learning_rate": 8.202844066688462e-06,
      "loss": 0.2396,
      "step": 12000
    },
    {
      "epoch": 3.922977970734845,
      "grad_norm": 2.1437551975250244,
      "learning_rate": 8.170153644982021e-06,
      "loss": 0.2375,
      "step": 12200
    },
    {
      "epoch": 3.987296993085705,
      "grad_norm": 2.8162059783935547,
      "learning_rate": 8.137626675384113e-06,
      "loss": 0.2385,
      "step": 12400
    },
    {
      "epoch": 4.051455217880688,
      "grad_norm": 2.505800485610962,
      "learning_rate": 8.104936253677673e-06,
      "loss": 0.2317,
      "step": 12600
    },
    {
      "epoch": 4.1157742402315485,
      "grad_norm": 2.2435059547424316,
      "learning_rate": 8.072245831971233e-06,
      "loss": 0.2301,
      "step": 12800
    },
    {
      "epoch": 4.1800932625824085,
      "grad_norm": 2.208909034729004,
      "learning_rate": 8.039555410264793e-06,
      "loss": 0.2305,
      "step": 13000
    },
    {
      "epoch": 4.244412284933269,
      "grad_norm": 2.0333073139190674,
      "learning_rate": 8.006864988558352e-06,
      "loss": 0.2283,
      "step": 13200
    },
    {
      "epoch": 4.30873130728413,
      "grad_norm": 2.437255620956421,
      "learning_rate": 7.974174566851914e-06,
      "loss": 0.2285,
      "step": 13400
    },
    {
      "epoch": 4.37305032963499,
      "grad_norm": 2.1313934326171875,
      "learning_rate": 7.941484145145473e-06,
      "loss": 0.2268,
      "step": 13600
    },
    {
      "epoch": 4.43736935198585,
      "grad_norm": 2.3695502281188965,
      "learning_rate": 7.908793723439033e-06,
      "loss": 0.2281,
      "step": 13800
    },
    {
      "epoch": 4.50168837433671,
      "grad_norm": 2.3714799880981445,
      "learning_rate": 7.876103301732593e-06,
      "loss": 0.2285,
      "step": 14000
    },
    {
      "epoch": 4.566007396687571,
      "grad_norm": 2.148329019546509,
      "learning_rate": 7.843412880026154e-06,
      "loss": 0.2285,
      "step": 14200
    },
    {
      "epoch": 4.630326419038431,
      "grad_norm": 2.6452717781066895,
      "learning_rate": 7.810885910428245e-06,
      "loss": 0.2286,
      "step": 14400
    },
    {
      "epoch": 4.694645441389291,
      "grad_norm": 2.203331470489502,
      "learning_rate": 7.778195488721804e-06,
      "loss": 0.2262,
      "step": 14600
    },
    {
      "epoch": 4.758964463740151,
      "grad_norm": 2.239518642425537,
      "learning_rate": 7.745505067015366e-06,
      "loss": 0.2255,
      "step": 14800
    },
    {
      "epoch": 4.823283486091011,
      "grad_norm": 2.2322895526885986,
      "learning_rate": 7.712814645308925e-06,
      "loss": 0.2284,
      "step": 15000
    },
    {
      "epoch": 4.823283486091011,
      "eval_loss": 0.22340841591358185,
      "eval_runtime": 6283.1507,
      "eval_samples_per_second": 4.636,
      "eval_steps_per_second": 0.58,
      "eval_wer": 31.49793737232363,
      "step": 15000
    },
    {
      "epoch": 4.887602508441872,
      "grad_norm": 2.171865224838257,
      "learning_rate": 7.680124223602485e-06,
      "loss": 0.2286,
      "step": 15200
    },
    {
      "epoch": 4.951921530792732,
      "grad_norm": 2.2217211723327637,
      "learning_rate": 7.647433801896045e-06,
      "loss": 0.2237,
      "step": 15400
    },
    {
      "epoch": 5.0160797555877155,
      "grad_norm": 2.2957966327667236,
      "learning_rate": 7.614743380189605e-06,
      "loss": 0.2247,
      "step": 15600
    },
    {
      "epoch": 5.0803987779385755,
      "grad_norm": 2.2841222286224365,
      "learning_rate": 7.582052958483165e-06,
      "loss": 0.2184,
      "step": 15800
    },
    {
      "epoch": 5.144717800289436,
      "grad_norm": 2.9461894035339355,
      "learning_rate": 7.5493625367767255e-06,
      "loss": 0.2176,
      "step": 16000
    },
    {
      "epoch": 5.209036822640296,
      "grad_norm": 2.2747585773468018,
      "learning_rate": 7.516672115070285e-06,
      "loss": 0.2171,
      "step": 16200
    },
    {
      "epoch": 5.273355844991156,
      "grad_norm": 2.220026969909668,
      "learning_rate": 7.4841451454723765e-06,
      "loss": 0.217,
      "step": 16400
    },
    {
      "epoch": 5.337674867342017,
      "grad_norm": 2.335299253463745,
      "learning_rate": 7.451454723765937e-06,
      "loss": 0.218,
      "step": 16600
    },
    {
      "epoch": 5.401993889692877,
      "grad_norm": 2.2069528102874756,
      "learning_rate": 7.418764302059497e-06,
      "loss": 0.2172,
      "step": 16800
    },
    {
      "epoch": 5.466312912043737,
      "grad_norm": 2.500458002090454,
      "learning_rate": 7.386073880353057e-06,
      "loss": 0.2174,
      "step": 17000
    },
    {
      "epoch": 5.530631934394597,
      "grad_norm": 2.2738373279571533,
      "learning_rate": 7.353383458646617e-06,
      "loss": 0.2186,
      "step": 17200
    },
    {
      "epoch": 5.594950956745458,
      "grad_norm": 2.0394363403320312,
      "learning_rate": 7.3206930369401776e-06,
      "loss": 0.2168,
      "step": 17400
    },
    {
      "epoch": 5.659269979096318,
      "grad_norm": 2.0548949241638184,
      "learning_rate": 7.288002615233737e-06,
      "loss": 0.2167,
      "step": 17600
    },
    {
      "epoch": 5.723589001447178,
      "grad_norm": 2.0610129833221436,
      "learning_rate": 7.255312193527298e-06,
      "loss": 0.2154,
      "step": 17800
    },
    {
      "epoch": 5.787908023798038,
      "grad_norm": 2.0888965129852295,
      "learning_rate": 7.222621771820857e-06,
      "loss": 0.2157,
      "step": 18000
    },
    {
      "epoch": 5.852227046148899,
      "grad_norm": 2.3282668590545654,
      "learning_rate": 7.189931350114417e-06,
      "loss": 0.2162,
      "step": 18200
    },
    {
      "epoch": 5.916546068499759,
      "grad_norm": 2.2571957111358643,
      "learning_rate": 7.157404380516509e-06,
      "loss": 0.2174,
      "step": 18400
    },
    {
      "epoch": 5.980865090850619,
      "grad_norm": 2.201342821121216,
      "learning_rate": 7.124713958810069e-06,
      "loss": 0.2137,
      "step": 18600
    },
    {
      "epoch": 6.045023315645603,
      "grad_norm": 2.3466155529022217,
      "learning_rate": 7.09202353710363e-06,
      "loss": 0.2098,
      "step": 18800
    },
    {
      "epoch": 6.109342337996463,
      "grad_norm": 2.0573270320892334,
      "learning_rate": 7.059333115397189e-06,
      "loss": 0.2089,
      "step": 19000
    },
    {
      "epoch": 6.173661360347323,
      "grad_norm": 2.026381492614746,
      "learning_rate": 7.02664269369075e-06,
      "loss": 0.2085,
      "step": 19200
    },
    {
      "epoch": 6.237980382698183,
      "grad_norm": 2.2646751403808594,
      "learning_rate": 6.993952271984309e-06,
      "loss": 0.2074,
      "step": 19400
    },
    {
      "epoch": 6.302299405049043,
      "grad_norm": 2.0940823554992676,
      "learning_rate": 6.961261850277869e-06,
      "loss": 0.2086,
      "step": 19600
    },
    {
      "epoch": 6.366618427399904,
      "grad_norm": 2.2303521633148193,
      "learning_rate": 6.928571428571429e-06,
      "loss": 0.2096,
      "step": 19800
    },
    {
      "epoch": 6.430937449750764,
      "grad_norm": 2.2108261585235596,
      "learning_rate": 6.8958810068649895e-06,
      "loss": 0.2089,
      "step": 20000
    },
    {
      "epoch": 6.430937449750764,
      "eval_loss": 0.2148449569940567,
      "eval_runtime": 6212.1239,
      "eval_samples_per_second": 4.689,
      "eval_steps_per_second": 0.586,
      "eval_wer": 30.543488717322866,
      "step": 20000
    },
    {
      "epoch": 6.495256472101624,
      "grad_norm": 2.3403568267822266,
      "learning_rate": 6.863190585158549e-06,
      "loss": 0.2096,
      "step": 20200
    },
    {
      "epoch": 6.559575494452484,
      "grad_norm": 2.071211576461792,
      "learning_rate": 6.830663615560641e-06,
      "loss": 0.2076,
      "step": 20400
    },
    {
      "epoch": 6.623894516803345,
      "grad_norm": 2.031785488128662,
      "learning_rate": 6.797973193854202e-06,
      "loss": 0.2075,
      "step": 20600
    },
    {
      "epoch": 6.688213539154205,
      "grad_norm": 2.1697540283203125,
      "learning_rate": 6.765282772147761e-06,
      "loss": 0.2086,
      "step": 20800
    },
    {
      "epoch": 6.752532561505065,
      "grad_norm": 2.1642816066741943,
      "learning_rate": 6.732592350441321e-06,
      "loss": 0.2094,
      "step": 21000
    },
    {
      "epoch": 6.816851583855925,
      "grad_norm": 2.093594789505005,
      "learning_rate": 6.699901928734881e-06,
      "loss": 0.2065,
      "step": 21200
    },
    {
      "epoch": 6.881170606206785,
      "grad_norm": 2.0487377643585205,
      "learning_rate": 6.6672115070284415e-06,
      "loss": 0.2074,
      "step": 21400
    },
    {
      "epoch": 6.945489628557646,
      "grad_norm": 2.0511105060577393,
      "learning_rate": 6.634521085322001e-06,
      "loss": 0.2072,
      "step": 21600
    },
    {
      "epoch": 7.009647853352629,
      "grad_norm": 2.1460208892822266,
      "learning_rate": 6.601830663615562e-06,
      "loss": 0.204,
      "step": 21800
    },
    {
      "epoch": 7.07396687570349,
      "grad_norm": 2.093196392059326,
      "learning_rate": 6.569140241909121e-06,
      "loss": 0.2013,
      "step": 22000
    },
    {
      "epoch": 7.13828589805435,
      "grad_norm": 2.342313766479492,
      "learning_rate": 6.536449820202682e-06,
      "loss": 0.1994,
      "step": 22200
    },
    {
      "epoch": 7.20260492040521,
      "grad_norm": 2.05419921875,
      "learning_rate": 6.503759398496241e-06,
      "loss": 0.2023,
      "step": 22400
    },
    {
      "epoch": 7.26692394275607,
      "grad_norm": 2.248352289199829,
      "learning_rate": 6.471232428898333e-06,
      "loss": 0.2024,
      "step": 22600
    },
    {
      "epoch": 7.33124296510693,
      "grad_norm": 2.308692216873169,
      "learning_rate": 6.4385420071918935e-06,
      "loss": 0.2007,
      "step": 22800
    },
    {
      "epoch": 7.395561987457791,
      "grad_norm": 2.0985047817230225,
      "learning_rate": 6.405851585485453e-06,
      "loss": 0.1989,
      "step": 23000
    },
    {
      "epoch": 7.459881009808651,
      "grad_norm": 2.1786727905273438,
      "learning_rate": 6.373161163779014e-06,
      "loss": 0.2009,
      "step": 23200
    },
    {
      "epoch": 7.524200032159511,
      "grad_norm": 2.358017921447754,
      "learning_rate": 6.3404707420725734e-06,
      "loss": 0.2011,
      "step": 23400
    },
    {
      "epoch": 7.588519054510371,
      "grad_norm": 2.221282482147217,
      "learning_rate": 6.307780320366134e-06,
      "loss": 0.2,
      "step": 23600
    },
    {
      "epoch": 7.652838076861232,
      "grad_norm": 2.1816442012786865,
      "learning_rate": 6.275089898659693e-06,
      "loss": 0.1995,
      "step": 23800
    },
    {
      "epoch": 7.717157099212092,
      "grad_norm": 2.1074419021606445,
      "learning_rate": 6.242399476953253e-06,
      "loss": 0.2008,
      "step": 24000
    },
    {
      "epoch": 7.781476121562952,
      "grad_norm": 2.12418532371521,
      "learning_rate": 6.209709055246813e-06,
      "loss": 0.2029,
      "step": 24200
    },
    {
      "epoch": 7.845795143913812,
      "grad_norm": 2.0285849571228027,
      "learning_rate": 6.177018633540374e-06,
      "loss": 0.2005,
      "step": 24400
    },
    {
      "epoch": 7.910114166264673,
      "grad_norm": 2.1275014877319336,
      "learning_rate": 6.144491663942466e-06,
      "loss": 0.2014,
      "step": 24600
    },
    {
      "epoch": 7.974433188615533,
      "grad_norm": 2.047292709350586,
      "learning_rate": 6.1118012422360254e-06,
      "loss": 0.1999,
      "step": 24800
    },
    {
      "epoch": 8.038591413410517,
      "grad_norm": 2.2886574268341064,
      "learning_rate": 6.079110820529586e-06,
      "loss": 0.197,
      "step": 25000
    },
    {
      "epoch": 8.038591413410517,
      "eval_loss": 0.20965221524238586,
      "eval_runtime": 6307.1939,
      "eval_samples_per_second": 4.619,
      "eval_steps_per_second": 0.577,
      "eval_wer": 29.90140507668599,
      "step": 25000
    },
    {
      "epoch": 8.102910435761377,
      "grad_norm": 2.158328056335449,
      "learning_rate": 6.046420398823145e-06,
      "loss": 0.1942,
      "step": 25200
    },
    {
      "epoch": 8.167229458112237,
      "grad_norm": 2.0762622356414795,
      "learning_rate": 6.013729977116705e-06,
      "loss": 0.1941,
      "step": 25400
    },
    {
      "epoch": 8.231548480463097,
      "grad_norm": 2.2431387901306152,
      "learning_rate": 5.981039555410265e-06,
      "loss": 0.1951,
      "step": 25600
    },
    {
      "epoch": 8.295867502813957,
      "grad_norm": 1.9715090990066528,
      "learning_rate": 5.948349133703826e-06,
      "loss": 0.1946,
      "step": 25800
    },
    {
      "epoch": 8.360186525164817,
      "grad_norm": 2.1715543270111084,
      "learning_rate": 5.915658711997385e-06,
      "loss": 0.1949,
      "step": 26000
    },
    {
      "epoch": 8.424505547515677,
      "grad_norm": 2.1786696910858154,
      "learning_rate": 5.882968290290946e-06,
      "loss": 0.1954,
      "step": 26200
    },
    {
      "epoch": 8.488824569866537,
      "grad_norm": 2.2478559017181396,
      "learning_rate": 5.8502778685845056e-06,
      "loss": 0.1943,
      "step": 26400
    },
    {
      "epoch": 8.553143592217399,
      "grad_norm": 2.0193216800689697,
      "learning_rate": 5.817750898986597e-06,
      "loss": 0.1931,
      "step": 26600
    },
    {
      "epoch": 8.61746261456826,
      "grad_norm": 2.024120330810547,
      "learning_rate": 5.785060477280157e-06,
      "loss": 0.1944,
      "step": 26800
    },
    {
      "epoch": 8.68178163691912,
      "grad_norm": 1.9868948459625244,
      "learning_rate": 5.752370055573717e-06,
      "loss": 0.1967,
      "step": 27000
    },
    {
      "epoch": 8.74610065926998,
      "grad_norm": 2.0132243633270264,
      "learning_rate": 5.719679633867278e-06,
      "loss": 0.194,
      "step": 27200
    },
    {
      "epoch": 8.81041968162084,
      "grad_norm": 2.1960537433624268,
      "learning_rate": 5.686989212160837e-06,
      "loss": 0.1945,
      "step": 27400
    },
    {
      "epoch": 8.8747387039717,
      "grad_norm": 2.118748903274536,
      "learning_rate": 5.654298790454398e-06,
      "loss": 0.1943,
      "step": 27600
    },
    {
      "epoch": 8.93905772632256,
      "grad_norm": 2.0620296001434326,
      "learning_rate": 5.621608368747958e-06,
      "loss": 0.1948,
      "step": 27800
    },
    {
      "epoch": 9.003215951117543,
      "grad_norm": 2.0099258422851562,
      "learning_rate": 5.588917947041518e-06,
      "loss": 0.1953,
      "step": 28000
    },
    {
      "epoch": 9.067534973468403,
      "grad_norm": 2.1706490516662598,
      "learning_rate": 5.556227525335077e-06,
      "loss": 0.187,
      "step": 28200
    },
    {
      "epoch": 9.131853995819263,
      "grad_norm": 1.989235758781433,
      "learning_rate": 5.523537103628637e-06,
      "loss": 0.1896,
      "step": 28400
    },
    {
      "epoch": 9.196173018170123,
      "grad_norm": 2.4199020862579346,
      "learning_rate": 5.49101013403073e-06,
      "loss": 0.1889,
      "step": 28600
    },
    {
      "epoch": 9.260492040520983,
      "grad_norm": 2.318398952484131,
      "learning_rate": 5.458319712324289e-06,
      "loss": 0.1899,
      "step": 28800
    },
    {
      "epoch": 9.324811062871845,
      "grad_norm": 2.014559745788574,
      "learning_rate": 5.42562929061785e-06,
      "loss": 0.1899,
      "step": 29000
    },
    {
      "epoch": 9.389130085222705,
      "grad_norm": 2.0770111083984375,
      "learning_rate": 5.39293886891141e-06,
      "loss": 0.1904,
      "step": 29200
    },
    {
      "epoch": 9.453449107573565,
      "grad_norm": 2.1191565990448,
      "learning_rate": 5.36024844720497e-06,
      "loss": 0.1903,
      "step": 29400
    },
    {
      "epoch": 9.517768129924425,
      "grad_norm": 1.8838344812393188,
      "learning_rate": 5.327558025498529e-06,
      "loss": 0.191,
      "step": 29600
    },
    {
      "epoch": 9.582087152275285,
      "grad_norm": 2.064694404602051,
      "learning_rate": 5.2948676037920895e-06,
      "loss": 0.189,
      "step": 29800
    },
    {
      "epoch": 9.646406174626145,
      "grad_norm": 2.2259907722473145,
      "learning_rate": 5.262177182085649e-06,
      "loss": 0.1896,
      "step": 30000
    },
    {
      "epoch": 9.646406174626145,
      "eval_loss": 0.20603837072849274,
      "eval_runtime": 6469.2735,
      "eval_samples_per_second": 4.503,
      "eval_steps_per_second": 0.563,
      "eval_wer": 29.357595694795236,
      "step": 30000
    },
    {
      "epoch": 9.710725196977005,
      "grad_norm": 2.174774169921875,
      "learning_rate": 5.229486760379209e-06,
      "loss": 0.1898,
      "step": 30200
    },
    {
      "epoch": 9.775044219327865,
      "grad_norm": 2.170811414718628,
      "learning_rate": 5.1967963386727695e-06,
      "loss": 0.1885,
      "step": 30400
    },
    {
      "epoch": 9.839363241678726,
      "grad_norm": 2.454228401184082,
      "learning_rate": 5.164105916966329e-06,
      "loss": 0.1889,
      "step": 30600
    },
    {
      "epoch": 9.903682264029587,
      "grad_norm": 2.278226613998413,
      "learning_rate": 5.131578947368422e-06,
      "loss": 0.1891,
      "step": 30800
    },
    {
      "epoch": 9.968001286380447,
      "grad_norm": 2.151634931564331,
      "learning_rate": 5.098888525661981e-06,
      "loss": 0.1881,
      "step": 31000
    },
    {
      "epoch": 10.032159511175431,
      "grad_norm": 2.1410274505615234,
      "learning_rate": 5.0661981039555416e-06,
      "loss": 0.1861,
      "step": 31200
    },
    {
      "epoch": 10.096478533526291,
      "grad_norm": 2.1889536380767822,
      "learning_rate": 5.033507682249101e-06,
      "loss": 0.184,
      "step": 31400
    },
    {
      "epoch": 10.160797555877151,
      "grad_norm": 2.2102479934692383,
      "learning_rate": 5.000817260542662e-06,
      "loss": 0.1849,
      "step": 31600
    },
    {
      "epoch": 10.225116578228011,
      "grad_norm": 2.0018393993377686,
      "learning_rate": 4.9681268388362215e-06,
      "loss": 0.1833,
      "step": 31800
    },
    {
      "epoch": 10.289435600578871,
      "grad_norm": 2.114179849624634,
      "learning_rate": 4.935436417129781e-06,
      "loss": 0.1831,
      "step": 32000
    },
    {
      "epoch": 10.353754622929731,
      "grad_norm": 1.9474581480026245,
      "learning_rate": 4.902745995423342e-06,
      "loss": 0.1842,
      "step": 32200
    },
    {
      "epoch": 10.418073645280591,
      "grad_norm": 2.0356032848358154,
      "learning_rate": 4.8700555737169014e-06,
      "loss": 0.1852,
      "step": 32400
    },
    {
      "epoch": 10.482392667631451,
      "grad_norm": 2.0535342693328857,
      "learning_rate": 4.837365152010461e-06,
      "loss": 0.1866,
      "step": 32600
    },
    {
      "epoch": 10.546711689982311,
      "grad_norm": 2.2602412700653076,
      "learning_rate": 4.804838182412553e-06,
      "loss": 0.185,
      "step": 32800
    },
    {
      "epoch": 10.611030712333173,
      "grad_norm": 2.098829507827759,
      "learning_rate": 4.772147760706114e-06,
      "loss": 0.1844,
      "step": 33000
    },
    {
      "epoch": 10.675349734684033,
      "grad_norm": 2.0167388916015625,
      "learning_rate": 4.7394573389996735e-06,
      "loss": 0.1871,
      "step": 33200
    },
    {
      "epoch": 10.739668757034893,
      "grad_norm": 2.245697259902954,
      "learning_rate": 4.706766917293233e-06,
      "loss": 0.1866,
      "step": 33400
    },
    {
      "epoch": 10.803987779385753,
      "grad_norm": 1.9759703874588013,
      "learning_rate": 4.674076495586794e-06,
      "loss": 0.1849,
      "step": 33600
    },
    {
      "epoch": 10.868306801736614,
      "grad_norm": 2.1898162364959717,
      "learning_rate": 4.6413860738803535e-06,
      "loss": 0.1856,
      "step": 33800
    },
    {
      "epoch": 10.932625824087474,
      "grad_norm": 2.0218801498413086,
      "learning_rate": 4.608695652173913e-06,
      "loss": 0.1847,
      "step": 34000
    },
    {
      "epoch": 10.996944846438334,
      "grad_norm": 1.9428986310958862,
      "learning_rate": 4.576005230467474e-06,
      "loss": 0.1863,
      "step": 34200
    },
    {
      "epoch": 11.061103071233317,
      "grad_norm": 1.9156979322433472,
      "learning_rate": 4.543314808761033e-06,
      "loss": 0.1788,
      "step": 34400
    },
    {
      "epoch": 11.125422093584177,
      "grad_norm": 2.0453121662139893,
      "learning_rate": 4.510624387054593e-06,
      "loss": 0.1817,
      "step": 34600
    },
    {
      "epoch": 11.189741115935037,
      "grad_norm": 1.9229934215545654,
      "learning_rate": 4.477933965348154e-06,
      "loss": 0.1808,
      "step": 34800
    },
    {
      "epoch": 11.254060138285897,
      "grad_norm": 2.319345235824585,
      "learning_rate": 4.445406995750246e-06,
      "loss": 0.1793,
      "step": 35000
    },
    {
      "epoch": 11.254060138285897,
      "eval_loss": 0.20413178205490112,
      "eval_runtime": 6186.7151,
      "eval_samples_per_second": 4.708,
      "eval_steps_per_second": 0.589,
      "eval_wer": 29.14897509945317,
      "step": 35000
    },
    {
      "epoch": 11.31837916063676,
      "grad_norm": 2.07478404045105,
      "learning_rate": 4.4127165740438055e-06,
      "loss": 0.1798,
      "step": 35200
    },
    {
      "epoch": 11.38269818298762,
      "grad_norm": 2.0194761753082275,
      "learning_rate": 4.380026152337365e-06,
      "loss": 0.1792,
      "step": 35400
    },
    {
      "epoch": 11.44701720533848,
      "grad_norm": 1.903509497642517,
      "learning_rate": 4.347335730630926e-06,
      "loss": 0.1796,
      "step": 35600
    },
    {
      "epoch": 11.51133622768934,
      "grad_norm": 2.0315921306610107,
      "learning_rate": 4.314645308924485e-06,
      "loss": 0.1819,
      "step": 35800
    },
    {
      "epoch": 11.5756552500402,
      "grad_norm": 2.0309042930603027,
      "learning_rate": 4.281954887218046e-06,
      "loss": 0.1805,
      "step": 36000
    },
    {
      "epoch": 11.63997427239106,
      "grad_norm": 2.0719332695007324,
      "learning_rate": 4.249264465511606e-06,
      "loss": 0.1807,
      "step": 36200
    },
    {
      "epoch": 11.70429329474192,
      "grad_norm": 2.17317271232605,
      "learning_rate": 4.216574043805165e-06,
      "loss": 0.1832,
      "step": 36400
    },
    {
      "epoch": 11.76861231709278,
      "grad_norm": 2.0271966457366943,
      "learning_rate": 4.183883622098726e-06,
      "loss": 0.1804,
      "step": 36600
    },
    {
      "epoch": 11.83293133944364,
      "grad_norm": 2.235299825668335,
      "learning_rate": 4.151193200392286e-06,
      "loss": 0.1826,
      "step": 36800
    },
    {
      "epoch": 11.897250361794502,
      "grad_norm": 1.8323442935943604,
      "learning_rate": 4.118666230794378e-06,
      "loss": 0.1822,
      "step": 37000
    },
    {
      "epoch": 11.961569384145362,
      "grad_norm": 2.1653242111206055,
      "learning_rate": 4.0859758090879374e-06,
      "loss": 0.1829,
      "step": 37200
    },
    {
      "epoch": 12.025727608940343,
      "grad_norm": 2.1361212730407715,
      "learning_rate": 4.053285387381498e-06,
      "loss": 0.1792,
      "step": 37400
    },
    {
      "epoch": 12.090046631291205,
      "grad_norm": 2.1540911197662354,
      "learning_rate": 4.020594965675058e-06,
      "loss": 0.1779,
      "step": 37600
    },
    {
      "epoch": 12.154365653642065,
      "grad_norm": 2.157705783843994,
      "learning_rate": 3.987904543968617e-06,
      "loss": 0.1754,
      "step": 37800
    },
    {
      "epoch": 12.218684675992925,
      "grad_norm": 2.100783586502075,
      "learning_rate": 3.955214122262178e-06,
      "loss": 0.1761,
      "step": 38000
    },
    {
      "epoch": 12.283003698343785,
      "grad_norm": 1.9860684871673584,
      "learning_rate": 3.922523700555738e-06,
      "loss": 0.178,
      "step": 38200
    },
    {
      "epoch": 12.347322720694645,
      "grad_norm": 2.138315200805664,
      "learning_rate": 3.889833278849297e-06,
      "loss": 0.1769,
      "step": 38400
    },
    {
      "epoch": 12.411641743045505,
      "grad_norm": 1.8979172706604004,
      "learning_rate": 3.857142857142858e-06,
      "loss": 0.1761,
      "step": 38600
    },
    {
      "epoch": 12.475960765396366,
      "grad_norm": 2.144052505493164,
      "learning_rate": 3.8244524354364175e-06,
      "loss": 0.1772,
      "step": 38800
    },
    {
      "epoch": 12.540279787747226,
      "grad_norm": 2.2078232765197754,
      "learning_rate": 3.7919254658385097e-06,
      "loss": 0.1784,
      "step": 39000
    },
    {
      "epoch": 12.604598810098086,
      "grad_norm": 2.0689291954040527,
      "learning_rate": 3.75923504413207e-06,
      "loss": 0.179,
      "step": 39200
    },
    {
      "epoch": 12.668917832448948,
      "grad_norm": 2.1173605918884277,
      "learning_rate": 3.7265446224256295e-06,
      "loss": 0.1761,
      "step": 39400
    },
    {
      "epoch": 12.733236854799808,
      "grad_norm": 2.0470852851867676,
      "learning_rate": 3.6938542007191896e-06,
      "loss": 0.1791,
      "step": 39600
    },
    {
      "epoch": 12.797555877150668,
      "grad_norm": 2.237996816635132,
      "learning_rate": 3.6611637790127497e-06,
      "loss": 0.1791,
      "step": 39800
    },
    {
      "epoch": 12.861874899501528,
      "grad_norm": 2.107485055923462,
      "learning_rate": 3.62847335730631e-06,
      "loss": 0.1776,
      "step": 40000
    },
    {
      "epoch": 12.861874899501528,
      "eval_loss": 0.20320001244544983,
      "eval_runtime": 5730.0624,
      "eval_samples_per_second": 5.084,
      "eval_steps_per_second": 0.636,
      "eval_wer": 29.061075282609227,
      "step": 40000
    },
    {
      "epoch": 12.926193921852388,
      "grad_norm": 2.1215012073516846,
      "learning_rate": 3.5957829355998696e-06,
      "loss": 0.1792,
      "step": 40200
    },
    {
      "epoch": 12.990512944203248,
      "grad_norm": 2.1944947242736816,
      "learning_rate": 3.5630925138934297e-06,
      "loss": 0.177,
      "step": 40400
    },
    {
      "epoch": 13.054671168998231,
      "grad_norm": 2.1703405380249023,
      "learning_rate": 3.53040209218699e-06,
      "loss": 0.1754,
      "step": 40600
    },
    {
      "epoch": 13.118990191349091,
      "grad_norm": 2.224743366241455,
      "learning_rate": 3.49771167048055e-06,
      "loss": 0.1741,
      "step": 40800
    },
    {
      "epoch": 13.183309213699951,
      "grad_norm": 2.370253324508667,
      "learning_rate": 3.4650212487741096e-06,
      "loss": 0.1727,
      "step": 41000
    },
    {
      "epoch": 13.247628236050812,
      "grad_norm": 1.8502309322357178,
      "learning_rate": 3.4324942791762018e-06,
      "loss": 0.1732,
      "step": 41200
    },
    {
      "epoch": 13.311947258401672,
      "grad_norm": 2.1553802490234375,
      "learning_rate": 3.399803857469762e-06,
      "loss": 0.1731,
      "step": 41400
    },
    {
      "epoch": 13.376266280752532,
      "grad_norm": 2.113837242126465,
      "learning_rate": 3.3671134357633216e-06,
      "loss": 0.1743,
      "step": 41600
    },
    {
      "epoch": 13.440585303103393,
      "grad_norm": 1.9942282438278198,
      "learning_rate": 3.3344230140568817e-06,
      "loss": 0.1742,
      "step": 41800
    },
    {
      "epoch": 13.504904325454254,
      "grad_norm": 2.089869976043701,
      "learning_rate": 3.301732592350442e-06,
      "loss": 0.1754,
      "step": 42000
    },
    {
      "epoch": 13.569223347805114,
      "grad_norm": 1.8944735527038574,
      "learning_rate": 3.269042170644002e-06,
      "loss": 0.1742,
      "step": 42200
    },
    {
      "epoch": 13.633542370155974,
      "grad_norm": 2.06595516204834,
      "learning_rate": 3.2363517489375616e-06,
      "loss": 0.1736,
      "step": 42400
    },
    {
      "epoch": 13.697861392506834,
      "grad_norm": 2.0173680782318115,
      "learning_rate": 3.2036613272311218e-06,
      "loss": 0.1738,
      "step": 42600
    },
    {
      "epoch": 13.762180414857694,
      "grad_norm": 2.098628282546997,
      "learning_rate": 3.170970905524682e-06,
      "loss": 0.1735,
      "step": 42800
    },
    {
      "epoch": 13.826499437208554,
      "grad_norm": 2.226824998855591,
      "learning_rate": 3.138280483818241e-06,
      "loss": 0.1757,
      "step": 43000
    },
    {
      "epoch": 13.890818459559414,
      "grad_norm": 2.020033121109009,
      "learning_rate": 3.1057535142203337e-06,
      "loss": 0.1755,
      "step": 43200
    },
    {
      "epoch": 13.955137481910274,
      "grad_norm": 2.29543399810791,
      "learning_rate": 3.073063092513894e-06,
      "loss": 0.1762,
      "step": 43400
    },
    {
      "epoch": 14.019295706705257,
      "grad_norm": 1.9776209592819214,
      "learning_rate": 3.040372670807454e-06,
      "loss": 0.1735,
      "step": 43600
    },
    {
      "epoch": 14.083614729056118,
      "grad_norm": 1.7997843027114868,
      "learning_rate": 3.0076822491010137e-06,
      "loss": 0.1704,
      "step": 43800
    },
    {
      "epoch": 14.14793375140698,
      "grad_norm": 1.968531847000122,
      "learning_rate": 2.9749918273945738e-06,
      "loss": 0.1717,
      "step": 44000
    },
    {
      "epoch": 14.21225277375784,
      "grad_norm": 2.061990737915039,
      "learning_rate": 2.942301405688134e-06,
      "loss": 0.1726,
      "step": 44200
    },
    {
      "epoch": 14.2765717961087,
      "grad_norm": 2.0133299827575684,
      "learning_rate": 2.909610983981694e-06,
      "loss": 0.1714,
      "step": 44400
    },
    {
      "epoch": 14.34089081845956,
      "grad_norm": 2.0535309314727783,
      "learning_rate": 2.8769205622752537e-06,
      "loss": 0.1717,
      "step": 44600
    },
    {
      "epoch": 14.40520984081042,
      "grad_norm": 2.1071929931640625,
      "learning_rate": 2.8442301405688134e-06,
      "loss": 0.1722,
      "step": 44800
    },
    {
      "epoch": 14.46952886316128,
      "grad_norm": 2.0523617267608643,
      "learning_rate": 2.811539718862373e-06,
      "loss": 0.17,
      "step": 45000
    },
    {
      "epoch": 14.46952886316128,
      "eval_loss": 0.20234042406082153,
      "eval_runtime": 5780.3456,
      "eval_samples_per_second": 5.039,
      "eval_steps_per_second": 0.63,
      "eval_wer": 28.696460806301626,
      "step": 45000
    }
  ],
  "logging_steps": 200,
  "max_steps": 62180,
  "num_input_tokens_seen": 0,
  "num_train_epochs": 20,
  "save_steps": 5000,
  "stateful_callbacks": {
    "TrainerControl": {
      "args": {
        "should_epoch_stop": false,
        "should_evaluate": false,
        "should_log": false,
        "should_save": true,
        "should_training_stop": false
      },
      "attributes": {}
    }
  },
  "total_flos": 1.4178134111256576e+20,
  "train_batch_size": 32,
  "trial_name": null,
  "trial_params": null
}