lfhase commited on Aug 18

Commit

0acdbd9

verified ·

1 Parent(s): 334f0e5

Upload folder using huggingface_hub

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

hvqvae.pth +3 -0
llama2/graph-text-molgen/forward_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/README.md +9 -0
llama2/graph-text-molgen/forward_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/adapter_config.json +26 -0
llama2/graph-text-molgen/forward_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/adapter_model.bin +3 -0
llama2/graph-text-molgen/forward_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/config.json +35 -0
llama2/graph-text-molgen/forward_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/non_lora_trainables.bin +3 -0
llama2/graph-text-molgen/forward_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/trainer_state.json +0 -0
llama2/graph-text-molgen/reagent_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/README.md +9 -0
llama2/graph-text-molgen/reagent_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/adapter_config.json +26 -0
llama2/graph-text-molgen/reagent_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/adapter_model.bin +3 -0
llama2/graph-text-molgen/reagent_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/config.json +35 -0
llama2/graph-text-molgen/reagent_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/non_lora_trainables.bin +3 -0
llama2/graph-text-molgen/reagent_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/trainer_state.json +0 -0
llama2/graph-text-molgen/retrosynthesis-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/README.md +9 -0
llama2/graph-text-molgen/retrosynthesis-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/adapter_config.json +26 -0
llama2/graph-text-molgen/retrosynthesis-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/adapter_model.bin +3 -0
llama2/graph-text-molgen/retrosynthesis-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/config.json +35 -0
llama2/graph-text-molgen/retrosynthesis-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/non_lora_trainables.bin +3 -0
llama2/graph-text-molgen/retrosynthesis-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/trainer_state.json +0 -0
llama2/llava-hvqvae2-llama-2-7b-chat-pretrain/config.json +35 -0
llama2/llava-hvqvae2-llama-2-7b-chat-pretrain/mm_projector.bin +3 -0
llama2/llava-hvqvae2-llama-2-7b-chat-pretrain/trainer_state.json +0 -0
llama2/molcap-llava-hvqvae2-llama-2-7b-chat-finetune_lora-50ep/README.md +9 -0
llama2/molcap-llava-hvqvae2-llama-2-7b-chat-finetune_lora-50ep/adapter_config.json +26 -0
llama2/molcap-llava-hvqvae2-llama-2-7b-chat-finetune_lora-50ep/adapter_model.bin +3 -0
llama2/molcap-llava-hvqvae2-llama-2-7b-chat-finetune_lora-50ep/config.json +35 -0
llama2/molcap-llava-hvqvae2-llama-2-7b-chat-finetune_lora-50ep/non_lora_trainables.bin +3 -0
llama2/molcap-llava-hvqvae2-llama-2-7b-chat-finetune_lora-50ep/trainer_state.json +0 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_clintox/README.md +9 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_clintox/adapter_config.json +26 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_clintox/adapter_model.bin +3 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_clintox/config.json +36 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_clintox/non_lora_trainables.bin +3 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_clintox/trainer_state.json +2308 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_cyp450/README.md +9 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_cyp450/adapter_config.json +26 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_cyp450/config.json +36 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_cyp450/trainer_state.json +0 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_muv/README.md +9 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_muv/adapter_config.json +26 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_muv/adapter_model.bin +3 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_muv/config.json +36 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_muv/non_lora_trainables.bin +3 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_muv/trainer_state.json +0 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_sider/README.md +9 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_sider/adapter_config.json +26 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_sider/adapter_model.bin +3 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_sider/config.json +36 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_sider/non_lora_trainables.bin +3 -0
vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_sider/trainer_state.json +0 -0

hvqvae.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d99e41195c50d911a00328a49192d5b8cdd2a0bd203f38ed05f931cb0c2996b4
+size 7478074

llama2/graph-text-molgen/forward_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0

llama2/graph-text-molgen/forward_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "llama-2-7b-chat",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.05,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 64,
+  "revision": null,
+  "target_modules": [
+    "gate_proj",
+    "k_proj",
+    "down_proj",
+    "v_proj",
+    "o_proj",
+    "up_proj",
+    "q_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

llama2/graph-text-molgen/forward_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ce9e1a1a7c7ac0b957b748681edae23fac240bc27db412ae52415d78423b66a3
+size 319970957

llama2/graph-text-molgen/forward_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "llama-2-7b-chat",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 4096,
+  "mm_graph_tower": "hvqvae2",
+  "mm_hidden_size": 308,
+  "mm_projector_type": "hlinear",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "model_type": "llava_graph",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 32,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
+  "tie_word_embeddings": false,
+  "torch_dtype": "float16",
+  "transformers_version": "4.33.2",
+  "tune_mm_mlp_adapter": false,
+  "use_cache": true,
+  "use_lap_pe": true,
+  "use_mm_proj": true,
+  "vocab_size": 32000
+}

llama2/graph-text-molgen/forward_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/non_lora_trainables.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:977e67e9cdde408a93d6da8182eb17bdb25a2f9a20452fee352a908b725ca113
+size 11335231

llama2/graph-text-molgen/forward_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

llama2/graph-text-molgen/reagent_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0

llama2/graph-text-molgen/reagent_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "llama-2-7b-chat",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.05,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 64,
+  "revision": null,
+  "target_modules": [
+    "gate_proj",
+    "k_proj",
+    "o_proj",
+    "v_proj",
+    "down_proj",
+    "up_proj",
+    "q_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

llama2/graph-text-molgen/reagent_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:83e6b19a80fa1ec1f7728219cd86316b9d65b11edcd92c462d2eb11b75eae856
+size 319970957

llama2/graph-text-molgen/reagent_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "llama-2-7b-chat",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 4096,
+  "mm_graph_tower": "hvqvae2",
+  "mm_hidden_size": 308,
+  "mm_projector_type": "hlinear",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "model_type": "llava_graph",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 32,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
+  "tie_word_embeddings": false,
+  "torch_dtype": "float16",
+  "transformers_version": "4.33.2",
+  "tune_mm_mlp_adapter": false,
+  "use_cache": true,
+  "use_lap_pe": true,
+  "use_mm_proj": true,
+  "vocab_size": 32000
+}

llama2/graph-text-molgen/reagent_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/non_lora_trainables.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c6f533fb28b1a0dcbf3b5b8b3e9a5f60053ab3c61849cc11d2e92937e9b99e41
+size 11335231

llama2/graph-text-molgen/reagent_pred-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

llama2/graph-text-molgen/retrosynthesis-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0

llama2/graph-text-molgen/retrosynthesis-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "llama-2-7b-chat",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.05,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 64,
+  "revision": null,
+  "target_modules": [
+    "v_proj",
+    "o_proj",
+    "k_proj",
+    "up_proj",
+    "q_proj",
+    "down_proj",
+    "gate_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

llama2/graph-text-molgen/retrosynthesis-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fb9b722d5cdef8ec5c5bd99953017d2df5bccf4a98c451db8aa148afd1dca572
+size 319970957

llama2/graph-text-molgen/retrosynthesis-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "llama-2-7b-chat",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 4096,
+  "mm_graph_tower": "hvqvae2",
+  "mm_hidden_size": 308,
+  "mm_projector_type": "hlinear",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "model_type": "llava_graph",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 32,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
+  "tie_word_embeddings": false,
+  "torch_dtype": "float16",
+  "transformers_version": "4.33.2",
+  "tune_mm_mlp_adapter": false,
+  "use_cache": true,
+  "use_lap_pe": true,
+  "use_mm_proj": true,
+  "vocab_size": 32000
+}

llama2/graph-text-molgen/retrosynthesis-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/non_lora_trainables.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8dad9674828b2165c4753e24fb36bcdd7e4e7f8d04a4254fddb701cda91c7cee
+size 11335231

llama2/graph-text-molgen/retrosynthesis-llava-hvqvae2-llama-2-7b-chat-finetune_lora-5ep16bz/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

llama2/llava-hvqvae2-llama-2-7b-chat-pretrain/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "llama-2-7b-chat",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 4096,
+  "mm_graph_tower": "hvqvae2",
+  "mm_hidden_size": 308,
+  "mm_projector_type": "hlinear",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "model_type": "llava_graph",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 32,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
+  "tie_word_embeddings": false,
+  "torch_dtype": "float16",
+  "transformers_version": "4.33.2",
+  "tune_mm_mlp_adapter": true,
+  "use_cache": true,
+  "use_lap_pe": true,
+  "use_mm_proj": true,
+  "vocab_size": 32000
+}

llama2/llava-hvqvae2-llama-2-7b-chat-pretrain/mm_projector.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ca86cf37d5c3ff431e9960c06d57876b68a5d3264ffe028a0b244a63cc3aac9b
+size 7596223

llama2/llava-hvqvae2-llama-2-7b-chat-pretrain/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

llama2/molcap-llava-hvqvae2-llama-2-7b-chat-finetune_lora-50ep/README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0

llama2/molcap-llava-hvqvae2-llama-2-7b-chat-finetune_lora-50ep/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "llama-2-7b-chat",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 16,
+  "lora_dropout": 0.05,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 64,
+  "revision": null,
+  "target_modules": [
+    "gate_proj",
+    "q_proj",
+    "o_proj",
+    "up_proj",
+    "k_proj",
+    "v_proj",
+    "down_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

llama2/molcap-llava-hvqvae2-llama-2-7b-chat-finetune_lora-50ep/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0a4156fa46026e3b6db7e344c7c8e0c71269dab1e050f4e058c042028001305a
+size 319970957

llama2/molcap-llava-hvqvae2-llama-2-7b-chat-finetune_lora-50ep/config.json ADDED Viewed

	@@ -0,0 +1,35 @@

+{
+  "_name_or_path": "llama-2-7b-chat",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 4096,
+  "mm_graph_tower": "hvqvae2",
+  "mm_hidden_size": 308,
+  "mm_projector_type": "hlinear",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "model_type": "llava_graph",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 32,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
+  "tie_word_embeddings": false,
+  "torch_dtype": "float16",
+  "transformers_version": "4.33.2",
+  "tune_mm_mlp_adapter": false,
+  "use_cache": true,
+  "use_lap_pe": true,
+  "use_mm_proj": true,
+  "vocab_size": 32000
+}

llama2/molcap-llava-hvqvae2-llama-2-7b-chat-finetune_lora-50ep/non_lora_trainables.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ce7a0b85f149002efc83f1e353479a2eb8b0c0ddbcab68b294b9cfccfc687de1
+size 11335231

llama2/molcap-llava-hvqvae2-llama-2-7b-chat-finetune_lora-50ep/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_clintox/README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_clintox/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "./vicuna-v1-3-7b",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 256,
+  "lora_dropout": 0.05,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 128,
+  "revision": null,
+  "target_modules": [
+    "gate_proj",
+    "v_proj",
+    "q_proj",
+    "down_proj",
+    "k_proj",
+    "o_proj",
+    "up_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_clintox/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8ff93670b4d42680a8515ee55572fee64ff0286dd15b9d0b172dfe5b1078f2e2
+size 639786637

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_clintox/config.json ADDED Viewed

	@@ -0,0 +1,36 @@

+{
+  "_name_or_path": "./vicuna-v1-3-7b",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 2048,
+  "mm_graph_tower": "hvqvae2",
+  "mm_hidden_size": 308,
+  "mm_projector_type": "hlinear",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "model_type": "llava_graph",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 32,
+  "pad_token_id": 0,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
+  "tie_word_embeddings": false,
+  "torch_dtype": "float16",
+  "transformers_version": "4.33.2",
+  "tune_mm_mlp_adapter": false,
+  "use_cache": true,
+  "use_lap_pe": true,
+  "use_mm_proj": true,
+  "vocab_size": 32000
+}

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_clintox/non_lora_trainables.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:48c804016822b1fcbeb5fdf1dcac9b404ab1763cae8255f273536ac9d72cbd1b
+size 11335231

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_clintox/trainer_state.json ADDED Viewed

	@@ -0,0 +1,2308 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 20.0,
+  "eval_steps": 500,
+  "global_step": 380,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.05,
+      "learning_rate": 3.3333333333333333e-06,
+      "loss": 6.5781,
+      "step": 1
+    },
+    {
+      "epoch": 0.11,
+      "learning_rate": 6.666666666666667e-06,
+      "loss": 6.5469,
+      "step": 2
+    },
+    {
+      "epoch": 0.16,
+      "learning_rate": 1e-05,
+      "loss": 6.6484,
+      "step": 3
+    },
+    {
+      "epoch": 0.21,
+      "learning_rate": 1.3333333333333333e-05,
+      "loss": 6.0312,
+      "step": 4
+    },
+    {
+      "epoch": 0.26,
+      "learning_rate": 1.6666666666666667e-05,
+      "loss": 5.1328,
+      "step": 5
+    },
+    {
+      "epoch": 0.32,
+      "learning_rate": 2e-05,
+      "loss": 3.6328,
+      "step": 6
+    },
+    {
+      "epoch": 0.37,
+      "learning_rate": 2.3333333333333336e-05,
+      "loss": 2.4062,
+      "step": 7
+    },
+    {
+      "epoch": 0.42,
+      "learning_rate": 2.6666666666666667e-05,
+      "loss": 1.5195,
+      "step": 8
+    },
+    {
+      "epoch": 0.47,
+      "learning_rate": 3.0000000000000004e-05,
+      "loss": 0.9883,
+      "step": 9
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 3.3333333333333335e-05,
+      "loss": 0.6602,
+      "step": 10
+    },
+    {
+      "epoch": 0.58,
+      "learning_rate": 3.6666666666666666e-05,
+      "loss": 0.5137,
+      "step": 11
+    },
+    {
+      "epoch": 0.63,
+      "learning_rate": 4e-05,
+      "loss": 0.3823,
+      "step": 12
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 3.9999271211568084e-05,
+      "loss": 0.2935,
+      "step": 13
+    },
+    {
+      "epoch": 0.74,
+      "learning_rate": 3.999708489938559e-05,
+      "loss": 0.1488,
+      "step": 14
+    },
+    {
+      "epoch": 0.79,
+      "learning_rate": 3.99934412227884e-05,
+      "loss": 0.2485,
+      "step": 15
+    },
+    {
+      "epoch": 0.84,
+      "learning_rate": 3.998834044732348e-05,
+      "loss": 0.1338,
+      "step": 16
+    },
+    {
+      "epoch": 0.89,
+      "learning_rate": 3.998178294472944e-05,
+      "loss": 0.1754,
+      "step": 17
+    },
+    {
+      "epoch": 0.95,
+      "learning_rate": 3.997376919290946e-05,
+      "loss": 0.1593,
+      "step": 18
+    },
+    {
+      "epoch": 1.0,
+      "learning_rate": 3.996429977589653e-05,
+      "loss": 0.1721,
+      "step": 19
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 3.995337538381079e-05,
+      "loss": 0.1564,
+      "step": 20
+    },
+    {
+      "epoch": 1.11,
+      "learning_rate": 3.99409968128093e-05,
+      "loss": 0.1659,
+      "step": 21
+    },
+    {
+      "epoch": 1.16,
+      "learning_rate": 3.9927164965028006e-05,
+      "loss": 0.1531,
+      "step": 22
+    },
+    {
+      "epoch": 1.21,
+      "learning_rate": 3.991188084851596e-05,
+      "loss": 0.1584,
+      "step": 23
+    },
+    {
+      "epoch": 1.26,
+      "learning_rate": 3.98951455771619e-05,
+      "loss": 0.1647,
+      "step": 24
+    },
+    {
+      "epoch": 1.32,
+      "learning_rate": 3.987696037061304e-05,
+      "loss": 0.1562,
+      "step": 25
+    },
+    {
+      "epoch": 1.37,
+      "learning_rate": 3.98573265541862e-05,
+      "loss": 0.1322,
+      "step": 26
+    },
+    {
+      "epoch": 1.42,
+      "learning_rate": 3.98362455587712e-05,
+      "loss": 0.1619,
+      "step": 27
+    },
+    {
+      "epoch": 1.47,
+      "learning_rate": 3.981371892072661e-05,
+      "loss": 0.1064,
+      "step": 28
+    },
+    {
+      "epoch": 1.53,
+      "learning_rate": 3.9789748281767754e-05,
+      "loss": 0.1302,
+      "step": 29
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 3.976433538884706e-05,
+      "loss": 0.1328,
+      "step": 30
+    },
+    {
+      "epoch": 1.63,
+      "learning_rate": 3.9737482094026764e-05,
+      "loss": 0.1242,
+      "step": 31
+    },
+    {
+      "epoch": 1.68,
+      "learning_rate": 3.9709190354343936e-05,
+      "loss": 0.2114,
+      "step": 32
+    },
+    {
+      "epoch": 1.74,
+      "learning_rate": 3.967946223166784e-05,
+      "loss": 0.1575,
+      "step": 33
+    },
+    {
+      "epoch": 1.79,
+      "learning_rate": 3.9648299892549654e-05,
+      "loss": 0.082,
+      "step": 34
+    },
+    {
+      "epoch": 1.84,
+      "learning_rate": 3.961570560806461e-05,
+      "loss": 0.1068,
+      "step": 35
+    },
+    {
+      "epoch": 1.89,
+      "learning_rate": 3.958168175364646e-05,
+      "loss": 0.0997,
+      "step": 36
+    },
+    {
+      "epoch": 1.95,
+      "learning_rate": 3.954623080891435e-05,
+      "loss": 0.1587,
+      "step": 37
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 3.950935535749213e-05,
+      "loss": 0.0936,
+      "step": 38
+    },
+    {
+      "epoch": 2.05,
+      "learning_rate": 3.9471058086820024e-05,
+      "loss": 0.14,
+      "step": 39
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 3.943134178795883e-05,
+      "loss": 0.14,
+      "step": 40
+    },
+    {
+      "epoch": 2.16,
+      "learning_rate": 3.939020935538647e-05,
+      "loss": 0.1548,
+      "step": 41
+    },
+    {
+      "epoch": 2.21,
+      "learning_rate": 3.934766378678704e-05,
+      "loss": 0.1184,
+      "step": 42
+    },
+    {
+      "epoch": 2.26,
+      "learning_rate": 3.930370818283235e-05,
+      "loss": 0.1104,
+      "step": 43
+    },
+    {
+      "epoch": 2.32,
+      "learning_rate": 3.925834574695599e-05,
+      "loss": 0.1354,
+      "step": 44
+    },
+    {
+      "epoch": 2.37,
+      "learning_rate": 3.9211579785119804e-05,
+      "loss": 0.108,
+      "step": 45
+    },
+    {
+      "epoch": 2.42,
+      "learning_rate": 3.9163413705572984e-05,
+      "loss": 0.0513,
+      "step": 46
+    },
+    {
+      "epoch": 2.47,
+      "learning_rate": 3.911385101860369e-05,
+      "loss": 0.1129,
+      "step": 47
+    },
+    {
+      "epoch": 2.53,
+      "learning_rate": 3.906289533628322e-05,
+      "loss": 0.1,
+      "step": 48
+    },
+    {
+      "epoch": 2.58,
+      "learning_rate": 3.9010550372202756e-05,
+      "loss": 0.1213,
+      "step": 49
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 3.895681994120272e-05,
+      "loss": 0.1859,
+      "step": 50
+    },
+    {
+      "epoch": 2.68,
+      "learning_rate": 3.890170795909477e-05,
+      "loss": 0.1483,
+      "step": 51
+    },
+    {
+      "epoch": 2.74,
+      "learning_rate": 3.8845218442376416e-05,
+      "loss": 0.0887,
+      "step": 52
+    },
+    {
+      "epoch": 2.79,
+      "learning_rate": 3.878735550793827e-05,
+      "loss": 0.13,
+      "step": 53
+    },
+    {
+      "epoch": 2.84,
+      "learning_rate": 3.8728123372764085e-05,
+      "loss": 0.1549,
+      "step": 54
+    },
+    {
+      "epoch": 2.89,
+      "learning_rate": 3.8667526353623326e-05,
+      "loss": 0.1699,
+      "step": 55
+    },
+    {
+      "epoch": 2.95,
+      "learning_rate": 3.8605568866756666e-05,
+      "loss": 0.1741,
+      "step": 56
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 3.8542255427554065e-05,
+      "loss": 0.1244,
+      "step": 57
+    },
+    {
+      "epoch": 3.05,
+      "learning_rate": 3.8477590650225735e-05,
+      "loss": 0.11,
+      "step": 58
+    },
+    {
+      "epoch": 3.11,
+      "learning_rate": 3.8411579247465845e-05,
+      "loss": 0.1753,
+      "step": 59
+    },
+    {
+      "epoch": 3.16,
+      "learning_rate": 3.834422603010906e-05,
+      "loss": 0.1378,
+      "step": 60
+    },
+    {
+      "epoch": 3.21,
+      "learning_rate": 3.827553590677996e-05,
+      "loss": 0.1133,
+      "step": 61
+    },
+    {
+      "epoch": 3.26,
+      "learning_rate": 3.820551388353525e-05,
+      "loss": 0.14,
+      "step": 62
+    },
+    {
+      "epoch": 3.32,
+      "learning_rate": 3.813416506349899e-05,
+      "loss": 0.1765,
+      "step": 63
+    },
+    {
+      "epoch": 3.37,
+      "learning_rate": 3.806149464649066e-05,
+      "loss": 0.1208,
+      "step": 64
+    },
+    {
+      "epoch": 3.42,
+      "learning_rate": 3.798750792864617e-05,
+      "loss": 0.1493,
+      "step": 65
+    },
+    {
+      "epoch": 3.47,
+      "learning_rate": 3.791221030203193e-05,
+      "loss": 0.1252,
+      "step": 66
+    },
+    {
+      "epoch": 3.53,
+      "learning_rate": 3.783560725425188e-05,
+      "loss": 0.1162,
+      "step": 67
+    },
+    {
+      "epoch": 3.58,
+      "learning_rate": 3.775770436804751e-05,
+      "loss": 0.1919,
+      "step": 68
+    },
+    {
+      "epoch": 3.63,
+      "learning_rate": 3.767850732089105e-05,
+      "loss": 0.0798,
+      "step": 69
+    },
+    {
+      "epoch": 3.68,
+      "learning_rate": 3.759802188457168e-05,
+      "loss": 0.1332,
+      "step": 70
+    },
+    {
+      "epoch": 3.74,
+      "learning_rate": 3.75162539247749e-05,
+      "loss": 0.0937,
+      "step": 71
+    },
+    {
+      "epoch": 3.79,
+      "learning_rate": 3.743320940065503e-05,
+      "loss": 0.1108,
+      "step": 72
+    },
+    {
+      "epoch": 3.84,
+      "learning_rate": 3.7348894364400914e-05,
+      "loss": 0.116,
+      "step": 73
+    },
+    {
+      "epoch": 3.89,
+      "learning_rate": 3.726331496079486e-05,
+      "loss": 0.0609,
+      "step": 74
+    },
+    {
+      "epoch": 3.95,
+      "learning_rate": 3.71764774267648e-05,
+      "loss": 0.1792,
+      "step": 75
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 3.7088388090929776e-05,
+      "loss": 0.0847,
+      "step": 76
+    },
+    {
+      "epoch": 4.05,
+      "learning_rate": 3.699905337313866e-05,
+      "loss": 0.153,
+      "step": 77
+    },
+    {
+      "epoch": 4.11,
+      "learning_rate": 3.690847978400236e-05,
+      "loss": 0.1088,
+      "step": 78
+    },
+    {
+      "epoch": 4.16,
+      "learning_rate": 3.681667392441926e-05,
+      "loss": 0.1165,
+      "step": 79
+    },
+    {
+      "epoch": 4.21,
+      "learning_rate": 3.672364248509422e-05,
+      "loss": 0.1244,
+      "step": 80
+    },
+    {
+      "epoch": 4.26,
+      "learning_rate": 3.662939224605091e-05,
+      "loss": 0.1249,
+      "step": 81
+    },
+    {
+      "epoch": 4.32,
+      "learning_rate": 3.653393007613771e-05,
+      "loss": 0.1248,
+      "step": 82
+    },
+    {
+      "epoch": 4.37,
+      "learning_rate": 3.643726293252717e-05,
+      "loss": 0.0751,
+      "step": 83
+    },
+    {
+      "epoch": 4.42,
+      "learning_rate": 3.633939786020884e-05,
+      "loss": 0.123,
+      "step": 84
+    },
+    {
+      "epoch": 4.47,
+      "learning_rate": 3.624034199147602e-05,
+      "loss": 0.1466,
+      "step": 85
+    },
+    {
+      "epoch": 4.53,
+      "learning_rate": 3.614010254540581e-05,
+      "loss": 0.1448,
+      "step": 86
+    },
+    {
+      "epoch": 4.58,
+      "learning_rate": 3.60386868273331e-05,
+      "loss": 0.1605,
+      "step": 87
+    },
+    {
+      "epoch": 4.63,
+      "learning_rate": 3.593610222831809e-05,
+      "loss": 0.1544,
+      "step": 88
+    },
+    {
+      "epoch": 4.68,
+      "learning_rate": 3.58323562246077e-05,
+      "loss": 0.0949,
+      "step": 89
+    },
+    {
+      "epoch": 4.74,
+      "learning_rate": 3.572745637709065e-05,
+      "loss": 0.1155,
+      "step": 90
+    },
+    {
+      "epoch": 4.79,
+      "learning_rate": 3.562141033074649e-05,
+      "loss": 0.1235,
+      "step": 91
+    },
+    {
+      "epoch": 4.84,
+      "learning_rate": 3.55142258140884e-05,
+      "loss": 0.1772,
+      "step": 92
+    },
+    {
+      "epoch": 4.89,
+      "learning_rate": 3.540591063859996e-05,
+      "loss": 0.1523,
+      "step": 93
+    },
+    {
+      "epoch": 4.95,
+      "learning_rate": 3.5296472698165856e-05,
+      "loss": 0.126,
+      "step": 94
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 3.51859199684966e-05,
+      "loss": 0.1054,
+      "step": 95
+    },
+    {
+      "epoch": 5.05,
+      "learning_rate": 3.5074260506547225e-05,
+      "loss": 0.1022,
+      "step": 96
+    },
+    {
+      "epoch": 5.11,
+      "learning_rate": 3.4961502449930165e-05,
+      "loss": 0.1858,
+      "step": 97
+    },
+    {
+      "epoch": 5.16,
+      "learning_rate": 3.484765401632214e-05,
+      "loss": 0.1566,
+      "step": 98
+    },
+    {
+      "epoch": 5.21,
+      "learning_rate": 3.473272350286529e-05,
+      "loss": 0.1021,
+      "step": 99
+    },
+    {
+      "epoch": 5.26,
+      "learning_rate": 3.461671928556248e-05,
+      "loss": 0.0933,
+      "step": 100
+    },
+    {
+      "epoch": 5.32,
+      "learning_rate": 3.449964981866689e-05,
+      "loss": 0.1385,
+      "step": 101
+    },
+    {
+      "epoch": 5.37,
+      "learning_rate": 3.438152363406582e-05,
+      "loss": 0.1249,
+      "step": 102
+    },
+    {
+      "epoch": 5.42,
+      "learning_rate": 3.426234934065896e-05,
+      "loss": 0.1295,
+      "step": 103
+    },
+    {
+      "epoch": 5.47,
+      "learning_rate": 3.4142135623730954e-05,
+      "loss": 0.1067,
+      "step": 104
+    },
+    {
+      "epoch": 5.53,
+      "learning_rate": 3.402089124431843e-05,
+      "loss": 0.1349,
+      "step": 105
+    },
+    {
+      "epoch": 5.58,
+      "learning_rate": 3.38986250385715e-05,
+      "loss": 0.1412,
+      "step": 106
+    },
+    {
+      "epoch": 5.63,
+      "learning_rate": 3.37753459171098e-05,
+      "loss": 0.0981,
+      "step": 107
+    },
+    {
+      "epoch": 5.68,
+      "learning_rate": 3.365106286437309e-05,
+      "loss": 0.0834,
+      "step": 108
+    },
+    {
+      "epoch": 5.74,
+      "learning_rate": 3.3525784937966474e-05,
+      "loss": 0.1453,
+      "step": 109
+    },
+    {
+      "epoch": 5.79,
+      "learning_rate": 3.339952126800033e-05,
+      "loss": 0.1552,
+      "step": 110
+    },
+    {
+      "epoch": 5.84,
+      "learning_rate": 3.3272281056424854e-05,
+      "loss": 0.0876,
+      "step": 111
+    },
+    {
+      "epoch": 5.89,
+      "learning_rate": 3.3144073576359455e-05,
+      "loss": 0.151,
+      "step": 112
+    },
+    {
+      "epoch": 5.95,
+      "learning_rate": 3.301490817141698e-05,
+      "loss": 0.1343,
+      "step": 113
+    },
+    {
+      "epoch": 6.0,
+      "learning_rate": 3.288479425502273e-05,
+      "loss": 0.1047,
+      "step": 114
+    },
+    {
+      "epoch": 6.05,
+      "learning_rate": 3.27537413097284e-05,
+      "loss": 0.1417,
+      "step": 115
+    },
+    {
+      "epoch": 6.11,
+      "learning_rate": 3.262175888652106e-05,
+      "loss": 0.0889,
+      "step": 116
+    },
+    {
+      "epoch": 6.16,
+      "learning_rate": 3.248885660412701e-05,
+      "loss": 0.0912,
+      "step": 117
+    },
+    {
+      "epoch": 6.21,
+      "learning_rate": 3.235504414831087e-05,
+      "loss": 0.095,
+      "step": 118
+    },
+    {
+      "epoch": 6.26,
+      "learning_rate": 3.2220331271169614e-05,
+      "loss": 0.1486,
+      "step": 119
+    },
+    {
+      "epoch": 6.32,
+      "learning_rate": 3.2084727790421895e-05,
+      "loss": 0.1378,
+      "step": 120
+    },
+    {
+      "epoch": 6.37,
+      "learning_rate": 3.194824358869252e-05,
+      "loss": 0.1383,
+      "step": 121
+    },
+    {
+      "epoch": 6.42,
+      "learning_rate": 3.181088861279222e-05,
+      "loss": 0.1015,
+      "step": 122
+    },
+    {
+      "epoch": 6.47,
+      "learning_rate": 3.1672672872992755e-05,
+      "loss": 0.1249,
+      "step": 123
+    },
+    {
+      "epoch": 6.53,
+      "learning_rate": 3.153360644229735e-05,
+      "loss": 0.1289,
+      "step": 124
+    },
+    {
+      "epoch": 6.58,
+      "learning_rate": 3.139369945570659e-05,
+      "loss": 0.1287,
+      "step": 125
+    },
+    {
+      "epoch": 6.63,
+      "learning_rate": 3.125296210947983e-05,
+      "loss": 0.1008,
+      "step": 126
+    },
+    {
+      "epoch": 6.68,
+      "learning_rate": 3.111140466039205e-05,
+      "loss": 0.1459,
+      "step": 127
+    },
+    {
+      "epoch": 6.74,
+      "learning_rate": 3.0969037424986376e-05,
+      "loss": 0.146,
+      "step": 128
+    },
+    {
+      "epoch": 6.79,
+      "learning_rate": 3.082587077882225e-05,
+      "loss": 0.1721,
+      "step": 129
+    },
+    {
+      "epoch": 6.84,
+      "learning_rate": 3.068191515571921e-05,
+      "loss": 0.1113,
+      "step": 130
+    },
+    {
+      "epoch": 6.89,
+      "learning_rate": 3.053718104699654e-05,
+      "loss": 0.1014,
+      "step": 131
+    },
+    {
+      "epoch": 6.95,
+      "learning_rate": 3.0391679000708673e-05,
+      "loss": 0.106,
+      "step": 132
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 3.024541962087641e-05,
+      "loss": 0.1711,
+      "step": 133
+    },
+    {
+      "epoch": 7.05,
+      "learning_rate": 3.0098413566714165e-05,
+      "loss": 0.0898,
+      "step": 134
+    },
+    {
+      "epoch": 7.11,
+      "learning_rate": 2.9950671551853094e-05,
+      "loss": 0.0875,
+      "step": 135
+    },
+    {
+      "epoch": 7.16,
+      "learning_rate": 2.980220434356035e-05,
+      "loss": 0.126,
+      "step": 136
+    },
+    {
+      "epoch": 7.21,
+      "learning_rate": 2.965302276195431e-05,
+      "loss": 0.1261,
+      "step": 137
+    },
+    {
+      "epoch": 7.26,
+      "learning_rate": 2.9503137679216073e-05,
+      "loss": 0.114,
+      "step": 138
+    },
+    {
+      "epoch": 7.32,
+      "learning_rate": 2.935256001879709e-05,
+      "loss": 0.1384,
+      "step": 139
+    },
+    {
+      "epoch": 7.37,
+      "learning_rate": 2.9201300754623046e-05,
+      "loss": 0.1226,
+      "step": 140
+    },
+    {
+      "epoch": 7.42,
+      "learning_rate": 2.9049370910294143e-05,
+      "loss": 0.1263,
+      "step": 141
+    },
+    {
+      "epoch": 7.47,
+      "learning_rate": 2.8896781558281688e-05,
+      "loss": 0.1452,
+      "step": 142
+    },
+    {
+      "epoch": 7.53,
+      "learning_rate": 2.8743543819121132e-05,
+      "loss": 0.1198,
+      "step": 143
+    },
+    {
+      "epoch": 7.58,
+      "learning_rate": 2.8589668860601643e-05,
+      "loss": 0.1314,
+      "step": 144
+    },
+    {
+      "epoch": 7.63,
+      "learning_rate": 2.843516789695219e-05,
+      "loss": 0.1091,
+      "step": 145
+    },
+    {
+      "epoch": 7.68,
+      "learning_rate": 2.828005218802427e-05,
+      "loss": 0.1127,
+      "step": 146
+    },
+    {
+      "epoch": 7.74,
+      "learning_rate": 2.812433303847133e-05,
+      "loss": 0.1125,
+      "step": 147
+    },
+    {
+      "epoch": 7.79,
+      "learning_rate": 2.7968021796924834e-05,
+      "loss": 0.1816,
+      "step": 148
+    },
+    {
+      "epoch": 7.84,
+      "learning_rate": 2.781112985516725e-05,
+      "loss": 0.1317,
+      "step": 149
+    },
+    {
+      "epoch": 7.89,
+      "learning_rate": 2.7653668647301797e-05,
+      "loss": 0.0975,
+      "step": 150
+    },
+    {
+      "epoch": 7.95,
+      "learning_rate": 2.7495649648919153e-05,
+      "loss": 0.1036,
+      "step": 151
+    },
+    {
+      "epoch": 8.0,
+      "learning_rate": 2.7337084376261135e-05,
+      "loss": 0.0846,
+      "step": 152
+    },
+    {
+      "epoch": 8.05,
+      "learning_rate": 2.7177984385381366e-05,
+      "loss": 0.1436,
+      "step": 153
+    },
+    {
+      "epoch": 8.11,
+      "learning_rate": 2.701836127130314e-05,
+      "loss": 0.0847,
+      "step": 154
+    },
+    {
+      "epoch": 8.16,
+      "learning_rate": 2.6858226667174362e-05,
+      "loss": 0.0792,
+      "step": 155
+    },
+    {
+      "epoch": 8.21,
+      "learning_rate": 2.6697592243419723e-05,
+      "loss": 0.1567,
+      "step": 156
+    },
+    {
+      "epoch": 8.26,
+      "learning_rate": 2.6536469706890226e-05,
+      "loss": 0.1548,
+      "step": 157
+    },
+    {
+      "epoch": 8.32,
+      "learning_rate": 2.637487080000992e-05,
+      "loss": 0.1852,
+      "step": 158
+    },
+    {
+      "epoch": 8.37,
+      "learning_rate": 2.6212807299920218e-05,
+      "loss": 0.1085,
+      "step": 159
+    },
+    {
+      "epoch": 8.42,
+      "learning_rate": 2.605029101762152e-05,
+      "loss": 0.1364,
+      "step": 160
+    },
+    {
+      "epoch": 8.47,
+      "learning_rate": 2.588733379711248e-05,
+      "loss": 0.1144,
+      "step": 161
+    },
+    {
+      "epoch": 8.53,
+      "learning_rate": 2.572394751452683e-05,
+      "loss": 0.1056,
+      "step": 162
+    },
+    {
+      "epoch": 8.58,
+      "learning_rate": 2.5560144077267826e-05,
+      "loss": 0.1411,
+      "step": 163
+    },
+    {
+      "epoch": 8.63,
+      "learning_rate": 2.5395935423140487e-05,
+      "loss": 0.1246,
+      "step": 164
+    },
+    {
+      "epoch": 8.68,
+      "learning_rate": 2.5231333519481577e-05,
+      "loss": 0.1379,
+      "step": 165
+    },
+    {
+      "epoch": 8.74,
+      "learning_rate": 2.5066350362287407e-05,
+      "loss": 0.1045,
+      "step": 166
+    },
+    {
+      "epoch": 8.79,
+      "learning_rate": 2.490099797533964e-05,
+      "loss": 0.1032,
+      "step": 167
+    },
+    {
+      "epoch": 8.84,
+      "learning_rate": 2.4735288409328937e-05,
+      "loss": 0.0997,
+      "step": 168
+    },
+    {
+      "epoch": 8.89,
+      "learning_rate": 2.456923374097678e-05,
+      "loss": 0.0868,
+      "step": 169
+    },
+    {
+      "epoch": 8.95,
+      "learning_rate": 2.4402846072155313e-05,
+      "loss": 0.0928,
+      "step": 170
+    },
+    {
+      "epoch": 9.0,
+      "learning_rate": 2.4236137529005355e-05,
+      "loss": 0.1117,
+      "step": 171
+    },
+    {
+      "epoch": 9.05,
+      "learning_rate": 2.4069120261052682e-05,
+      "loss": 0.1288,
+      "step": 172
+    },
+    {
+      "epoch": 9.11,
+      "learning_rate": 2.390180644032257e-05,
+      "loss": 0.1489,
+      "step": 173
+    },
+    {
+      "epoch": 9.16,
+      "learning_rate": 2.3734208260452727e-05,
+      "loss": 0.1038,
+      "step": 174
+    },
+    {
+      "epoch": 9.21,
+      "learning_rate": 2.356633793580463e-05,
+      "loss": 0.1051,
+      "step": 175
+    },
+    {
+      "epoch": 9.26,
+      "learning_rate": 2.3398207700573336e-05,
+      "loss": 0.1711,
+      "step": 176
+    },
+    {
+      "epoch": 9.32,
+      "learning_rate": 2.3229829807895904e-05,
+      "loss": 0.0945,
+      "step": 177
+    },
+    {
+      "epoch": 9.37,
+      "learning_rate": 2.306121652895836e-05,
+      "loss": 0.1277,
+      "step": 178
+    },
+    {
+      "epoch": 9.42,
+      "learning_rate": 2.289238015210142e-05,
+      "loss": 0.1415,
+      "step": 179
+    },
+    {
+      "epoch": 9.47,
+      "learning_rate": 2.2723332981924937e-05,
+      "loss": 0.0664,
+      "step": 180
+    },
+    {
+      "epoch": 9.53,
+      "learning_rate": 2.2554087338391098e-05,
+      "loss": 0.1089,
+      "step": 181
+    },
+    {
+      "epoch": 9.58,
+      "learning_rate": 2.2384655555926625e-05,
+      "loss": 0.1195,
+      "step": 182
+    },
+    {
+      "epoch": 9.63,
+      "learning_rate": 2.2215049982523827e-05,
+      "loss": 0.0781,
+      "step": 183
+    },
+    {
+      "epoch": 9.68,
+      "learning_rate": 2.2045282978840684e-05,
+      "loss": 0.1266,
+      "step": 184
+    },
+    {
+      "epoch": 9.74,
+      "learning_rate": 2.1875366917300057e-05,
+      "loss": 0.155,
+      "step": 185
+    },
+    {
+      "epoch": 9.79,
+      "learning_rate": 2.1705314181187922e-05,
+      "loss": 0.1202,
+      "step": 186
+    },
+    {
+      "epoch": 9.84,
+      "learning_rate": 2.153513716375099e-05,
+      "loss": 0.1676,
+      "step": 187
+    },
+    {
+      "epoch": 9.89,
+      "learning_rate": 2.1364848267293424e-05,
+      "loss": 0.0894,
+      "step": 188
+    },
+    {
+      "epoch": 9.95,
+      "learning_rate": 2.1194459902272997e-05,
+      "loss": 0.1196,
+      "step": 189
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 2.102398448639667e-05,
+      "loss": 0.0975,
+      "step": 190
+    },
+    {
+      "epoch": 10.05,
+      "learning_rate": 2.085343444371551e-05,
+      "loss": 0.1364,
+      "step": 191
+    },
+    {
+      "epoch": 10.11,
+      "learning_rate": 2.068282220371936e-05,
+      "loss": 0.108,
+      "step": 192
+    },
+    {
+      "epoch": 10.16,
+      "learning_rate": 2.0512160200430896e-05,
+      "loss": 0.0727,
+      "step": 193
+    },
+    {
+      "epoch": 10.21,
+      "learning_rate": 2.03414608714995e-05,
+      "loss": 0.1112,
+      "step": 194
+    },
+    {
+      "epoch": 10.26,
+      "learning_rate": 2.017073665729479e-05,
+      "loss": 0.135,
+      "step": 195
+    },
+    {
+      "epoch": 10.32,
+      "learning_rate": 2e-05,
+      "loss": 0.1162,
+      "step": 196
+    },
+    {
+      "epoch": 10.37,
+      "learning_rate": 1.982926334270522e-05,
+      "loss": 0.1771,
+      "step": 197
+    },
+    {
+      "epoch": 10.42,
+      "learning_rate": 1.9658539128500507e-05,
+      "loss": 0.0685,
+      "step": 198
+    },
+    {
+      "epoch": 10.47,
+      "learning_rate": 1.948783979956911e-05,
+      "loss": 0.1078,
+      "step": 199
+    },
+    {
+      "epoch": 10.53,
+      "learning_rate": 1.9317177796280643e-05,
+      "loss": 0.1307,
+      "step": 200
+    },
+    {
+      "epoch": 10.58,
+      "learning_rate": 1.9146565556284492e-05,
+      "loss": 0.113,
+      "step": 201
+    },
+    {
+      "epoch": 10.63,
+      "learning_rate": 1.8976015513603344e-05,
+      "loss": 0.0933,
+      "step": 202
+    },
+    {
+      "epoch": 10.68,
+      "learning_rate": 1.8805540097727003e-05,
+      "loss": 0.1012,
+      "step": 203
+    },
+    {
+      "epoch": 10.74,
+      "learning_rate": 1.8635151732706586e-05,
+      "loss": 0.1204,
+      "step": 204
+    },
+    {
+      "epoch": 10.79,
+      "learning_rate": 1.8464862836249014e-05,
+      "loss": 0.1306,
+      "step": 205
+    },
+    {
+      "epoch": 10.84,
+      "learning_rate": 1.829468581881208e-05,
+      "loss": 0.1296,
+      "step": 206
+    },
+    {
+      "epoch": 10.89,
+      "learning_rate": 1.8124633082699956e-05,
+      "loss": 0.1087,
+      "step": 207
+    },
+    {
+      "epoch": 10.95,
+      "learning_rate": 1.7954717021159316e-05,
+      "loss": 0.1519,
+      "step": 208
+    },
+    {
+      "epoch": 11.0,
+      "learning_rate": 1.778495001747618e-05,
+      "loss": 0.1353,
+      "step": 209
+    },
+    {
+      "epoch": 11.05,
+      "learning_rate": 1.7615344444073385e-05,
+      "loss": 0.1101,
+      "step": 210
+    },
+    {
+      "epoch": 11.11,
+      "learning_rate": 1.7445912661608912e-05,
+      "loss": 0.1388,
+      "step": 211
+    },
+    {
+      "epoch": 11.16,
+      "learning_rate": 1.7276667018075073e-05,
+      "loss": 0.1658,
+      "step": 212
+    },
+    {
+      "epoch": 11.21,
+      "learning_rate": 1.710761984789858e-05,
+      "loss": 0.1342,
+      "step": 213
+    },
+    {
+      "epoch": 11.26,
+      "learning_rate": 1.6938783471041647e-05,
+      "loss": 0.1012,
+      "step": 214
+    },
+    {
+      "epoch": 11.32,
+      "learning_rate": 1.6770170192104107e-05,
+      "loss": 0.149,
+      "step": 215
+    },
+    {
+      "epoch": 11.37,
+      "learning_rate": 1.6601792299426668e-05,
+      "loss": 0.1259,
+      "step": 216
+    },
+    {
+      "epoch": 11.42,
+      "learning_rate": 1.6433662064195378e-05,
+      "loss": 0.093,
+      "step": 217
+    },
+    {
+      "epoch": 11.47,
+      "learning_rate": 1.6265791739547276e-05,
+      "loss": 0.123,
+      "step": 218
+    },
+    {
+      "epoch": 11.53,
+      "learning_rate": 1.609819355967744e-05,
+      "loss": 0.1042,
+      "step": 219
+    },
+    {
+      "epoch": 11.58,
+      "learning_rate": 1.5930879738947328e-05,
+      "loss": 0.0735,
+      "step": 220
+    },
+    {
+      "epoch": 11.63,
+      "learning_rate": 1.576386247099465e-05,
+      "loss": 0.0945,
+      "step": 221
+    },
+    {
+      "epoch": 11.68,
+      "learning_rate": 1.5597153927844693e-05,
+      "loss": 0.0979,
+      "step": 222
+    },
+    {
+      "epoch": 11.74,
+      "learning_rate": 1.543076625902322e-05,
+      "loss": 0.1059,
+      "step": 223
+    },
+    {
+      "epoch": 11.79,
+      "learning_rate": 1.5264711590671067e-05,
+      "loss": 0.1222,
+      "step": 224
+    },
+    {
+      "epoch": 11.84,
+      "learning_rate": 1.5099002024660368e-05,
+      "loss": 0.0948,
+      "step": 225
+    },
+    {
+      "epoch": 11.89,
+      "learning_rate": 1.4933649637712593e-05,
+      "loss": 0.1166,
+      "step": 226
+    },
+    {
+      "epoch": 11.95,
+      "learning_rate": 1.4768666480518432e-05,
+      "loss": 0.1295,
+      "step": 227
+    },
+    {
+      "epoch": 12.0,
+      "learning_rate": 1.4604064576859513e-05,
+      "loss": 0.0759,
+      "step": 228
+    },
+    {
+      "epoch": 12.05,
+      "learning_rate": 1.4439855922732182e-05,
+      "loss": 0.1631,
+      "step": 229
+    },
+    {
+      "epoch": 12.11,
+      "learning_rate": 1.4276052485473177e-05,
+      "loss": 0.1216,
+      "step": 230
+    },
+    {
+      "epoch": 12.16,
+      "learning_rate": 1.4112666202887522e-05,
+      "loss": 0.1101,
+      "step": 231
+    },
+    {
+      "epoch": 12.21,
+      "learning_rate": 1.3949708982378487e-05,
+      "loss": 0.0963,
+      "step": 232
+    },
+    {
+      "epoch": 12.26,
+      "learning_rate": 1.3787192700079792e-05,
+      "loss": 0.1061,
+      "step": 233
+    },
+    {
+      "epoch": 12.32,
+      "learning_rate": 1.3625129199990083e-05,
+      "loss": 0.1411,
+      "step": 234
+    },
+    {
+      "epoch": 12.37,
+      "learning_rate": 1.3463530293109783e-05,
+      "loss": 0.0859,
+      "step": 235
+    },
+    {
+      "epoch": 12.42,
+      "learning_rate": 1.3302407756580278e-05,
+      "loss": 0.0946,
+      "step": 236
+    },
+    {
+      "epoch": 12.47,
+      "learning_rate": 1.3141773332825647e-05,
+      "loss": 0.077,
+      "step": 237
+    },
+    {
+      "epoch": 12.53,
+      "learning_rate": 1.2981638728696868e-05,
+      "loss": 0.0906,
+      "step": 238
+    },
+    {
+      "epoch": 12.58,
+      "learning_rate": 1.282201561461864e-05,
+      "loss": 0.1389,
+      "step": 239
+    },
+    {
+      "epoch": 12.63,
+      "learning_rate": 1.2662915623738874e-05,
+      "loss": 0.1498,
+      "step": 240
+    },
+    {
+      "epoch": 12.68,
+      "learning_rate": 1.2504350351080845e-05,
+      "loss": 0.1659,
+      "step": 241
+    },
+    {
+      "epoch": 12.74,
+      "learning_rate": 1.2346331352698206e-05,
+      "loss": 0.0935,
+      "step": 242
+    },
+    {
+      "epoch": 12.79,
+      "learning_rate": 1.2188870144832758e-05,
+      "loss": 0.1377,
+      "step": 243
+    },
+    {
+      "epoch": 12.84,
+      "learning_rate": 1.2031978203075172e-05,
+      "loss": 0.0899,
+      "step": 244
+    },
+    {
+      "epoch": 12.89,
+      "learning_rate": 1.1875666961528679e-05,
+      "loss": 0.0848,
+      "step": 245
+    },
+    {
+      "epoch": 12.95,
+      "learning_rate": 1.1719947811975732e-05,
+      "loss": 0.0976,
+      "step": 246
+    },
+    {
+      "epoch": 13.0,
+      "learning_rate": 1.1564832103047818e-05,
+      "loss": 0.1545,
+      "step": 247
+    },
+    {
+      "epoch": 13.05,
+      "learning_rate": 1.1410331139398365e-05,
+      "loss": 0.0834,
+      "step": 248
+    },
+    {
+      "epoch": 13.11,
+      "learning_rate": 1.1256456180878867e-05,
+      "loss": 0.0946,
+      "step": 249
+    },
+    {
+      "epoch": 13.16,
+      "learning_rate": 1.110321844171832e-05,
+      "loss": 0.1459,
+      "step": 250
+    },
+    {
+      "epoch": 13.21,
+      "learning_rate": 1.0950629089705857e-05,
+      "loss": 0.1298,
+      "step": 251
+    },
+    {
+      "epoch": 13.26,
+      "learning_rate": 1.0798699245376959e-05,
+      "loss": 0.1202,
+      "step": 252
+    },
+    {
+      "epoch": 13.32,
+      "learning_rate": 1.0647439981202918e-05,
+      "loss": 0.0473,
+      "step": 253
+    },
+    {
+      "epoch": 13.37,
+      "learning_rate": 1.0496862320783926e-05,
+      "loss": 0.0822,
+      "step": 254
+    },
+    {
+      "epoch": 13.42,
+      "learning_rate": 1.0346977238045699e-05,
+      "loss": 0.0879,
+      "step": 255
+    },
+    {
+      "epoch": 13.47,
+      "learning_rate": 1.0197795656439662e-05,
+      "loss": 0.1451,
+      "step": 256
+    },
+    {
+      "epoch": 13.53,
+      "learning_rate": 1.0049328448146908e-05,
+      "loss": 0.1359,
+      "step": 257
+    },
+    {
+      "epoch": 13.58,
+      "learning_rate": 9.901586433285845e-06,
+      "loss": 0.1129,
+      "step": 258
+    },
+    {
+      "epoch": 13.63,
+      "learning_rate": 9.75458037912359e-06,
+      "loss": 0.1344,
+      "step": 259
+    },
+    {
+      "epoch": 13.68,
+      "learning_rate": 9.608320999291333e-06,
+      "loss": 0.1667,
+      "step": 260
+    },
+    {
+      "epoch": 13.74,
+      "learning_rate": 9.462818953003465e-06,
+      "loss": 0.1226,
+      "step": 261
+    },
+    {
+      "epoch": 13.79,
+      "learning_rate": 9.318084844280798e-06,
+      "loss": 0.1144,
+      "step": 262
+    },
+    {
+      "epoch": 13.84,
+      "learning_rate": 9.174129221177762e-06,
+      "loss": 0.1069,
+      "step": 263
+    },
+    {
+      "epoch": 13.89,
+      "learning_rate": 9.030962575013622e-06,
+      "loss": 0.0981,
+      "step": 264
+    },
+    {
+      "epoch": 13.95,
+      "learning_rate": 8.888595339607961e-06,
+      "loss": 0.1045,
+      "step": 265
+    },
+    {
+      "epoch": 14.0,
+      "learning_rate": 8.74703789052018e-06,
+      "loss": 0.0757,
+      "step": 266
+    },
+    {
+      "epoch": 14.05,
+      "learning_rate": 8.606300544293412e-06,
+      "loss": 0.0715,
+      "step": 267
+    },
+    {
+      "epoch": 14.11,
+      "learning_rate": 8.466393557702659e-06,
+      "loss": 0.0791,
+      "step": 268
+    },
+    {
+      "epoch": 14.16,
+      "learning_rate": 8.327327127007247e-06,
+      "loss": 0.1019,
+      "step": 269
+    },
+    {
+      "epoch": 14.21,
+      "learning_rate": 8.189111387207782e-06,
+      "loss": 0.0872,
+      "step": 270
+    },
+    {
+      "epoch": 14.26,
+      "learning_rate": 8.051756411307494e-06,
+      "loss": 0.0925,
+      "step": 271
+    },
+    {
+      "epoch": 14.32,
+      "learning_rate": 7.915272209578112e-06,
+      "loss": 0.1394,
+      "step": 272
+    },
+    {
+      "epoch": 14.37,
+      "learning_rate": 7.779668728830389e-06,
+      "loss": 0.1261,
+      "step": 273
+    },
+    {
+      "epoch": 14.42,
+      "learning_rate": 7.644955851689129e-06,
+      "loss": 0.1342,
+      "step": 274
+    },
+    {
+      "epoch": 14.47,
+      "learning_rate": 7.511143395872986e-06,
+      "loss": 0.1777,
+      "step": 275
+    },
+    {
+      "epoch": 14.53,
+      "learning_rate": 7.37824111347895e-06,
+      "loss": 0.0706,
+      "step": 276
+    },
+    {
+      "epoch": 14.58,
+      "learning_rate": 7.246258690271599e-06,
+      "loss": 0.1198,
+      "step": 277
+    },
+    {
+      "epoch": 14.63,
+      "learning_rate": 7.115205744977276e-06,
+      "loss": 0.1486,
+      "step": 278
+    },
+    {
+      "epoch": 14.68,
+      "learning_rate": 6.985091828583024e-06,
+      "loss": 0.1417,
+      "step": 279
+    },
+    {
+      "epoch": 14.74,
+      "learning_rate": 6.855926423640549e-06,
+      "loss": 0.0808,
+      "step": 280
+    },
+    {
+      "epoch": 14.79,
+      "learning_rate": 6.727718943575161e-06,
+      "loss": 0.1207,
+      "step": 281
+    },
+    {
+      "epoch": 14.84,
+      "learning_rate": 6.6004787319996714e-06,
+      "loss": 0.1378,
+      "step": 282
+    },
+    {
+      "epoch": 14.89,
+      "learning_rate": 6.474215062033527e-06,
+      "loss": 0.0938,
+      "step": 283
+    },
+    {
+      "epoch": 14.95,
+      "learning_rate": 6.348937135626922e-06,
+      "loss": 0.0977,
+      "step": 284
+    },
+    {
+      "epoch": 15.0,
+      "learning_rate": 6.224654082890207e-06,
+      "loss": 0.0988,
+      "step": 285
+    },
+    {
+      "epoch": 15.05,
+      "learning_rate": 6.101374961428512e-06,
+      "loss": 0.104,
+      "step": 286
+    },
+    {
+      "epoch": 15.11,
+      "learning_rate": 5.979108755681575e-06,
+      "loss": 0.098,
+      "step": 287
+    },
+    {
+      "epoch": 15.16,
+      "learning_rate": 5.857864376269051e-06,
+      "loss": 0.1224,
+      "step": 288
+    },
+    {
+      "epoch": 15.21,
+      "learning_rate": 5.737650659341048e-06,
+      "loss": 0.1119,
+      "step": 289
+    },
+    {
+      "epoch": 15.26,
+      "learning_rate": 5.618476365934184e-06,
+      "loss": 0.0853,
+      "step": 290
+    },
+    {
+      "epoch": 15.32,
+      "learning_rate": 5.500350181333121e-06,
+      "loss": 0.132,
+      "step": 291
+    },
+    {
+      "epoch": 15.37,
+      "learning_rate": 5.383280714437518e-06,
+      "loss": 0.097,
+      "step": 292
+    },
+    {
+      "epoch": 15.42,
+      "learning_rate": 5.267276497134715e-06,
+      "loss": 0.1141,
+      "step": 293
+    },
+    {
+      "epoch": 15.47,
+      "learning_rate": 5.152345983677866e-06,
+      "loss": 0.0679,
+      "step": 294
+    },
+    {
+      "epoch": 15.53,
+      "learning_rate": 5.038497550069836e-06,
+      "loss": 0.1497,
+      "step": 295
+    },
+    {
+      "epoch": 15.58,
+      "learning_rate": 4.925739493452783e-06,
+      "loss": 0.1241,
+      "step": 296
+    },
+    {
+      "epoch": 15.63,
+      "learning_rate": 4.814080031503407e-06,
+      "loss": 0.1188,
+      "step": 297
+    },
+    {
+      "epoch": 15.68,
+      "learning_rate": 4.703527301834148e-06,
+      "loss": 0.1086,
+      "step": 298
+    },
+    {
+      "epoch": 15.74,
+      "learning_rate": 4.594089361400047e-06,
+      "loss": 0.0771,
+      "step": 299
+    },
+    {
+      "epoch": 15.79,
+      "learning_rate": 4.4857741859116024e-06,
+      "loss": 0.0798,
+      "step": 300
+    },
+    {
+      "epoch": 15.84,
+      "learning_rate": 4.3785896692535165e-06,
+      "loss": 0.1273,
+      "step": 301
+    },
+    {
+      "epoch": 15.89,
+      "learning_rate": 4.272543622909355e-06,
+      "loss": 0.1525,
+      "step": 302
+    },
+    {
+      "epoch": 15.95,
+      "learning_rate": 4.167643775392305e-06,
+      "loss": 0.1028,
+      "step": 303
+    },
+    {
+      "epoch": 16.0,
+      "learning_rate": 4.0638977716819105e-06,
+      "loss": 0.1076,
+      "step": 304
+    },
+    {
+      "epoch": 16.05,
+      "learning_rate": 3.961313172666898e-06,
+      "loss": 0.1121,
+      "step": 305
+    },
+    {
+      "epoch": 16.11,
+      "learning_rate": 3.859897454594192e-06,
+      "loss": 0.1235,
+      "step": 306
+    },
+    {
+      "epoch": 16.16,
+      "learning_rate": 3.7596580085239897e-06,
+      "loss": 0.0991,
+      "step": 307
+    },
+    {
+      "epoch": 16.21,
+      "learning_rate": 3.6606021397911605e-06,
+      "loss": 0.0968,
+      "step": 308
+    },
+    {
+      "epoch": 16.26,
+      "learning_rate": 3.562737067472841e-06,
+      "loss": 0.1037,
+      "step": 309
+    },
+    {
+      "epoch": 16.32,
+      "learning_rate": 3.466069923862283e-06,
+      "loss": 0.1241,
+      "step": 310
+    },
+    {
+      "epoch": 16.37,
+      "learning_rate": 3.3706077539490933e-06,
+      "loss": 0.1168,
+      "step": 311
+    },
+    {
+      "epoch": 16.42,
+      "learning_rate": 3.276357514905788e-06,
+      "loss": 0.1035,
+      "step": 312
+    },
+    {
+      "epoch": 16.47,
+      "learning_rate": 3.1833260755807392e-06,
+      "loss": 0.0432,
+      "step": 313
+    },
+    {
+      "epoch": 16.53,
+      "learning_rate": 3.0915202159976453e-06,
+      "loss": 0.1074,
+      "step": 314
+    },
+    {
+      "epoch": 16.58,
+      "learning_rate": 3.0009466268613384e-06,
+      "loss": 0.1264,
+      "step": 315
+    },
+    {
+      "epoch": 16.63,
+      "learning_rate": 2.911611909070229e-06,
+      "loss": 0.123,
+      "step": 316
+    },
+    {
+      "epoch": 16.68,
+      "learning_rate": 2.8235225732352043e-06,
+      "loss": 0.1694,
+      "step": 317
+    },
+    {
+      "epoch": 16.74,
+      "learning_rate": 2.7366850392051468e-06,
+      "loss": 0.113,
+      "step": 318
+    },
+    {
+      "epoch": 16.79,
+      "learning_rate": 2.651105635599094e-06,
+      "loss": 0.0794,
+      "step": 319
+    },
+    {
+      "epoch": 16.84,
+      "learning_rate": 2.566790599344973e-06,
+      "loss": 0.1141,
+      "step": 320
+    },
+    {
+      "epoch": 16.89,
+      "learning_rate": 2.4837460752251e-06,
+      "loss": 0.1049,
+      "step": 321
+    },
+    {
+      "epoch": 16.95,
+      "learning_rate": 2.401978115428325e-06,
+      "loss": 0.0822,
+      "step": 322
+    },
+    {
+      "epoch": 17.0,
+      "learning_rate": 2.3214926791089563e-06,
+      "loss": 0.0925,
+      "step": 323
+    },
+    {
+      "epoch": 17.05,
+      "learning_rate": 2.242295631952496e-06,
+      "loss": 0.1565,
+      "step": 324
+    },
+    {
+      "epoch": 17.11,
+      "learning_rate": 2.164392745748125e-06,
+      "loss": 0.0919,
+      "step": 325
+    },
+    {
+      "epoch": 17.16,
+      "learning_rate": 2.0877896979680654e-06,
+      "loss": 0.0696,
+      "step": 326
+    },
+    {
+      "epoch": 17.21,
+      "learning_rate": 2.0124920713538378e-06,
+      "loss": 0.1249,
+      "step": 327
+    },
+    {
+      "epoch": 17.26,
+      "learning_rate": 1.9385053535093455e-06,
+      "loss": 0.0936,
+      "step": 328
+    },
+    {
+      "epoch": 17.32,
+      "learning_rate": 1.865834936501012e-06,
+      "loss": 0.1407,
+      "step": 329
+    },
+    {
+      "epoch": 17.37,
+      "learning_rate": 1.7944861164647576e-06,
+      "loss": 0.0899,
+      "step": 330
+    },
+    {
+      "epoch": 17.42,
+      "learning_rate": 1.7244640932200484e-06,
+      "loss": 0.0845,
+      "step": 331
+    },
+    {
+      "epoch": 17.47,
+      "learning_rate": 1.6557739698909436e-06,
+      "loss": 0.1045,
+      "step": 332
+    },
+    {
+      "epoch": 17.53,
+      "learning_rate": 1.5884207525341566e-06,
+      "loss": 0.0789,
+      "step": 333
+    },
+    {
+      "epoch": 17.58,
+      "learning_rate": 1.5224093497742654e-06,
+      "loss": 0.1224,
+      "step": 334
+    },
+    {
+      "epoch": 17.63,
+      "learning_rate": 1.4577445724459382e-06,
+      "loss": 0.1201,
+      "step": 335
+    },
+    {
+      "epoch": 17.68,
+      "learning_rate": 1.3944311332433368e-06,
+      "loss": 0.1676,
+      "step": 336
+    },
+    {
+      "epoch": 17.74,
+      "learning_rate": 1.3324736463766775e-06,
+      "loss": 0.0922,
+      "step": 337
+    },
+    {
+      "epoch": 17.79,
+      "learning_rate": 1.2718766272359195e-06,
+      "loss": 0.096,
+      "step": 338
+    },
+    {
+      "epoch": 17.84,
+      "learning_rate": 1.2126444920617297e-06,
+      "loss": 0.115,
+      "step": 339
+    },
+    {
+      "epoch": 17.89,
+      "learning_rate": 1.154781557623592e-06,
+      "loss": 0.0891,
+      "step": 340
+    },
+    {
+      "epoch": 17.95,
+      "learning_rate": 1.0982920409052312e-06,
+      "loss": 0.0937,
+      "step": 341
+    },
+    {
+      "epoch": 18.0,
+      "learning_rate": 1.0431800587972862e-06,
+      "loss": 0.144,
+      "step": 342
+    },
+    {
+      "epoch": 18.05,
+      "learning_rate": 9.894496277972498e-07,
+      "loss": 0.1003,
+      "step": 343
+    },
+    {
+      "epoch": 18.11,
+      "learning_rate": 9.371046637167835e-07,
+      "loss": 0.0836,
+      "step": 344
+    },
+    {
+      "epoch": 18.16,
+      "learning_rate": 8.861489813963154e-07,
+      "loss": 0.09,
+      "step": 345
+    },
+    {
+      "epoch": 18.21,
+      "learning_rate": 8.365862944270243e-07,
+      "loss": 0.1049,
+      "step": 346
+    },
+    {
+      "epoch": 18.26,
+      "learning_rate": 7.884202148802056e-07,
+      "loss": 0.0909,
+      "step": 347
+    },
+    {
+      "epoch": 18.32,
+      "learning_rate": 7.416542530440174e-07,
+      "loss": 0.1455,
+      "step": 348
+    },
+    {
+      "epoch": 18.37,
+      "learning_rate": 6.962918171676536e-07,
+      "loss": 0.0975,
+      "step": 349
+    },
+    {
+      "epoch": 18.42,
+      "learning_rate": 6.523362132129718e-07,
+      "loss": 0.1263,
+      "step": 350
+    },
+    {
+      "epoch": 18.47,
+      "learning_rate": 6.097906446135349e-07,
+      "loss": 0.101,
+      "step": 351
+    },
+    {
+      "epoch": 18.53,
+      "learning_rate": 5.68658212041171e-07,
+      "loss": 0.1289,
+      "step": 352
+    },
+    {
+      "epoch": 18.58,
+      "learning_rate": 5.289419131799811e-07,
+      "loss": 0.1259,
+      "step": 353
+    },
+    {
+      "epoch": 18.63,
+      "learning_rate": 4.906446425078782e-07,
+      "loss": 0.1038,
+      "step": 354
+    },
+    {
+      "epoch": 18.68,
+      "learning_rate": 4.5376919108565345e-07,
+      "loss": 0.0813,
+      "step": 355
+    },
+    {
+      "epoch": 18.74,
+      "learning_rate": 4.183182463535418e-07,
+      "loss": 0.1128,
+      "step": 356
+    },
+    {
+      "epoch": 18.79,
+      "learning_rate": 3.842943919353914e-07,
+      "loss": 0.1093,
+      "step": 357
+    },
+    {
+      "epoch": 18.84,
+      "learning_rate": 3.517001074503501e-07,
+      "loss": 0.0865,
+      "step": 358
+    },
+    {
+      "epoch": 18.89,
+      "learning_rate": 3.2053776833216533e-07,
+      "loss": 0.0916,
+      "step": 359
+    },
+    {
+      "epoch": 18.95,
+      "learning_rate": 2.9080964565606273e-07,
+      "loss": 0.1151,
+      "step": 360
+    },
+    {
+      "epoch": 19.0,
+      "learning_rate": 2.625179059732341e-07,
+      "loss": 0.1344,
+      "step": 361
+    },
+    {
+      "epoch": 19.05,
+      "learning_rate": 2.356646111529415e-07,
+      "loss": 0.1064,
+      "step": 362
+    },
+    {
+      "epoch": 19.11,
+      "learning_rate": 2.102517182322483e-07,
+      "loss": 0.1053,
+      "step": 363
+    },
+    {
+      "epoch": 19.16,
+      "learning_rate": 1.862810792733849e-07,
+      "loss": 0.0972,
+      "step": 364
+    },
+    {
+      "epoch": 19.21,
+      "learning_rate": 1.6375444122879613e-07,
+      "loss": 0.0987,
+      "step": 365
+    },
+    {
+      "epoch": 19.26,
+      "learning_rate": 1.4267344581380127e-07,
+      "loss": 0.1519,
+      "step": 366
+    },
+    {
+      "epoch": 19.32,
+      "learning_rate": 1.2303962938696068e-07,
+      "loss": 0.0834,
+      "step": 367
+    },
+    {
+      "epoch": 19.37,
+      "learning_rate": 1.0485442283810321e-07,
+      "loss": 0.1057,
+      "step": 368
+    },
+    {
+      "epoch": 19.42,
+      "learning_rate": 8.811915148404294e-08,
+      "loss": 0.0887,
+      "step": 369
+    },
+    {
+      "epoch": 19.47,
+      "learning_rate": 7.283503497200083e-08,
+      "loss": 0.0955,
+      "step": 370
+    },
+    {
+      "epoch": 19.53,
+      "learning_rate": 5.900318719070264e-08,
+      "loss": 0.1124,
+      "step": 371
+    },
+    {
+      "epoch": 19.58,
+      "learning_rate": 4.6624616189214765e-08,
+      "loss": 0.1663,
+      "step": 372
+    },
+    {
+      "epoch": 19.63,
+      "learning_rate": 3.570022410347651e-08,
+      "loss": 0.1356,
+      "step": 373
+    },
+    {
+      "epoch": 19.68,
+      "learning_rate": 2.623080709054149e-08,
+      "loss": 0.1042,
+      "step": 374
+    },
+    {
+      "epoch": 19.74,
+      "learning_rate": 1.8217055270568497e-08,
+      "loss": 0.0729,
+      "step": 375
+    },
+    {
+      "epoch": 19.79,
+      "learning_rate": 1.1659552676519525e-08,
+      "loss": 0.0972,
+      "step": 376
+    },
+    {
+      "epoch": 19.84,
+      "learning_rate": 6.558777211598255e-09,
+      "loss": 0.1289,
+      "step": 377
+    },
+    {
+      "epoch": 19.89,
+      "learning_rate": 2.9151006144201298e-09,
+      "loss": 0.1013,
+      "step": 378
+    },
+    {
+      "epoch": 19.95,
+      "learning_rate": 7.287884319184813e-10,
+      "loss": 0.0726,
+      "step": 379
+    },
+    {
+      "epoch": 20.0,
+      "learning_rate": 0.0,
+      "loss": 0.1038,
+      "step": 380
+    },
+    {
+      "epoch": 20.0,
+      "step": 380,
+      "total_flos": 1.2544198305644544e+17,
+      "train_loss": 0.2236757378829153,
+      "train_runtime": 2520.2948,
+      "train_samples_per_second": 18.744,
+      "train_steps_per_second": 0.151
+    }
+  ],
+  "logging_steps": 1.0,
+  "max_steps": 380,
+  "num_train_epochs": 20,
+  "save_steps": 500,
+  "total_flos": 1.2544198305644544e+17,
+  "trial_name": null,
+  "trial_params": null
+}

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_cyp450/README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_cyp450/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "./vicuna-v1-3-7b",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 256,
+  "lora_dropout": 0.05,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 128,
+  "revision": null,
+  "target_modules": [
+    "gate_proj",
+    "down_proj",
+    "q_proj",
+    "v_proj",
+    "o_proj",
+    "up_proj",
+    "k_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_cyp450/config.json ADDED Viewed

	@@ -0,0 +1,36 @@

+{
+  "_name_or_path": "./vicuna-v1-3-7b",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 2048,
+  "mm_graph_tower": "hvqvae2",
+  "mm_hidden_size": 308,
+  "mm_projector_type": "hlinear",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "model_type": "llava_graph",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 32,
+  "pad_token_id": 0,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
+  "tie_word_embeddings": false,
+  "torch_dtype": "float16",
+  "transformers_version": "4.33.2",
+  "tune_mm_mlp_adapter": false,
+  "use_cache": true,
+  "use_lap_pe": true,
+  "use_mm_proj": true,
+  "vocab_size": 32000
+}

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_cyp450/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_muv/README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_muv/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "./vicuna-v1-3-7b",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 256,
+  "lora_dropout": 0.05,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 128,
+  "revision": null,
+  "target_modules": [
+    "gate_proj",
+    "v_proj",
+    "down_proj",
+    "up_proj",
+    "q_proj",
+    "k_proj",
+    "o_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_muv/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:328cad954d1e8571e2c38737f610c22e395c2d50f4398c5d3dc58c559d143c86
+size 639786637

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_muv/config.json ADDED Viewed

	@@ -0,0 +1,36 @@

+{
+  "_name_or_path": "./vicuna-v1-3-7b",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 2048,
+  "mm_graph_tower": "hvqvae2",
+  "mm_hidden_size": 308,
+  "mm_projector_type": "hlinear",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "model_type": "llava_graph",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 32,
+  "pad_token_id": 0,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
+  "tie_word_embeddings": false,
+  "torch_dtype": "float16",
+  "transformers_version": "4.33.2",
+  "tune_mm_mlp_adapter": false,
+  "use_cache": true,
+  "use_lap_pe": true,
+  "use_mm_proj": true,
+  "vocab_size": 32000
+}

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_muv/non_lora_trainables.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:05ba3c951e28a452dea5de42afef15c938838efdcfc7ace6367d07642be1cc06
+size 11335231

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_muv/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_sider/README.md ADDED Viewed

	@@ -0,0 +1,9 @@

+---
+library_name: peft
+---
+## Training procedure
+### Framework versions
+- PEFT 0.5.0

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_sider/adapter_config.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+  "auto_mapping": null,
+  "base_model_name_or_path": "./vicuna-v1-3-7b",
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "lora_alpha": 256,
+  "lora_dropout": 0.05,
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 128,
+  "revision": null,
+  "target_modules": [
+    "up_proj",
+    "v_proj",
+    "q_proj",
+    "o_proj",
+    "k_proj",
+    "gate_proj",
+    "down_proj"
+  ],
+  "task_type": "CAUSAL_LM"
+}

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_sider/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6685fba4bef8bb80482d235d034bd1d5cc1e443e3b5dc01f299d510d01db2f3d
+size 639786637

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_sider/config.json ADDED Viewed

	@@ -0,0 +1,36 @@

+{
+  "_name_or_path": "./vicuna-v1-3-7b",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "bos_token_id": 1,
+  "eos_token_id": 2,
+  "freeze_mm_mlp_adapter": false,
+  "hidden_act": "silu",
+  "hidden_size": 4096,
+  "initializer_range": 0.02,
+  "intermediate_size": 11008,
+  "max_position_embeddings": 2048,
+  "mm_graph_tower": "hvqvae2",
+  "mm_hidden_size": 308,
+  "mm_projector_type": "hlinear",
+  "mm_use_im_patch_token": false,
+  "mm_use_im_start_end": false,
+  "model_type": "llava_graph",
+  "num_attention_heads": 32,
+  "num_hidden_layers": 32,
+  "num_key_value_heads": 32,
+  "pad_token_id": 0,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
+  "tie_word_embeddings": false,
+  "torch_dtype": "float16",
+  "transformers_version": "4.33.2",
+  "tune_mm_mlp_adapter": false,
+  "use_cache": true,
+  "use_lap_pe": true,
+  "use_mm_proj": true,
+  "vocab_size": 32000
+}

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_sider/non_lora_trainables.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:96dd77e8eaf9d0f27d20361dcbfef3a531b1f7ca98a7f87c55234c6542f914d4
+size 11335231

vicuna/MoleculeNet-llava-hvqvae2-vicuna-v1-3-7b-finetune_lora-large_gimlet_sider/trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff