Spaces:

sagawa
/

ReactionT5_task_yield

Sleeping

App Files Files Community

sagawa commited on Jan 15, 2023

Commit

c454156

1 Parent(s): b823009

Update app.py

Browse files

Files changed (1) hide show

app.py +38 -8

app.py CHANGED Viewed

@@ -11,7 +11,7 @@ import pandas as pd
 from tqdm.auto import tqdm
 import tokenizers
 import transformers
-from transformers import AutoTokenizer, AutoConfig, AutoModel, T5EncoderModel, get_linear_schedule_with_warmup
 import datasets
 from datasets import load_dataset, load_metric
 import sentencepiece
@@ -102,25 +102,55 @@ if st.button('predict'):
                     self.config = torch.load(config_path)
                 if pretrained:
                     if 't5' in cfg.model:
-                        self.model = T5EncoderModel.from_pretrained(CFG.pretrained_model_name_or_path)
                     else:
                         self.model = AutoModel.from_pretrained(CFG.pretrained_model_name_or_path)
                 else:
                     if 't5' in cfg.model:
-                        self.model = T5EncoderModel.from_pretrained('sagawa/ZINC-t5')
                     else:
                         self.model = AutoModel.from_config(self.config)
                 self.model.resize_token_embeddings(len(cfg.tokenizer))
                 self.fc_dropout1 = nn.Dropout(cfg.fc_dropout)
-                self.fc1 = nn.Linear(self.config.hidden_size, self.config.hidden_size)
                 self.fc_dropout2 = nn.Dropout(cfg.fc_dropout)
-                self.fc2 = nn.Linear(self.config.hidden_size, 1)
             def forward(self, inputs):
-                outputs = self.model(**inputs)
                 last_hidden_states = outputs[0]
-                output = self.fc1(self.fc_dropout1(last_hidden_states)[:, 0, :].view(-1, self.config.hidden_size))
-                output = self.fc2(self.fc_dropout2(output))
                 return output

 from tqdm.auto import tqdm
 import tokenizers
 import transformers
+from transformers import AutoTokenizer, AutoConfig, AutoModel, T5EncoderModel, get_linear_schedule_with_warmup, AutoModelForSeq2SeqLM, T5ForConditionalGeneration
 import datasets
 from datasets import load_dataset, load_metric
 import sentencepiece
                     self.config = torch.load(config_path)
                 if pretrained:
                     if 't5' in cfg.model:
+                        self.model = T5ForConditionalGeneration.from_pretrained(CFG.pretrained_model_name_or_path)
                     else:
                         self.model = AutoModel.from_pretrained(CFG.pretrained_model_name_or_path)
                 else:
                     if 't5' in cfg.model:
+                        self.model = T5ForConditionalGeneration.from_pretrained('sagawa/ZINC-t5')
                     else:
                         self.model = AutoModel.from_config(self.config)
                 self.model.resize_token_embeddings(len(cfg.tokenizer))
                 self.fc_dropout1 = nn.Dropout(cfg.fc_dropout)
+                self.fc1 = nn.Linear(self.config.hidden_size, self.config.hidden_size//2)
                 self.fc_dropout2 = nn.Dropout(cfg.fc_dropout)
+                self.fc2 = nn.Linear(self.config.hidden_size, self.config.hidden_size//2)
+                self.fc3 = nn.Linear(self.config.hidden_size//2*2, self.config.hidden_size)
+                self.fc4 = nn.Linear(self.config.hidden_size, self.config.hidden_size)
+                self.fc5 = nn.Linear(self.config.hidden_size, 1)
+                self._init_weights(self.fc1)
+                self._init_weights(self.fc2)
+                self._init_weights(self.fc3)
+                self._init_weights(self.fc4)
+            def _init_weights(self, module):
+                if isinstance(module, nn.Linear):
+                    module.weight.data.normal_(mean=0.0, std=0.01)
+                    if module.bias is not None:
+                        module.bias.data.zero_()
+                elif isinstance(module, nn.Embedding):
+                    module.weight.data.normal_(mean=0.0, std=0.01)
+                    if module.padding_idx is not None:
+                        module.weight.data[module.padding_idx].zero_()
+                elif isinstance(module, nn.LayerNorm):
+                    module.bias.data.zero_()
+                    module.weight.data.fill_(1.0)
             def forward(self, inputs):
+                encoder_outputs = self.model.encoder(**inputs)
+                encoder_hidden_states = encoder_outputs[0]
+                outputs = self.model.decoder(input_ids=torch.full((inputs['input_ids'].size(0),1),
+                                                    self.config.decoder_start_token_id,
+                                                    dtype=torch.long,
+                                                    device=device), encoder_hidden_states=encoder_hidden_states)
                 last_hidden_states = outputs[0]
+                output1 = self.fc1(self.fc_dropout1(last_hidden_states).view(-1, self.config.hidden_size))
+                output2 = self.fc2(encoder_hidden_states[:, 0, :].view(-1, self.config.hidden_size))
+                output = self.fc3(self.fc_dropout2(torch.hstack((output1, output2))))
+                output = self.fc4(output)
+                output = self.fc5(output)
                 return output