Sunbread
/

isekai-rolename-vae

Model card Files Files and versions Community

Sunbread commited on Jun 26, 2024

Commit

db0dcb9

1 Parent(s): 84d86b3

add files

Browse files

Files changed (4) hide show

decoder.pt +3 -0
inference.py +60 -0
model.py +167 -0
rolename.txt +0 -0

decoder.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6574bd2e0f77d393da6412bd11886c176e551dce94f4383b3bf81a5e1a61d745
+size 180232

inference.py ADDED Viewed

	@@ -0,0 +1,60 @@

+#!/usr/bin/env python
+# coding: utf-8
+import torch
+import torch.nn as nn
+import torch.nn.functional as F
+class DecoderGRU(nn.Module):
+    def __init__(self, hidden_size, output_size):
+        super(DecoderGRU, self).__init__()
+        self.proj = nn.Linear(hidden_size, hidden_size)
+        self.embedding = nn.Embedding(output_size, hidden_size)
+        self.gru = nn.GRU(hidden_size, hidden_size, batch_first=True)
+        self.out = nn.Linear(hidden_size, output_size)
+    def forward(self, encoder_sample, target_tensor=None, max_length=16):
+        batch_size = encoder_sample.size(0)
+        decoder_hidden = self.proj(encoder_sample).unsqueeze(0)
+        if target_tensor is not None:
+            decoder_input = target_tensor
+            decoder_outputs, decoder_hidden = self.forward_step(decoder_input, decoder_hidden)
+        else:
+            decoder_input = torch.empty(batch_size, 1, dtype=torch.long).fill_(SOS_token)
+            decoder_outputs = []
+            for i in range(max_length):
+                decoder_output, decoder_hidden = self.forward_step(decoder_input, decoder_hidden)
+                decoder_outputs.append(decoder_output)
+                _, topi = decoder_output.topk(1)
+                decoder_input = topi.squeeze(-1).detach()
+            decoder_outputs = torch.cat(decoder_outputs, dim=1)
+        decoder_outputs = F.log_softmax(decoder_outputs, dim=-1)
+        return decoder_outputs, decoder_hidden
+    def forward_step(self, input, hidden):
+        output = self.embedding(input)
+        output = F.relu(output)
+        output, hidden = self.gru(output, hidden)
+        output = self.out(output)
+        return output, hidden
+dec = torch.load('decoder.pt').to('cpu')
+SOS_token = 1
+EOS_token = 2
+katakana = list('゠ァアィイゥウェエォオカガキギクグケゲコゴサザシジスズセゼソゾタダチヂッツヅテデトドナニヌネノハバパヒビピフブプヘベペホボポマミムメモャヤュユョヨラリルレロヮワヰヱヲンヴヵヶヷヸヹヺ・ーヽヾヿㇰㇱㇲㇳㇴㇵㇶㇷㇸㇹㇺㇻㇼㇽㇾㇿ')
+vocab = ['<pad>', '<sos>', '<eos>'] + katakana
+vocab_dict = {v: k for k, v in enumerate(vocab)}
+h=64
+max_len=40
+def detokenize(tokens):
+    if EOS_token in tokens:
+        return ''.join(vocab[token] for token in tokens[:tokens.index(EOS_token)])
+    else:
+        return None
+for name in [detokenize(seq) for seq in dec(torch.randn(16,h), max_length=max_len)[0].topk(1)[1].squeeze().tolist()]:
+    if name is not None:
+        print(name)

model.py ADDED Viewed

	@@ -0,0 +1,167 @@

+#!/usr/bin/env python
+# coding: utf-8
+import torch
+import torch.nn as nn
+from torch import optim
+from torch.utils.data import DataLoader, Dataset
+import torch.nn.functional as F
+import pandas as pd
+torch.manual_seed(114514)
+torch.set_default_device('cuda')
+SOS_token = 1
+EOS_token = 2
+katakana = list('゠ァアィイゥウェエォオカガキギクグケゲコゴサザシジスズセゼソゾタダチヂッツヅテデトドナニヌネノハバパヒビピフブプヘベペホボポマミムメモャヤュユョヨラリルレロヮワヰヱヲンヴヵヶヷヸヹヺ・ーヽヾヿㇰㇱㇲㇳㇴㇵㇶㇷㇸㇹㇺㇻㇼㇽㇾㇿ')
+vocab = ['<pad>', '<sos>', '<eos>'] + katakana
+vocab_dict = {v: k for k, v in enumerate(vocab)}
+texts = pd.read_csv('rolename.txt', header=None)[0].tolist()
+vocab_size=len(vocab)
+h=64
+max_len=40
+bs=64
+lr=1e-3
+epochs=20
+def tokenize(text):
+    return [vocab_dict[ch] for ch in text]
+def detokenize(tokens):
+    if EOS_token in tokens:
+        tokens = tokens[:tokens.index(EOS_token)]
+    return ''.join(vocab[token] for token in tokens)
+class BatchNormVAE(nn.Module): # https://spaces.ac.cn/archives/7381/
+    def __init__(self, num_features, **kwargs):
+        super(BatchNormVAE, self).__init__()
+        kwargs['affine'] = False
+        self.TAU = 0.5
+        self.bn = nn.BatchNorm1d(num_features, **kwargs)
+        self.theta = nn.Parameter(torch.zeros(1))
+    def forward(self, mu, sigma):
+        mu = self.bn(mu)
+        sigma = self.bn(sigma)
+        scale_mu = torch.sqrt(self.TAU + (1 - self.TAU) * F.sigmoid(self.theta))
+        scale_sigma = torch.sqrt((1 - self.TAU) * F.sigmoid(-self.theta))
+        return mu*scale_mu, sigma*scale_sigma
+class EncoderVAEBiGRU(nn.Module):
+    def __init__(self, input_size, hidden_size, dropout_p=0.1):
+        super(EncoderVAEBiGRU, self).__init__()
+        self.hidden_size = hidden_size
+        self.embedding = nn.Embedding(input_size, hidden_size)
+        self.gru = nn.GRU(hidden_size, hidden_size, batch_first=True, bidirectional=True)
+        self.proj_mu = nn.Linear(2 * hidden_size, hidden_size)
+        self.proj_sigma = nn.Linear(2 * hidden_size, hidden_size)
+        self.dropout = nn.Dropout(dropout_p)
+        self.bn = BatchNormVAE(hidden_size)
+    def forward(self, input, input_lengths):
+        input_lengths = input_lengths.to('cpu')
+        embedded = self.dropout(self.embedding(input))
+        embedded = nn.utils.rnn.pack_padded_sequence(embedded, input_lengths, batch_first=True, enforce_sorted=False)
+        _, hidden = self.gru(embedded)
+        hidden = hidden.permute(1, 0, 2).flatten(1, 2)
+        mu = self.proj_mu(hidden)
+        sigma = self.proj_sigma(hidden) # not std, can be negative
+        mu, sigma = self.bn(mu, sigma)
+        return self._reparameterize(mu, sigma), mu, sigma ** 2
+    def _reparameterize(self, mu, sigma):
+        eps = torch.randn_like(sigma)
+        return eps * sigma + mu # var is sigma^2
+class DecoderGRU(nn.Module):
+    def __init__(self, hidden_size, output_size):
+        super(DecoderGRU, self).__init__()
+        self.proj = nn.Linear(hidden_size, hidden_size)
+        self.embedding = nn.Embedding(output_size, hidden_size)
+        self.gru = nn.GRU(hidden_size, hidden_size, batch_first=True)
+        self.out = nn.Linear(hidden_size, output_size)
+    def forward(self, encoder_sample, target_tensor=None, max_length=16):
+        batch_size = encoder_sample.size(0)
+        decoder_hidden = self.proj(encoder_sample).unsqueeze(0)
+        if target_tensor is not None:
+            decoder_input = target_tensor
+            decoder_outputs, decoder_hidden = self.forward_step(decoder_input, decoder_hidden)
+        else:
+            decoder_input = torch.empty(batch_size, 1, dtype=torch.long).fill_(SOS_token)
+            decoder_outputs = []
+            for i in range(max_length):
+                decoder_output, decoder_hidden = self.forward_step(decoder_input, decoder_hidden)
+                decoder_outputs.append(decoder_output)
+                _, topi = decoder_output.topk(1)
+                decoder_input = topi.squeeze(-1).detach()
+            decoder_outputs = torch.cat(decoder_outputs, dim=1)
+        decoder_outputs = F.log_softmax(decoder_outputs, dim=-1)
+        return decoder_outputs, decoder_hidden
+    def forward_step(self, input, hidden):
+        output = self.embedding(input)
+        output = F.relu(output)
+        output, hidden = self.gru(output, hidden)
+        output = self.out(output)
+        return output, hidden
+class KatakanaDataset(Dataset):
+    def __init__(self, texts, tokenizer, max_length):
+        self.texts = texts
+        self.tokenizer = tokenizer
+        self.max_length = max_length
+    def __len__(self):
+        return len(self.texts)
+    def __getitem__(self, idx):
+        text = self.texts[idx]
+        tokens = self.tokenizer(text)
+        enc_text = tokens
+        enc_len = len(enc_text)
+        input_text = [SOS_token] + tokens
+        target_text = tokens + [EOS_token]
+        enc_text = torch.tensor(enc_text + [0] * (self.max_length - len(enc_text)), dtype=torch.long)
+        input_text = torch.tensor(input_text + [0] * (self.max_length - len(input_text)), dtype=torch.long)
+        target_text = torch.tensor(target_text + [0] * (self.max_length - len(target_text)), dtype=torch.long)
+        return enc_text, enc_len, input_text, target_text
+dataloader = DataLoader(
+    KatakanaDataset(texts, tokenize, max_len),
+    batch_size=bs,
+    shuffle=True,
+    generator=torch.Generator(device='cuda'),
+)
+def train_epoch(dataloader, encoder, decoder, optimizer):
+    total_loss = 0
+    nll = nn.NLLLoss()
+    for enc_text, enc_len, input_text, target_text in dataloader:
+        optimizer.zero_grad()
+        encoder_sample, mu, var = encoder(enc_text, enc_len)
+        decoder_outputs, _ = decoder(encoder_sample, input_text)
+        loss_recons = nll(decoder_outputs.view(-1, decoder_outputs.size(-1)), target_text.view(-1))
+        loss_kld = 0.5 * torch.mean(mu ** 2 + var - var.log() - 1)
+        loss = loss_recons + loss_kld
+        loss.backward()
+        optimizer.step()
+        total_loss += loss.item()
+    return total_loss / len(dataloader)
+enc = EncoderVAEBiGRU(vocab_size, h).train()
+dec = DecoderGRU(h, vocab_size).train()
+optimizer = optim.Adam(list(enc.parameters()) + list(dec.parameters()), lr=lr)
+for i in range(epochs):
+    print('epoch=%d, loss=%f' % (i, train_epoch(dataloader, enc, dec, optimizer)))
+dec.eval()
+for name in [detokenize(seq) for seq in dec(torch.randn(8,h), max_length=max_len)[0].topk(1)[1].squeeze().tolist()]:
+    print(name)
+torch.save(dec, 'decoder.pt')

rolename.txt ADDED Viewed

The diff for this file is too large to render. See raw diff