jojo-ai-mst
commited on
docs: tokenizer & model
Browse files
README.md
CHANGED
@@ -40,6 +40,30 @@ print(outputs)
|
|
40 |
# [{'generated_text': 'အီတလီနိုင်ငံသည် ဥရောပတိုက်၏ အမျိုးသားရေးရာ ကိစ္စများကို ရပ်ဖက်အာဏာရှိသော စီချလျက်ရှိနေခဲ့ရာ မှတ်တမ်းများပါဝင်ကြသည်။ ထိုခေတ် အခါက ရောမနိုင်ငံတော်၏ အမွေအနှစ်နေရာများတွင် ဥရောပတိုက်တွင် ဥရောပတိုက်တွင် ဥပဒေစနစ်နှစ်ခု အဖြစ် စေလွှတ်သော ပြဋ္ဌာန်းသတ်ရန် ဥပဒေစနစ်ကို ပြန်လည်ပြုစုခြင်းကို '}]
|
41 |
```
|
42 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
43 |
|
44 |
## Here are the guidelines for using the MyanmarGPT license,
|
45 |
- MyanmarGPT is free to use for everyone,
|
|
|
40 |
# [{'generated_text': 'အီတလီနိုင်ငံသည် ဥရောပတိုက်၏ အမျိုးသားရေးရာ ကိစ္စများကို ရပ်ဖက်အာဏာရှိသော စီချလျက်ရှိနေခဲ့ရာ မှတ်တမ်းများပါဝင်ကြသည်။ ထိုခေတ် အခါက ရောမနိုင်ငံတော်၏ အမွေအနှစ်နေရာများတွင် ဥရောပတိုက်တွင် ဥရောပတိုက်တွင် ဥပဒေစနစ်နှစ်ခု အဖြစ် စေလွှတ်သော ပြဋ္ဌာန်းသတ်ရန် ဥပဒေစနစ်ကို ပြန်လည်ပြုစုခြင်းကို '}]
|
41 |
```
|
42 |
|
43 |
+
### alternative ways
|
44 |
+
|
45 |
+
```python
|
46 |
+
|
47 |
+
model = GPT2LMHeadModel.from_pretrained("jojo-ai-mst/MyanmarGPT")
|
48 |
+
tokenizer = GPT2Tokenizer.from_pretrained("jojo-ai-mst/MyanmarGPT")
|
49 |
+
|
50 |
+
def generate_text(prompt, max_length=300, temperature=0.8, top_k=50):
|
51 |
+
input_ids = tokenizer.encode(prompt, return_tensors="pt").cuda()
|
52 |
+
output = model.generate(
|
53 |
+
input_ids,
|
54 |
+
max_length=max_length,
|
55 |
+
temperature=temperature,
|
56 |
+
top_k=top_k,
|
57 |
+
pad_token_id=tokenizer.eos_token_id,
|
58 |
+
do_sample=True
|
59 |
+
)
|
60 |
+
for result in output:
|
61 |
+
generated_text = tokenizer.decode(result, skip_special_tokens=True)
|
62 |
+
print(generated_text)
|
63 |
+
|
64 |
+
generate_text("အီတလီ ")
|
65 |
+
```
|
66 |
+
|
67 |
|
68 |
## Here are the guidelines for using the MyanmarGPT license,
|
69 |
- MyanmarGPT is free to use for everyone,
|