Update README.md
Browse files
README.md
CHANGED
@@ -54,14 +54,14 @@ print("Translated Tamil Sentence:", translated_text)
|
|
54 |
# Example Tamil Summarization:
|
55 |
|
56 |
tamil_article = """இது குறித்து அவர் பிபிசி தமிழிடம் கூறுகையில், "இத்தீர்ப்பை மிகச் சிறந்த முற்போக்கான தீர்ப்பாக பார்க்கிறேன்.
|
57 |
-
|
58 |
-
|
59 |
-
|
60 |
-
|
61 |
-
|
62 |
-
|
63 |
-
|
64 |
-
|
65 |
|
66 |
tamil_input_ids = tokenizer.encode(tamil_article, return_tensors="pt",truncation=True).input_ids
|
67 |
summary_ids = model.generate(tamil_input_ids, max_length=128)
|
@@ -70,4 +70,11 @@ print("Summarized Tamil Text:", summary)
|
|
70 |
```
|
71 |
## Model Output
|
72 |
- **For translation tasks, the model outputs translated text in Tamil.**
|
73 |
-
- **For summarization tasks, the model outputs a summarized version of the input Tamil text.**
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
54 |
# Example Tamil Summarization:
|
55 |
|
56 |
tamil_article = """இது குறித்து அவர் பிபிசி தமிழிடம் கூறுகையில், "இத்தீர்ப்பை மிகச் சிறந்த முற்போக்கான தீர்ப்பாக பார்க்கிறேன்.
|
57 |
+
அடிப்படை உரிமை என்ன என்பதை மிகவும் தீவிரமாக இத்தீர்ப்பு விளக்கியுள்ளது" என்றார்.
|
58 |
+
"இந்திய அரசியலமைப்பின் 21-ஆவது விதியை மிகவும் ஆழமாக நீதிமன்றம் விளக்கியுள்ளது என்றும்,
|
59 |
+
ஏற்கனவே இரு வேறு வழக்குகளில் தனி நபர் அந்தரங்கத்தை அடிப்படை உரிமை பாதுகாக்காது எனக் குறிப்பிட்ட தீர்ப்புகளைத் திருத்தி
|
60 |
+
அந்த உரிமையை தற்போது உச்ச நீதிமன்றம் பாதுகாத்துள்ளது" என்று என்.ராம் கூறினார்.
|
61 |
+
"ஆதார் பதிவு விவகாரத்தில் இந்த தீர்ப்பு நிச்சயமாக பிரதிபலிக்கும் என்று கூறும் அவர், ஆதார் முறையைத் திணிக்க முயற்சிக்கும்
|
62 |
+
மத்திய அரசின் எண்ணம் இனி கடினமாக இருக்கும்" என்றார். "நெருக்கடி காலத்தில் நீதிபதி எச்.ஆர். கன்னா அளித்த தீர்ப்பு ஏற்படுத்திய
|
63 |
+
மாற்றத்தைப் போல இந்தத் தீர்ப்பும் சமூகத்தில் மாற்றத்தை ஏற்படுத்தலாம் என்று சிலர் கருதுவதாகவும்,மொத்தத்தில் இது ஒரு முக்கியத்துவம் நிறைந்த தீர்ப்பாகும்"
|
64 |
+
என்றும் என்.ராம் தெரிவித்தார். பிற செய்திகள் : சமூக ஊடகங்களில் பிபிசி தமிழ்"""
|
65 |
|
66 |
tamil_input_ids = tokenizer.encode(tamil_article, return_tensors="pt",truncation=True).input_ids
|
67 |
summary_ids = model.generate(tamil_input_ids, max_length=128)
|
|
|
70 |
```
|
71 |
## Model Output
|
72 |
- **For translation tasks, the model outputs translated text in Tamil.**
|
73 |
+
- **For summarization tasks, the model outputs a summarized version of the input Tamil text.**
|
74 |
+
|
75 |
+
## Fine-Tuning
|
76 |
+
If you want to fine-tune the model on your own dataset, you can follow these steps:
|
77 |
+
|
78 |
+
##### Prepare your dataset in the appropriate format.**
|
79 |
+
for summarization use prefix as "summarize: "
|
80 |
+
for translation default no prefix, directely u can tokenize the input and tokenize the output using target_text
|