7-Sky
/

skyopus-pol-rus

@@ -40,80 +40,51 @@ tags:
 ```python
 from transformers import MarianMTModel, MarianTokenizer
-# Пути к модели и токенизатору
 model_path = "trained_model"
-# Загрузка модели и токенизатора
 tokenizer = MarianTokenizer.from_pretrained(model_path)
 model = MarianMTModel.from_pretrained(model_path)
-# Словарь, который соответствует целевым языковым маркерам для разных языков
-language_map = {
-    "bel": "bel",
-    "bel_Latn": "bel_Latn",
-    "bos_Latn": "bos_Latn",
-    "bul": "bul",
-    "bul_Latn": "bul_Latn",
-    "ces": "ces",
-    "dsb": "dsb",
-    "hrv": "hrv",
-    "hsb": "hsb",
-    "mkd": "mkd",
-    "orv_Cyrl": "orv_Cyrl",
-    "pol": "pol",
-    "rus": "rus",
-    "slv": "slv",
-    "srp_Cyrl": "srp_Cyrl",
-    "srp_Latn": "srp_Latn",
-    "ukr": "ukr"
-}
-# Функция для перевода с несколькими вариантами
-def translate_text(source_text, target_language, num_translations=3):
-    if target_language not in language_map:
-        print("Неверное направление перевода. Попробуйте снова.")
-        return None
-    # Формируем текст с маркером целевого языка
-    language_token = f">>{target_language}<< "
-    text_with_token = language_token + source_text
-    # Токенизация текста
     inputs = tokenizer(text_with_token, return_tensors="pt")
-    # Перевод текста с несколькими вариантами
     translated_tokens = model.generate(
         **inputs,
-        num_return_sequences=num_translations,  # Количество вариантов перевода
-        num_beams=num_translations  # Используем несколько beam для разнообразия
     )
-    # Декодирование переведенного текста
     translations = [tokenizer.decode(tokens, skip_special_tokens=True) for tokens in translated_tokens]
     return translations
-# Основной цикл для ввода текста и вывода вариантов перевода
-print("Введите фразу для перевода или !q для выхода.")
 while True:
-    # Ввод фразы
-    source_text = input("Введите фразу: ")
-    # Проверка на команду выхода
     if source_text == "!q":
-        print("Выход из программы.")
         break
-    # Указание целевого языка (по умолчанию "rus")
-    target_language = "rus"
-    # Перевод фразы с несколькими вариантами
-    translations = translate_text(source_text, target_language)
     if translations:
-        # Вывод всех вариантов перевода
         for idx, translation in enumerate(translations, 1):
-            print(f"Вариант {idx}: {translation}")
 ```

 ```python
 from transformers import MarianMTModel, MarianTokenizer
+# Paths to the model and tokenizer
 model_path = "trained_model"
+# Load the model and tokenizer
 tokenizer = MarianTokenizer.from_pretrained(model_path)
 model = MarianMTModel.from_pretrained(model_path)
+# Function to translate text with multiple variants (Russian only)
+def translate_text(source_text, num_translations=3):
+    # Add the fixed language token for Russian
+    text_with_token = ">>rus<< " + source_text
+    # Tokenize the input text
     inputs = tokenizer(text_with_token, return_tensors="pt")
+    # Generate translations with multiple variants
     translated_tokens = model.generate(
         **inputs,
+        num_return_sequences=num_translations,  # Number of translation variants
+        num_beams=num_translations  # Use multiple beams for diversity
     )
+    # Decode the translated tokens into readable text
     translations = [tokenizer.decode(tokens, skip_special_tokens=True) for tokens in translated_tokens]
     return translations
+# Main loop for text input and translation output
+print("Enter a phrase to translate or !q to quit.")
 while True:
+    # Get input phrase from the user
+    source_text = input("Enter a phrase: ")
+    # Check for the quit command
     if source_text == "!q":
+        print("Exiting the program.")
         break
+    # Translate the phrase with multiple variants
+    translations = translate_text(source_text)
     if translations:
+        # Output all translation variants
         for idx, translation in enumerate(translations, 1):
+            print(f"Variant {idx}: {translation}")
 ```