adel67460
/

auto

Model card Files Files and versions Community

auto / train_interface.py

adel67460

Upload train_interface.py with huggingface_hub

cbc6f45 verified about 2 months ago

raw

history blame contribute delete

4.59 kB

	import os
	import json
	import sys
	from datetime import datetime
	import traceback
	from transformers import AutoTokenizer, AutoModelForCausalLM, TrainingArguments, Trainer
	from datasets import load_dataset
	import torch
	import pandas as pd
	from huggingface_hub import login
	from connect_huggingface import setup_huggingface
	import gradio as gr

	class TrainingCallback:
	def __init__(self):
	self.logs = []

	def on_log(self, args, state, control, logs=None, **kwargs):
	if logs:
	self.logs.append(logs)

	def get_logs(self):
	return "\n".join([str(log) for log in self.logs])

	def start_training():
	try:
	# Configuration de Hugging Face
	if not setup_huggingface():
	return "Erreur : Impossible de configurer Hugging Face", "### Logs d'entraînement\nErreur de configuration Hugging Face"

	# Initialiser les logs
	status = "Configuration de l'environnement..."
	logs = f"### Logs d'entraînement\nDémarrage à {datetime.now().strftime('%Y-%m-%d %H:%M:%S')}\n\n"

	# Charger la configuration
	with open('config.json', 'r') as f:
	config = json.load(f)

	# Charger le modèle et le tokenizer
	logs += "- Chargement du modèle et du tokenizer...\n"
	tokenizer = AutoTokenizer.from_pretrained(config['model']['tokenizer'])
	model = AutoModelForCausalLM.from_pretrained(
	config['model']['name'],
	torch_dtype=torch.bfloat16 if config['training']['bf16'] else torch.float32,
	device_map="auto"
	)

	# Charger le dataset
	status = "Chargement du dataset..."
	logs += f"- Chargement de {config['dataset']['name']}...\n"
	dataset = load_dataset(config['dataset']['name'])

	# Configurer l'entraînement
	status = "Configuration de l'entraînement..."
	logs += "- Configuration des paramètres d'entraînement...\n"

	training_args = TrainingArguments(
	output_dir="./results",
	num_train_epochs=config['training']['epochs'],
	per_device_train_batch_size=config['training']['batch_size'],
	learning_rate=config['training']['learning_rate'],
	warmup_ratio=config['training']['warmup_ratio'],
	evaluation_strategy=config['training']['evaluation_strategy'],
	eval_steps=config['training']['eval_steps'],
	save_strategy=config['training']['save_strategy'],
	save_steps=config['training']['save_steps'],
	save_total_limit=config['training']['save_total_limit'],
	load_best_model_at_end=config['training']['load_best_model_at_end'],
	metric_for_best_model=config['training']['metric_for_best_model'],
	greater_is_better=config['training']['greater_is_better'],
	gradient_accumulation_steps=config['training']['gradient_accumulation_steps'],
	logging_steps=config['training']['logging_steps'],
	fp16=config['training']['fp16'],
	bf16=config['training']['bf16']
	)

	# Créer le callback pour les logs
	callback = TrainingCallback()

	# Créer le Trainer
	trainer = Trainer(
	model=model,
	args=training_args,
	train_dataset=dataset[config['dataset']['train_split']],
	eval_dataset=dataset[config['dataset']['eval_split']],
	callbacks=[callback]
	)

	# Démarrer l'entraînement
	status = "Entraînement en cours..."
	logs += "- Début de l'entraînement...\n"

	trainer.train()

	# Ajouter les logs d'entraînement
	logs += "\n### Logs détaillés\n"
	logs += callback.get_logs()

	status = "Entraînement terminé avec succès!"
	logs += "\n\nEntraînement terminé avec succès!"

	return status, logs

	except Exception as e:
	error_msg = f"Erreur pendant l'entraînement : {str(e)}\n{traceback.format_exc()}"
	print(error_msg)
	return "Erreur pendant l'entraînement", f"### Logs d'entraînement\n❌ {error_msg}"

	# Interface Gradio
	demo = gr.Interface(
	fn=start_training,
	inputs=[],
	outputs=[gr.Textbox(label="Statut de l'entraînement"), gr.Markdown(label="Logs de l'entraînement")],
	title="AUTO Training Space",
	description="Cliquez sur le bouton pour lancer l'entraînement du modèle."
	)

	if __name__ == "__main__":
	demo.launch()