Spaces:

tfrere
/

leaderboard-parser-agent

Build error

App Files Files Community

tfrere commited on Mar 19

Commit

9bb60ac

1 Parent(s): 0821095

update readme

Browse files

Files changed (1) hide show

README.md +9 -90

README.md CHANGED Viewed

@@ -1,90 +1,9 @@
-# Leaderboard Parser
-Un outil pour extraire automatiquement les données des leaderboards Hugging Face à l'aide d'agents IA.
-## Structure du projet
-```
-leaderboard-parser/
-├── main.py                # Point d'entrée principal
-├── data/                  # Données d'entrée et de sortie
-│   ├── leaderboards.json  # Liste des URLs des leaderboards à traiter
-│   └── leaderboard_results.json # Résultats de l'extraction
-├── src/                   # Code source principal
-│   ├── agent.py           # Gestion de l'agent IA
-│   ├── browser.py         # Gestion du navigateur
-│   └── tools.py           # Outils utilisés par l'agent
-├── experiments/           # Scripts expérimentaux
-├── pyproject.toml         # Configuration Poetry
-└── README.md              # Documentation
-```
-## Description
-Ce projet utilise Playwright et smolagents pour naviguer sur les leaderboards Hugging Face et extraire les informations du premier modèle de chaque leaderboard. Les informations extraites incluent :
-- Nom du modèle
-- Score
-- Position/rang
-- Créateur/auteur
-## Prérequis
-- Python 3.10 ou supérieur
-- Poetry (gestionnaire de dépendances)
-## Installation
-1. Assurez-vous d'avoir Python 3.10+ installé
-2. Installez Poetry si ce n'est pas déjà fait : `pip install poetry`
-3. Installez les dépendances : `poetry install`
-## Configuration
-1. Copiez le fichier `.env.example` vers `.env`
-2. Configurez vos clés API dans le fichier `.env`
-3. Modifiez le fichier `data/leaderboards.json` pour ajouter ou supprimer des URLs de leaderboards
-## Utilisation
-Pour exécuter le parser sur tous les leaderboards définis dans `data/leaderboards.json` :
-```bash
-poetry run leaderboard-parser
-```
-Ou directement :
-```bash
-poetry run python main.py
-```
-Les résultats seront sauvegardés dans `data/leaderboard_results.json`.
-## Fonctionnement
-L'outil utilise un agent IA basé sur `smolagents` pour :
-1. Naviguer vers chaque URL de leaderboard
-2. Analyser la page pour trouver le tableau de classement
-3. Extraire les trois premiers modèles avec leurs scores
-4. Sauvegarder les résultats dans un fichier JSON
-## Développement
-Pour ajouter un nouvel outil à l'agent, créez une fonction dans `src/tools.py` et décorez-la avec `@tool`.
-Pour modifier les instructions données à l'agent, modifiez la variable `leaderboard_instructions` dans `src/agent.py`.
-## Expériences
-Le dossier `experiments/` contient des scripts expérimentaux qui ont été utilisés pour développer et tester différentes approches.
-## Comment ça fonctionne
-1. Le script charge les URLs des leaderboards depuis `data/leaderboards.json`
-2. Pour chaque URL, il lance un navigateur et utilise un agent IA pour :
-   - Naviguer vers l'URL du leaderboard
-   - Analyser la page pour trouver les trois premiers modèles
-   - Extraire les informations pertinentes
-3. Les résultats sont sauvegardés dans `data/leaderboard_results.json`

+---
+title: minimal-browser-screenshot-experiment
+emoji: 💻
+colorFrom: blue
+colorTo: red
+sdk: docker
+app_file: app/server.py
+pinned: false
+---