Mistral-7B Q5_1 GGUF

Este repositorio contiene la versión cuantizada Q5_1 del modelo Mistral-7B, en formato GGUF, optimizado para ejecución eficiente en CPU con llama.cpp.

📌 Información del modelo

Nombre: Mistral-7B Q5_1
Formato: GGUF
Cuantización: Q5_1 (INT5 equivalente)
Tamaño: 5.44 GB
Fuente original: Mistral-7B
Optimizado para: Inferencia rápida en CPU

🚀 Requisitos

Para usar este modelo, necesitas llama.cpp o un framework compatible con GGUF.

🔧 Instalación de llama.cpp

git clone https://github.com/ggerganov/llama.cpp.git
cd llama.cpp
make

🏃 Uso del modelo

./main -m mistral-7b-q5_1.gguf -p "Hola, ¿cómo estás?"

📜 Licencia

Este modelo sigue los términos de la licencia original de Mistral-7B.

Si tienes dudas o mejoras, ¡haz un pull request! 😊