Novaciano's picture
Update README.md
834611b verified
---
datasets:
- anthracite-org/kalo-opus-instruct-22k-no-refusal
- anthracite-org/stheno-filtered-v1.1
- anthracite-org/nopm_claude_writing_fixed
- AiAF/SCPWiki-Archive-02-March-2025-Datasets
- passing2961/multifaceted-skill-of-mind
- huihui-ai/QWQ-LONGCOT-500K
- huihui-ai/LONGCOT-Refine-500K
- Epiculous/Synthstruct-Gens-v1.1-Filtered-n-Cleaned
- Epiculous/SynthRP-Gens-v1.1-Filtered-n-Cleaned
- alexandreteles/AlpacaToxicQA_ShareGPT
- Nitral-AI/Active_RP-ShareGPT
- PJMixers/hieunguyenminh_roleplay-deduped-ShareGPT
- Nitral-AI/RP_Alignment-ShareGPT
- Chaser-cz/sonnet35-charcard-roleplay-sharegpt
- AiCloser/sharegpt_cot_dataset
- PJMixers/Gryphe_Opus-WritingPrompts-Story2Prompt-ShareGPT
- priveeai/pippa_sharegpt
- Locutusque/sharegpt_gpt4_uncensored_cleaned
- OpenCoder-LLM/opc-sft-stage1
- OpenCoder-LLM/opc-sft-stage2
- microsoft/orca-agentinstruct-1M-v1
- microsoft/orca-math-word-problems-200k
- NousResearch/hermes-function-calling-v1
- AI-MO/NuminaMath-CoT
- AI-MO/NuminaMath-TIR
- allenai/tulu-3-sft-mixture
- cognitivecomputations/dolphin-coder
- HuggingFaceTB/smoltalk
- cognitivecomputations/samantha-data
- m-a-p/CodeFeedback-Filtered-Instruction
- m-a-p/Code-Feedback
- mlabonne/FineTome-100k
- PawanKrd/math-gpt-4o-200k
- V3N0M/Jenna-50K-Alpaca-Uncensored
- FreedomIntelligence/medical-o1-reasoning-SFT
base_model:
- danieliuspodb/llama-3.2-1b-extremist4
- huihui-ai/Llama-3.2-1B-Instruct-abliterated
- UUFO-Aigis/Magnum-1b-v1
- prithivMLmods/Llama-Express.1-Math
- unsloth/Llama-3.2-1B-Instruct
- bunnycore/FuseChat-3.2-1B-Creative-RP
- CarrotAI/Llama-3.2-Rabbit-Ko-1B-Instruct
- carsenk/llama3.2_1b_2025_uncensored_v2
- xdrshjr/llama3.2_1b_uncensored_5000_8epoch_lora
- passing2961/Thanos-1B
- huihui-ai/MicroThinker-1B-Preview
- Trelis/Llama-3.2-1B-Instruct-MATH-synthetic
- prithivMLmods/Bellatrix-Tiny-1B-v3
- cognitivecomputations/Dolphin3.0-Llama3.2-1B
- Nexesenex/Dolphin3.0-Llama3.1-1B-abliterated
- KidIkaros/Llama-3.2-1B-Instruct-abliterated
- Nexesenex/Llama_3.2_1b_SunOrca_V1
- NickyNicky/Llama-1B-GRPO_Final
- DeepAutoAI/Explore_Llama-3.2-1B-Inst_v1.1
- AiAF/Pretrained-SCP-1B-QLoRA
library_name: transformers
tags:
- transformers
- mergekit
- merge
- 1b
- rp
- nsfw
- roleplay
- español
- uncensored
- llama
- llama3.2
- not-for-all-audiences
language:
- es
- en
pipeline_tag: text-generation
model-index:
- name: HarmfulProject-3.2-1B
results:
- task:
type: text-generation
name: Text Generation
dataset:
name: IFEval (0-Shot)
type: HuggingFaceH4/ifeval
args:
num_few_shot: 0
metrics:
- type: inst_level_strict_acc and prompt_level_strict_acc
value: 39.22
name: strict accuracy
source:
url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=Novaciano/HarmfulProject-3.2-1B
name: Open LLM Leaderboard
- task:
type: text-generation
name: Text Generation
dataset:
name: BBH (3-Shot)
type: BBH
args:
num_few_shot: 3
metrics:
- type: acc_norm
value: 9.39
name: normalized accuracy
source:
url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=Novaciano/HarmfulProject-3.2-1B
name: Open LLM Leaderboard
- task:
type: text-generation
name: Text Generation
dataset:
name: MATH Lvl 5 (4-Shot)
type: hendrycks/competition_math
args:
num_few_shot: 7
metrics:
- type: exact_match
value: 7.48
name: exact match
source:
url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=Novaciano/HarmfulProject-3.2-1B
name: Open LLM Leaderboard
- task:
type: text-generation
name: Text Generation
dataset:
name: GPQA (0-shot)
type: Idavidrein/gpqa
args:
num_few_shot: 0
metrics:
- type: acc_norm
value: 2.13
name: acc_norm
source:
url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=Novaciano/HarmfulProject-3.2-1B
name: Open LLM Leaderboard
- task:
type: text-generation
name: Text Generation
dataset:
name: MuSR (0-shot)
type: TAUR-Lab/MuSR
args:
num_few_shot: 0
metrics:
- type: acc_norm
value: 3.06
name: acc_norm
source:
url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=Novaciano/HarmfulProject-3.2-1B
name: Open LLM Leaderboard
- task:
type: text-generation
name: Text Generation
dataset:
name: MMLU-PRO (5-shot)
type: TIGER-Lab/MMLU-Pro
config: main
split: test
args:
num_few_shot: 5
metrics:
- type: acc
value: 10.46
name: accuracy
source:
url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=Novaciano/HarmfulProject-3.2-1B
name: Open LLM Leaderboard
---
<center> <img src="https://i.ibb.co/hJk8j3Rz/IMG-20250306-WA0039.jpg" alt="IMG-20250306-WA0039" border="0"></a> </center>
# 🏆 BEST Model Llama 3.2 1B of UGI Scoreboard [11/03/2025] 🥇
<center> <img src="https://i.ibb.co/35vWL8Lc/IMG-20250311-011611.jpg" alt="IMG-20250311-011611" border="0"></a> </center>
# [Open LLM Leaderboard Evaluation Results](https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard)
Detailed results can be found [here](https://huggingface.co/datasets/open-llm-leaderboard/Novaciano__BLAST_PROCESSING-3.2-1B-details)
| Metric |Value|
|-------------------|----:|
|Avg. |11.95|
|IFEval (0-Shot) |39.22|
|BBH (3-Shot) | 9.36|
|MATH Lvl 5 (4-Shot)| 7.48|
|GPQA (0-shot) | 2.13|
|MuSR (0-shot) | 3.06|
|MMLU-PRO (5-shot) | 10.46|
# Mezcla
Esta mezcla de 20 modelos pre-entrenados fue creado usando [mergekit](https://github.com/cg123/mergekit).
**Cada uno de los modelos que lo compone destaca en lo suyo:**
- Roleplay
- GRPO
- Uncensored
- Abliterated
- Gran cantidad de datasets inyectados
## Detalle de la Mezcla
"Blast Processing" es una variante innovadora del modelo Llama3.2-1B, diseñado para ofrecer un rendimiento explosivamente rápido y eficiente en tareas de generación y comprensión de lenguaje. Inspirado en la idea de “procesamiento a todo gas” y en los avances tecnológicos que permiten manejar enormes cantidades de datos a alta velocidad, este modelo fue **creado a partir de la fusión de 20 Modelos** *(los mejores que encontré hasta el momento)*, técnicas de compresión avanzada y optimizaciones de hardware para brindar respuestas en tiempo récord haciendo uso de poca memoria RAM, sin sacrificar la calidad o la coherencia del output.
**Entre sus características distintivas se destacan:**
- **Velocidad excepcional:** Gracias a optimizaciones en la arquitectura y técnicas de cuantización, "Blast Processing" maximiza el uso del hardware, permitiendo una generación de tokens muy rápida, ideal para aplicaciones en tiempo real.
- **Eficiencia en recursos:** Su diseño ligero lo hace apto para dispositivos móviles y entornos con recursos limitados, sin perder la capacidad de procesamiento que se espera de modelos de última generación.
- **Rendimiento robusto:** Mantiene la calidad y precisión en tareas de lenguaje natural, al integrar refinamientos en el entrenamiento que refuerzan su coherencia y consistencia, incluso en escenarios de alta demanda.
Con "Blast Processing", no solo se apuesta por la **potencia bruta en velocidad**, sino también por una experiencia de usuario más dinámica y fluida, abriendo paso a nuevas aplicaciones en áreas como asistentes virtuales, análisis de datos en tiempo real y sistemas interactivos **para dispositivos móviles.**
Esta denominación evoca una imagen de tecnología de alto rendimiento, lista para "despegar" en cualquier escenario donde la rapidez y la eficiencia sean esenciales, haciendo honor al legado de la innovación en IA y procesamiento de datos.
### Método de Mezcla
Este modelo fue mezclado usando el método de mezcla [Model Stock](https://arxiv.org/abs/2403.19522) usando el modelo [bunnycore/FuseChat-3.2-1B-Creative-RP](https://huggingface.co/bunnycore/FuseChat-3.2-1B-Creative-RP) como base.
### Modelos Mezclados
Los siguientes modelos fueron incluídos en la mezcla:
* [danieliuspodb/llama-3.2-1b-extremist4](https://huggingface.co/danieliuspodb/llama-3.2-1b-extremist4)
* [huihui-ai/Llama-3.2-1B-Instruct-abliterated](https://huggingface.co/huihui-ai/Llama-3.2-1B-Instruct-abliterated)
* [UUFO-Aigis/Magnum-1b-v1](https://huggingface.co/UUFO-Aigis/Magnum-1b-v1)
* [prithivMLmods/Llama-Express.1-Math](https://huggingface.co/prithivMLmods/Llama-Express.1-Math)
* [unsloth/Llama-3.2-1B-Instruct](https://huggingface.co/unsloth/Llama-3.2-1B-Instruct)
* [CarrotAI/Llama-3.2-Rabbit-Ko-1B-Instruct](https://huggingface.co/CarrotAI/Llama-3.2-Rabbit-Ko-1B-Instruct)
* [carsenk/llama3.2_1b_2025_uncensored_v2](https://huggingface.co/carsenk/llama3.2_1b_2025_uncensored_v2)
* [xdrshjr/llama3.2_1b_uncensored_5000_8epoch_lora](https://huggingface.co/xdrshjr/llama3.2_1b_uncensored_5000_8epoch_lora)
* [passing2961/Thanos-1B](https://huggingface.co/passing2961/Thanos-1B)
* [huihui-ai/MicroThinker-1B-Preview](https://huggingface.co/huihui-ai/MicroThinker-1B-Preview)
* [Trelis/Llama-3.2-1B-Instruct-MATH-synthetic](https://huggingface.co/Trelis/Llama-3.2-1B-Instruct-MATH-synthetic)
* [prithivMLmods/Bellatrix-Tiny-1B-v3](https://huggingface.co/prithivMLmods/Bellatrix-Tiny-1B-v3)
* [cognitivecomputations/Dolphin3.0-Llama3.2-1B](https://huggingface.co/cognitivecomputations/Dolphin3.0-Llama3.2-1B)
* [Nexesenex/Dolphin3.0-Llama3.1-1B-abliterated](https://huggingface.co/Nexesenex/Dolphin3.0-Llama3.1-1B-abliterated)
* [KidIkaros/Llama-3.2-1B-Instruct-abliterated](https://huggingface.co/KidIkaros/Llama-3.2-1B-Instruct-abliterated)
* [Nexesenex/Llama_3.2_1b_SunOrca_V1](https://huggingface.co/Nexesenex/Llama_3.2_1b_SunOrca_V1)
* [NickyNicky/Llama-1B-GRPO_Final](https://huggingface.co/NickyNicky/Llama-1B-GRPO_Final)
* [DeepAutoAI/Explore_Llama-3.2-1B-Inst_v1.1](https://huggingface.co/DeepAutoAI/Explore_Llama-3.2-1B-Inst_v1.1)
* [AiAF/Pretrained-SCP-1B-QLoRA](https://huggingface.co/AiAF/Pretrained-SCP-1B-QLoRA)