File size: 10,287 Bytes
7a4d30f
3c757ea
1cefdfb
 
 
2d1b240
27c4758
a505d6a
 
1cefdfb
 
3c757ea
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
ffb57b6
 
 
 
7a4d30f
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
dba8f44
7a4d30f
 
dba8f44
 
 
 
 
f457608
 
 
 
 
 
 
3c757ea
834611b
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
7a4d30f
2023632
 
 
74c4767
2483435
 
 
834611b
 
 
 
 
 
 
 
 
 
 
 
 
 
dba8f44
7a4d30f
6bbfbfe
7a4d30f
a65a25c
 
 
 
 
 
 
 
dba8f44
7a4d30f
dba8f44
7a4d30f
dba8f44
7a4d30f
dba8f44
 
 
 
 
 
 
 
 
 
 
 
 
 
 
7a4d30f
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
dba8f44
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
---
datasets:
- anthracite-org/kalo-opus-instruct-22k-no-refusal
- anthracite-org/stheno-filtered-v1.1
- anthracite-org/nopm_claude_writing_fixed
- AiAF/SCPWiki-Archive-02-March-2025-Datasets
- passing2961/multifaceted-skill-of-mind
- huihui-ai/QWQ-LONGCOT-500K
- huihui-ai/LONGCOT-Refine-500K
- Epiculous/Synthstruct-Gens-v1.1-Filtered-n-Cleaned
- Epiculous/SynthRP-Gens-v1.1-Filtered-n-Cleaned
- alexandreteles/AlpacaToxicQA_ShareGPT
- Nitral-AI/Active_RP-ShareGPT
- PJMixers/hieunguyenminh_roleplay-deduped-ShareGPT
- Nitral-AI/RP_Alignment-ShareGPT
- Chaser-cz/sonnet35-charcard-roleplay-sharegpt
- AiCloser/sharegpt_cot_dataset
- PJMixers/Gryphe_Opus-WritingPrompts-Story2Prompt-ShareGPT
- priveeai/pippa_sharegpt
- Locutusque/sharegpt_gpt4_uncensored_cleaned
- OpenCoder-LLM/opc-sft-stage1
- OpenCoder-LLM/opc-sft-stage2
- microsoft/orca-agentinstruct-1M-v1
- microsoft/orca-math-word-problems-200k
- NousResearch/hermes-function-calling-v1
- AI-MO/NuminaMath-CoT
- AI-MO/NuminaMath-TIR
- allenai/tulu-3-sft-mixture
- cognitivecomputations/dolphin-coder
- HuggingFaceTB/smoltalk
- cognitivecomputations/samantha-data
- m-a-p/CodeFeedback-Filtered-Instruction
- m-a-p/Code-Feedback
- mlabonne/FineTome-100k
- PawanKrd/math-gpt-4o-200k
- V3N0M/Jenna-50K-Alpaca-Uncensored
- FreedomIntelligence/medical-o1-reasoning-SFT
base_model:
- danieliuspodb/llama-3.2-1b-extremist4
- huihui-ai/Llama-3.2-1B-Instruct-abliterated
- UUFO-Aigis/Magnum-1b-v1
- prithivMLmods/Llama-Express.1-Math
- unsloth/Llama-3.2-1B-Instruct
- bunnycore/FuseChat-3.2-1B-Creative-RP
- CarrotAI/Llama-3.2-Rabbit-Ko-1B-Instruct
- carsenk/llama3.2_1b_2025_uncensored_v2
- xdrshjr/llama3.2_1b_uncensored_5000_8epoch_lora
- passing2961/Thanos-1B
- huihui-ai/MicroThinker-1B-Preview
- Trelis/Llama-3.2-1B-Instruct-MATH-synthetic
- prithivMLmods/Bellatrix-Tiny-1B-v3
- cognitivecomputations/Dolphin3.0-Llama3.2-1B
- Nexesenex/Dolphin3.0-Llama3.1-1B-abliterated
- KidIkaros/Llama-3.2-1B-Instruct-abliterated
- Nexesenex/Llama_3.2_1b_SunOrca_V1
- NickyNicky/Llama-1B-GRPO_Final
- DeepAutoAI/Explore_Llama-3.2-1B-Inst_v1.1
- AiAF/Pretrained-SCP-1B-QLoRA
library_name: transformers
tags:
- transformers
- mergekit
- merge
- 1b
- rp
- nsfw
- roleplay
- español
- uncensored
- llama
- llama3.2
- not-for-all-audiences
language:
- es
- en
pipeline_tag: text-generation
model-index:
- name: HarmfulProject-3.2-1B
  results:
  - task:
      type: text-generation
      name: Text Generation
    dataset:
      name: IFEval (0-Shot)
      type: HuggingFaceH4/ifeval
      args:
        num_few_shot: 0
    metrics:
    - type: inst_level_strict_acc and prompt_level_strict_acc
      value: 39.22
      name: strict accuracy
    source:
      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=Novaciano/HarmfulProject-3.2-1B
      name: Open LLM Leaderboard
  - task:
      type: text-generation
      name: Text Generation
    dataset:
      name: BBH (3-Shot)
      type: BBH
      args:
        num_few_shot: 3
    metrics:
    - type: acc_norm
      value: 9.39
      name: normalized accuracy
    source:
      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=Novaciano/HarmfulProject-3.2-1B
      name: Open LLM Leaderboard
  - task:
      type: text-generation
      name: Text Generation
    dataset:
      name: MATH Lvl 5 (4-Shot)
      type: hendrycks/competition_math
      args:
        num_few_shot: 7
    metrics:
    - type: exact_match
      value: 7.48
      name: exact match
    source:
      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=Novaciano/HarmfulProject-3.2-1B
      name: Open LLM Leaderboard
  - task:
      type: text-generation
      name: Text Generation
    dataset:
      name: GPQA (0-shot)
      type: Idavidrein/gpqa
      args:
        num_few_shot: 0
    metrics:
    - type: acc_norm
      value: 2.13
      name: acc_norm
    source:
      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=Novaciano/HarmfulProject-3.2-1B
      name: Open LLM Leaderboard
  - task:
      type: text-generation
      name: Text Generation
    dataset:
      name: MuSR (0-shot)
      type: TAUR-Lab/MuSR
      args:
        num_few_shot: 0
    metrics:
    - type: acc_norm
      value: 3.06
      name: acc_norm
    source:
      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=Novaciano/HarmfulProject-3.2-1B
      name: Open LLM Leaderboard
  - task:
      type: text-generation
      name: Text Generation
    dataset:
      name: MMLU-PRO (5-shot)
      type: TIGER-Lab/MMLU-Pro
      config: main
      split: test
      args:
        num_few_shot: 5
    metrics:
    - type: acc
      value: 10.46
      name: accuracy
    source:
      url: https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard?query=Novaciano/HarmfulProject-3.2-1B
      name: Open LLM Leaderboard
---

<center> <img src="https://i.ibb.co/hJk8j3Rz/IMG-20250306-WA0039.jpg" alt="IMG-20250306-WA0039" border="0"></a> </center>

# 🏆 BEST Model Llama 3.2 1B of UGI Scoreboard [11/03/2025] 🥇

<center>   <img src="https://i.ibb.co/35vWL8Lc/IMG-20250311-011611.jpg" alt="IMG-20250311-011611" border="0"></a>  </center>

# [Open LLM Leaderboard Evaluation Results](https://huggingface.co/spaces/open-llm-leaderboard/open_llm_leaderboard)

Detailed results can be found [here](https://huggingface.co/datasets/open-llm-leaderboard/Novaciano__BLAST_PROCESSING-3.2-1B-details)

|      Metric       |Value|
|-------------------|----:|
|Avg.               |11.95|
|IFEval (0-Shot)    |39.22|
|BBH (3-Shot)       | 9.36|
|MATH Lvl 5 (4-Shot)| 7.48|
|GPQA (0-shot)      | 2.13|
|MuSR (0-shot)      | 3.06|
|MMLU-PRO (5-shot)  | 10.46|

# Mezcla

Esta mezcla de 20 modelos pre-entrenados fue creado usando [mergekit](https://github.com/cg123/mergekit).

**Cada uno de los modelos que lo compone destaca en lo suyo:**

- Roleplay
- GRPO
- Uncensored
- Abliterated
- Gran cantidad de datasets inyectados

## Detalle de la Mezcla

"Blast Processing" es una variante innovadora del modelo Llama3.2-1B, diseñado para ofrecer un rendimiento explosivamente rápido y eficiente en tareas de generación y comprensión de lenguaje. Inspirado en la idea de “procesamiento a todo gas” y en los avances tecnológicos que permiten manejar enormes cantidades de datos a alta velocidad, este modelo fue **creado a partir de la fusión de 20 Modelos** *(los mejores que encontré hasta el momento)*, técnicas de compresión avanzada y optimizaciones de hardware para brindar respuestas en tiempo récord haciendo uso de poca memoria RAM, sin sacrificar la calidad o la coherencia del output.

**Entre sus características distintivas se destacan:**

- **Velocidad excepcional:** Gracias a optimizaciones en la arquitectura y técnicas de cuantización, "Blast Processing" maximiza el uso del hardware, permitiendo una generación de tokens muy rápida, ideal para aplicaciones en tiempo real.
- **Eficiencia en recursos:** Su diseño ligero lo hace apto para dispositivos móviles y entornos con recursos limitados, sin perder la capacidad de procesamiento que se espera de modelos de última generación.
- **Rendimiento robusto:** Mantiene la calidad y precisión en tareas de lenguaje natural, al integrar refinamientos en el entrenamiento que refuerzan su coherencia y consistencia, incluso en escenarios de alta demanda.

Con "Blast Processing", no solo se apuesta por la **potencia bruta en velocidad**, sino también por una experiencia de usuario más dinámica y fluida, abriendo paso a nuevas aplicaciones en áreas como asistentes virtuales, análisis de datos en tiempo real y sistemas interactivos **para dispositivos móviles.**

Esta denominación evoca una imagen de tecnología de alto rendimiento, lista para "despegar" en cualquier escenario donde la rapidez y la eficiencia sean esenciales, haciendo honor al legado de la innovación en IA y procesamiento de datos.

### Método de Mezcla

Este modelo fue mezclado usando el método de mezcla [Model Stock](https://arxiv.org/abs/2403.19522) usando el modelo [bunnycore/FuseChat-3.2-1B-Creative-RP](https://huggingface.co/bunnycore/FuseChat-3.2-1B-Creative-RP) como base.

### Modelos Mezclados

Los siguientes modelos fueron incluídos en la mezcla:
* [danieliuspodb/llama-3.2-1b-extremist4](https://huggingface.co/danieliuspodb/llama-3.2-1b-extremist4)
* [huihui-ai/Llama-3.2-1B-Instruct-abliterated](https://huggingface.co/huihui-ai/Llama-3.2-1B-Instruct-abliterated)
* [UUFO-Aigis/Magnum-1b-v1](https://huggingface.co/UUFO-Aigis/Magnum-1b-v1)
* [prithivMLmods/Llama-Express.1-Math](https://huggingface.co/prithivMLmods/Llama-Express.1-Math)
* [unsloth/Llama-3.2-1B-Instruct](https://huggingface.co/unsloth/Llama-3.2-1B-Instruct)
* [CarrotAI/Llama-3.2-Rabbit-Ko-1B-Instruct](https://huggingface.co/CarrotAI/Llama-3.2-Rabbit-Ko-1B-Instruct)
* [carsenk/llama3.2_1b_2025_uncensored_v2](https://huggingface.co/carsenk/llama3.2_1b_2025_uncensored_v2)
* [xdrshjr/llama3.2_1b_uncensored_5000_8epoch_lora](https://huggingface.co/xdrshjr/llama3.2_1b_uncensored_5000_8epoch_lora)
* [passing2961/Thanos-1B](https://huggingface.co/passing2961/Thanos-1B)
* [huihui-ai/MicroThinker-1B-Preview](https://huggingface.co/huihui-ai/MicroThinker-1B-Preview)
* [Trelis/Llama-3.2-1B-Instruct-MATH-synthetic](https://huggingface.co/Trelis/Llama-3.2-1B-Instruct-MATH-synthetic)
* [prithivMLmods/Bellatrix-Tiny-1B-v3](https://huggingface.co/prithivMLmods/Bellatrix-Tiny-1B-v3)
* [cognitivecomputations/Dolphin3.0-Llama3.2-1B](https://huggingface.co/cognitivecomputations/Dolphin3.0-Llama3.2-1B)
* [Nexesenex/Dolphin3.0-Llama3.1-1B-abliterated](https://huggingface.co/Nexesenex/Dolphin3.0-Llama3.1-1B-abliterated)
* [KidIkaros/Llama-3.2-1B-Instruct-abliterated](https://huggingface.co/KidIkaros/Llama-3.2-1B-Instruct-abliterated)
* [Nexesenex/Llama_3.2_1b_SunOrca_V1](https://huggingface.co/Nexesenex/Llama_3.2_1b_SunOrca_V1)
* [NickyNicky/Llama-1B-GRPO_Final](https://huggingface.co/NickyNicky/Llama-1B-GRPO_Final)
* [DeepAutoAI/Explore_Llama-3.2-1B-Inst_v1.1](https://huggingface.co/DeepAutoAI/Explore_Llama-3.2-1B-Inst_v1.1)
* [AiAF/Pretrained-SCP-1B-QLoRA](https://huggingface.co/AiAF/Pretrained-SCP-1B-QLoRA)