GRAG-PHI-4B (German Retrieval Augmented Generation)

avemio 's Collections

GRAG-NEMO-12B (German Retrieval Augmented Generation)

GRAG-LLAMA-3.1-8B (German Retrieval Augmented Generation)

GRAG-MISTRAL-7B-v3.0 (German Retrieval Augmented Generation)

GRAG-EMBEDDING-MODELS

GRAG-WHISPER-MODELS

GRAG-BENCHMARKS

GRAG-DATASETS

GRAG-PHI-4B (German Retrieval Augmented Generation)

updated 17 days ago

Here you can find all the final checkpoints & datasets from training Phi-3.5-mini-128k Model from Microsoft on the GRAG Datasets.

Upvote

avemio/GRAG-PHI-3.5-MINI-4B-MERGED-HESSIAN-AI

Question Answering • Updated 18 days ago • 191

Note This model was merged from the SFT- & ORPO Checkpoints. SFT Model with 60% weights & ORPO Model with 40% weights.
avemio/GRAG-PHI-3.5-MINI-4B-ORPO-HESSIAN-AI

Question Answering • Updated 18 days ago • 23

Note This model was trained on 20.7 Million Tokens in ORPO (Odd-Ratio-Preference Optimization) on synthetically generated or enhanced Data. Please see the GRAG-ORPO-Dataset (https://huggingface.co/datasets/avemio/GRAG-ORPO-ShareGPT-HESSIAN-AI) for reference.
avemio/GRAG-PHI-3.5-MINI-4B-SFT-HESSIAN-AI

Question Answering • Updated 18 days ago • 21

Note This model was trained on 1,5 Billion Tokens in SFT(Supervised Fine-Tuning) on synthetically generated or enhanced Data. Please see the GRAG-SFT-Dataset (https://huggingface.co/datasets/avemio/GRAG-SFT-ShareGPT-HESSIAN-AI) for reference.
avemio/GRAG-PHI-3.5-MINI-4B-CPT-HESSIAN-AI

Question Answering • Updated 18 days ago • 7

Note This model was trained on 507,5 Million Tokens in CPT (Continued Pre-Training) on synthetically generated or enhanced Data. Please see the GRAG-CPT-Dataset (https://huggingface.co/datasets/avemio/GRAG-CPT-HESSIAN-AI) for reference.
avemio/GRAG-ORPO-ShareGPT-HESSIAN-AI

Viewer • Updated Dec 16, 2024 • 13.7k • 40
avemio/GRAG-SFT-ShareGPT-HESSIAN-AI

Viewer • Updated Dec 12, 2024 • 1.01M • 30 • 1
avemio/GRAG-CPT-HESSIAN-AI

Viewer • Updated Dec 12, 2024 • 654k • 21
avemio/GRAG-PHI-3.5-MINI-4B-MERGED-HESSIAN-AI-Q8_0-GGUF

Question Answering • Updated 18 days ago • 15
avemio/GRAG-PHI-3.5-MINI-4B-ORPO-HESSIAN-AI-Q8_0-GGUF

Question Answering • Updated 18 days ago • 16
avemio/GRAG-PHI-3.5-MINI-4B-SFT-HESSIAN-AI-Q8_0-GGUF

Updated Dec 2, 2024

Upvote