Multilingual E5 Large finetuned on E-FAQ

This is a sentence-transformers model finetuned from intfloat/multilingual-e5-large. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used mainly for text retrieval or paraphrase mining.

Framework Versions

Python: 3.12.3
Sentence Transformers: 3.0.1
Transformers: 4.42.3
PyTorch: 2.3.1+cu121
Accelerate: 0.31.0
Datasets: 2.20.0
Tokenizers: 0.19.1

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MatryoshkaLoss

@misc{kusupati2024matryoshka,
    title={Matryoshka Representation Learning}, 
    author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi},
    year={2024},
    eprint={2205.13147},
    archivePrefix={arXiv},
    primaryClass={cs.LG}
}

Collection including GoBotsAI/multilingual-e5-large-finetuned-e-faq

Evaluation results

Cosine Accuracy@1 on Unknown
self-reported

0.807
Cosine Accuracy@10 on Unknown
self-reported

0.953
Cosine Precision@1 on Unknown
self-reported

0.807
Cosine Precision@10 on Unknown
self-reported

0.179
Cosine Recall@1 on Unknown
self-reported

0.568
Cosine Recall@10 on Unknown
self-reported

0.916
Cosine Ndcg@10 on Unknown
self-reported

0.853
Cosine Mrr@10 on Unknown
self-reported

0.858
Cosine Map@1 on Unknown
self-reported

0.807
Cosine Map@10 on Unknown
self-reported

0.814

View on Papers With Code

GoBotsAI
/

multilingual-e5-large-finetuned-e-faq