SentenceTransformer based on Snowflake/snowflake-arctic-embed-m-v2.0

This is a sentence-transformers model finetuned from Snowflake/snowflake-arctic-embed-m-v2.0 on the csv dataset. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: Snowflake/snowflake-arctic-embed-m-v2.0
  • Maximum Sequence Length: 8192 tokens
  • Output Dimensionality: 768 dimensions
  • Similarity Function: Cosine Similarity
  • Training Dataset:
    • csv

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 8192, 'do_lower_case': False}) with Transformer model: GteModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
  (2): Normalize()
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("sentence_transformers_model_id")
# Run inference
sentences = [
    'Gia Cát Lượng đã giúp ai trong việc quản lý nước Thục?',
    'phải trông coi mọi việc, giúp Thành Vương đến lúc trưởng thành. \r\n4\r\n Hoắc Quang giữ chức Đại tư mã tướng quân, phò Hán Chiêu Đế lúc lên ngôi mới 9 tuổi. \r\n5\r\n Gia Cát Lượng tức Khổng Minh, là thừa tướng của Chiêu Đế Lưu Bị nước Thục đời Tam Quốc. Lưu Bị chết, con là Lưu Thiện nối \r\nngôi, tức Thục Hậu chúa, mọi việc nước, việc quân đều phải trông cậy vào Gia Cát Lượng. \r\n6\r\n Tô Hiến Thành là Thái úy triều Lý Cao Tông, nhận di mệnh Cao Tông phò vua nhỏ là Long Cán lên nối ngôi mới 3 tuổi. \r\n7\r\n Tứ phụ: nghĩa là bốn viên đại thần giúp vua khi mới lên ngôi. \r\n8\r\n Chỉ Thuận Tông. \r\n9\r\n Xích chủy: nghĩa là mõm đỏ, miệng đỏ, hay đỏ mỏ. Xích chủy hầu là loài đỏ mỏ ám chỉ Lê Quý Ly. \r\n10 Bạch kê: nghĩa là gà trắng. Nghệ Tông sinh năm Tân Dậu, tức năm gà. Tân thuộc hành kim, loài kim sắc trắng. Vì thế "bạch kê" \r\nám chỉ Nghệ Tông. \r\n11 Chữ vương? ở trong lòng chữ khẩu? là chữ "quốc"?. \r\n12 Theo tục nhà Trần, hằng năm vào ngày mồng 4 tháng 4, vua hội họp bề tôi làm lễ tuyên thệ ở đền Đồng Cổ. (Xem bản kỷ, quyển \r\n5, Kiến Trung năm thứ 3, 1277). \r\n13 Chỉ Quý Ly. \r\n288 Đại Việt Sử Ký Toàn Thư - Bản Kỷ - Quyển VIII \r\nQuý Ly bỏ mũ, rập đầu khóc lóc từ tạ, chỉ trời vạch đất thề rằng: \r\n"Nếu thần không biết dốc lòng trung, hết sức giúp Quan gia để truyền đến con cháu về sau thì \r\ntrời sẽ ghét bỏ thần". \r\nQuý Ly lại nói: "Lúc Linh Đức Vương làm điều thất đức, nếu không nhờ oai linh bệ hạ thì thần đã',
    'Tây. Ngoài cơ sờ đúc súng cũ của tiên triều, năm 1825 vua Minh \r\nMệnh mờ thêm sáu xưởng nữa. vốn cần cù và ham học hỏi sáng \r\ntạo, những người thợ quân giới đã được "thứ súng tay nạp thuốc nổ \r\nmạnh theo kiểu Tây dương". Vào những năm cuối triều Minh \r\nM ệnh, họ đã đúc 15 cỗ đại pháo X ung tiêu băng đồng và hai cỗ \r\nsúng lớn Chấn hải, loại đại pháo lợi hại trong thủy chiến phương \r\nTây. Sau đó, lại xuất xưởng tiếp 30 cỗ Chấn hải. Năm 1829, quản \r\nkho Hải Dương là Tôn Thất Thiện cùng với 100 lính Chấn cơ chế \r\nra cối gỗ chạy bàng sức nước ở khe suối để giã, luyện thuốc súng. \r\nDụng cụ này là xe "Thủy hỏa ký tế", và những năm sau được phổ \r\ncập trong quân ngũ. Từ vũ khí phương Tây, người Đại Nam đã tự \r\ntìm hiểu từng chi tiết để chế tạo thước đo ngắm bắn, thước kiểm tra \r\nthuốc súng. Trong bảy năm ờ ngôi, vua Thiệu Trị đúc 9 cỗ súng \r\nbàng đồng hiệu là "Thần uy phục viễn đại tướng quân", cỗ to nhất \r\nlà 10.706 cân, cỗ nhỏ nhất là 10.222 cân, tổng cộng là 93.829 cân.\r\n649\r\nLỊCH SỬ VIỆT NAM - TẬP 5\r\nVà ba cỗ súng hiệu "Bảo Đại định công an dân hòa chúng thượng \r\ntướng quân", mỗi cỗ trên 14.500 cân, tổng cộng là 43.620 cân1.\r\nĐe tạo điều kiện cho quân thủy học tập, bộ Công cấp cho họ la \r\nbàn, thước đo nước, đồng hồ cát xem giờ của phương Tây. v ề khoa \r\nmục bắn súng thì lính thủy phải tập bắn súng điểu sang và đại bác. \r\nMinh Mệnh yêu cầu Hiệp biện Đại học sĩ lãnh Thượng thư bộ Binh \r\nTrương Đăng Quế đọc kỹ các sách và bản đồ thủy chiến "Tây',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Evaluation

Metrics

Information Retrieval

Metric Value
cosine_accuracy@1 0.4333
cosine_accuracy@3 0.6475
cosine_accuracy@5 0.7219
cosine_accuracy@10 0.7982
cosine_precision@1 0.4333
cosine_precision@3 0.2158
cosine_precision@5 0.1444
cosine_precision@10 0.0798
cosine_recall@1 0.4333
cosine_recall@3 0.6475
cosine_recall@5 0.7219
cosine_recall@10 0.7982
cosine_ndcg@10 0.6168
cosine_mrr@10 0.5586
cosine_map@100 0.565

Training Details

Training Dataset

csv

  • Dataset: csv
  • Size: 21,892 training samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 9 tokens
    • mean: 26.95 tokens
    • max: 103 tokens
    • min: 25 tokens
    • mean: 373.94 tokens
    • max: 596 tokens
  • Samples:
    anchor positive
    Tính chất kiến trúc của đình làng triều Mạc được thể hiện qua những đặc điểm gì, như số gian, hình dạng, nội thất và cách bố trí không gian trong công trình? Đình làng là công trình kiến trúc công cộng được dựng nên

    băng sự đóng góp của cải và công sức của cả cộng đồng làng xã.

    Ngoài chức năng là trụ sở hành chính của cả làng, ngôi đình còn là

    trung tâm sinh hoạt văn hóa làng xã, là nơi diễn ra các nghi lễ trọng

    đại trong dịp tế lễ thần Thành hoàng làng và tô chức hội hè hăng

    năm. Có thê nói, ngôi đình làng là nơi hội tụ sức mạnh của cả cộng

    đồng và là biểu trưng đặc sắc nhất của văn hóa làng xã.


    Trong các ngôi đình triều Mạc, Thân thành hoàng có lý lịch

    xuất thân khá phong phú. Tản Viên sơn thánh là vị thần có ảnh

    hưởng lớn ở xứ Đoài được thờ phụng ở đình Tây Đăng, Thanh Lũng

    và nhiều làng xã khác. Thần Cao Sơn, Quý Minh tương truyền là

    tướng tâm phúc của Hùng Vương được thờ ở đình làng Lỗ Hạnh.

    Dân làng Lỗ Hạnh còn thờ cả Phương Dung công chúa... Từ thế

    kỷ XYVI và các thế kỷ tiếp sau, Thần thành hoàng làng trở thành

    vị vua tỉnh thần ở các làng xã, tín ngưỡng thờ cúng Thân thành

    hoàng càng trở nên phong phú thê hiện qua lễ...
    Nguyễn Khắc Nhu có vai trò gì trong khởi nghĩa toàn khu vực miền núi Bắc Kỳ của Việt Nam Quốc dân Đảng vào năm 1930? bị nổ do bất cẩn. Do đó công việc bị phát hiện. Hai người phụ trách

    cơ quan chế bom là Đỗ Cương và Quản Trác trốn thoát. Nhiều binh

    lính và dân thường bị bắt. Công việc bạo động của Xứ Nhu không

    thành. Đúng lúc này Việt Nam Quốc dân Đảng vừa thành lập, cử

    người tới mời Xứ Nhu và Việt Nam Dân quốc gia nhập Việt Nam

    Quốc dân Đảng. Hầu hết các đồng chí của Xứ Nhu trở thành đảng

    viên của Việt Nam Quốc dân Đảng ở vùng Bắc Ninh, Bắc Giang.

    Do đó, Việt Nam Quốc dân Đảng mạnh lên về số lượng1. Cùng với

    việc phát triển đảng viên ở Bẳc Ninh, Bắc Giang, Việt Nam Quốc

    dân Đảng còn thiết lập nhiều cơ sở ở các tỉnh Thái Bình, Hải Dương,

    1. Nguyễn Khắc Nhu tức Xứ Nhu (1882-1930), người làng Song Khê, huyện

    Yên Dũng, tinh Bắc Giang. Với lòng yêu nuớc và ý chí chống Pháp,

    ông dự tính thành lập một tổ chức hoạt động công khai nhăm đào tạo

    tài năng cho đất nước lấy tên là "Hội Quốc dân dục tài”. Việc này

    không thành công, ông lại lập tổ chức bí mật nhăm bạo động lật đổ ách

    áp b...
    Giá gạo tháng 3-1950 ở Liên khu IV là bao nhiêu đồng/tạ và có chênh lệch gì so với giá gạo ở Liên khu III và Liên khu Việt Bắc? ngày càng tăng nhanh, nhất là ở Việt Bắc. Giá gạo tăng mạnh

    nhất, giá thực phẩm cũng tăng dần theo giá gạo. Giá các mặt hàng

    kỹ nghệ tăng chậm hơn. Giá hàng ngoại hóa hầu như không tăng

    vỉ trong vùng Pháp chiếm đóng, hàng ngoại hóa tính bằng tiền

    Đông Dương không tăng, hom nữa nhân dân cũng ít tiêu thụ hàng

    ngoại hóa vì bị cấm.

    1. Viện Kinh tế học, Kinh tế Việt Nam từ Cách mạng Tháng Tám đến..., Sách

    đã dẫn, tr. 238.

    2. Chuơng trình và báo cáo của Bộ Kinh tế về tình hình hoạt động năm 1950.

    Trung tâm lưu trữ quốc gia in, phông Phủ Thủ tướng, Hồ sơ số 1914.

    488

    Chương VI. Việt Nam dân chủ cộng hòa xây dựng..

    Giá gạo trong những tháng đầu năm 1950 so với cuối năm 1949

    có thay đổi, Liên khu IV (Thanh Hóa) giá tăng lên 154%; Liên khu

    III (Hà Đông - Hà Nam) giá tăng lên 153%; Liên khu Việt Bắc

    (Thái Nguyên) giá tăng lên 800%.

    Giá gạo ở Thái Nguyên từ 1.625 đồng/tạ lên 13.000 đồng/tạ

    (tăng 800%); ờ Phú Thọ từ 2.650 đồng/tạ lên 7.500 đồng/tạ (tăng

    283%). Mặt khác, ...
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Evaluation Dataset

csv

  • Dataset: csv
  • Size: 21,892 evaluation samples
  • Columns: anchor and positive
  • Approximate statistics based on the first 1000 samples:
    anchor positive
    type string string
    details
    • min: 10 tokens
    • mean: 26.56 tokens
    • max: 108 tokens
    • min: 24 tokens
    • mean: 369.01 tokens
    • max: 559 tokens
  • Samples:
    anchor positive
    Nguyễn Hoàng đã thực hiện những hành động gì để dần dần tách khỏi sự ràng buộc của họ Trịnh sau khi trở lại Thuận Quảng vào năm 1600, và những hành động này đã ảnh hưởng như thế nào đến mối quan hệ giữa hai dòng họ? thẳng đối với họ Nguyễn. Trịnh Tùng đã lấy danh nghĩa vua Lê sai

    sứ giả là Thiêm đô ngự sử Lê Nghĩa Trạch đem sắc vào phủ dụ

    Nguyễn Hoàng và vẫn cho ở lại trấn thủ, hằng năm nộp thuế như

    cũ. Cùng với sắc của vua Lê, Trịnh Tùng có gửi thư kèm theo

    Chương ĩ. Sự phân liệt Đàng Trong - Đàng Ngoài...

    1, Toàn thư. quyển 17, tập IV, Sđd, tr. 200.

    2, Đại Nam thực lục, Tiền biên, quyển 1, tập I, Sđd, tr. 34.

    3, Đại Nam thực lục, Tiển biên, quyển 1, tập I, Sđd, tr. 35.

    39

    LỊCH SỬ VIỆT NAM - TẬP 4

    "khuyên giữ việc thuế cống". Nguyễn Hoàng sai sứ giả đáp lễ tạ on

    vua Lê và gửi thư cho Trịnh Tùng hẹn kết nghĩa thông gia, đem con

    gái là Ngọc Tú gả cho Trịnh Tráng (con Trịnh Tùng) lấy danh

    nghĩa hôn nhân để duy trì mối quan hệ bề ngoài giao hảo giữa hai

    dòng họ vốn có sẵn một mối thù địch.

    - Chính sách cùa họ Nguyễn từ khi Nguyễn Hoàng trở lại

    Thuận Quảng

    Năm 1600, Nguyễn Hoàng ròi được khỏi đất Bẳc trở về Thuận

    Quảng bắt đầu thực hiện một chính sách cai trị mói, dần dần tác...
    Báo cáo của Ủy ban Kháng chiến hành chính Hà Nội về hoạt động giáo dục bù nhìn và tình hình các giáo sư trường Chu Văn An có nội dung gì? Tài liệu tham khảo

    21. Báo cáo sô' 2 BC/I ngày 12-11-1949 và Báo cáo sô' 463

    BC/DB ngày 25-12-1949 của Ty Công an H à Nội. Trung

    tâm Lưu trữ Quốc gia III, phông Phủ Thủ tướng, Hồ sơ

    SỐ921.

    28. Báo “Le song” ngày 11-2-1949. Trung tâm Lưu trữ Quốc

    gia III, phông Phủ Thủ tướng, Hồ sơ sô' 2002.

    29. Báo cáo của u ỷ ban Kháng chiến hành chính Hà Nội vê

    hoạt động giáo dục bù nhìn và tình hình các giáo sư

    trường Chu Văn An. Trung tâm Lưu trữ Quốc gia III,

    phông Phủ Thủ tướng, Hồ sơ số 979.

    30. Báo cáo của Tổng Giám đốc Việt N am Công an vụ sô'

    122/NCB3 ngày 1-4-1951. Trung tâm Lưu trữ Quốic gia

    III, phông Phủ Thủ tướng, Hồ sơ sô' 979.

    31. Báo cáo thành tích về cống tác công an trong 8 năm kháng

    chiến (1946-1954) của Bộ Công an. Trung tâm Lưu trữ

    Quốc gia III, phông Phủ Thủ tướng, Hồ sơ sô' 927.

    32. Báo cáo một năm kháng chiến (12-1946 đến 12-1947) của

    UBKCHC Khu 12. Trung tâm Lưu trữ Quốc gia III, phông

    Phủ Thủ tướng, Hồ sơ sô" 2000.

    33. Báo cáo thành tích quăn sự trong 8 n...
    Đặc điểm dân số của nước ta ảnh hưởng đến các ngành dịch vụ như thế nào và đòi hỏi những ngành dịch vụ nào cần được ưu tiên phát triển trong quá trình đô thị hóa? — Trong các thành phố lớn thường hình thành các trung tâm giao dịch,

    thương mại. Đó là nơi tập trung các ngân hàng, các văn phòng đại diện

    của các công ti, các siêu thị hay các tổ hợp thương mại, dịch vụ lớn...

    Ở các thành phố lớn trên thế giới, thường dễ nhận thấy các trung tâm

    thương mại này do sự tập trung các ngôi nhà cao tầng, chọc trời. Một

    thành phố có thể có trung tâm thương mại chính và một số trung tâm

    thương mại nhỏ hơn, kết quả của sự phát triển đô thị.


    — Ở nước ta, các thành phố, thị xã thường có khu hành chính (phân

    “đô”) và khu buôn bán, dịch vụ (phân “thị'). Ở Hà Nội, Thành phố

    Hồ Chí Minh các trung tâm giao dịch, thương mại của thành phố đang

    được hình thành rõ nét.


    CÂU HỎI VÀ BÀI TẬP


    174


    1. Cho biết đặc điểm dân số của nước ta (đông, tăng còn tương đối

    nhanh, mức sống đang nâng lên và đô thị hoá đang phát triển với

    tốc độ nhanh hơn) có ảnh hưởng đến các ngành dịch vụ như thế

    nào ? Các đặc điểm đó đòi hỏi những ngành dịch vụ nào cần được

    ưu tiê...
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • eval_strategy: steps
  • per_device_train_batch_size: 6
  • per_device_eval_batch_size: 6
  • learning_rate: 3e-06
  • num_train_epochs: 2
  • warmup_ratio: 0.05
  • bf16: True
  • batch_sampler: no_duplicates

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: steps
  • prediction_loss_only: True
  • per_device_train_batch_size: 6
  • per_device_eval_batch_size: 6
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 3e-06
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1.0
  • num_train_epochs: 2
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.05
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: True
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: no_duplicates
  • multi_dataset_batch_sampler: proportional

Training Logs

Epoch Step Training Loss Validation Loss Snowflake/snowflake-arctic-embed-m-v2.0_cosine_ndcg@10
1.6139 5300 0.0151 0.0323 0.6185
1.6443 5400 0.0212 0.0323 0.6182
1.6748 5500 0.0363 0.0323 0.6173
1.7052 5600 0.0151 0.0324 0.6182
1.7357 5700 0.0224 0.0324 0.6175
1.7661 5800 0.0222 0.0325 0.6179
1.7966 5900 0.016 0.0325 0.6171
1.8270 6000 0.0262 0.0325 0.6172
1.8575 6100 0.0205 0.0325 0.6179
1.8879 6200 0.0172 0.0325 0.6169
1.9184 6300 0.0216 0.0325 0.6177
1.9488 6400 0.0281 0.0324 0.6170
1.9793 6500 0.0274 0.0324 0.6168

Framework Versions

  • Python: 3.11.11
  • Sentence Transformers: 3.4.1
  • Transformers: 4.48.0
  • PyTorch: 2.5.1
  • Accelerate: 1.2.1
  • Datasets: 3.2.0
  • Tokenizers: 0.21.0

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}
Downloads last month
20
Safetensors
Model size
305M params
Tensor type
F32
·
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.

Model tree for minhtuan7akp/snowflake-m-v2.0-vietnamese-finetune

Finetuned
(3)
this model

Evaluation results

  • Cosine Accuracy@1 on Snowflake/snowflake arctic embed m v2.0
    self-reported
    0.433
  • Cosine Accuracy@3 on Snowflake/snowflake arctic embed m v2.0
    self-reported
    0.647
  • Cosine Accuracy@5 on Snowflake/snowflake arctic embed m v2.0
    self-reported
    0.722
  • Cosine Accuracy@10 on Snowflake/snowflake arctic embed m v2.0
    self-reported
    0.798
  • Cosine Precision@1 on Snowflake/snowflake arctic embed m v2.0
    self-reported
    0.433
  • Cosine Precision@3 on Snowflake/snowflake arctic embed m v2.0
    self-reported
    0.216
  • Cosine Precision@5 on Snowflake/snowflake arctic embed m v2.0
    self-reported
    0.144
  • Cosine Precision@10 on Snowflake/snowflake arctic embed m v2.0
    self-reported
    0.080
  • Cosine Recall@1 on Snowflake/snowflake arctic embed m v2.0
    self-reported
    0.433
  • Cosine Recall@3 on Snowflake/snowflake arctic embed m v2.0
    self-reported
    0.647