--- tags: - bertopic library_name: bertopic pipeline_tag: text-classification --- # MARTINI_enrich_BERTopic_ArunasGl This is a [BERTopic](https://github.com/MaartenGr/BERTopic) model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets. ## Usage To use this model, please install BERTopic: ``` pip install -U bertopic ``` You can use the model as follows: ```python from bertopic import BERTopic topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_ArunasGl") topic_model.get_topic_info() ``` ## Topic overview * Number of topics: 20 * Number of training documents: 2504
Click here for an overview of all topics. | Topic ID | Topic Keywords | Topic Frequency | Label | |----------|----------------|-----------------|-------| | -1 | trumpas - amerikos - pavyzdziui - prezidento - reiskia | 21 | -1_trumpas_amerikos_pavyzdziui_prezidento | | 0 | ukrainieciai - zelenskis - rusija - baltarusijos - nato | 1338 | 0_ukrainieciai_zelenskis_rusija_baltarusijos | | 1 | motyvacija - intuicija - svytuokles - prasme - niekada | 210 | 1_motyvacija_intuicija_svytuokles_prasme | | 2 | vakcinomis - kovid - pfizer - virusas - injekcijos | 147 | 2_vakcinomis_kovid_pfizer_virusas | | 3 | korupcijos - trumpas - operacijoms - kongreso - jfk | 106 | 3_korupcijos_trumpas_operacijoms_kongreso | | 4 | trumpas - prezidentui - donaldui - amerikos - tikrai | 83 | 4_trumpas_prezidentui_donaldui_amerikos | | 5 | mossad - palestinieciai - israelio - hamas - mi6 | 78 | 5_mossad_palestinieciai_israelio_hamas | | 6 | probiotikai - lactobacillus - antioksidantas - vitaminu - reishi | 58 | 6_probiotikai_lactobacillus_antioksidantas_vitaminu | | 7 | bankrutavo - kriptovaliutu - finansiniu - ftx - cbdc | 54 | 7_bankrutavo_kriptovaliutu_finansiniu_ftx | | 8 | sukciai - nepriestaraujate - pravaziuojanciam - susirasinejimu - nekritikuoja | 53 | 8_sukciai_nepriestaraujate_pravaziuojanciam_susirasinejimu | | 9 | bidenas - kongresmenas - mccarthy - feinstein - susitarimo | 52 | 9_bidenas_kongresmenas_mccarthy_feinstein | | 10 | помните - россии - победу - воина - года | 52 | 10_помните_россии_победу_воина | | 11 | instagramas - fb - influenceriais - bot - platforma | 41 | 11_instagramas_fb_influenceriais_bot | | 12 | pedofilija - seksualiai - holivudas - persekiojima - epsteinas | 40 | 12_pedofilija_seksualiai_holivudas_persekiojima | | 13 | giuliani - trumpas - prokuroru - federaliniu - donaldui | 39 | 13_giuliani_trumpas_prokuroru_federaliniu | | 14 | elektromagnetiniais - energijos - generatorius - voltu - sildytuva | 32 | 14_elektromagnetiniais_energijos_generatorius_voltu | | 15 | mafija - rotschildu - chazarai - bankininkystes - judaizma | 29 | 15_mafija_rotschildu_chazarai_bankininkystes | | 16 | delfi - prielankiausia - kadyrovui - socialdemokratai - skandalas | 26 | 16_delfi_prielankiausia_kadyrovui_socialdemokratai | | 17 | prancuzijai - protestai - politikais - prezidente - macrono | 23 | 17_prancuzijai_protestai_politikais_prezidente | | 18 | musk - trumpu - twitter - elona - zurnalistu | 22 | 18_musk_trumpu_twitter_elona |
## Training hyperparameters * calculate_probabilities: True * language: None * low_memory: False * min_topic_size: 10 * n_gram_range: (1, 1) * nr_topics: None * seed_topic_list: None * top_n_words: 10 * verbose: False * zeroshot_min_similarity: 0.7 * zeroshot_topic_list: None ## Framework versions * Numpy: 1.26.4 * HDBSCAN: 0.8.40 * UMAP: 0.5.7 * Pandas: 2.2.3 * Scikit-Learn: 1.5.2 * Sentence-transformers: 3.3.1 * Transformers: 4.46.3 * Numba: 0.60.0 * Plotly: 5.24.1 * Python: 3.10.12