topic_modelling / README.md
LidiiaMelnyk's picture
Add BERTopic model
afa8433 verified
metadata
tags:
  - bertopic
library_name: bertopic
pipeline_tag: text-classification

topic_modelling

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("LidiiaMelnyk/topic_modelling")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 28
  • Number of training documents: 2090
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 welche dekrete - dekrete - dekrete erlässt - erlässt donald - erlässt 32 -1_welche dekrete_dekrete_dekrete erlässt_erlässt donald
0 rechner - wohnen - ich - wo - gold 334 "Wohnortwahl und Lebensqualität"
1 shine serie - serie podcast - podcast rice - serie - shine 169 "Podcast über Ernährungstrends"
2 sitiation - sitiation in - die sitiation - gaza wie - wie ist 104 "Gaza-Situation und Konflikt"
3 umfrageergebnisse - merz - umfrageergebnisse umfrageergebnisse - friedrich - friedrich merz 104 Es tut mir leid, aber ich benötige mehr Informationen oder spezifische Inhalte aus den Dokumenten, um ein prägnantes und spezifisches Label zu generieren. Bitte teile mir den Inhalt oder das Thema der Dokumente mit.
4 wer wird - der bundestagswahl - gewinnen - wird bei - bundestagswahl gewinnen 98 Bundestagswahl 2025 Prognosen
5 passiert - ukraine - der ukraine - was passiert - in der 94 "Ukraine-Konflikt und Entwicklungen"
6 essen - frisch - isenschmid - isenschmid frisch - lachs 92 "Isenschmid Frisch Produkte"
7 artikel - es - über - zu - gibt 85 Es tut mir leid, aber ich benötige mehr Informationen oder spezifische Inhalte aus den Dokumenten, um ein prägnantes und spezifisches Label zu generieren. Bitte teilen Sie mir den Inhalt oder das Thema der Dokumente mit.
8 trump - macht trump - was macht - trumps - macht 85 "Bundesregierung Amtsantritt Stellungnahme"
9 afd - grünen - der grünen - sagt die - sagt 80 "AFD und Remigration"
10 umfragen - führen aktuell - zur bundestagswahl - welche parteien - umfragen zur 78 "Wahlumfragen und Parteien"
11 scholz - olaf scholz - olaf - scholz olaf - bernd 78 "Olaf Scholz und Politik"
12 deutschland deutschland - deutschland - zypern - schweiz - korea 70 "Deutschland und Identität"
13 bundestagswahl bundestagswahl - bundestagswahl - passiert im - im bundestag - bundestag 56 Bundestagswahl 2025
14 merkel - angela - angela merkel - trump - merkel angela 54 "Angela Merkel und Politik"
15 aldi - aldi süd - asylbewerberzahlen - asylbewerberzahlen deutschla - deutschla 48 "Deutsche Arbeitskultur und Regeln"
16 serie rice - podcast serie - shine podcast - serie - shine 47 "Reis und Kultur Podcast"
17 gaza was - in gaza - die neusten - neusten - neusten ereignisse 46 "Gaza Konflikt Ereignisse"
18 im nahen - nahen osten - nahen - osten - lage im 44 Nahostkonflikt und geopolitische Lage
19 alles - alles gesagt - gesagt - gesagt podcast - podcast alles 41 Podcast-Inhalte und Diskussionen
20 generated by - generated - utenseal - by - by utenseal 39 Es tut mir leid, aber ich benötige mehr Informationen oder spezifische Inhalte aus den Dokumenten, um ein prägnantes und spezifisches Label zu generieren. Bitte teilen Sie mir den Inhalt oder das Thema der Dokumente mit.
21 boltzmann - hürth - ersti - blühdorn - ersti gendern 37 "Boltzmann-Theorien und Anwendungen"
22 was geschah - grammys - geschah bei - geschah - den grammys 37 "Grammys 2025 Ereignisse"
23 test - test test - test generation - generation test - generation 36 "Testdokumente und Analyse"
24 - - - - 36 Es scheint, dass keine spezifischen Dokumente oder Inhalte bereitgestellt wurden. Bitte geben Sie die relevanten Informationen oder Dokumente an, damit ich ein prägnantes und spezifisches Label generieren kann.
25 seroe - podcast seroe - seroe rice - shine podcast - shine 34 "Reis und Podcast-Kultur"
26 erleichtert das - sterben - würde - das sterben - was erleichtert 32 "Würdevolles Sterben"

Training hyperparameters

  • calculate_probabilities: False
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 2)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.4
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.6.1
  • Sentence-transformers: 3.4.1
  • Transformers: 4.48.3
  • Numba: 0.58.1
  • Plotly: 6.0.0
  • Python: 3.9.6