HDBSCAN_45_8_ngram3

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("Trubnik1967/HDBSCAN_45_8_ngram3")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 9
  • Number of training documents: 29572
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 но 44444444444444444444444111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111 - 44444444444444444444444111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111 - но - - 540 -1_но 44444444444444444444444111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111_44444444444444444444444111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111_но_
0 не - деньга - продавец - товар - прийти 2 0_не_деньга_продавец_товар
1 размер - не - маленький - но - продавец 15435 1_размер_не_маленький_но
2 не - ткань - нитка - шов - торчать 7050 2_не_ткань_нитка_шов
3 качество - не - плохой - ужасный - качество не 2407 3_качество_не_плохой_ужасный
4 цвет - не - фото - цвет не - картинка 1354 4_цвет_не_фото_цвет не
5 брак - прийти - дырка - не - прийти брак 1247 5_брак_прийти_дырка_не
6 запах - не - стирка - ужасный - качество 980 6_запах_не_стирка_ужасный
7 описание - соответствовать - не соответствовать - соответствовать описание - не 557 7_описание_соответствовать_не соответствовать_соответствовать описание

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 100
  • n_gram_range: (1, 3)
  • nr_topics: 9
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: True
  • zeroshot_min_similarity: None
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.25.2
  • HDBSCAN: 0.8.33
  • UMAP: 0.5.5
  • Pandas: 1.5.3
  • Scikit-Learn: 1.2.2
  • Sentence-transformers: 2.5.1
  • Transformers: 4.39.0
  • Numba: 0.58.1
  • Plotly: 5.15.0
  • Python: 3.10.12
Downloads last month
5
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.