Spaces:

kollera
/

zerospam

Runtime error

kollera commited on Oct 29, 2024

Commit

56863df

verified ·

1 Parent(s): 6382463

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,17 +1,21 @@
 import gradio as gr
 from transformers import pipeline, Trainer, TrainingArguments, DistilBertForSequenceClassification, DistilBertTokenizer
 from datasets import load_dataset
 # Carica il dataset di spam detection da Hugging Face
 dataset = load_dataset("tanquangduong/spam-detection-dataset-splits")
 # Carica il tokenizer e il modello pre-addestrato
 tokenizer = DistilBertTokenizer.from_pretrained("distilbert-base-uncased")
 model = DistilBertForSequenceClassification.from_pretrained("distilbert-base-uncased")
-# Tokenizza il dataset
 def tokenize_function(examples):
-    return tokenizer(examples['message'], truncation=True, padding="max_length", max_length=128)
 tokenized_datasets = dataset.map(tokenize_function, batched=True)

 import gradio as gr
 from transformers import pipeline, Trainer, TrainingArguments, DistilBertForSequenceClassification, DistilBertTokenizer
 from datasets import load_dataset
+import torch
 # Carica il dataset di spam detection da Hugging Face
 dataset = load_dataset("tanquangduong/spam-detection-dataset-splits")
+# Visualizza i nomi delle colonne per verificare quale contiene il testo delle email
+print(dataset['train'].column_names)
 # Carica il tokenizer e il modello pre-addestrato
 tokenizer = DistilBertTokenizer.from_pretrained("distilbert-base-uncased")
 model = DistilBertForSequenceClassification.from_pretrained("distilbert-base-uncased")
+# Aggiorna il nome della colonna con il nome corretto
 def tokenize_function(examples):
+    return tokenizer(examples['text'], truncation=True, padding="max_length", max_length=128)
 tokenized_datasets = dataset.map(tokenize_function, batched=True)