Spaces:

MjolnirThor
/

flan-t5-custom-handler

Paused

MjolnirThor commited on Nov 18, 2024

Commit

13b79a4

verified ·

1 Parent(s): 232a012

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,24 +1,53 @@
-from fastapi import FastAPI, HTTPException
-from handler import EndpointHandler
-from pydantic import BaseModel
-class Input(BaseModel):
-    inputs: str
-app = FastAPI()
-handler = EndpointHandler()
-@app.post("/generate")
-async def generate(input_data: Input):
-    try:
-        result = handler({"inputs": input_data.inputs})
-        return result
-    except Exception as e:
-        raise HTTPException(status_code=500, detail=str(e))
-@app.get("/")
-async def root():
-    return {
-        "message": "FLAN-T5 Custom Handler API",
-        "usage": "POST /generate with {'inputs': 'your text here'}"
-    }

+from datasets import load_dataset
+from transformers import (
+    AutoModelForSeq2SeqLM,
+    AutoTokenizer,
+    Trainer,
+    DataCollatorForSeq2Seq
+)
+from training_config import training_args
+import os
+# Load dataset
+dataset = load_dataset("health360/Healix-Shot", split=f"train[:100000]")
+# Initialize model and tokenizer
+model_name = "google/flan-t5-large"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
+model = AutoModelForSeq2SeqLM.from_pretrained(model_name)
+def tokenize_function(examples):
+    return tokenizer(
+        examples['text'],
+        padding="max_length",
+        truncation=True,
+        max_length=512,
+        return_attention_mask=True
+    )
+# Process dataset
+train_test_split = dataset.train_test_split(test_size=0.1)
+tokenized_train = train_test_split['train'].map(
+    tokenize_function,
+    batched=True,
+    remove_columns=dataset.column_names
+)
+tokenized_eval = train_test_split['test'].map(
+    tokenize_function,
+    batched=True,
+    remove_columns=dataset.column_names
+)
+# Initialize trainer
+trainer = Trainer(
+    model=model,
+    args=training_args,
+    train_dataset=tokenized_train,
+    eval_dataset=tokenized_eval,
+    data_collator=DataCollatorForSeq2Seq(tokenizer=tokenizer, model=model)
+)
+# Train and save
+trainer.train()
+model.push_to_hub("MjolnirThor/flan-t5-custom-handler")
+tokenizer.push_to_hub("MjolnirThor/flan-t5-custom-handler")