Spaces:

yash009
/

textgeneration

Runtime error

textgeneration / question_paper.py

Yash Sachdeva

solar

21e7dd1 about 1 year ago

798 Bytes

	import transformers
	import torch

	from fastapi import FastAPI

	from transformers import AutoModelForCausalLM, AutoTokenizer

	app = FastAPI()

	MODEL = None
	TOKENIZER = None


	@app.get("/")
	def llama():
	text = "Hi, my name is "
	inputs = TOKENIZER(text, return_tensors="pt")
	outputs = MODEL.generate(**inputs, max_new_tokens=64)
	tresponse = TOKENIZER.decode(outputs[0], skip_special_tokens=True)
	print(tresponse)

	return tresponse


	@app.on_event("startup")
	def init_model():
	global MODEL
	if not MODEL:
	print("loading model")
	TOKENIZER = AutoTokenizer.from_pretrained("Upstage/SOLAR-10.7B-v1.0")
	MODEL = AutoModelForCausalLM.from_pretrained("Upstage/SOLAR-10.7B-v1.0", device_map="auto", torch_dtype=torch.float16,)
	print("loaded model")