Spaces:

imkhan107
/

gen-slides

Runtime error

App Files Files Community

gen-slides / genppt.py

imkhan107

Upload 8 files

6787477 verified about 1 year ago

raw

history blame contribute delete

4.48 kB

	import json
	import os
	from typing import Optional, List, Dict, Any

	from ppt import SlideDeck
	from gemini import GeminiModel, LangchainGemini
	from prompts import get_ppt_prompt
	from utils import parse_page_ranges

	# Define available models
	MODELS: Dict[str, Any] = {
	"gemini_flash_l": LangchainGemini,
	"gemini_flash": GeminiModel
	}

	class GenPPT:
	"""
	A class to generate PowerPoint presentations from text or PDF sources using AI models.
	"""

	def __init__(
	self,
	source: str = "",
	text: str = "",
	agenda: str = "Generic",
	model_name: str = "gemini_flash_l",
	llm_api_key: Optional[str] = None,
	pages: Optional[str] = None,
	max_pages: int = 20,
	):
	"""
	Initialize the GenPPT object.

	Args:
	source (str): Path to the source PDF file.
	text (str): Input text for presentation generation.
	agenda (str): Agenda type for the presentation.
	model_name (str): Name of the AI model to use.
	llm_api_key (Optional[str]): API key for the language model.
	pages (Optional[str]): Page range to extract from PDF.
	max_pages (int): Maximum number of pages to process.
	"""
	self.source: Optional[str] = source.strip() or None
	self.text: Optional[str] = text.strip() or None
	self.agenda: str = agenda.strip() or "Generic"

	self.max_pages: int = max_pages
	self.pages=pages

	self.model_name: str = model_name.strip()
	try:
	self.llm = MODELS[self.model_name](API_KEY=llm_api_key)
	except KeyError:
	print(f"Warning: Model '{self.model_name}' not found. Using default model.")
	self.llm = MODELS["gemini_flash_l"](API_KEY=llm_api_key)

	def run(self) -> Optional[Any]:
	"""
	Run the presentation generation process.

	Returns:
	Optional[Any]: Generated presentation or None if an error occurs.
	"""
	try:
	if self.text is None:
	if self.source is not None:
	self.text = self.extract_markdown_from_pdf()
	else:
	raise ValueError("Both source and text cannot be None.")

	slides = self.generate_slides()
	return self.generate_presentation(slides)
	except Exception as e:
	print(f"An error occurred during presentation generation: {e}")
	return None

	def extract_markdown_from_pdf(self) -> str:
	"""
	Extract markdown content from the source PDF.

	Returns:
	str: Extracted markdown text.

	Raises:
	ImportError: If pymupdf4llm is not installed.
	FileNotFoundError: If the source PDF file is not found.
	"""
	try:
	import pymupdf4llm
	except ImportError:
	raise ImportError("pymupdf4llm is required for PDF extraction. Please install it.")

	if not os.path.exists(self.source):
	raise FileNotFoundError(f"Source PDF file not found: {self.source}")

	print(f"Extracting {len(self.pages)} pages")
	return pymupdf4llm.to_markdown(self.source, pages=self.pages)

	def generate_slides(self) -> List[Dict[str, Any]]:
	"""
	Generate slide content using the AI model.

	Returns:
	List[Dict[str, Any]]: List of slide data dictionaries.

	Raises:
	ValueError: If the model response is invalid.
	"""
	prompt = f"{get_ppt_prompt()}\nAgenda: {self.agenda}\nContent: {self.text}"
	resp = self.llm.execute(prompt)

	try:
	return json.loads(resp.content.strip("```").replace("json", "").strip())
	except json.JSONDecodeError as e:
	raise ValueError(f"Invalid model response: {e}")

	def generate_presentation(self, content: List[Dict[str, Any]]) -> Any:
	"""
	Create the final presentation using the generated slide content.

	Args:
	content (List[Dict[str, Any]]): List of slide data dictionaries.

	Returns:
	Any: The generated presentation object.
	"""
	deck = SlideDeck()
	title_slide_data, *slides_data = content
	return deck.create_presentation(title_slide_data, slides_data)