Spaces:

suprimedev
/

pdftotextz

Running

suprimedev commited on Aug 23

Commit

4d2d695

verified ·

1 Parent(s): 8f6558e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,31 +1,27 @@
 import gradio as gr
 import easyocr
-from pdf2image import convert_from_path
 from PIL import Image
 # مدل OCR فارسی و انگلیسی
 reader = easyocr.Reader(['fa', 'en'])
-def pdf_to_text(pdf_file):
     try:
-        # تبدیل صفحات PDF به تصاویر
-        images = convert_from_path(pdf_file.name)
-        full_text = ""
-        for img in images:
-            # OCR روی هر تصویر
-            text = reader.readtext(img, detail=0)
-            full_text += "\n".join(text) + "\n\n"
-        return full_text
     except Exception as e:
-        return f"خطا در پردازش PDF: {str(e)}"
 # رابط Gradio
 iface = gr.Interface(
-    fn=pdf_to_text,
-    inputs=gr.File(label="آپلود PDF"),
     outputs=gr.Textbox(label="متن استخراج شده", lines=20),
-    title="Persian PDF OCR",
-    description="فایل PDF خود را آپلود کنید تا متن فارسی و انگلیسی آن استخراج شود."
 )
 iface.launch()

 import gradio as gr
 import easyocr
 from PIL import Image
 # مدل OCR فارسی و انگلیسی
 reader = easyocr.Reader(['fa', 'en'])
+def image_to_text(image_file):
     try:
+        # باز کردن تصویر
+        img = Image.open(image_file.name)
+        # OCR روی تصویر
+        text = reader.readtext(img, detail=0)
+        return "\n".join(text)
     except Exception as e:
+        return f"خطا در پردازش تصویر: {str(e)}"
 # رابط Gradio
 iface = gr.Interface(
+    fn=image_to_text,
+    inputs=gr.File(label="آپلود تصویر (JPG/PNG)"),
     outputs=gr.Textbox(label="متن استخراج شده", lines=20),
+    title="Persian Image OCR",
+    description="یک تصویر فارسی یا انگلیسی آپلود کنید تا متن آن استخراج شود."
 )
 iface.launch()