Spaces:

randydev
/

Meta-AI

Running

App Files Files Community

randydev commited on Feb 19

Commit

28577cd

verified ·

1 Parent(s): fe38f2a

Create magnet_dl.py

Browse files

Files changed (1) hide show

torrents/magnet_dl.py +124 -0

torrents/magnet_dl.py ADDED Viewed

	@@ -0,0 +1,124 @@

+import asyncio
+import re
+import time
+import aiohttp
+import cloudscraper
+import requests
+from bs4 import BeautifulSoup
+from constants.base_url import MAGNETDL
+class Magnetdl:
+    def __init__(self):
+        self.BASE_URL = MAGNETDL
+        self.LIMIT = None
+    def _parser(self, htmls):
+        try:
+            for html in htmls:
+                soup = BeautifulSoup(html, "html.parser")
+                my_dict = {"data": []}
+                table = soup.find("table", class_="download")
+                for tr in soup.find_all("tr"):
+                    td = tr.find_all("td")
+                    if len(td) > 1:
+                        name = td[1].find("a").get_text(strip=True)
+                        if name != "":
+                            magnet = td[0].find("a")["href"]
+                            try:
+                                size = td[5].get_text(strip=True)
+                            except IndexError:
+                                size = None
+                            url = td[1].find("a")["href"]
+                            date = td[2].get_text(strip=True)
+                            seeders = td[6].get_text(strip=True)
+                            leechers = td[7].get_text(strip=True)
+                            category = td[3].text
+                            my_dict["data"].append(
+                                {
+                                    "name": name,
+                                    "size": size,
+                                    "seeders": seeders,
+                                    "leechers": leechers,
+                                    "category": category,
+                                    "hash": re.search(
+                                        r"([{a-f\d,A-F\d}]{32,40})\b", magnet
+                                    ).group(0),
+                                    "magnet": magnet,
+                                    "url": self.BASE_URL + url,
+                                    "date": date,
+                                }
+                            )
+                        if len(my_dict["data"]) == self.LIMIT:
+                            break
+                total_results = soup.find("div", id="footer").text.replace(",", "")
+                current_page = int(
+                    (re.search(r"Page\s\d*", total_results).group(0)).replace(
+                        "Page ", ""
+                    )
+                )
+                total_pages = (
+                    int(
+                        (
+                            (re.search(r"Found\s\d*", total_results).group(0)).replace(
+                                "Found ", ""
+                            )
+                        )
+                    )
+                    // 40
+                )
+                my_dict["current_page"] = current_page
+                my_dict["total_pages"] = (
+                    30
+                    if total_pages > 30
+                    else total_pages
+                    if total_pages != 0
+                    else total_pages + 1
+                )
+                return my_dict
+        except:
+            return None
+    async def _get_html(self, session, url):
+        session = cloudscraper.create_scraper(sess=session)
+        try:
+            return session.get(url).text
+        except:
+            return None
+    async def _get_all_results(self, session, url):
+        return await asyncio.gather(asyncio.create_task(self._get_html(session, url)))
+    async def search(self, query, page, limit):
+        async with aiohttp.ClientSession() as session:
+            start_time = time.time()
+            self.LIMIT = limit
+            query = requests.utils.unquote(query)
+            query = query.split(" ")
+            query = "-".join(query)
+            url = self.BASE_URL + "/{}/{}/se/desc/{}/".format(query[0], query, page)
+            return await self.parser_result(start_time, url, session)
+    async def parser_result(self, start_time, url, session):
+        data = await self._get_all_results(session, url)
+        results = self._parser(data)
+        if results is not None:
+            results["time"] = time.time() - start_time
+            results["total"] = len(results["data"])
+            return results
+        return results
+    async def recent(self, category, page, limit):
+        async with aiohttp.ClientSession() as session:
+            start_time = time.time()
+            self.LIMIT = limit
+            if not category:
+                url = self.BASE_URL + "/download/movies/{}".format(page)
+            else:
+                if category == "books":
+                    category = "e-books"
+                url = self.BASE_URL + "/download/{}/{}/".format(category, page)
+            return await self.parser_result(start_time, url, session)
+    #! maximum page in category is 30