Spaces:

randydev
/

Meta-AI

Running

App Files Files Community

Meta-AI / torrents /magnet_dl.py

randydev

Create magnet_dl.py

28577cd verified about 1 month ago

raw

history blame contribute delete

4.83 kB

	import asyncio
	import re
	import time
	import aiohttp
	import cloudscraper
	import requests
	from bs4 import BeautifulSoup
	from constants.base_url import MAGNETDL


	class Magnetdl:
	def __init__(self):
	self.BASE_URL = MAGNETDL
	self.LIMIT = None

	def _parser(self, htmls):
	try:
	for html in htmls:
	soup = BeautifulSoup(html, "html.parser")

	my_dict = {"data": []}
	table = soup.find("table", class_="download")
	for tr in soup.find_all("tr"):
	td = tr.find_all("td")
	if len(td) > 1:
	name = td[1].find("a").get_text(strip=True)
	if name != "":
	magnet = td[0].find("a")["href"]
	try:
	size = td[5].get_text(strip=True)
	except IndexError:
	size = None
	url = td[1].find("a")["href"]
	date = td[2].get_text(strip=True)
	seeders = td[6].get_text(strip=True)
	leechers = td[7].get_text(strip=True)
	category = td[3].text
	my_dict["data"].append(
	{
	"name": name,
	"size": size,
	"seeders": seeders,
	"leechers": leechers,
	"category": category,
	"hash": re.search(
	r"([{a-f\d,A-F\d}]{32,40})\b", magnet
	).group(0),
	"magnet": magnet,
	"url": self.BASE_URL + url,
	"date": date,
	}
	)
	if len(my_dict["data"]) == self.LIMIT:
	break
	total_results = soup.find("div", id="footer").text.replace(",", "")
	current_page = int(
	(re.search(r"Page\s\d*", total_results).group(0)).replace(
	"Page ", ""
	)
	)
	total_pages = (
	int(
	(
	(re.search(r"Found\s\d*", total_results).group(0)).replace(
	"Found ", ""
	)
	)
	)
	// 40
	)
	my_dict["current_page"] = current_page
	my_dict["total_pages"] = (
	30
	if total_pages > 30
	else total_pages
	if total_pages != 0
	else total_pages + 1
	)
	return my_dict
	except:
	return None

	async def _get_html(self, session, url):
	session = cloudscraper.create_scraper(sess=session)
	try:
	return session.get(url).text
	except:
	return None

	async def _get_all_results(self, session, url):
	return await asyncio.gather(asyncio.create_task(self._get_html(session, url)))

	async def search(self, query, page, limit):
	async with aiohttp.ClientSession() as session:
	start_time = time.time()
	self.LIMIT = limit
	query = requests.utils.unquote(query)
	query = query.split(" ")
	query = "-".join(query)
	url = self.BASE_URL + "/{}/{}/se/desc/{}/".format(query[0], query, page)
	return await self.parser_result(start_time, url, session)

	async def parser_result(self, start_time, url, session):
	data = await self._get_all_results(session, url)
	results = self._parser(data)
	if results is not None:
	results["time"] = time.time() - start_time
	results["total"] = len(results["data"])
	return results
	return results

	async def recent(self, category, page, limit):
	async with aiohttp.ClientSession() as session:
	start_time = time.time()
	self.LIMIT = limit
	if not category:
	url = self.BASE_URL + "/download/movies/{}".format(page)
	else:
	if category == "books":
	category = "e-books"
	url = self.BASE_URL + "/download/{}/{}/".format(category, page)
	return await self.parser_result(start_time, url, session)

	#! maximum page in category is 30