Spaces:

SoulofSukuna
/

Tor-Search-Api

Sleeping

App Files Files Community

Tor-Search-Api / torrents /x1337.py

SoulofSukuna

Update torrents/x1337.py

3917f77 verified 7 months ago

raw

history blame contribute delete

7.22 kB

	import asyncio
	import re
	import time
	import cloudscraper
	from bs4 import BeautifulSoup
	from helper.asyncioPoliciesFix import decorator_asyncio_fix
	from constants.base_url import X1337
	from constants.headers import HEADER_AIO

	class x1337:
	def __init__(self):
	self.BASE_URL = X1337
	self.LIMIT = None
	self.scraper = cloudscraper.create_scraper()

	@decorator_asyncio_fix
	async def _individual_scrap(self, url, obj):
	try:
	html = await asyncio.to_thread(self.scraper.get, url, headers=HEADER_AIO)
	html = html.text
	soup = BeautifulSoup(html, "html.parser")
	try:
	magnet = soup.select_one(".no-top-radius > div > ul > li > a")["href"]
	uls = soup.find_all("ul", class_="list")[1]
	lis = uls.find_all("li")[0]
	imgs = [
	img["data-original"]
	for img in (soup.find("div", id="description")).find_all("img")
	if img["data-original"].endswith((".png", ".jpg", ".jpeg"))
	]
	files = [f.text for f in soup.find("div", id="files").find_all("li")]
	if len(imgs) > 0:
	obj["screenshot"] = imgs
	obj["category"] = lis.find("span").text
	obj["files"] = files
	try:
	poster = soup.select_one("div.torrent-image img")["src"]
	if str(poster).startswith("//"):
	obj["poster"] = "https:" + poster
	elif str(poster).startswith("/"):
	obj["poster"] = self.BASE_URL + poster
	except:
	pass
	obj["magnet"] = magnet
	obj["hash"] = re.search(r"([{a-f\d,A-F\d}]{32,40})\b", magnet).group(0)
	except IndexError:
	pass
	except:
	return None

	async def _get_torrent(self, result, urls):
	tasks = []
	for idx, url in enumerate(urls):
	for obj in result["data"]:
	if obj["url"] == url:
	task = asyncio.create_task(self._individual_scrap(url, result["data"][idx]))
	tasks.append(task)
	await asyncio.gather(*tasks)
	return result

	def _parser(self, htmls):
	try:
	for html in htmls:
	soup = BeautifulSoup(html, "html.parser")
	list_of_urls = []
	my_dict = {"data": []}
	trs = soup.select("tbody tr")
	for tr in trs:
	td = tr.find_all("td")
	name = td[0].find_all("a")[-1].text
	if name:
	url = self.BASE_URL + td[0].find_all("a")[-1]["href"]
	list_of_urls.append(url)
	seeders = td[1].text
	leechers = td[2].text
	date = td[3].text
	size = td[4].text.replace(seeders, "")
	uploader = td[5].find("a").text

	my_dict["data"].append(
	{
	"name": name,
	"size": size,
	"date": date,
	"seeders": seeders,
	"leechers": leechers,
	"url": url,
	"uploader": uploader,
	}
	)
	if len(my_dict["data"]) == self.LIMIT:
	break
	try:
	pages = soup.select(".pagination li a")
	my_dict["current_page"] = int(pages[0].text)
	tpages = pages[-1].text
	if tpages == ">>":
	my_dict["total_pages"] = int(pages[-2].text)
	else:
	my_dict["total_pages"] = int(pages[-1].text)
	except:
	pass
	return my_dict, list_of_urls
	except:
	return None, None

	async def search(self, query, page, limit):
	self.LIMIT = limit
	start_time = time.time()
	url = self.BASE_URL + "/search/{}/{}/".format(query, page)
	return await self.parser_result(start_time, url, query=query, page=page)

	async def parser_result(self, start_time, url, page, query=None):
	html = await asyncio.to_thread(self.scraper.get, url, headers=HEADER_AIO)
	htmls = [html.text]
	result, urls = self._parser(htmls)
	if result is not None:
	results = await self._get_torrent(result, urls)
	results["time"] = time.time() - start_time
	results["total"] = len(results["data"])
	if query is None:
	return results
	while True:
	if len(results["data"]) >= self.LIMIT:
	results["data"] = results["data"][: self.LIMIT]
	results["total"] = len(results["data"])
	return results
	page += 1
	url = self.BASE_URL + "/search/{}/{}/".format(query, page)
	html = await asyncio.to_thread(self.scraper.get, url, headers=HEADER_AIO)
	htmls = [html.text]
	result, urls = self._parser(htmls)
	if result is not None:
	if len(result["data"]) > 0:
	res = await self._get_torrent(result, urls)
	for obj in res["data"]:
	results["data"].append(obj)
	try:
	results["current_page"] = res["current_page"]
	except:
	pass
	results["time"] = time.time() - start_time
	results["total"] = len(results["data"])
	else:
	break
	else:
	break
	return results
	return result

	async def trending(self, category, page, limit):
	start_time = time.time()
	self.LIMIT = limit
	if not category:
	url = self.BASE_URL + "/home/"
	else:
	url = self.BASE_URL + "/popular-{}".format(category.lower())
	return await self.parser_result(start_time, url, page)

	async def recent(self, category, page, limit):
	start_time = time.time()
	self.LIMIT = limit
	if not category:
	url = self.BASE_URL + "/trending"
	else:
	url = self.BASE_URL + "/cat/{}/{}/".format(
	str(category).capitalize(), page
	)
	return await self.parser_result(start_time, url, page)

	async def search_by_category(self, query, category, page, limit):
	start_time = time.time()
	self.LIMIT = limit
	url = self.BASE_URL + "/category-search/{}/{}/{}/".format(
	query, category.capitalize(), page
	)
	return await self.parser_result(start_time, url, page, query)