Spaces:

celise88
/

Pathfinder

Runtime error

App Files Files Community

celise88 commited on Jan 29, 2024

Commit

c8742c4

1 Parent(s): 7a72283

package version bug fix

Browse files

Files changed (3) hide show

main.py +14 -15
match_utils.py +10 -17
requirements.txt +2 -5

main.py CHANGED Viewed

@@ -12,7 +12,6 @@ from fastapi.templating import Jinja2Templates
 from fastapi.staticfiles import StaticFiles
 from fastapi.responses import HTMLResponse
 import pandas as pd
-import time
 from uuid import uuid1
 from mangum import Mangum
 from localStoragePy import localStoragePy
@@ -171,24 +170,24 @@ async def post_matches(request: Request, bt: BackgroundTasks, resume: UploadFile
     username = localStorage.getItem('username')
-    def add_data_to_db(skills):
         db = pd.read_csv('static/res_embeddings.csv')
-        embeds = format(skillEmbed(skills)).replace('[[','').replace(']]','').replace('[','').replace(']','').split(',')
         db.iloc[db['username']== username,5:] = embeds
         db.to_csv('static/res_embeddings.csv', index=False)
-    def get_jobs_from_db(skills):
-        job_matches = sim_result_loop_jobFinder(skills)
         print(job_matches)
     resume = get_resume(resume)
     skills = skill_extractor(resume)
-    simResults = await sim_result_loop(skills)
     links = get_links(simResults[0])
     if username is not None:
-        bt.add_task(add_data_to_db, skills)
-        bt.add_task(get_jobs_from_db, skills)
     return templates.TemplateResponse('find_my_match.html', context={'request': request, 'resume': resume, 'skills': skills, 'simResults': simResults[0], 'links': links, 'statelist': statelist})
@@ -212,24 +211,24 @@ async def post_matches(request: Request, bt: BackgroundTasks, jobdesc: UploadFil
     username = localStorage.getItem('username')
-    def add_data_to_db(skills):
         db = pd.read_csv('static/jd_embeddings.csv')
-        embeds = format(skillEmbed(skills)).replace('[[','').replace(']]','').split(',')
         db.iloc[db['username']== username,5:] = embeds
         db.to_csv('static/jd_embeddings.csv', index=False)
-    def get_cand_from_db(skills):
-        cand_matches = sim_result_loop_candFinder(skills)
         print(cand_matches)
     jobdesc = get_resume(jobdesc)
     skills = skill_extractor(jobdesc)
-    simResults = await sim_result_loop(skills)
     links = get_links(simResults[0])
     if username is not None:
-        bt.add_task(add_data_to_db, skills)
-        bt.add_task(get_cand_from_db, skills)
     return templates.TemplateResponse('candidate_matcher.html', context={'request': request, 'jobdesc': jobdesc, 'skills': skills, 'simResults': simResults[0], 'links': links})

 from fastapi.staticfiles import StaticFiles
 from fastapi.responses import HTMLResponse
 import pandas as pd
 from uuid import uuid1
 from mangum import Mangum
 from localStoragePy import localStoragePy
     username = localStorage.getItem('username')
+    def add_data_to_db(resume):
         db = pd.read_csv('static/res_embeddings.csv')
+        embeds = format(skillEmbed(resume)).replace('[[','').replace(']]','').replace('[','').replace(']','').split(',')
         db.iloc[db['username']== username,5:] = embeds
         db.to_csv('static/res_embeddings.csv', index=False)
+    def get_jobs_from_db(resume):
+        job_matches = sim_result_loop_jobFinder(resume)
         print(job_matches)
     resume = get_resume(resume)
     skills = skill_extractor(resume)
+    simResults = await sim_result_loop(resume)
     links = get_links(simResults[0])
     if username is not None:
+        bt.add_task(add_data_to_db, resume)
+        bt.add_task(get_jobs_from_db, resume)
     return templates.TemplateResponse('find_my_match.html', context={'request': request, 'resume': resume, 'skills': skills, 'simResults': simResults[0], 'links': links, 'statelist': statelist})
     username = localStorage.getItem('username')
+    def add_data_to_db(jobdesc):
         db = pd.read_csv('static/jd_embeddings.csv')
+        embeds = format(skillEmbed(jobdesc)).replace('[[','').replace(']]','').split(',')
         db.iloc[db['username']== username,5:] = embeds
         db.to_csv('static/jd_embeddings.csv', index=False)
+    def get_cand_from_db(jobdesc):
+        cand_matches = sim_result_loop_candFinder(jobdesc)
         print(cand_matches)
     jobdesc = get_resume(jobdesc)
     skills = skill_extractor(jobdesc)
+    simResults = await sim_result_loop(jobdesc)
     links = get_links(simResults[0])
     if username is not None:
+        bt.add_task(add_data_to_db, jobdesc)
+        bt.add_task(get_cand_from_db, jobdesc)
     return templates.TemplateResponse('candidate_matcher.html', context={'request': request, 'jobdesc': jobdesc, 'skills': skills, 'simResults': simResults[0], 'links': links})

match_utils.py CHANGED Viewed

@@ -24,8 +24,8 @@ simdat = pd.read_csv('static/embeddings/cohere_embeddings.csv')
 coheredat = pd.read_csv('static/cohere_tSNE_dat.csv')
 # LOAD LLM MODELS:
-model = Ollama(model="mistral")
-embedding_model = OllamaEmbeddings(model="mistral")
 parser = CommaSeparatedListOutputParser()
 # UTILITY FUNCTIONS
@@ -81,20 +81,13 @@ def skill_extractor(resume):
      return parser.parse(result)
-def skillEmbed(skills):
-    embeddings = embedding_model.embed_query(skills)
     return embeddings
-async def sim_result_loop(skilltext):
-    if type(skilltext) == str:
-        skills = skilltext
-    if type(skilltext) == dict:
-        skills = [key for key, value in skilltext.items() if value == "Skill"]
-        skills = str(skills).replace("'", "").replace(",", "")
-    if type(skilltext) == list:
-        skills = ', '.join(skilltext)
-    embeds = skillEmbed(skills)
     def cosine(A, B):
         return np.dot(A,B)/(norm(A)*norm(B))
     def format_sim(sim):
@@ -125,8 +118,8 @@ def get_links(simResults):
     return links
-def sim_result_loop_jobFinder(skills):
-    embeds = skillEmbed(skills)
     def cosine(A, B):
         return np.dot(A,B)/(norm(A)*norm(B))
     def format_sim(sim):
@@ -147,8 +140,8 @@ def sim_result_loop_jobFinder(skills):
     return simResults
-def sim_result_loop_candFinder(skills):
-    embeds = skillEmbed(skills)
     def cosine(A, B):
         return np.dot(A,B)/(norm(A)*norm(B))
     def format_sim(sim):

 coheredat = pd.read_csv('static/cohere_tSNE_dat.csv')
 # LOAD LLM MODELS:
+model = Ollama(model="mistral", temperature=0)
+embedding_model = OllamaEmbeddings(model="mistral", temperature=0)
 parser = CommaSeparatedListOutputParser()
 # UTILITY FUNCTIONS
      return parser.parse(result)
+def skillEmbed(resume):
+    embeddings = embedding_model.embed_query(resume)
     return embeddings
+async def sim_result_loop(resume):
+    embeds = skillEmbed(resume)
     def cosine(A, B):
         return np.dot(A,B)/(norm(A)*norm(B))
     def format_sim(sim):
     return links
+def sim_result_loop_jobFinder(jobdesc):
+    embeds = skillEmbed(jobdesc)
     def cosine(A, B):
         return np.dot(A,B)/(norm(A)*norm(B))
     def format_sim(sim):
     return simResults
+def sim_result_loop_candFinder(resume):
+    embeds = skillEmbed(resume)
     def cosine(A, B):
         return np.dot(A,B)/(norm(A)*norm(B))
     def format_sim(sim):

requirements.txt CHANGED Viewed

@@ -11,16 +11,13 @@ python-docx==0.8.11
 aiofiles==22.1.0
 nltk==3.8.1
 unidecode==1.3.6
-cohere==3.1.5
-python-dotenv==0.21.1
-transformers==4.25.1
 torch==1.13.1
-accelerate==0.16.0
 plotly-express==0.4.1
 bcrypt==4.0.1
 passlib==1.7.4
 localStoragePy==0.2.3
-sentence-transformers==2.2.2
 mangum==0.17.0
 certifi==2023.7.22
 langchain==0.1.4

 aiofiles==22.1.0
 nltk==3.8.1
 unidecode==1.3.6
+transformers==4.37.2
 torch==1.13.1
+accelerate==0.26.1
 plotly-express==0.4.1
 bcrypt==4.0.1
 passlib==1.7.4
 localStoragePy==0.2.3
 mangum==0.17.0
 certifi==2023.7.22
 langchain==0.1.4