Spaces:

chewing
/

nai3_TagsQuester

Sleeping

chewing commited on Jan 16, 2024

Commit

adc3a3a

1 Parent(s): 580c19f

添加tagger

Files changed (3) hide show

app.py CHANGED Viewed

@@ -1,4 +1,3 @@
-import streamlit as st
 from tagger_map import Tagger as Tagger_Map
 from tagger_map import zh_dict
@@ -7,15 +6,34 @@ def search_text(search_sentences,topn= 5):
     search_sentences = search_sentences.replace("_"," ")
     search_sentences = search_sentences.strip()
     if search_sentences not in zh_dict:
-        return ["error"]
     else:
         rtn0 = tagger_map.get_top_weighted_neighbors(search_sentences,topn)
     rtn = []
     for tag in rtn0:
         rtn.append(f"{tag.replace(' ','_')}《{zh_dict[tag]}》")
-    return rtn
-x = st.slider('Select a value')
-st.write(x, 'squared is', x * x)

 from tagger_map import Tagger as Tagger_Map
 from tagger_map import zh_dict
     search_sentences = search_sentences.replace("_"," ")
     search_sentences = search_sentences.strip()
     if search_sentences not in zh_dict:
+        log = "数据库内未找到相似tag，您是否在查询以下tag?"
+        rtn0 = tagger_map.fuzzy_complete_word(search_sentences,topn)
     else:
+        log = " 查询结果："
         rtn0 = tagger_map.get_top_weighted_neighbors(search_sentences,topn)
     rtn = []
     for tag in rtn0:
         rtn.append(f"{tag.replace(' ','_')}《{zh_dict[tag]}》")
+    return log, rtn
+# -----------------------------
+import streamlit as st
+# 创建一个文本输入框
+input_text = st.text_input("查询tag")
+# 创建一个滑动条，范围从1到10
+n = st.slider("查询数量", min_value=5, max_value=30,value=5,step=5)
+# 初始化结果区域
+result = ""
+# 当输入栏有内容时，进行计算并将结果显示在屏幕上
+if input_text:
+    log, rtn_0 = search_text(input_text, n)
+    result = f'### {log}\n - ' + '\n- '.join(rtn_0)
+# 显示结果
+with st.container():
+    st.markdown(result)

requirements.txt CHANGED Viewed

@@ -1,3 +1,4 @@
 RainbowPrint
 bidict
-networkx

 RainbowPrint
 bidict
+networkx
+fuzzywuzzy

tagger_map.py CHANGED Viewed

@@ -4,6 +4,7 @@ import networkx as nx
 import heapq
 from bidict import bidict
 from RainbowPrint import RainbowPrint as rp
 zh_path = r"./data/all_name_id_zh.txt"
@@ -58,7 +59,13 @@ class Tagger():
         # 仅返回邻居节点的标识
         return [self.nodes_id.inverse[nbr] for _, nbr in top_neighbors_with_weights]
 if __name__ == '__main__':

 import heapq
 from bidict import bidict
 from RainbowPrint import RainbowPrint as rp
+from fuzzywuzzy import process
 zh_path = r"./data/all_name_id_zh.txt"
         # 仅返回邻居节点的标识
         return [self.nodes_id.inverse[nbr] for _, nbr in top_neighbors_with_weights]
+    def fuzzy_complete_word(self, query, limit=5):
+        vocabulary = list(self.nodes_id.keys())
+        results = process.extract(query, vocabulary, limit=limit)
+        # 提取匹配词汇
+        matches = [result[0] for result in results]
+        rp.debug('map: fuzzy:', matches)
+        return matches
 if __name__ == '__main__':