File size: 6,698 Bytes
84e731e
988c70d
84e731e
988c70d
 
cf64182
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
52bab38
 
cf64182
 
 
 
 
84e731e
9fd3415
 
 
84e731e
988c70d
 
 
 
 
 
 
1eda1a2
 
 
9fd3415
 
 
 
 
 
 
 
 
 
dbe2643
9fd3415
 
 
988c70d
 
 
 
9fd3415
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
cf64182
1eda1a2
9fd3415
b8aba5d
84e731e
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
import gradio as gr
from deepthulac import LacModel, SEG_MODEL, POS_MODEL
# import jieba
lac_seg = LacModel.load(path=SEG_MODEL, device='cpu')
lac_pos = LacModel.load(path=POS_MODEL, device='cpu')
examples=["他在衬衫外套了件外套,出门去了。",
              "这件和服务必在今天裁剪完毕。",
              "把手抬起来",
              "这名研究生命大,躲过一劫。",
              "1953年袁隆平毕业于西南农学院,分发到湖南安江农业学校。袁隆平决意研究农产源于他目睹1959年湖南在三年大饥荒期间的惨状;[10]1966年2月他在中国科学院《科学通报》于文革休刊前最后一期赶及发表他第一篇论文,受国家科委注目,国家科委因而责成安江农业学校在湖南文革期间保护并支持袁隆平研究。[11][12][13]在国家科委支持下,袁隆平的水稻研究在1970至2000年代屡有突破,使他获联合国多项奖项和获封澳门科技大学荣誉博士,于2019年更获颁共和国勋章[14]。",
              "我们每个人之于世界就像一粒沙,但不同活法能过出不同的人生,平凡世界中的美好,永远属于那些主动发掘美好的人,属于那些拥有不凡的精神的人。当你开始在一颦一笑中,发现每一个人可爱的模样,你便懂得了欣赏,当你在春花秋月更替中,学会了珍惜和看淡无常,你便懂得了生命。",
              "对这个世界如果你有太多的抱怨 跌倒了就不敢继续往前走 为什么人要这么的脆弱堕落 请你打开电视看看 多少人为生命在努力勇敢的走下去 我们是不是该知足 珍惜一切就算没有拥有",
              "今天跟集美出去逛街啦,搞点神仙甜品778茶百道yyds,真的绝绝子 ~还点做了个隐藏甜品吃真的绝绝子啊!!茶百道的分装就是yyds",
              ]
examples = [
    "我爱北京天安门",
    # '上证报中国证券网讯 360集团创始人、董事长周鸿祎6月27日晚间在微博晒出清华大学录取通知书。通知书显示,周鸿祎被录取为清华大学计算机科学与技术系电子信息专业攻读博士学位研究生(非全日制、定向就业)。',
    '360公司创始人、董事长兼CEO周鸿祎在个人微博上晒出了清华大学研究生录取通知书,配文称“终于考上了,希望360智脑帮助我顺利毕业”。',
    '在国家科委支持下,袁隆平的水稻研究在1970至2000年代屡有突破,使他获联合国多项奖项和获封澳门科技大学荣誉博士,于2019年更获颁共和国勋章',
    '英国科学家艾萨克·牛顿出版《自然哲学的数学原理》,阐述运动定律和万有引力定律。',
    '英国罗斯林研究所研究的多莉出生,是世界上首只克隆成年体细胞成功的哺乳动物。',
    '忽如一夜春风来,千树万树梨花开。',
    '世有伯乐,然后有千里马。',
    "今天跟集美出去逛街啦,搞点神仙甜品778茶百道yyds,真的绝绝子~",
    '这名研究生命大,躲过一劫。',
    "他在衬衫外套了件外套,出门去了。",
    "当你开始在一颦一笑中,发现每一个人可爱的模样,你便懂得了欣赏,当你在春花秋月更替中,学会了珍惜和看淡无常,你便懂得了生命。"
]

def infer(
    input_text,
    **kwargs,
):
    seg_res = lac_seg.seg(input_text.split('\n'), split_long=False)['seg']['res']
    seg_res = '\n'.join([' / '.join(r) for r in seg_res])
    pos_res = lac_pos.seg(input_text.split('\n'), split_long=False)['pos']['res']
    pos_res = '\n'.join(['  '.join(r) for r in pos_res])
    # return '\n'.join([' / '.join(r) for r in res])  # , '\n'.join([' / '.join(jieba.cut(sent)) for sent in input_text.split('\n')])
    # return '\n'.join([' / '.join(r) for r in res]), 
    return seg_res, pos_res

# https://discuss.huggingface.co/t/connection-errored-out/25329
# https://discuss.huggingface.co/t/error-connection-errored-out-during-processing/23439
gr.Interface(
    fn=infer,
    inputs=[
        gr.components.Textbox(
            lines=5,
            label="待分词文本",
            placeholder="他在衬衫外套了件外套,出门去了。",
        ),
    ],
    outputs=[
        gr.components.Textbox(
            lines=5,
            label="分词结果",
        ),
        gr.components.Textbox(
            lines=5,
            label="分词+词性标注结果",
        ),
        # gr.inputs.Textbox(
        #    lines=5,
        #    label="jieba(对照)",
        # )
    ],
    title="DeepTHULAC在线分词演示",
    description="",
    # article="<strong>一些较难的分词例子</strong>:<br/>他在衬衫外套了件外套,出门去了。<br/>"
    # "这件和服务必在今天裁剪完毕。<br/>"
    # "把手抬起来!<br/>"
    # "这件和服务必于今日裁剪完毕。<br/>"
    # "这名研究生命大,躲过一劫。<br/>"
    # "<strong>一些分词例子</strong>:<br/>"
    # "1953年袁隆平毕业于西南农学院,分发到湖南安江农业学校。袁隆平决意研究农产源于他目睹1959年湖南在三年大饥荒期间的惨状;[10]1966年2月他在中国科学院《科学通报》于文革休刊前最后一期赶及发表他第一篇论文,受国家科委注目,国家科委因而责成安江农业学校在湖南文革期间保护并支持袁隆平研究。[11][12][13]在国家科委支持下,袁隆平的水稻研究在1970至2000年代屡有突破,使他获联合国多项奖项和获封澳门科技大学荣誉博士,于2019年更获颁共和国勋章[14]。<br/>"
    # "我们每个人之于世界就像一粒沙,但不同活法能过出不同的人生,平凡世界中的美好,永远属于那些主动发掘美好的人,属于那些拥有不凡的精神的人。当你开始在一颦一笑中,发现每一个人可爱的模样,你便懂得了欣赏,当你在春花秋月更替中,学会了珍惜和看淡无常,你便懂得了生命。<br/>"
    # "对这个世界如果你有太多的抱怨 跌倒了就不敢继续往前走 为什么人要这么的脆弱堕落 请你打开电视看看 多少人为生命在努力勇敢的走下去 我们是不是该知足 珍惜一切就算没有拥有<br/>"
    # "今天跟集美出去逛街啦,搞点神仙甜品778茶百道yyds,真的绝绝子 ~还点做了个隐藏甜品吃真的绝绝子啊!!茶百道的分装就是yyds<br/>"
    # "<br/>",
    examples=examples,
    cache_examples=False,
    theme=gr.themes.Default(spacing_size="sm", radius_size="none", text_size=gr.themes.sizes.text_lg)
).launch()