Update README.md
Browse files
README.md
CHANGED
@@ -36,7 +36,7 @@ It achieves the following results on the evaluation set:
|
|
36 |
|
37 |
아래 항목에 대한 개체명 인식을 제공합니다.
|
38 |
|
39 |
-
- 사람이름 [PS]
|
40 |
- 주소 (구 주소 및 도로명 주소) [AD]
|
41 |
- 카드번호 [CN]
|
42 |
- 계좌번호 [BN]
|
@@ -76,4 +76,29 @@ The following hyperparameters were used during training:
|
|
76 |
- Transformers 4.40.2
|
77 |
- Pytorch 2.3.0+cu118
|
78 |
- Datasets 2.19.1
|
79 |
-
- Tokenizers 0.19.1
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
36 |
|
37 |
아래 항목에 대한 개체명 인식을 제공합니다.
|
38 |
|
39 |
+
- 사람이름 [PS] - 낮은 인식률
|
40 |
- 주소 (구 주소 및 도로명 주소) [AD]
|
41 |
- 카드번호 [CN]
|
42 |
- 계좌번호 [BN]
|
|
|
76 |
- Transformers 4.40.2
|
77 |
- Pytorch 2.3.0+cu118
|
78 |
- Datasets 2.19.1
|
79 |
+
- Tokenizers 0.19.1
|
80 |
+
|
81 |
+
### Use
|
82 |
+
```python
|
83 |
+
from transformers import AutoTokenizer, AutoModelForTokenClassification
|
84 |
+
from transformers import pipeline
|
85 |
+
|
86 |
+
tokenizer = AutoTokenizer.from_pretrained("vitus9988/klue_roberta_small_ner_identified")
|
87 |
+
model = AutoModelForTokenClassification.from_pretrained("vitus9988/klue_roberta_small_ner_identified")
|
88 |
+
|
89 |
+
nlp = pipeline("ner", model=model, tokenizer=tokenizer, aggregation_strategy="simple")
|
90 |
+
example = """
|
91 |
+
저는 서울특별시 강남대로 56길 100호에 삽니다. 전화번호는 010-1234-5678이고 주민등록번호는 123456-1234567입니다. 메일주소는 [email protected]입니다.
|
92 |
+
"""
|
93 |
+
|
94 |
+
ner_results = nlp(example)
|
95 |
+
for i in ner_results:
|
96 |
+
print(i)
|
97 |
+
|
98 |
+
#{'entity_group': 'AD', 'score': 0.79996574, 'word': '서울특별시 강남대로 56길 100호', 'start': 4, 'end': 23}
|
99 |
+
#{'entity_group': 'PH', 'score': 0.948794, 'word': '010 - 1234 - 5678', 'start': 36, 'end': 49}
|
100 |
+
#{'entity_group': 'RN', 'score': 0.90686846, 'word': '123456 - 1234567', 'start': 60, 'end': 74}
|
101 |
+
#{'entity_group': 'EM', 'score': 0.935588, 'word': 'hugging @ face. com', 'start': 85, 'end': 101}
|
102 |
+
|
103 |
+
```
|
104 |
+
|