|
--- |
|
language: |
|
- ko |
|
tags: |
|
- summarization |
|
widget: |
|
- text: '[BOS] 안녕하세요 저는 30대 여성입니다. [SEP] 반갑습니다. 저는 동해에 거주해서 바닷가에 앉아서 물멍하는거 좋아하는데 물멍좋아하세요? [SEP] 수필 좋네요! 저는 물을 보면서 생각정리를 해서 가끔 그런 제가 만족스러워요. [SEP] 점심에 차 한잔 너무 좋네요! 저는 오늘도 자주먹는 단감을 챙겨 바닷가에 앉아 잠시 생각을 했어요 [SEP] 네! 저는 과일은 다 좋아해요. 과일 좋아하세요? [SEP] 저도 딸기 좋아해요! 그리고 귤도 좋아해요! [SEP] 저랑 취향이 맞네요ㅎㅎ 무슨일 하시나요?? </s>' |
|
inference: |
|
parameters: |
|
max_length: 200 |
|
top_k: 5 |
|
--- |
|
|
|
|
|
**[Notice] 반말 발화에서 페르소나를 추출 할 수 있는 [V-2](https://huggingface.co/NLPBada/kobart-chat-persona-extraction-v2) 추가 공개!** |
|
|
|
|
|
|
|
# KoBART persona extraction |
|
|
|
- 개요 : 한 사용자의 일상 대화 채팅으로 해당 사용자의 페르소나를 추출할 수 있는 모델 |
|
- 사용 모델 : [KoBART](https://huggingface.co/gogamza/kobart-base-v2) |
|
- 데이터 : [AIHub 한국어 멀티 세션 대화](https://www.aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&dataSetSn=71630) |
|
|
|
# 실험 정리 |
|
- [깃허브 레포지토리](https://github.com/DonghaeSuh/persona_extraction_model) |
|
- [블로그 정리](https://blog.naver.com/gypsi12/223378404085) |
|
|
|
# validation score |
|
- BLEU : 0.4493 |
|
| | Rouge-1 | Rouge-2 | Rouge-l | |
|
| --- | --- | --- | --- | |
|
| recall | 0.5708 | 0.3671 | 0.5679 | |
|
| precision | 0.6247 | 0.3939 | 0.6217 | |
|
| f1 | 0.5913 | 0.3789 | 0.5882 | |
|
|
|
# 예시 |
|
``` |
|
## 입력 ## |
|
['벌써 6일이 지났네요. 그동안 어떻게 지내셨어요?', |
|
'운동 너무 좋죠! 저는 중고 자동차를 좀 알아볼려고 해요.', |
|
'제가 차를 잘 몰라서요ㅠ 첫 차라 새차는 부담스러워서 중고를 사보려구요.', |
|
'아 그래요? 몰랐었는데 진짜 조심해야겠네요ㅠ.', |
|
'진짜 나쁜 사람들 많네요. 자동차는 금액대도 커서 더 위험할거 같아요.', |
|
'그러네요! 가을을 싫어하시는군요? 아이고ㅠ 저는 이런 가을에는 음악 듣는걸 좋아해요.', |
|
'팝 좋죠! 저는 EDM 음악을 좋아해요ㅋㅋ 가을과 별로 안어울리지만 신나는거 같아요. 그럼 또 봐요!'] |
|
|
|
## 출력 ## |
|
"나는 중고 중고차를 알아볼 것이다, |
|
나는 중고차가 부담스럽다, |
|
나는 가을에 음악을 듣는 것을 좋아한다, |
|
나는 EDM 음악을 좋아한다. " |
|
``` |