seongil-dn commited on
Commit
958a0a8
·
verified ·
1 Parent(s): 8ca100c

Add new SentenceTransformer model

Browse files
.gitattributes CHANGED
@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
33
  *.zip filter=lfs diff=lfs merge=lfs -text
34
  *.zst filter=lfs diff=lfs merge=lfs -text
35
  *tfevents* filter=lfs diff=lfs merge=lfs -text
36
+ tokenizer.json filter=lfs diff=lfs merge=lfs -text
1_Pooling/config.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "word_embedding_dimension": 1024,
3
+ "pooling_mode_cls_token": true,
4
+ "pooling_mode_mean_tokens": false,
5
+ "pooling_mode_max_tokens": false,
6
+ "pooling_mode_mean_sqrt_len_tokens": false,
7
+ "pooling_mode_weightedmean_tokens": false,
8
+ "pooling_mode_lasttoken": false,
9
+ "include_prompt": true
10
+ }
README.md ADDED
@@ -0,0 +1,520 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ tags:
3
+ - sentence-transformers
4
+ - sentence-similarity
5
+ - feature-extraction
6
+ - generated_from_trainer
7
+ - dataset_size:451949
8
+ - loss:CachedGISTEmbedLoss
9
+ base_model: BAAI/bge-m3
10
+ widget:
11
+ - source_sentence: 신체와 행동상의 특성을 통해 신원을 확인하는 기술로서 가장 민감한 개인정보에 해당하는 것은 뭐야?
12
+ sentences:
13
+ - 그러나 「개인정보 보호법」은 모든 생체인식 정보를 민감정보로서 포함하고 있지 않다. 예를 들어 지문은 개인의 고유성, 동일성을 나타내고 정보주체를
14
+ 타인으로부터 식별가능하게 하는 개인정보이지만(헌법재판소, 2005), 현행 개인정보 보호법에서는 민감정보로 규율되고 있지 않다. 또 민족 또는
15
+ 인종적 기원을 드러낼 수 있는 유전정보는 민감정보로서 보호받고 있지만, 국제 규범에서 통상 민감정보로서 보호하고 있는 민족 또는 인종적 기원에
16
+ 대한 보호를 우리 법률은 명시하고 있지 않다. 어플리케이션이나 기기 등으로 수집되는 개인정보 또한 모두가 건강정보는 아닐 수 있다. 다만 진료정보인
17
+ 경우이거나 직접적으로나 간접적으로 건강 상태나 위험에 대해 판단할 수 있는 원본 감지정보인 경우, 혹은 건강상태나 건강위험에 대한 결론을 도출하는
18
+ 경우는 민감정보에 포함되는 건강관련 정보로서 보호될 수 있을 것이다.
19
+ - '2. 거시경제분석모델을 통한 수요전망
20
+
21
+ 가. 실물경제 및 금융산업 성장 전망
22
+
23
+ (1) 실물경제 성장 전망
24
+
25
+ □ 한국 실질 국내총생산(GDP)은 성장률이 지속적으로 하락하는 추세에 있음. ○ 한국의 연평균 성장률은 1980년대에는 8.9%, 1990년부터
26
+ 외환위기 이전인 1997년까지는 8.2%로 빠른 성장세를 유지하였으나, 1998년 외환위기로 성장률이 △5.5%까지 하락함. ○ 1999년에는
27
+ 기저효과 등으로 실질 국내총생산(GDP) 성장률이 11.3%까지 반등하였다가 점차 하락세를 보여 2003년에는 2.9%까지 하락함
28
+
29
+ ○ 이후 2007년까지 연평균 4.9%의 성장률을 보였으나, 2008년과 2009년에는 글로벌 금융위기의 영향으로 다시 큰 폭으로 하락
30
+
31
+ ○ 2010년에는 전년대비 6.5% 성장하였으나, 2011년 유로지역 재정위기로 인해 다시 하락하여 2012년에는 2.3%를 기록하고 2013년과
32
+ 2014년에는 반등하여 각각 2.9% 및 3.3%를 기록
33
+
34
+ ○ 2015년에는 수출 둔화 지속과 내수 회복 지연 등으로 2.6%를 기록하였으며, 2016년에는 소폭 상승한 2.7%를 기록할 전망
35
+
36
+ □ 이러한 경제성장률 하락 추세는 앞으로도 지속될 것으로 예상됨. ○ 한국 잠재성장률이 2016년에는 약 2.9%이지만 2040년에는 1.7%까지
37
+ 점진적으로 하락할 것으로 전망
38
+
39
+ ○ 물론 성장잠재력 수준은 여러 유·무형의 요인들에 의해 결정이 되기 때문에 직접적인 관측이 어렵지만 여러 통계기법을 활용하여 잠재성장률을
40
+ 추정하더라도, 향후 잠재성장률의 추세적인 하락은 불가피한 현상으로 판단됨. □ 경제성장률은 장기적으로 잠재성장률 추세와 비슷한 움직임을 보이겠지만
41
+ 단기적으로는 경기적인 요인으로 인해 잠재성장률 수준을 하회하거나 상회할 수 있음. ○ 이에 따라 금융연구원의 경제전망 모형을 이용하여 향후
42
+ 5년간인 2017∼2021년까지의 경제성장률을 추정함. □ 2017년 우리경제는 내수와 수출부진으로 2.5% 성장에 그칠 것으로 예상되며,
43
+ 이후 2018년과 2019년에는 소폭 개선되어 각각 2.7%, 2.8%를 기록할 것으로 전망됨. (2) 금융산업 성장 전망
44
+
45
+ □ 2016년 1~3분기 중 한국에서 창출된 부가가치는 1,109.7조원이며 이중 금융업이 창출한 부가가치는 68.6조원으로 전체 부가가치중
46
+ 6.18%를 차지함.'
47
+ - 지문이나 홍채와 같은 바이오 정보는 신체와 행동상의 특성을 통해 신원을 확인하는 기술로서, 기존에 저장해 둔 개인의 바이오 정보와 제시된 바이오
48
+ 정보를 대조하는 방식이며, 또한 각 개인의 신체에 각인되어 특별한 신체적 변화가 없는 한 평생토록 바꿀 수 없기 때문에 개인정보 중에서도 가장
49
+ 민감한 개인정보에 해당한다고 볼 수 있다. 그럼에도 불구하고, 개인정보 생명주기에 따라 수집과정에서 명확한 인식과 설명(개인정보 열람 정정
50
+ 삭제 청구권) 없는 수집의 위험성, 저장관리 과정에서 해킹에 의한 유출 및 삭제, 이용 및 제공과정에서 다른 개인정보 데이터베이스와의 결합에
51
+ 따른 오 남용(특성, 습관, 행동, 감정추론) 사례가 발생할 가능성이 존재하며, 원데이터의 복원이나 당사자 역추적 등도 가능하므로 개인정���
52
+ 유출 가능성을 배제할 수는 없다. 본 진정사건과 관련하여 공익근무요원들에 대한 복무(근태)관리는 담당자가 지속적인 점검을 통하여 이를 감독할
53
+ 수가 있으며, 부득이하게 출퇴근용 카드발급시스템을 사용한다 하더라도 충분히 예방할 수 있으므로 지문등록시스템 도입은 침해의 최소성에 맞지 않다고
54
+ 판단된다.
55
+ - source_sentence: 장애인활동 지원에 관한 법률이 개정되어 무엇이 늘어났어?
56
+ sentences:
57
+ - '장애인 활동 지원에 관한 법률 시행 규칙 일부 개정령안
58
+
59
+ 1. 개정이유
60
+
61
+ 보건복지부 사회보장위원회 결정(2013.12월 의결)에 따라 2016년부터 사회보장사업의 선정기준을 전국가구평균소득에서 기준 중위소득으로 표준화가
62
+ 추진되고 있어 기존 ‘전국가구평균소득’을 ‘기준중위소득’으로 변경하고, 「장애인복지법」상 서비스 지원 종합조사 도입으로 ‘기본급여’와 ‘추가급여’가
63
+ ‘활동지원급여’로 통합됨에 따라 본인부담율을 조정하는 한편, 운영상 나타난 일부 미비사항을 보완하고자 함 2. 주요내용
64
+
65
+ 가. 본인부담금의 산정방법을 기준중위소득으로 변경하고, ‘기본급여’와 ‘추가급여’가 ‘활동지원급여’인 단일서비스로 통합됨에 따라 본인부담율
66
+ 조정(안 별표6)
67
+
68
+ 나. 활동지원 응급안전서비스 신청서 개선(안 별지 제5의2서식)
69
+
70
+ 3. 참고사항
71
+
72
+ 가. 관계법령 : 생략
73
+
74
+ 나. 예산조치 : 별도조치 필요 없음
75
+
76
+ 다. 합의 : 해당기관 없음
77
+
78
+ 라. 기타 : 1) 신ㆍ구조문대비표'
79
+ - '장애인활동 지원에 관한 법률 시행령 일부개정령안
80
+
81
+ 1. 의결주문
82
+
83
+ 장애인활동 지원에 관한 법률 시행령 일부개정령안을 별지와 같이 의결한다.
84
+
85
+ 2. 제안이유 및 주요내용
86
+
87
+ 활동지원급여를 신청할 수 있는 사람을 종전의 중증장애인에서 모든 장애인으로 확대하고 활동지원급여 신청의 조사를 「장애인복지법」에 따른 서비스
88
+ 지원 종합조사로 대체하는 등의 내용으로 「장애인활동 지원에 관한 법률」이 개정됨에 따라, 이에 맞추어 활동지원급여 수급자격 심의기준 및 수급자격
89
+ 갱신에 관한 사항 등을 정비하는 한편, 활동지원급여 수급자격 결정의 유효기간을 종전의 2년에서 3년으로 늘림으로써 수급자의 권익을 보다 안정적으로
90
+ 보호하고, 과태료의 가중된 부과처분에 적용되는 차수를 명확히 하는 등 현행 제도의 운영상 나타난 일부 미비점을 개선ㆍ보완하려는 것임. 3.
91
+ 주요토의과제
92
+
93
+ 없음 4. 참고사항
94
+
95
+ 가. 관계법령 : 생략
96
+
97
+ 나. 예산조치 : 별도조치 필요 없음
98
+
99
+ 다. 합의 : 해당기관 없음
100
+
101
+ 라. 기타 : 1) 신ㆍ구조문대비표, 별첨
102
+
103
+ 2) 입법예고(2018. 9. 3. ~ 10. 15.) 결과, 특기할 사항 없음'
104
+ - '과천과학관에서 먼저 배우는 MBL과 수학 융합탐구<br> 일정 및 내용<br>○ 중등반 MBL-수학 융합 탐구과정 <table><tbody><tr><td>시간</td><td>차시</td><td>내용</td><td>실험도구</td><td>비고</td></tr><tr><td
105
+ rowspan=''2''>09:30~ 10:50 </td><td>1</td><td rowspan=''2''>정비례 그래프 기울기 구하기 [수학만화+수학문제풀이]
106
+ MBL 온도센서를 이용한 시합(조별) 엑셀에서 추세선 분석-운동시합(시범)-정비례 그래프 보일법칙(시범)-반비례 그래프 연관 관계 시범 </td><td
107
+ rowspan=''2''>노트북,초음파센서,온도센서,기체압력센서,판자</td><td rowspan=''2''>교육동3층 제4실험실</td></tr><tr><td>2</td></tr><tr><td
108
+ rowspan=''2''>11:00~ 12:20 </td><td>3</td><td rowspan=''2''>함수의 변환 연습하기<br>(예:시간·위치
109
+ 그래프→시간·속도 그래프) MBL 초음파센서를 이용한 등속도운동 실험 및 분석 </td><td rowspan=''2''>노트북</td><td
110
+ rowspan=''2''>교육동3층 제4실험실</td></tr><tr><td>4</td></tr><tr><td>12:20~13:10</td><td>
111
+ </td><td>점심 식사</td><td> </td><td>식당<br>(자유) </td></tr><tr><td rowspan=''2''>13:10~
112
+ 14:30 </td><td>5</td><td rowspan=''2''>멘토 소개 및 자유탐구 활동 안내 기초과학관 탐방, 전시물 과학원리 탐구
113
+ MBL실험 시범 - 관련 전시물 : 신경전달 반응속도/거중기/뇌그림 </td><td rowspan=''2''>멘토, 심전도센서, 초음파 센서,힘센서</td><td
114
+ rowspan=''2''>과천과학관 기초과학관 </td></tr><tr><td>6</td></tr><tr><td rowspan=''2''>14:40~
115
+ 16:00 </td><td>7</td><td rowspan=''2''>MBL을 활용하여 기초과학관의 전시물 속 과학원리 탐구실험하기 실험결과
116
+ 발표 및 토론/참가확인서 발급 </td><td rowspan=''2''>시험지, 시상물품, 참가확인서</td><td rowspan=''2''>교육동3층
117
+ 제4실험실</td></tr><tr><td>8</td></tr></tbody></table>'
118
+ - source_sentence: 인도네시아에서 아체특별자치주가 기록한 빈곤 퍼센트는 얼마나 돼?
119
+ sentences:
120
+ - 연말연시를 맞아 인도네시아 부유층이 초호화 파티를 벌이고 있는 것과는 달리 대재앙으로 살아남은 반다 아체주의 이재민들이 이번엔 굶주림으로 생사
121
+ 기로에 놓였다. 고지대의 길거리 등에서 텐트도 없이 생활하고 있는 이재민들은 1일 강진과 지진해일의 대재앙이 일어난지 7일째를 맞았지만 국제사회가
122
+ 지원하는 구호품을 거의 공급 받지 못하고 있다. 도로변 인도에서 밤을 새운 시슬라(38.주부)는 "반다 아체 공군기지에 외국 수송기들이 잇따라
123
+ 도착하는데 구호품을 나눠준다는 소식은 없다"면서 "도대체 정부는 무엇을 하는지 모르겠다"고 분통을 터뜨렸다. 시슬라는 "악취를 막기 위한 마스크는
124
+ 일부 나눠주는 것을 봤다"면서 "그러나 먹기 위한 비상식품이나 부상자들을 치료하기 위한 의약품, 텐트 등은 아예 볼 수가없다"고 말했다. 또
125
+ 만디리(28.점원)는 "구호품이 속속 도착하고 있다는 말을 들었지만 어디를 가야 식량을 얻을 수 있는 지 도대체 알 수가 없다"면서 "통신
126
+ 두절로 우리는 정보를 얻을 수 없다"고 하소연했다. 반다 아체 공군기지에 구호품을 싣고 도착한 호주 공군의 리처드(24) 상병은 "어제 밤
127
+ 호주를 출발해 생수와 라면, 과자류를 갖고 왔다"면서 "배급은 인도네시아군 소관 사항"이라고 말했다. 인도네시아 들도 "반다 아체 인근 도시인
128
+ 메단의 폴로냐공항이나 자카르타 할림 페르다나쿠수마 공군기지에는 국제사회가 지원해준 각종 구호품이 산더미처럼 쌓여 있다"고 말했다. 이에 대해
129
+ 임시 주정부 청사가 마련된 반다 아체 주지사 관저의 한 관계자는 "인력도 부족하고 정신이 없다"면서 "특히 헬기나 트럭 등 운송장비가 부족해
130
+ 대책이없다"고 털어놨다. 한편 심리적 공황에 빠진 반다 아체주 주민과는 달리 자카르타의 고급 호텔 등지에서는 부유층들이 연말연시를 맞아 초호화
131
+ 파티를 벌여 대조를 이루고 있다고 인도네시아 현지 들이 전했다.
132
+ - 우리나라는 우리의 발전경험을 개도국과 공유하는 경제발전경험공유사업(KSP)이라는 대표적인 정책자문 사업을 실시 중이다. 2004년에 베트남과
133
+ 우즈베키스탄에 대한 자문을 시작으로 10년 이상 수행해 오면서 대상국가와 주제들을 다각화하였다. 특히 경제발전과 거시금융경제 등 전체적인 발전담론
134
+ 위주의 자문에서 구체적인 성장전략으로 자문 영역이 전환되는 추세에 있다. 그동안의 수행 경험을 바탕으로 하여 급변하는 국제사회 개발협력 정세와
135
+ 일관된 우리나라 정책자문 사업의 방향성이 요구된다. 정책자문 컨설팅의 역할과 방향성 정립이 더욱 중요해진 이유이다. 경제발전의 조건이 선진국의
136
+ 그것과 매우 다른 개도국의 지속가능한 발전을 촉진하기 위하여 개 도국은 선진국과는 차별화된 성장전략이 필요하다. 혁신역량을 바탕으로 한 산업과
137
+ 무역의 역동성이 개도국의 지속가능하고 상생적인 발전을 유인하며, 따라서 개도국 혁신역량의 구축에 초점을 맞추는 협력모델이 중요하다. 주목할
138
+ 점은 한 국가의 발전에 영향을 미치는 혁신이란 기술뿐만 아니라 제도나 조직 측면에서의 혁신 등 매우 다양한 측면을 포함한다는 것이다.
139
+ - 인도네시아 서북단 아체특별자치주(州) 주정부 건물 앞에 최근 축하 화환 10개가 줄지어 늘어섰다. 주민들이 자발적으로 보낸 화환들인데, 축하
140
+ 메시지가 이채롭다. ‘수마트라에서 가장 가난한 지역이 된 걸 축하한다’ ‘빈곤 우승자가 된 주지사에게 감사하다’ ‘가난 1등 아체 축하’ 등이다.
141
+ 발신자는 ‘아체 주민들’, ‘전 아첨꾼’이라고 돼 있다. 22일 드틱닷컴에 따르면 아체의 주도인 반다아체 주정부 청사 앞에 17일 다양한 화환이
142
+ 전시됐다. 축하 형식을 갖췄지만 기실 모두 수마트라섬에 있는 10개 주 중에서 아체특별자치주가 가장 빈곤한 지역에 선정된 걸 비꼬는 내용이다.
143
+ 경찰까지 출동했다. 실제 인도네시아 통계청(BPS)은 지난해 9월 기준 아체의 빈곤율이 15.43%로 수마트라섬에서 가장 높다고 최근 발표했다.
144
+ 수마트라섬은 자바섬에 이어 인도네시아 2대 주요 섬이다. 인도네시아 전체 빈곤율은 10.19%이다. 지난해 3월 조사에서 아체는 수마트라섬에서
145
+ 븡쿨루주에 이어 빈곤율 2위였다. 아체 주정부 관계자는 “신종 코로나바이러스 감염증(코로나19) 사태로 인한 결과”라며 “인도네시아 전체 빈곤율이
146
+ 전년 동기 대비 0.97%포인트 증가한 걸 감안하면 같은 기간 0.42%포인트 상승한 아체는 양호한 편”이라고 해명했다. 아울러 아체 주정부는
147
+ “빈곤율을 줄이기 위한 정책 노력을 계속하고 있다”고 밝혔다. 그러면서 “아체는 2000년 (인도네시아 중앙정부와) 내전, 2004년 동남아
148
+ 쓰나미로 인해 급속도로 가난해진 역사적 배경이 있기 때문에 두 배로 열심히 일해야 한다”고 덧붙였다. 정작 주민들은 핑계에 불과하다고 일축했다.
149
+ 풍자 화환을 보낸 한 주민은 “코로나19로 인해 시위를 할 수 없으니 그 열망을 화환에 담아 보낸 것”이라며 “전염병보다 (주지사의) 행정
150
+ 능력과 비효율적인 예산 집행이 문제”라고 꼬집었다. 2005년 특별자치주가 되면서 중앙정부로부터 받고 있는 특별자치기금 운용에 문제가 있다는
151
+ 지적도 잇따랐다. 자치권을 인정받는 아체는 이슬람 관습법(샤리아)이 실질 지배하는 독특한 지역이다.
152
+ - source_sentence: 세종시에서 진행하는 메타버스 강연은 선착순으로 어느 정도나 되는 사람들을 모집해?
153
+ sentences:
154
+ - '문화예술전문인력 양성 및 지원 패러다임 전환 방향 모색 연구<br>4. 문화예술전문인력 양성 사업 실태 분석 및 시사점<br>1) 문화예술전문인력
155
+ 양성 사업의 현황 및 특징<br>□ 문화예술전문인력 양성 사업 실태를 분석하는 틀로써 5개의 요소로 대분류하고, 각각의 중분류와 소분류 요소를
156
+ 도출. 현재 시행 중인 문화예술전문인력 양성 사업(176개 사업)을 아래와 같은 분석 틀에 따라 지원 주체, 지원 목적, 지원 대상, 지원
157
+ 방식, 지원 장르별로 분석함. <br>- 분석 틀은 사업 성격에 따라 상호배타성이 약한 경우도 있어 중복되는 경우가 상당수 있음. <br>
158
+ <table><tbody><tr><td>대분류</td><td>중분류</td><td>소분류</td></tr><tr><td rowspan=''3''>지원
159
+ 주체</td><td>·중앙정부 및 소속/산하 기관</td><td>·문화체육관광부, 문화재청 <br>·문화체육관광부, 문화재청의 소속/산하 기관<br>-국립문화예술기관,
160
+ 특수법인 형식의 문화예술기관, 민법상 법인 형식의 정부재정지원 문화예술기관 </td></tr><tr><td>·광역 및 기초 지자체 문화재단</td><td>·광역단위
161
+ 문화재단 기초단위 문화재단</td></tr><tr><td>·민간 문화재단</td><td>·기업출연 문화재단</td></tr><tr><td>지원
162
+ 목적</td><td>·창작자의 창작역량 강화<br>·현장 종사자의 직무역량 강화<br>·경력개발 지원 </td><td> </td></tr><tr><td
163
+ rowspan=''2''>지원 대상</td><td>·경력 단계(경력기간, 직급, 나이, 자격증, 선행과정 이수 등 기준 적용)</td><td>·예비인력
164
+ <br>·신진 <br>·중견 <br>·시니어 </td></tr><tr><td>·직능 구분</td><td>·창작·실연: 창작, 실연 <br>·기획·경영:
165
+ 기획·학예, 교육, 경영, 기획·경영 전반, 연구·비평, 특수 <br>·기술: 무대기술, 보존·복원, 기타 장르별 기술직 <br>·관리·행정:
166
+ 관리, 행정(공무원) </td></tr><tr><td rowspan=''3''>지원 방식</td><td>·창작지원연계</td><td>·국내외
167
+ 레지던시 <br>·예술창작지원연계 </td></tr><tr><td>·교육·훈련</td><td>·집체교육·연수 <br>·워크숍·세미나 <br>·멘토링·코칭·컨설팅
168
+ <br>·온라인 기반 </td></tr><tr><td>·경력개발</td><td> ·해외연수·리서치 트립 <br>·인력배치지원 <br>·인턴십
169
+ </td></tr><tr><td>지원 장르</td><td>·시각예술<br>·공연예술<br>·전통예술<br>·문학<br>·융복합 장르(다원예술
170
+ 등) </td><td> </td></tr></tbody></table> 문화예술전문인력 지원 실태 분석 틀'
171
+ - 세종시와 중소벤처기업부가 31일부터 일반시민이 자율주행버스에 탑승할 수 있는 BRT 대중교통 유상 서비스 실증을 본격 시작한다. 시는 자율주행
172
+ 규제자유특구 사업을 통해 2020년 5월부터 주거단지 및 도심공원, 일반도로에서 자율주행차 실증을 진행하는 등 안전성 확보와 인프라를 구축하는데
173
+ 주력해왔다. 특히 ㈜오토노머스에이투지는 안전점검 등을 거쳐 지난 3월부터 약 3달간 산학연클러스터지원센터-세종시청-세종시외버스터미널 등 6.3㎞
174
+ 구간에서 자율주행버스 시범 운행을 해 왔다. 지난 5월부터는 시민체험단 27명을 대상으로 레벨4 수준에서 시속 50㎞까지 고속주행 기술을 점검하는
175
+ 유상서비스를 사전 점검했다. 31일~7월30일 진행되는 이번 일반시민 대상 유상 서비스로 일반시민들은 500원 이하의 저렴한 비용으로 자율주행버스를
176
+ 이용할 수 있게 된다. 자율주행버스는 안전요원 2명이 동승하며, 코로나19 확산 차단을 위한 방역 등 안전을 최우선 가치로 두고 매주 월~금요일
177
+ 주 5일 운행한다. 정차정류장은 국책연구단지→소담동→세종시청→시외버스터미널 순이며, 1일 운행 횟수는 오전11시, 오후 2시, 3시, 4시
178
+ 등 모두 4회다. 류제일 경제정책과장은 “세종시에 자율주행 대중교통 셔틀을 도입할 경우 교통체증 및 주차난 해소, 대기오염 저감 등이 기대된다”라며
179
+ “앞으로 자율주행 기술동향을 고려해 자율주행 대중교통 버스 도입을 검토해 나갈 계획”이라고 말했다.
180
+ - 세종시가 4월 과학의 달을 맞아 (재)세종테크노파크와 오는 22일 ‘스마트한 세종의 미래’를 주제로 실시간 강연을 연다. 이번 강연은 메타버스를
181
+ 활용해 온라인 생중계로 자율주행차 전문가 강연이다. 메타버스는 가공, 추상을 의미하는 ‘메타(meta)’와 현실 세계를 의미하는 ‘유니버스(universe)’의
182
+ 합성어로 3차원 가상세계를 의미한다. 특히 메타버스 가상세계에서 자율주행전문가가 참가자와 직접 자신의 아바타로 강연에 참여해, 첨단 과학기술을
183
+ 체험하는 형식이다. 메타버스 강연은 45명을 선착순 모집하고, 신청은 16일까지 세종테크노파크 홈페이지와 세종시청 홈페이지에서 가능하다. 강연은
184
+ 22일 오후 3시부터 1시간 동안이고, 메타버스 신청자 외에도 유튜브에서 ‘세종테크노파크’를 검색한 후 채널에 접속해 시청할 수 있다. 메타버스
185
+ 강연참여자는 세종테크노파크로부터 접속 환경 적응을 위한 매뉴얼을 전달받고, 사전모임을 통해 아바타 개설 등 사전연습을 진행한다. 또 강연 당일에는
186
+ 가상공간 내 강연 및 공연은 관람하고 강연자와 참석자간 소통을 통해 질의응답을 할 예정이다. 시 관계자는 “짧은 시간 동안 과학을 체험할 수
187
+ 있는 특별한 기회를 마련하기 위해 메타버스라는 가상세계를 선택했다”며 “스마트한 세종의 미래에 시민 여러분들의 많은 관심과 참여 바란다”고
188
+ 말했다. 한편 이번 행사는 과학기술정보통신부의 4월 과학의 달 ‘봄날의 과학산책’ 과 연계한 지역별 프로그램으로, 전국의 지역과학문화 거점센터들이
189
+ 릴레이 형식으로 과학콘텐츠를 선보이고 있다. 시는 2021년 지역과학문화 거점센터로 선정돼 (재)세종테크노파크가 운영 중에 있다.
190
+ - source_sentence: 관광 교통 서비스 체계 구축 정책의 추진은 몇 단계로 나눠서 할 수 있을까?
191
+ sentences:
192
+ - 창의ᆞ혁신상품은 TV홈쇼핑으로 구매하세요! □ 미래부가 내세우는 공영TV홈쇼핑의 또 다른 차별화 포인트는 중소기업, 농축수산가공업체 등을 위한
193
+ 종합 글로벌 유통 채널 구축의 구심점으로 공영TV홈쇼핑을 활용한다는 것이다. o 공영TV홈쇼핑은 인터넷, 모바일, 오프라인 매장을 연결하는
194
+ 종합유통 채널 구축을 위한 시발점이 될 것이다. 심사과정에서 TV홈쇼핑에서 발생한 광고효과를 다른 유통채널을 통해 판매로 유도하는 종합 유통
195
+ 채널 구축 전략을 평가하고, 중소기업ㆍ창의혁신기업ㆍ농어민 지원을 위해 기존에 운영되고 있는 유통채널과의 전략적 제휴 등도 추진해 나가도록 할
196
+ 계획이다. o 또한, 공영TV홈쇼핑은 창의ㆍ혁신 상품, 중소기업 제품 등의 글로벌시장 진출을 지원하기 위한 기반을 구축할 것이다. 농식품부,
197
+ 중기청등 관련 부처에서 추진 중인 해외진출 지원 사업 등과 연계하고, 이미 해외에서 TV홈쇼핑 채널을 운영 중인 기존 TV홈쇼핑 업체와의 상생
198
+ 협력 등을 통해 해외 판로 개척 모델을 만들어 나가도록 유도할 계획이다. □ 미래부는 12월 12일 더케이호텔서울(서초구 양재동)에서 승인신청
199
+ 요령 등에 대한 사업자 대상 설명회를 개최하여 공영TV홈쇼핑채널 신청을 희망하는 사업자들에게 자세한 안내를 할 예정이다. o 이후, 12월
200
+ 29일부터 31일까지 3일간 사업자 신청 접수를 받고 시청자 의견청취, 심사위원회 운영 등의 심사 절차를 진행하여 2015년 1월에는 신설
201
+ 공영TV홈쇼핑 사업자 선정을 마무리할 계획이다.
202
+ - 관광 교통 서비스 체계 정책 추진 주체로는 중앙 및 지방정부, 공공기관, 민간기관 등이 고려될 수 있다. 중앙정부 및 지방정부, 공공기관 중
203
+ 연구기관은 정책을 추진하는 주체로서, 지방정부와 사업기관은 정책을 실행하는 주체로서, 민간 기관은 직접 사업을 추진하는 주체로서 참여할 수
204
+ 있다. 관광 교통은 기존 교통시설 및 수단을 관광객이 이용하는 개념이기 때문에 정책 영역이 국토교통부, 문화체육관광부, 넓게는 해양수산부 등
205
+ 여러 부처에 걸쳐 있다. 원활한 정책사업 추진을 위해서는 부처 간 협력이 필수적이며, 부처 간 협력 체계로는 협력적 개별사업추진, 공동사업추진,
206
+ 사업추진 조직구성 등 세 가지 대안을 고려해볼 수 있다. 관광 교통 서비스 체계 구축 정책은 3단계로 구분하여 추진할 수 있다. 1단계는 2016년
207
+ 2017년으로 설정하고자 하며, 이 시기는 관광 교통 정책 사업을 추진하기 위한 기반을 마련하는 단계이다. 2단계는 2018년부터 2020년까지
208
+ 3년간으로 본격적인 정책 사업이 추진되는 시기이며, 3단계는 2021년 이후 정책사업의 효과가 창출되는 기간으로, 확장된 형태의 신규 사업을
209
+ 발굴 및 추진할 수 있어야 한다.
210
+ - 관광교통 서비스 체계는 관광 활동을 위한 관광객의 이동 편의성과 효용을 최대화 하는 시스템을 뜻한다. 서비스 체계를 적용하는 영역은 관광 교통
211
+ 정보, 관광교통수단, 관광교통 편의 서비스로 구분하여 볼 수 있다. 관광교통 정보는 관광 목적지에 도달하기 위해 필요한 관광교통 수단 및 관광교통
212
+ 편의 서비스 등에 대한 종합적 정보를 뜻한다. 주요 관광자원과 관광 자원까지 이동하는 데 필요한 루트, 루트를 이동하기 위해 필요한 관광교통
213
+ 수단과 비용, 관광교통 편의 서비스 등에 대한 정보를 모두 포함한다. 관광교통 수단은 출발지로부터 관광목적지를 연결하는 일반 및 특수교통수단을
214
+ 뜻한다. 또한 교통 수단의 시간적, 공간적 연계 배치와 기반 시설로서 공항, 터미널, 역 또한 교통수단의 범위에 포함한다. 관광교통 편의 시스템은
215
+ 교통수단의 이용을 보다 편리하게 하는 제도 및 서비스를 뜻한다. 관광교통 편의 서비스 영역에는 예약 할인, 그 밖의 제반 편의 서비스를 모두
216
+ 포괄한다. 또한 교통수단의 이용은 물론 관광지 입장까지 아우르는 통합 패스 티켓, 바우처 등을 포함한다.
217
+ pipeline_tag: sentence-similarity
218
+ library_name: sentence-transformers
219
+ ---
220
+
221
+ # SentenceTransformer based on BAAI/bge-m3
222
+
223
+ This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3). It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
224
+
225
+ ## Model Details
226
+
227
+ ### Model Description
228
+ - **Model Type:** Sentence Transformer
229
+ - **Base model:** [BAAI/bge-m3](https://huggingface.co/BAAI/bge-m3) <!-- at revision 5617a9f61b028005a4858fdac845db406aefb181 -->
230
+ - **Maximum Sequence Length:** 1024 tokens
231
+ - **Output Dimensionality:** 1024 tokens
232
+ - **Similarity Function:** Cosine Similarity
233
+ <!-- - **Training Dataset:** Unknown -->
234
+ <!-- - **Language:** Unknown -->
235
+ <!-- - **License:** Unknown -->
236
+
237
+ ### Model Sources
238
+
239
+ - **Documentation:** [Sentence Transformers Documentation](https://sbert.net)
240
+ - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers)
241
+ - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers)
242
+
243
+ ### Full Model Architecture
244
+
245
+ ```
246
+ SentenceTransformer(
247
+ (0): Transformer({'max_seq_length': 1024, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
248
+ (1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
249
+ (2): Normalize()
250
+ )
251
+ ```
252
+
253
+ ## Usage
254
+
255
+ ### Direct Usage (Sentence Transformers)
256
+
257
+ First install the Sentence Transformers library:
258
+
259
+ ```bash
260
+ pip install -U sentence-transformers
261
+ ```
262
+
263
+ Then you can load this model and run inference.
264
+ ```python
265
+ from sentence_transformers import SentenceTransformer
266
+
267
+ # Download from the 🤗 Hub
268
+ model = SentenceTransformer("seongil-dn/bge-m3-kor-retrieval-451949-bs4096-full-24")
269
+ # Run inference
270
+ sentences = [
271
+ '관광 교통 서비스 체계 구축 정책의 추진은 몇 단계로 나눠서 할 수 있을까?',
272
+ '관광 교통 서비스 체계 정책 추진 주체로는 중앙 및 지방정부, 공공기관, 민간기관 등이 고려될 수 있다. 중앙정부 및 지방정부, 공공기관 중 연구기관은 정책을 추진하는 주체로서, 지방정부와 사업기관은 정책을 실행하는 주체로서, 민간 기관은 직접 사업을 추진하는 주체로서 참여할 수 있다. 관광 교통은 기존 교통시��� 및 수단을 관광객이 이용하는 개념이기 때문에 정책 영역이 국토교통부, 문화체육관광부, 넓게는 해양수산부 등 여러 부처에 걸쳐 있다. 원활한 정책사업 추진을 위해서는 부처 간 협력이 필수적이며, 부처 간 협력 체계로는 협력적 개별사업추진, 공동사업추진, 사업추진 조직구성 등 세 가지 대안을 고려해볼 수 있다. 관광 교통 서비스 체계 구축 정책은 3단계로 구분하여 추진할 수 있다. 1단계는 2016년 2017년으로 설정하고자 하며, 이 시기는 관광 교통 정책 사업을 추진하기 위한 기반을 마련하는 단계이다. 2단계는 2018년부터 2020년까지 3년간으로 본격적인 정책 사업이 추진되는 시기이며, 3단계는 2021년 이후 정책사업의 효과가 창출되는 기간으로, 확장된 형태의 신규 사업을 발굴 및 추진할 수 있어야 한다.',
273
+ '관광교통 서비스 체계는 관광 활동을 위한 관광객의 이동 편의성과 효용을 최대화 하는 시스템을 뜻한다. 서비스 체계를 적용하는 영역은 관광 교통 정보, 관광교통수단, 관광교통 편의 서비스로 구분하여 볼 수 있다. 관광교통 정보는 관광 목적지에 도달하기 위해 필요한 관광교통 수단 및 관광교통 편의 서비스 등에 대한 종합적 정보를 뜻한다. 주요 관광자원과 관광 자원까지 이동하는 데 필요한 루트, 루트를 이동하기 위해 필요한 관광교통 수단과 비용, 관광교통 편의 서비스 등에 대한 정보를 모두 포함한다. 관광교통 수단은 출발지로부터 관광목적지를 연결하는 일반 및 특수교통수단을 뜻한다. 또한 교통 수단의 시간적, 공간적 연계 배치와 기반 시설로서 공항, 터미널, 역 또한 교통수단의 범위에 포함한다. 관광교통 편의 시스템은 교통수단의 이용을 보다 편리하게 하는 제도 및 서비스를 뜻한다. 관광교통 편의 서비스 영역에는 예약 할인, 그 밖의 제반 편의 서비스를 모두 포괄한다. 또한 교통수단의 이용은 물론 관광지 입장까지 아우르는 통합 패스 티켓, 바우처 등을 포함한다.',
274
+ ]
275
+ embeddings = model.encode(sentences)
276
+ print(embeddings.shape)
277
+ # [3, 1024]
278
+
279
+ # Get the similarity scores for the embeddings
280
+ similarities = model.similarity(embeddings, embeddings)
281
+ print(similarities.shape)
282
+ # [3, 3]
283
+ ```
284
+
285
+ <!--
286
+ ### Direct Usage (Transformers)
287
+
288
+ <details><summary>Click to see the direct usage in Transformers</summary>
289
+
290
+ </details>
291
+ -->
292
+
293
+ <!--
294
+ ### Downstream Usage (Sentence Transformers)
295
+
296
+ You can finetune this model on your own dataset.
297
+
298
+ <details><summary>Click to expand</summary>
299
+
300
+ </details>
301
+ -->
302
+
303
+ <!--
304
+ ### Out-of-Scope Use
305
+
306
+ *List how the model may foreseeably be misused and address what users ought not to do with the model.*
307
+ -->
308
+
309
+ <!--
310
+ ## Bias, Risks and Limitations
311
+
312
+ *What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
313
+ -->
314
+
315
+ <!--
316
+ ### Recommendations
317
+
318
+ *What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
319
+ -->
320
+
321
+ ## Training Details
322
+
323
+ ### Training Hyperparameters
324
+ #### Non-Default Hyperparameters
325
+
326
+ - `per_device_train_batch_size`: 4096
327
+ - `learning_rate`: 3e-05
328
+ - `warmup_ratio`: 0.05
329
+ - `fp16`: True
330
+ - `batch_sampler`: no_duplicates
331
+
332
+ #### All Hyperparameters
333
+ <details><summary>Click to expand</summary>
334
+
335
+ - `overwrite_output_dir`: False
336
+ - `do_predict`: False
337
+ - `eval_strategy`: no
338
+ - `prediction_loss_only`: True
339
+ - `per_device_train_batch_size`: 4096
340
+ - `per_device_eval_batch_size`: 8
341
+ - `per_gpu_train_batch_size`: None
342
+ - `per_gpu_eval_batch_size`: None
343
+ - `gradient_accumulation_steps`: 1
344
+ - `eval_accumulation_steps`: None
345
+ - `torch_empty_cache_steps`: None
346
+ - `learning_rate`: 3e-05
347
+ - `weight_decay`: 0.0
348
+ - `adam_beta1`: 0.9
349
+ - `adam_beta2`: 0.999
350
+ - `adam_epsilon`: 1e-08
351
+ - `max_grad_norm`: 1.0
352
+ - `num_train_epochs`: 3
353
+ - `max_steps`: -1
354
+ - `lr_scheduler_type`: linear
355
+ - `lr_scheduler_kwargs`: {}
356
+ - `warmup_ratio`: 0.05
357
+ - `warmup_steps`: 0
358
+ - `log_level`: passive
359
+ - `log_level_replica`: warning
360
+ - `log_on_each_node`: True
361
+ - `logging_nan_inf_filter`: True
362
+ - `save_safetensors`: True
363
+ - `save_on_each_node`: False
364
+ - `save_only_model`: False
365
+ - `restore_callback_states_from_checkpoint`: False
366
+ - `no_cuda`: False
367
+ - `use_cpu`: False
368
+ - `use_mps_device`: False
369
+ - `seed`: 42
370
+ - `data_seed`: None
371
+ - `jit_mode_eval`: False
372
+ - `use_ipex`: False
373
+ - `bf16`: False
374
+ - `fp16`: True
375
+ - `fp16_opt_level`: O1
376
+ - `half_precision_backend`: auto
377
+ - `bf16_full_eval`: False
378
+ - `fp16_full_eval`: False
379
+ - `tf32`: None
380
+ - `local_rank`: 0
381
+ - `ddp_backend`: None
382
+ - `tpu_num_cores`: None
383
+ - `tpu_metrics_debug`: False
384
+ - `debug`: []
385
+ - `dataloader_drop_last`: True
386
+ - `dataloader_num_workers`: 0
387
+ - `dataloader_prefetch_factor`: None
388
+ - `past_index`: -1
389
+ - `disable_tqdm`: False
390
+ - `remove_unused_columns`: True
391
+ - `label_names`: None
392
+ - `load_best_model_at_end`: False
393
+ - `ignore_data_skip`: False
394
+ - `fsdp`: []
395
+ - `fsdp_min_num_params`: 0
396
+ - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
397
+ - `fsdp_transformer_layer_cls_to_wrap`: None
398
+ - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
399
+ - `deepspeed`: None
400
+ - `label_smoothing_factor`: 0.0
401
+ - `optim`: adamw_torch
402
+ - `optim_args`: None
403
+ - `adafactor`: False
404
+ - `group_by_length`: False
405
+ - `length_column_name`: length
406
+ - `ddp_find_unused_parameters`: None
407
+ - `ddp_bucket_cap_mb`: None
408
+ - `ddp_broadcast_buffers`: False
409
+ - `dataloader_pin_memory`: True
410
+ - `dataloader_persistent_workers`: False
411
+ - `skip_memory_metrics`: True
412
+ - `use_legacy_prediction_loop`: False
413
+ - `push_to_hub`: False
414
+ - `resume_from_checkpoint`: None
415
+ - `hub_model_id`: None
416
+ - `hub_strategy`: every_save
417
+ - `hub_private_repo`: False
418
+ - `hub_always_push`: False
419
+ - `gradient_checkpointing`: False
420
+ - `gradient_checkpointing_kwargs`: None
421
+ - `include_inputs_for_metrics`: False
422
+ - `eval_do_concat_batches`: True
423
+ - `fp16_backend`: auto
424
+ - `push_to_hub_model_id`: None
425
+ - `push_to_hub_organization`: None
426
+ - `mp_parameters`:
427
+ - `auto_find_batch_size`: False
428
+ - `full_determinism`: False
429
+ - `torchdynamo`: None
430
+ - `ray_scope`: last
431
+ - `ddp_timeout`: 1800
432
+ - `torch_compile`: False
433
+ - `torch_compile_backend`: None
434
+ - `torch_compile_mode`: None
435
+ - `dispatch_batches`: None
436
+ - `split_batches`: None
437
+ - `include_tokens_per_second`: False
438
+ - `include_num_input_tokens_seen`: False
439
+ - `neftune_noise_alpha`: None
440
+ - `optim_target_modules`: None
441
+ - `batch_eval_metrics`: False
442
+ - `eval_on_start`: False
443
+ - `eval_use_gather_object`: False
444
+ - `batch_sampler`: no_duplicates
445
+ - `multi_dataset_batch_sampler`: proportional
446
+
447
+ </details>
448
+
449
+ ### Training Logs
450
+ | Epoch | Step | Training Loss |
451
+ |:------:|:----:|:-------------:|
452
+ | 0.0769 | 1 | 3.0662 |
453
+ | 0.1538 | 2 | 3.0577 |
454
+ | 0.2308 | 3 | 3.1126 |
455
+ | 0.3077 | 4 | 1.8085 |
456
+ | 0.3846 | 5 | 1.6333 |
457
+ | 0.4615 | 6 | 1.5018 |
458
+ | 0.5385 | 7 | 1.4955 |
459
+ | 0.6154 | 8 | 1.2295 |
460
+ | 0.6923 | 9 | 1.0032 |
461
+ | 0.7692 | 10 | 0.884 |
462
+ | 0.8462 | 11 | 0.768 |
463
+ | 0.9231 | 12 | 0.7185 |
464
+ | 1.0 | 13 | 0.6493 |
465
+ | 1.0769 | 14 | 0.6176 |
466
+ | 1.1538 | 15 | 0.5703 |
467
+ | 1.2308 | 16 | 0.5469 |
468
+ | 1.3077 | 17 | 0.5242 |
469
+ | 1.3846 | 18 | 0.4967 |
470
+ | 1.4615 | 19 | 0.4758 |
471
+ | 1.5385 | 20 | 0.4665 |
472
+ | 1.6154 | 21 | 0.4561 |
473
+ | 1.6923 | 22 | 0.4341 |
474
+ | 1.7692 | 23 | 0.4299 |
475
+ | 1.8462 | 24 | 0.4039 |
476
+
477
+
478
+ ### Framework Versions
479
+ - Python: 3.10.12
480
+ - Sentence Transformers: 3.2.1
481
+ - Transformers: 4.44.2
482
+ - PyTorch: 2.3.1+cu121
483
+ - Accelerate: 1.1.1
484
+ - Datasets: 2.21.0
485
+ - Tokenizers: 0.19.1
486
+
487
+ ## Citation
488
+
489
+ ### BibTeX
490
+
491
+ #### Sentence Transformers
492
+ ```bibtex
493
+ @inproceedings{reimers-2019-sentence-bert,
494
+ title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
495
+ author = "Reimers, Nils and Gurevych, Iryna",
496
+ booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
497
+ month = "11",
498
+ year = "2019",
499
+ publisher = "Association for Computational Linguistics",
500
+ url = "https://arxiv.org/abs/1908.10084",
501
+ }
502
+ ```
503
+
504
+ <!--
505
+ ## Glossary
506
+
507
+ *Clearly define terms in order to be accessible across audiences.*
508
+ -->
509
+
510
+ <!--
511
+ ## Model Card Authors
512
+
513
+ *Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
514
+ -->
515
+
516
+ <!--
517
+ ## Model Card Contact
518
+
519
+ *Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
520
+ -->
config.json ADDED
@@ -0,0 +1,28 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "/root/models/bge-m3-kor-retrieval-451949-bs4096-full/checkpoint-24",
3
+ "architectures": [
4
+ "XLMRobertaModel"
5
+ ],
6
+ "attention_probs_dropout_prob": 0.1,
7
+ "bos_token_id": 0,
8
+ "classifier_dropout": null,
9
+ "eos_token_id": 2,
10
+ "hidden_act": "gelu",
11
+ "hidden_dropout_prob": 0.1,
12
+ "hidden_size": 1024,
13
+ "initializer_range": 0.02,
14
+ "intermediate_size": 4096,
15
+ "layer_norm_eps": 1e-05,
16
+ "max_position_embeddings": 8194,
17
+ "model_type": "xlm-roberta",
18
+ "num_attention_heads": 16,
19
+ "num_hidden_layers": 24,
20
+ "output_past": true,
21
+ "pad_token_id": 1,
22
+ "position_embedding_type": "absolute",
23
+ "torch_dtype": "float32",
24
+ "transformers_version": "4.44.2",
25
+ "type_vocab_size": 1,
26
+ "use_cache": true,
27
+ "vocab_size": 250002
28
+ }
config_sentence_transformers.json ADDED
@@ -0,0 +1,10 @@
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "__version__": {
3
+ "sentence_transformers": "3.2.1",
4
+ "transformers": "4.44.2",
5
+ "pytorch": "2.3.1+cu121"
6
+ },
7
+ "prompts": {},
8
+ "default_prompt_name": null,
9
+ "similarity_fn_name": null
10
+ }
model.safetensors ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:aa5b9ba83bdb91334cc49404b8e74d4d64646113bb4a83df56eea5c130fad648
3
+ size 2271064456
modules.json ADDED
@@ -0,0 +1,20 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ [
2
+ {
3
+ "idx": 0,
4
+ "name": "0",
5
+ "path": "",
6
+ "type": "sentence_transformers.models.Transformer"
7
+ },
8
+ {
9
+ "idx": 1,
10
+ "name": "1",
11
+ "path": "1_Pooling",
12
+ "type": "sentence_transformers.models.Pooling"
13
+ },
14
+ {
15
+ "idx": 2,
16
+ "name": "2",
17
+ "path": "2_Normalize",
18
+ "type": "sentence_transformers.models.Normalize"
19
+ }
20
+ ]
sentence_bert_config.json ADDED
@@ -0,0 +1,4 @@
 
 
 
 
 
1
+ {
2
+ "max_seq_length": 1024,
3
+ "do_lower_case": false
4
+ }
special_tokens_map.json ADDED
@@ -0,0 +1,51 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "bos_token": {
3
+ "content": "<s>",
4
+ "lstrip": false,
5
+ "normalized": false,
6
+ "rstrip": false,
7
+ "single_word": false
8
+ },
9
+ "cls_token": {
10
+ "content": "<s>",
11
+ "lstrip": false,
12
+ "normalized": false,
13
+ "rstrip": false,
14
+ "single_word": false
15
+ },
16
+ "eos_token": {
17
+ "content": "</s>",
18
+ "lstrip": false,
19
+ "normalized": false,
20
+ "rstrip": false,
21
+ "single_word": false
22
+ },
23
+ "mask_token": {
24
+ "content": "<mask>",
25
+ "lstrip": true,
26
+ "normalized": false,
27
+ "rstrip": false,
28
+ "single_word": false
29
+ },
30
+ "pad_token": {
31
+ "content": "<pad>",
32
+ "lstrip": false,
33
+ "normalized": false,
34
+ "rstrip": false,
35
+ "single_word": false
36
+ },
37
+ "sep_token": {
38
+ "content": "</s>",
39
+ "lstrip": false,
40
+ "normalized": false,
41
+ "rstrip": false,
42
+ "single_word": false
43
+ },
44
+ "unk_token": {
45
+ "content": "<unk>",
46
+ "lstrip": false,
47
+ "normalized": false,
48
+ "rstrip": false,
49
+ "single_word": false
50
+ }
51
+ }
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6e3b8957de04e3a4ed42b1a11381556f9adad8d0d502b9dd071c75f626b28f40
3
+ size 17083053
tokenizer_config.json ADDED
@@ -0,0 +1,62 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "added_tokens_decoder": {
3
+ "0": {
4
+ "content": "<s>",
5
+ "lstrip": false,
6
+ "normalized": false,
7
+ "rstrip": false,
8
+ "single_word": false,
9
+ "special": true
10
+ },
11
+ "1": {
12
+ "content": "<pad>",
13
+ "lstrip": false,
14
+ "normalized": false,
15
+ "rstrip": false,
16
+ "single_word": false,
17
+ "special": true
18
+ },
19
+ "2": {
20
+ "content": "</s>",
21
+ "lstrip": false,
22
+ "normalized": false,
23
+ "rstrip": false,
24
+ "single_word": false,
25
+ "special": true
26
+ },
27
+ "3": {
28
+ "content": "<unk>",
29
+ "lstrip": false,
30
+ "normalized": false,
31
+ "rstrip": false,
32
+ "single_word": false,
33
+ "special": true
34
+ },
35
+ "250001": {
36
+ "content": "<mask>",
37
+ "lstrip": true,
38
+ "normalized": false,
39
+ "rstrip": false,
40
+ "single_word": false,
41
+ "special": true
42
+ }
43
+ },
44
+ "bos_token": "<s>",
45
+ "clean_up_tokenization_spaces": true,
46
+ "cls_token": "<s>",
47
+ "eos_token": "</s>",
48
+ "mask_token": "<mask>",
49
+ "max_length": 1024,
50
+ "model_max_length": 1024,
51
+ "pad_to_multiple_of": null,
52
+ "pad_token": "<pad>",
53
+ "pad_token_type_id": 0,
54
+ "padding_side": "right",
55
+ "sep_token": "</s>",
56
+ "sp_model_kwargs": {},
57
+ "stride": 0,
58
+ "tokenizer_class": "XLMRobertaTokenizer",
59
+ "truncation_side": "right",
60
+ "truncation_strategy": "longest_first",
61
+ "unk_token": "<unk>"
62
+ }