File size: 17,941 Bytes
14ec528
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
---
tags:
- setfit
- sentence-transformers
- text-classification
- generated_from_setfit_trainer
widget:
- text: 빨수있는 헝겊 공구가방 남자 아기 출산선물 육아템 캠핑장난감 유아놀이 장남감 1  출산/육아 > 완구/인형 > 역할놀이/소꿉놀이
- text: 꼬마실로폰 완구 원목블록 출산 매트 육아  출산/육아 > 완구/인형 > 음악/악기놀이
- text: 아이링고  스타터세트 212pcs 블럭장난감 유치원교구  출산/육아 > 완구/인형 > 블록
- text: 쿠쿠토이즈 코코몽 모래놀이 완구 출산 육아 매트  출산/육아 > 완구/인형 > 역할놀이/소꿉놀이
- text: 유아용품 레드박스  주방놀이세트 완구 육아 출산 매트  출산/육아 > 완구/인형 > 역할놀이/소꿉놀이
metrics:
- accuracy
pipeline_tag: text-classification
library_name: setfit
inference: true
base_model: mini1013/master_domain
---

# SetFit with mini1013/master_domain

This is a [SetFit](https://github.com/huggingface/setfit) model that can be used for Text Classification. This SetFit model uses [mini1013/master_domain](https://huggingface.co/mini1013/master_domain) as the Sentence Transformer embedding model. A [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance is used for classification.

The model has been trained using an efficient few-shot learning technique that involves:

1. Fine-tuning a [Sentence Transformer](https://www.sbert.net) with contrastive learning.
2. Training a classification head with features from the fine-tuned Sentence Transformer.

## Model Details

### Model Description
- **Model Type:** SetFit
- **Sentence Transformer body:** [mini1013/master_domain](https://huggingface.co/mini1013/master_domain)
- **Classification head:** a [LogisticRegression](https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html) instance
- **Maximum Sequence Length:** 512 tokens
- **Number of Classes:** 18 classes
<!-- - **Training Dataset:** [Unknown](https://huggingface.co/datasets/unknown) -->
<!-- - **Language:** Unknown -->
<!-- - **License:** Unknown -->

### Model Sources

- **Repository:** [SetFit on GitHub](https://github.com/huggingface/setfit)
- **Paper:** [Efficient Few-Shot Learning Without Prompts](https://arxiv.org/abs/2209.11055)
- **Blogpost:** [SetFit: Efficient Few-Shot Learning Without Prompts](https://huggingface.co/blog/setfit)

### Model Labels
| Label | Examples                                                                                                                                                                                                                                                                      |
|:------|:------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|
| 17.0  | <ul><li>'포켓몬카드 오리진 디아루가 Vstar UR 유니버스 [S]  출산/육아 > 완구/인형 > 캐릭터카드/딱지'</li><li>'[리틀램스쿨][칭찬교구] 칭찬딱지(Chips Collector) C_2  출산/육아 > 완구/인형 > 캐릭터카드/딱지'</li><li>'매직 MH3 SPG 커스텀 TCG 카드 네크로도미넌스 나두 날개 달린 Wisdom Kozilek 부정한 출산 의식 대리인의 깨진 현실 플레어  출산/육아 > 완구/인형 > 캐릭터카드/딱지'</li></ul> |
| 7.0   | <ul><li>'꿈나라 자동 오르골모빌 흑백 컬러 신생아 아기 침대 수동 동물 도형 인형 애기 하트흑백 모빌  출산/육아 > 완구/인형 > 신생아/영유아완구'</li><li>'에뜨와 임신출산선물 코니딸랑이세트 07P083101  출산/육아 > 완구/인형 > 신생아/영유아완구'</li><li>'[모노레임] [단품][2025 뱀띠 출산선물][태명자수]햇뱀 딸랑이 인형(toy)  출산/육아 > 완구/인형 > 신생아/영유아완구'</li></ul>                       |
| 13.0  | <ul><li>'영유아용품 비키즈 투칸 피아노놀이 육아 완구 신생아 매트 출산  출산/육아 > 완구/인형 > 음악/악기놀이'</li><li>'핑크퐁 육아 출산 음악 악기놀이 아기상어 피아노 둥이선물 키즈카페 음량  출산/육아 > 완구/인형 > 음악/악기놀이'</li><li>'유아악기 파도소리 핸드드럼 구슬탬버린 출산선물  출산/육아 > 완구/인형 > 음악/악기놀이'</li></ul>                                                       |
| 0.0   | <ul><li>'애플비 신생아 초점책 아기초점책 4권  출산/육아 > 완구/인형 > 감각발달완구'</li><li>'아기 헝겊책 모음 코야 누가숨었지 초점 헝겊책 무당벌레  출산/육아 > 완구/인형 > 감각발달완구'</li><li>'1+1 정품 국민 애벌레 인형 촉감 감각 애착인형 백일 아기 장난감  출산/육아 > 완구/인형 > 감각발달완구'</li></ul>                                                                     |
| 12.0  | <ul><li>'꼭지퍼즐 핑크퐁 탈것 그림퍼즐 육아 완구 매트 출산 유아동퍼즐  출산/육아 > 완구/인형 > 유아동퍼즐'</li><li>'멜로디 동물퍼즐 유아장난감 출산선물 아기장난감  출산/육아 > 완구/인형 > 유아동퍼즐'</li><li>'쌍문상회 캐치티니핑 시즌3 직소퍼즐 150pcs 액자 유아동퍼즐 완구 매트 출산 육아  출산/육아 > 완구/인형 > 유아동퍼즐'</li></ul>                                                     |
| 16.0  | <ul><li>'손오공 탑블레이드 드래셀S  출산/육아 > 완구/인형 > 작동완구'</li><li>'포켓몬스터 팽이 세트 포켓몬팽이 2개 배틀판  출산/육아 > 완구/인형 > 작동완구'</li><li>'손오공 메탈베이블레이드 4D 엘드라고디스트로이 F:S  출산/육아 > 완구/인형 > 작동완구'</li></ul>                                                                                               |
| 14.0  | <ul><li>'뽀로로 봉제인형 패티 루피 크롱 에디 해리 포비  출산/육아 > 완구/인형 > 인형'</li><li>'옹알이 콩콩이 콩순이 동생 인형 장난감  출산/육아 > 완구/인형 > 인형'</li><li>'젤리캣 국민애착인형 블라썸 크림 버니 L  출산/육아 > 완구/인형 > 인형'</li></ul>                                                                                                   |
| 2.0   | <ul><li>'아기 전신운동 방울 손잡이 유아 목튜브 대근육 출산선물  출산/육아 > 완구/인형 > 물놀이용품'</li><li>'즈램린 애니멀 미니 워터건 물총 매트 육아 완구 물놀이용품 출산  출산/육아 > 완구/인형 > 물놀이용품'</li><li>'유아 놀이풀장 엠보싱바닥 아기풀장 수영장 소형  출산/육아 > 완구/인형 > 물놀이용품'</li></ul>                                                                     |
| 3.0   | <ul><li>'엉뚱발랄콩순이 물감색칠놀이3  출산/육아 > 완구/인형 > 미술놀이'</li><li>'스크레치페이퍼출산/육아완구/매트미술놀이기타미술놀이  출산/육아 > 완구/인형 > 미술놀이'</li><li>'치킨만들기 미니어쳐 양념후라이드 패스트푸드 출산 육아 미술놀이 위블센  출산/육아 > 완구/인형 > 미술놀이'</li></ul>                                                                                  |
| 6.0   | <ul><li>'비바 뉴 프리미엄 145 킥보드 스쿠터 씽씽이 접이식  출산/육아 > 완구/인형 > 승용완구 > 킥보드/씽씽이'</li><li>'마이크로킥보드 마이크로킥보드 미니 핸드 디럭스 LED 라벤더  출산/육아 > 완구/인형 > 승용완구 > 킥보드/씽씽이'</li><li>'마이크로킥보드 미니 투고 디럭스 플러스 LED 푸쉬바 세트  출산/육아 > 완구/인형 > 승용완구 > 킥보드/씽씽이'</li></ul>                                      |
| 4.0   | <ul><li>'아이링고 뉴 스타터세트 212pcs 블럭장난감 유치원교구  출산/육아 > 완구/인형 > 블록'</li><li>'18개월~3세 안심 장난감 블록 테이블 세트  출산/육아 > 완구/인형 > 블록'</li><li>'듀플로호환 유아대형블럭장난감 통큰블럭 소방 경찰 병원  출산/육아 > 완구/인형 > 블록'</li></ul>                                                                                    |
| 9.0   | <ul><li>'영유아용품 레드박스 뉴 피자놀이세트 매트 완구 출산 육아  출산/육아 > 완구/인형 > 역할놀이/소꿉놀이'</li><li>'김밥가게놀이 매트 육아 완구 출산 원목블록 민릿느  출산/육아 > 완구/인형 > 역할놀이/소꿉놀이'</li><li>'과일썰기놀이 완구 원목블록 출산 육아 매트  출산/육아 > 완구/인형 > 역할놀이/소꿉놀이'</li></ul>                                                                  |
| 5.0   | <ul><li>'세계유통 말랑말랑 키즈볼세트 육아 완구 출산 매트 소프트볼 공  출산/육아 > 완구/인형 > 스포츠완구'</li><li>'쿠쿠토이즈 동물볼링 육아 매트 출산 완구  출산/육아 > 완구/인형 > 스포츠완구'</li><li>'농구놀이 농구대 스포츠완구 완구 매트 출산 육아  출산/육아 > 완구/인형 > 스포츠완구'</li></ul>                                                                             |
| 11.0  | <ul><li>'어린이 세발 자전거 1-3-6 세 아기 영 유아 5세 임산부 출산 신혼부부 집들이 선물 덮게 없는 블루 1개  출산/육아 > 완구/인형 > 유아/어린이자전거'</li><li>'48개월 세발자전거 유모차 보호자 손잡이 캐노피자전거(그레이) 주행 튼튼한 1개  출산/육아 > 완구/인형 > 유아/어린이자전거'</li><li>'돌아기자전거 두돌 아기 자전거 3살 트라이크 36개월 30개월  출산/육아 > 완구/인형 > 유아/어린이자전거'</li></ul>         |
| 8.0   | <ul><li>'아리아띠 얼굴 몸통 두조각 동물 퍼즐 두돌 두뇌활동 출산선물  출산/육아 > 완구/인형 > 언어/학습완구'</li><li>'어린이 놀이영어 원목 알파벳자석블럭 4세 유치원생 출산선물  출산/육아 > 완구/인형 > 언어/학습완구'</li><li>'뚜뚜아트 세이펜 아기포스터 유아병풍 아기벽보 코팅 종이 숫자1-100  출산/육아 > 완구/인형 > 언어/학습완구'</li></ul>                                                  |
| 15.0  | <ul><li>'프레파라트 생물 과학교구 출산 자연 프레파라트 육아 생물 학습교구  출산/육아 > 완구/인형 > 자연/과학완구'</li><li>'어린이완구소프트 안킬로 사우르스 반디 공룡 출산 자연 매트  출산/육아 > 완구/인형 > 자연/과학완구'</li><li>'반디 소프트 카르노타우르스 공룡 완구 자연 매트 출산 육아  출산/육아 > 완구/인형 > 자연/과학완구'</li></ul>                                                     |
| 1.0   | <ul><li>'주택 마당 튼튼살대 2인용 어린이 그네 출산선물 유치부  출산/육아 > 완구/인형 > 공간놀이기구'</li><li>'출산선물 오래타는 튼튼 국산 방문그네 키카 유아그네 흔들그네  출산/육아 > 완구/인형 > 공간놀이기구'</li><li>'쿠쿠토이즈 에듀플레이하우스 바이올렛 완구 놀이집 매트 육아 출산  출산/육아 > 완구/인형 > 공간놀이기구'</li></ul>                                                          |
| 10.0  | <ul><li>'유치원 4세반 학습교구 손가락발달 큐브 구슬타워 성취감 돌아기 성장  출산/육아 > 완구/인형 > 원목교구/가베'</li><li>'원목링쌓기 롤러코스터 아기상어 핑크퐁 가베 출산 원목교구 카룰빈  출산/육아 > 완구/인형 > 원목교구/가베'</li><li>'다채로운 모양 블록 분류 게임 몬테소리 학습 교육 완구 비비 출산 인니 퍼즐 선물  출산/육아 > 완구/인형 > 원목교구/가베'</li></ul>                                    |

## Uses

### Direct Use for Inference

First install the SetFit library:

```bash
pip install setfit
```

Then you can load this model and run inference.

```python
from setfit import SetFitModel

# Download from the 🤗 Hub
model = SetFitModel.from_pretrained("mini1013/master_cate_bc13")
# Run inference
preds = model("꼬마실로폰 완구 원목블록 출산 매트 육아  출산/육아 > 완구/인형 > 음악/악기놀이")
```

<!--
### Downstream Use

*List how someone could finetune this model on their own dataset.*
-->

<!--
### Out-of-Scope Use

*List how the model may foreseeably be misused and address what users ought not to do with the model.*
-->

<!--
## Bias, Risks and Limitations

*What are the known or foreseeable issues stemming from this model? You could also flag here known failure cases or weaknesses of the model.*
-->

<!--
### Recommendations

*What are recommendations with respect to the foreseeable issues? For example, filtering explicit content.*
-->

## Training Details

### Training Set Metrics
| Training set | Min | Median  | Max |
|:-------------|:----|:--------|:----|
| Word count   | 7   | 14.3937 | 25  |

| Label | Training Sample Count |
|:------|:----------------------|
| 0.0   | 20                    |
| 1.0   | 20                    |
| 2.0   | 20                    |
| 3.0   | 20                    |
| 4.0   | 20                    |
| 5.0   | 20                    |
| 6.0   | 8                     |
| 7.0   | 20                    |
| 8.0   | 20                    |
| 9.0   | 20                    |
| 10.0  | 20                    |
| 11.0  | 20                    |
| 12.0  | 20                    |
| 13.0  | 20                    |
| 14.0  | 20                    |
| 15.0  | 20                    |
| 16.0  | 20                    |
| 17.0  | 20                    |

### Training Hyperparameters
- batch_size: (256, 256)
- num_epochs: (30, 30)
- max_steps: -1
- sampling_strategy: oversampling
- num_iterations: 50
- body_learning_rate: (2e-05, 1e-05)
- head_learning_rate: 0.01
- loss: CosineSimilarityLoss
- distance_metric: cosine_distance
- margin: 0.25
- end_to_end: False
- use_amp: False
- warmup_proportion: 0.1
- l2_weight: 0.01
- seed: 42
- eval_max_steps: -1
- load_best_model_at_end: False

### Training Results
| Epoch   | Step | Training Loss | Validation Loss |
|:-------:|:----:|:-------------:|:---------------:|
| 0.0147  | 1    | 0.4769        | -               |
| 0.7353  | 50   | 0.4673        | -               |
| 1.4706  | 100  | 0.1769        | -               |
| 2.2059  | 150  | 0.0467        | -               |
| 2.9412  | 200  | 0.012         | -               |
| 3.6765  | 250  | 0.0068        | -               |
| 4.4118  | 300  | 0.0067        | -               |
| 5.1471  | 350  | 0.0043        | -               |
| 5.8824  | 400  | 0.0022        | -               |
| 6.6176  | 450  | 0.0001        | -               |
| 7.3529  | 500  | 0.0001        | -               |
| 8.0882  | 550  | 0.0001        | -               |
| 8.8235  | 600  | 0.0001        | -               |
| 9.5588  | 650  | 0.0001        | -               |
| 10.2941 | 700  | 0.0001        | -               |
| 11.0294 | 750  | 0.0001        | -               |
| 11.7647 | 800  | 0.0           | -               |
| 12.5    | 850  | 0.0           | -               |
| 13.2353 | 900  | 0.0           | -               |
| 13.9706 | 950  | 0.0           | -               |
| 14.7059 | 1000 | 0.0           | -               |
| 15.4412 | 1050 | 0.0           | -               |
| 16.1765 | 1100 | 0.0           | -               |
| 16.9118 | 1150 | 0.0           | -               |
| 17.6471 | 1200 | 0.0           | -               |
| 18.3824 | 1250 | 0.0           | -               |
| 19.1176 | 1300 | 0.0           | -               |
| 19.8529 | 1350 | 0.0           | -               |
| 20.5882 | 1400 | 0.0           | -               |
| 21.3235 | 1450 | 0.0           | -               |
| 22.0588 | 1500 | 0.0           | -               |
| 22.7941 | 1550 | 0.0           | -               |
| 23.5294 | 1600 | 0.0           | -               |
| 24.2647 | 1650 | 0.0           | -               |
| 25.0    | 1700 | 0.0           | -               |
| 25.7353 | 1750 | 0.0           | -               |
| 26.4706 | 1800 | 0.0           | -               |
| 27.2059 | 1850 | 0.0           | -               |
| 27.9412 | 1900 | 0.0           | -               |
| 28.6765 | 1950 | 0.0           | -               |
| 29.4118 | 2000 | 0.0           | -               |

### Framework Versions
- Python: 3.10.12
- SetFit: 1.1.0
- Sentence Transformers: 3.3.1
- Transformers: 4.44.2
- PyTorch: 2.2.0a0+81ea7a4
- Datasets: 3.2.0
- Tokenizers: 0.19.1

## Citation

### BibTeX
```bibtex
@article{https://doi.org/10.48550/arxiv.2209.11055,
    doi = {10.48550/ARXIV.2209.11055},
    url = {https://arxiv.org/abs/2209.11055},
    author = {Tunstall, Lewis and Reimers, Nils and Jo, Unso Eun Seo and Bates, Luke and Korat, Daniel and Wasserblat, Moshe and Pereg, Oren},
    keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
    title = {Efficient Few-Shot Learning Without Prompts},
    publisher = {arXiv},
    year = {2022},
    copyright = {Creative Commons Attribution 4.0 International}
}
```

<!--
## Glossary

*Clearly define terms in order to be accessible across audiences.*
-->

<!--
## Model Card Authors

*Lists the people who create the model card, providing recognition and accountability for the detailed work that goes into its construction.*
-->

<!--
## Model Card Contact

*Provides a way for people who have updates to the Model Card, suggestions, or questions, to contact the Model Card authors.*
-->