File size: 2,496 Bytes
35a6d34 50a9ec7 50f3249 6af96e2 285c068 6551776 c6bee2c 54ad5c6 6af96e2 6551776 dca24c8 54ad5c6 dca24c8 358ff72 10d10ef 0e63ebc 42846cd 2ea44ac 54ad5c6 369c3c8 358ff72 80259bc 54ad5c6 358ff72 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 |
---
title: README
emoji: 🐢
colorFrom: blue
colorTo: gray
sdk: static
pinned: false
license: apache-2.0
---
<h1>Neler yaptık? ❤️🩹 </h1>
<h2>Adres Tanıma </h2>
</p>Etiketli veriden NER modeli eğittik, en iyi bunlar çalışıyor: <a href="https://huggingface.co/deprem-ml/deprem-ner">deprem-ner</a> ve <a href="https://huggingface.co/deprem-ml/deprem-ner-mdebertav3">deprem-ner-mdebertav3</a><br>
Şu modelleri zero-shot benchmark ettik, son modelleri kendimiz eğittik 👇 <br>
- convbert-base-turkish-ner (xlm-roberta-turkish-ner'le birebir çalışıyor)<br>
- xlm_roberta_large_df <br>
- xlm-roberta-turkish-ner <br>
- <a href="https://huggingface.co/deprem-ml/deprem-ner">deprem-ner</a> ve <a href="https://huggingface.co/deprem-ml/deprem-ner-mdebertav3">deprem-ner-mdebertav3</a> modellerimiz en iyi ve en spesifik location tag'lerini döndürüyor.
<br>
</p>
<h2> Intent Classification </h2>
<p>
- Etiketli veride insanların ihtiyaçlarını tahmin eden modeller eğittik, benchmark'ları leaderboard'larda ve model repository'leri bu organizasyonda bulabilirsiniz. v12 ve v13 arasındaki fark data drift ve ihtiyaca göre değişen label'lar.
<br>
</p>
<h2>OCR</h2>
<p> OCR için <a href="https://github.com/JaidedAI/EasyOCR">EasyOCR</a> kullandık. Space OCR'ın çıktısını kendi NER modelimize veriyor. Bu Space'i iki türlü kullanabilirsiniz:<br>
- GUI olarak kullanıp metin içeren screenshot ya da metnin kendisini verip input'un DB'ye düşmesini sağlayabilirsiniz.<br>
- (Kullanılan) Backend'inize entegre edebilirsiniz. Space'in en altında "Use via API"ya tıklayarak endpoint'ler nasıl kullanılıyor bakıp bu Space'i kendi backend'inizde kullanabilirsiniz. <br>
OCR tarafında test edilen ve/-ya görüşülen diğer toolboxlar (efor kaybına yol açmaması adına) aşağıda listelenmiştir;<br>
-Tesseract OCR <br>
-MMOCR<br>
-docTR<br>
-PaddleOCR<br>
Adres tanıma için kendi eğittimiz adres tanıma modelini kullanıyoruz.
<br>
Space'e PR açabilirsiniz. Space'e PR açmadan önce: <br>
- Sağ üstteki üç noktadan "Duplicate this Space" seçeneğini seçerek Space'i çiftleyin.<br>
- Değişikliklerinizi kendi fork'unuzda yapıp ardından ana Space'e PR açın. PR açarken lütfen kendi Space'inizin linkini açıklamaya ekleyin.<br>
- Dependency eklememeye çalışın.<br>
**GPU inference desteği için Hugging Face ekibine, labelling desteği için microsoft'a ve AWS'e sonsuz teşekkürlerimizi sunarız.**
</p> |