merve HF staff commited on
Commit
54ad5c6
·
1 Parent(s): 9571bd4

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +7 -11
README.md CHANGED
@@ -11,23 +11,18 @@ license: apache-2.0
11
  <h1>Neler yaptık? </h1>
12
  <h2>Adres Tanıma </h2>
13
  </p>Etiketli veriden NER modeli eğittik, en iyi bunlar çalışıyor: <a href="https://huggingface.co/deprem-ml/deprem-ner">deprem-ner</a> ve <a href="https://huggingface.co/deprem-ml/deprem-ner-mdebertav3">deprem-ner-mdebertav3</a><br>
14
- Bu model pipeline'da openAI davinci'nin yükünü hafifletiyor.
15
  <br>
16
- Şu modelleri benchmark ettik 👇 <br>
17
  - convbert-base-turkish-ner (xlm-roberta-turkish-ner'le birebir çalışıyor)<br>
18
  - xlm_roberta_large_df <br>
19
- - xlm-roberta-turkish-ner (iyi çalışıyor ama iyisi bulunabilir, LOC döndürüyor sadece)<br>
20
  - <a href="https://huggingface.co/deprem-ml/deprem-ner">deprem-ner</a> ve <a href="https://huggingface.co/deprem-ml/deprem-ner-mdebertav3">deprem-ner-mdebertav3</a> modellerimiz en iyi ve en spesifik location tag'lerini döndürüyor.
21
  <br>
22
- Benchmark'ları şu dataset'te görebilirsiniz: <a href="https://huggingface.co/datasets/deprem-ml/butun_model_benchmarklari">deprem-ml/butun_model_benchmarklari</a> <br>
23
- Benchmark ettiğimiz notebook'u <a href="https://colab.research.google.com/drive/1NxQe-EPjF0Sckf54ZqOKkDP7HlpBkk8P?usp=sharing">burada</a> bulabilirsiniz.
24
  </p>
25
  <h2> Intent Classification </h2>
26
  <p>
27
- - Pipeline'da zero-shot Türkçe metin sınıflandırma kullanıyoruz: emrecan/convbert-base-turkish-mc4-cased-allnli_tr
28
  <br>
29
- - Candidate label'ları belirlemek için clustering modeli eğitildi, embedding'ler <a href="https://huggingface.co/deprem-ml/distilroberta-tweet-clustering-embeddings">burada</a><br>.
30
- - Dockerized FastAPI based pipeline: https://github.com/acikkaynak/depremadres-intent-classification-v0
31
  </p>
32
  <h2>OCR</h2>
33
  <p> OCR için <a href="https://github.com/JaidedAI/EasyOCR">EasyOCR</a> kullandık. Space OCR'ın çıktısını davinci'ye veriyor, sonraki adımda NER'i swap edeceğiz. Bu Space'i iki türlü kullanabilirsiniz:<br>
@@ -37,12 +32,13 @@ Benchmark ettiğimiz notebook'u <a href="https://colab.research.google.com/drive
37
  -Tesseract OCR <br>
38
  -MMOCR<br>
39
  -docTR<br>
40
- -PaddleOCR
41
- <br><br>
 
42
  Space'e PR açabilirsiniz. Space'e PR açmadan önce: <br>
43
  - Sağ üstteki üç noktadan "Duplicate this Space" seçeneğini seçerek Space'i çiftleyin.<br>
44
  - Değişikliklerinizi kendi fork'unuzda yapıp ardından ana Space'e PR açın. PR açarken lütfen kendi Space'inizin linkini açıklamaya ekleyin.<br>
45
  - Dependency eklememeye çalışın.<br>
46
 
47
- **GPU inference desteği için Hugging Face ekibine, API key için microsoft'a ve labelling desteği için AWS'e sonsuz teşekkürlerimizi sunarız.**
48
  </p>
 
11
  <h1>Neler yaptık? </h1>
12
  <h2>Adres Tanıma </h2>
13
  </p>Etiketli veriden NER modeli eğittik, en iyi bunlar çalışıyor: <a href="https://huggingface.co/deprem-ml/deprem-ner">deprem-ner</a> ve <a href="https://huggingface.co/deprem-ml/deprem-ner-mdebertav3">deprem-ner-mdebertav3</a><br>
 
14
  <br>
15
+ Şu modelleri zero-shot benchmark ettik, son modeli kendimiz eğittik 👇 <br>
16
  - convbert-base-turkish-ner (xlm-roberta-turkish-ner'le birebir çalışıyor)<br>
17
  - xlm_roberta_large_df <br>
18
+ - xlm-roberta-turkish-ner <br>
19
  - <a href="https://huggingface.co/deprem-ml/deprem-ner">deprem-ner</a> ve <a href="https://huggingface.co/deprem-ml/deprem-ner-mdebertav3">deprem-ner-mdebertav3</a> modellerimiz en iyi ve en spesifik location tag'lerini döndürüyor.
20
  <br>
 
 
21
  </p>
22
  <h2> Intent Classification </h2>
23
  <p>
24
+ - Etiketli veride insanların ihtiyaçlarını tahmin eden modeller eğittik, benchmark'ları leaderboard'larda ve model repository'leri bu organizasyonda bulabilirsiniz. v12 ve v13 arasındaki fark data drift ve ihtiyaca göre değişen label'lar.
25
  <br>
 
 
26
  </p>
27
  <h2>OCR</h2>
28
  <p> OCR için <a href="https://github.com/JaidedAI/EasyOCR">EasyOCR</a> kullandık. Space OCR'ın çıktısını davinci'ye veriyor, sonraki adımda NER'i swap edeceğiz. Bu Space'i iki türlü kullanabilirsiniz:<br>
 
32
  -Tesseract OCR <br>
33
  -MMOCR<br>
34
  -docTR<br>
35
+ -PaddleOCR<br>
36
+ Adres tanıma için kendi eğittimiz adres tanıma modelini kullanıyoruz.
37
+ <br>
38
  Space'e PR açabilirsiniz. Space'e PR açmadan önce: <br>
39
  - Sağ üstteki üç noktadan "Duplicate this Space" seçeneğini seçerek Space'i çiftleyin.<br>
40
  - Değişikliklerinizi kendi fork'unuzda yapıp ardından ana Space'e PR açın. PR açarken lütfen kendi Space'inizin linkini açıklamaya ekleyin.<br>
41
  - Dependency eklememeye çalışın.<br>
42
 
43
+ **GPU inference desteği için Hugging Face ekibine, labelling desteği için microsoft'a ve AWS'e sonsuz teşekkürlerimizi sunarız.**
44
  </p>