anton-l
/

wav2vec2-large-xlsr-53-chuvash

Automatic Speech Recognition

xlsr-fine-tuning-week

Model card Files Files and versions Community

speech-test commited on Mar 27, 2021

Commit

8cd9d75

·

1 Parent(s): 137287d

Pure python evaluation

Files changed (1) hide show

README.md +10 -2

README.md CHANGED Viewed

@@ -80,11 +80,19 @@ tar -zxvf cv.tar.gz
 ```python
 import torch
 import torchaudio
 import pandas as pd
 from tqdm.auto import tqdm
-from datasets import load_dataset, load_metric
 from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
 wer = load_metric("wer")
 processor = Wav2Vec2Processor.from_pretrained("anton-l/wav2vec2-large-xlsr-53-chuvash")
@@ -97,7 +105,7 @@ clips_path = "cv-corpus-6.1-2020-12-11/cv/clips/"
 def clean_sentence(sent):
     sent = sent.lower()
     # replace non-alpha characters with space
-    sent = "".join(ch if ch.isalpha() or ch == "'" else " " for ch in sent)
     # remove repeated spaces
     sent = " ".join(sent.split())
     return sent

 ```python
 import torch
 import torchaudio
+import urllib.request
+import tarfile
 import pandas as pd
 from tqdm.auto import tqdm
+from datasets import load_metric
 from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
+# Download the raw data instead of using HF datasets to save space
+data_url = "https://voice-prod-bundler-ee1969a6ce8178826482b88e843c335139bd3fb4.s3.amazonaws.com/cv-corpus-6.1-2020-12-11/cv.tar.gz"
+filestream = urllib.request.urlopen(data_url)
+data_file = tarfile.open(fileobj=filestream, mode="r|gz")
+data_file.extractall()
 wer = load_metric("wer")
 processor = Wav2Vec2Processor.from_pretrained("anton-l/wav2vec2-large-xlsr-53-chuvash")
 def clean_sentence(sent):
     sent = sent.lower()
     # replace non-alpha characters with space
+    sent = "".join(ch if ch.isalpha() else " " for ch in sent)
     # remove repeated spaces
     sent = " ".join(sent.split())
     return sent