File size: 4,367 Bytes
4edc5e9
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
53e5494
 
ba8ceb8
 
06b57a4
 
53e5494
 
21aa37f
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
5781069
 
 
 
 
 
 
 
 
 
 
 
 
 
 
92e1d6b
8a8bac4
 
a03336b
53e5494
a03336b
53e5494
a03336b
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
---
license: apache-2.0
language:
- aa
- ae
- ak
- ba
- ru
- zh
- fr
- fy
- en
- el
- pl
- be
- dv
- de
- bg
metrics:
- charcut_mt
- code_eval
base_model:
- Felguk/felguk-audio-edit
pipeline_tag: zero-shot-classification
library_name: allennlp
tags:
- audio edit
- audio
---

# Felguk Audio Edit Model

<img src="https://huggingface.co/Felguk/felguk-audio-edit/resolve/main/hd_1f98aa0e8f0f1001c045db5a70e5e1dc_67777ddd2cf16.png" alt="Header Image" width="100%"/>

<img src="https://huggingface.co/Felguk/felguk-audio-edit/resolve/main/angry-cat.gif" alt="Angry Cat GIF" width="100%"/>

Это модель для редактирования аудио, разработанная Felguk. Она позволяет выполнять различные задачи, такие как обрезка, наложение эффектов и другие манипуляции с аудиофайлами.

## Поддерживаемые языки

Модель поддерживает работу с аудио на следующих языках:

- **Афарский (aa)**
- **Авестийский (ae)**
- **Акан (ak)**
- **Башкирский (ba)**
- **Русский (ru)**
- **Китайский (zh)**
- **Французский (fr)**
- **Фризский (fy)**
- **Английский (en)**
- **Греческий (el)**
- **Польский (pl)**
- **Белорусский (be)**
- **Мальдивский (dv)**
- **Немецкий (de)**
- **Болгарский (bg)**

| №   | Название инструмента       | Описание                                                                 |
|-----|----------------------------|-------------------------------------------------------------------------|
| 1   | **Trip Audio**             | Создание психоделических эффектов: эхо, реверберация, искажение.        |
| 2   | **Loud Audio**             | Увеличение громкости и нормализация звука.                              |
| 3   | **Speed Audio**            | Изменение скорости воспроизведения (ускорение или замедление).          |
| 4   | **Lyrics by Audio**       | Автоматическое распознавание текста песен из аудиофайлов.               |
| 5   | **Video to Audio Converter** | Извлечение аудиодорожки из видеофайлов.                               |
| 6   | **Audio Converter**        | Конвертация аудиофайлов между форматами (MP3, WAV, FLAC и др.).      |
| 7   | **Noise Reduction**        | Удаление фонового шума из аудиозаписей.                                 |
| 8   | **Pitch Shifter**          | Изменение тональности аудио (повышение или понижение pitch).            |
| 9   | **Audio Trimmer**          | Обрезка аудиофайлов до нужной длины.                                    |
| 10  | **Audio Mixer**            | Сведение нескольких аудиодорожек в одну.                                |

> **Примечание:** Демо-приложение для этой модели пока находится в разработке.  
> **Завершение примечания.**

[![Beta App](https://img.shields.io/badge/WebSim-Beta-orange)](https://drive.google.com/file/d/1VQsdRX_SEaZciwOXjcpia4ClpqN5shDZ/view)

## Использование

Пример использования модели для редактирования аудио:

```python
import torch
from transformers import AutoModelForAudioEditing, AutoProcessor

# Загрузка модели и процессора
model_name = "Felguk/felguk-audio-edit"
model = AutoModelForAudioEditing.from_pretrained(model_name)
processor = AutoProcessor.from_pretrained(model_name)

# Загрузка аудиофайла
audio_input, sample_rate = processor.load_audio("path_to_your_audio_file.wav")

# Обработка аудио
with torch.no_grad():
    edited_audio = model(audio_input)

# Сохранение результата
processor.save_audio("edited_audio.wav", edited_audio, sample_rate)