vlad.os/simple-asr-server

Fork 0

Go to file

red ce41cf4a09 - Добавлены параметры модели в гет эндпоинт

2025-08-20 23:25:05 +09:00

.idea

- Поменял всё снова на Whisper

2025-08-20 23:18:02 +09:00

.env.example

- Поменял всё снова на Whisper

2025-08-20 23:18:02 +09:00

app.py

- Добавлены параметры модели в гет эндпоинт

2025-08-20 23:25:05 +09:00

docker-compose.yml

- Поменял всё снова на Whisper

2025-08-20 23:18:02 +09:00

Dockerfile

- Поменял всё снова на Whisper

2025-08-20 23:18:02 +09:00

LICENSE

Create LICENSE

2025-07-15 00:38:19 +03:00

README.md

- Поменял всё снова на Whisper

2025-08-20 23:18:02 +09:00

requirements.txt

- Поменял всё снова на Whisper

2025-08-20 23:18:02 +09:00

simple-asr-server.service

- Поменял всё снова на Whisper

2025-08-20 23:18:02 +09:00

start_server.sh

- Поменял всё снова на Whisper

2025-08-20 23:18:02 +09:00

README.md

Simple ASR Server

Простой сервер для автоматического распознавания речи (ASR) на базе OpenAI Whisper.

Особенности

Поддержка различных моделей Whisper (tiny, base, small, medium, large, turbo)
Три формата вывода: plaintext, simple JSON, полный JSON
Параметр speedup для ускорения аудио перед распознаванием
Автоматическая конвертация аудио в поддерживаемый формат
API ключи для безопасности
Docker поддержка

Быстрый старт

Локальная установка

Установите зависимости:

pip install -r requirements.txt

Скопируйте и настройте переменные окружения:

cp .env.example .env

Запустите сервер:

python app.py

Docker

Постройте и запустите контейнер:

docker-compose up --build

API

POST /transcribe

Распознавание речи из аудиофайла.

Параметры:

file (файл) - Аудиофайл для распознавания
model_name (опционально) - Модель Whisper для использования
output_format - Формат вывода: plaintext, simple, или json
speedup - Коэффициент ускорения аудио (0.25-4.0)

Заголовки:

x-api-key - API ключ

Примеры:

# Простой текстовый вывод
curl -X POST "http://localhost:9854/transcribe?output_format=plaintext&speedup=1.5" \
  -H "x-api-key: YOUR_API_KEY" \
  -F "file=@audio.wav"

# JSON с только текстом
curl -X POST "http://localhost:9854/transcribe?output_format=simple" \
  -H "x-api-key: YOUR_API_KEY" \
  -F "file=@audio.wav"

# Полный JSON ответ с использованием другой модели
curl -X POST "http://localhost:9854/transcribe?output_format=json&model_name=base" \
  -H "x-api-key: YOUR_API_KEY" \
  -F "file=@audio.wav"

GET /health

Проверка состояния сервера.

Переменные окружения

См. .env.example для полного списка доступных переменных:

HOST - Хост сервера (по умолчанию: 0.0.0.0)
PORT - Порт сервера (по умолчанию: 9854)
DEFAULT_MODEL - Модель по умолчанию (по умолчанию: turbo)
MODEL_DOWNLOAD_ROOT - Папка для загрузки моделей
KEYS_FILE - Файл с API ключами

README.md Unescape Escape

Simple ASR Server

Особенности

Быстрый старт

Локальная установка

Docker

API

POST /transcribe

GET /health

Переменные окружения

README.md