утилита для Windows · работает у вас на компьютере

Транскрибация аудио и видео в текст. Пачкой. На вашем компьютере.

Программа «Транскрибатор» скачивает видео с YouTube, извлекает аудио из ваших файлов и делает расшифровку записей в готовые .txt — лекции, интервью, подкасты, вебинары. Распознавание оплачивается по факту минут, без подписок на онлайн-сервисы.

Установлю и настрою под вас. Покажу на вашей записи до оплаты.

$ transcrib --dir "D:\Записи\интервью" ╭───────────────────────────╮ │ ТРАНСКРИБАТОР v3.0 │ │ режим: облако (API) │ ╰───────────────────────────╯ 1 интервью_01.mp4 45.2 MB 2 интервью_02.mp4 38.7 MB 3 подкаст_03.mp3 22.1 MB аудио: 3.1 MB сжатие 15× Транскрибация ━━━━━━━━━━━━━━ 100% Сохранено: интервью_01.txt 12.4 KB Сохранено: интервью_02.txt 10.1 KB Сохранено: подкаст_03.txt 8.7 KB Файлы 3 / 3 ████████████████████ Время 4m 01s ══ СЕССИЯ ЗАВЕРШЕНА ══
для кого

Если записей больше, чем времени их слушать

--url плейлист

Блогерам и подкастерам

Скачайте свой канал или плейлист и получите расшифровки всех выпусков: для субтитров, описаний и переупаковки в статьи.

--dir лекции

Авторам курсов

Папка с лекциями превращается в текстовые конспекты. Основа для методичек, лендингов и проверки материала.

--file интервью.mp3

Журналистам и исследователям

Часовое интервью — в текст, по которому работает поиск. Цитаты находятся за секунды, а не за прослушивания.

merge → нейросеть

Тем, кто работает с ИИ

Команда merge склеивает расшифровки в один файл — готовый материал для ChatGPT, Claude и любых нейросетей: саммари, статьи, базы знаний.

как это работает

Как расшифровать записи: три шага — и папка с текстами

шаг 1 Укажите источник. Файл, целая папка, ссылка на YouTube-видео или плейлист, либо текстовый список ссылок. transcrib --dir "D:\Записи"
шаг 2 Программа делает всё сама. Скачивает, извлекает и сжимает аудио, режет на фрагменты и отправляет на распознавание. Вы видите живой прогресс по каждому фрагменту. Чанки 15/15 · 100% · OK
шаг 3 Забирайте текст. Готовый .txt появляется рядом с исходным файлом. При желании — один общий файл со всеми расшифровками. merge --dir "D:\Записи"
что внутри

Что умеет программа для транскрибации

[ok]
Пакетная обработка. Вся папка с видео и аудио — одной командой, без ручного перетаскивания файлов по одному.
[ok]
YouTube встроен. Видео, плейлисты и списки ссылок скачиваются и расшифровываются за один запуск.
[ok]
Оплата по факту. Распознавание тарифицируется по минутам аудио через API — вы не платите за месяцы, когда ничего не расшифровывали.
[ok]
Результат у вас на диске. Тексты не лежат в чужом личном кабинете — это обычные .txt рядом с исходниками, в вашем порядке.
[ok]
Склейка для нейросетей. Команда merge собирает расшифровки в один документ с заголовками-разделителями.
[ok]
Понятный отчёт. По каждому файлу — размер, статус, время; в конце — итоговая сводка сессии.
[ok]
Устойчивость к сбоям. Неудачные фрагменты отправляются повторно, а любые пропуски честно помечаются в тексте — без «тихих» дыр в расшифровке.
[ok]
Только аудио — тоже можно. Режим извлечения аудиодорожки из видео без расшифровки: компактные mp3 из тяжёлых роликов.
честно о том, как устроено

Что важно знать до покупки

  • «Транскрибатор» устанавливается на ваш компьютер и требует доступ в интернет: распознавание речи выполняет нейросетевая модель через API-сервис, на компьютере происходит вся остальная обработка — скачивание, извлечение и сжатие аудио, сохранение текста.
  • Распознавание оплачивается отдельно — напрямую провайдеру API, с вашего собственного ключа. Стоимость зависит от выбранной модели и считается по минутам аудио; на типовых задачах это единицы рублей за час записи (ориентир, не оферта — точный тариф провайдера покажу при настройке).
  • Записи с государственной тайной, строгими NDA или особо чувствительными персональными данными через внешние API обрабатывать не следует — скажу об этом прямо, а не мелким шрифтом.
  • Это консольная программа без «окошек». Если слово «терминал» пугает — не страшно: при установке под ключ вы получите шпаргалку из трёх команд и видеоинструкцию.
  • Основная платформа — Windows. Качество распознавания зависит от качества записи: диктофон в кармане расшифруется хуже, чем петличка.
вопросы

Частые вопросы

Я не программист. Справлюсь?

Да. При установке под ключ я сам ставлю программу и все зависимости, завожу ключ API, прогоняю вашу первую запись и оставляю короткую шпаргалку. Дальше вся работа — это одна команда, в которую вы подставляете путь к папке или ссылку.

Какие форматы поддерживаются?

Аудио: mp3, wav, m4a, aac, flac, ogg, wma. Видео: mp4, mkv, mov — аудиодорожка извлекается автоматически. Плюс YouTube: отдельные ролики, плейлисты и списки ссылок из файла.

На каком языке распознаёт?

Базовая настройка — русский. Под другие языки программа настраивается при установке — уточните при обращении.

Сколько стоит само распознавание?

Вы платите провайдеру API по факту минут аудио со своего ключа — без абонентской платы за «тариф». Точную стоимость на актуальной модели покажу на вашем примере при настройке: тарифы провайдера периодически меняются, обещать фиксированную цифру было бы нечестно.

Куда уходят мои записи? Это безопасно?

Аудио отправляется по защищённому соединению в API-сервис распознавания (OpenRouter) и используется для получения текста. Готовые расшифровки хранятся только у вас на диске. Для записей с повышенными требованиями к конфиденциальности внешние API — не лучший выбор, обсудим вашу ситуацию отдельно.

А есть версия для Mac или Linux?

Программа написана на Python и в принципе переносима. Основная поддерживаемая платформа — Windows; установку на Mac/Linux обсудим индивидуально.

следующий шаг

Покажу на вашей записи — бесплатно

Напишите мне в Telegram: пришлите пример вашей записи, я расшифрую её Транскрибатором и пришлю результат. Понравится — установлю и настрою всё под ваши задачи.

Написать в Telegram

Консультация и оценка вашей задачи — бесплатно. Переходя в Telegram, вы попадаете в сторонний сервис со своими условиями.

справка

О программе «Транскрибатор»

«Транскрибатор» — это программа для транскрибации (расшифровки) аудио и видео в текст, которая устанавливается на компьютер пользователя под Windows и работает из командной строки. Она решает задачу пакетной обработки: целая папка записей, плейлист YouTube или список ссылок превращаются в текстовые файлы .txt за один запуск. Распознавание речи выполняет нейросетевая модель через облачный API — поэтому для работы нужен интернет, а оплата идёт по минутам обработанного аудио, без месячных подписок. Типовые сценарии: расшифровка лекций и вебинаров для авторов курсов, транскрибация интервью для журналистов и исследователей, перевод выпусков подкастов и YouTube-каналов в текст для субтитров и статей, подготовка материалов для работы с нейросетями. Программа распространяется с установкой и настройкой под ключ.