Транскрибация аудио и видео в текст. Пачкой. На вашем компьютере.
Программа «Транскрибатор» скачивает видео с YouTube, извлекает аудио из ваших файлов и делает расшифровку записей в готовые .txt — лекции, интервью, подкасты, вебинары. Распознавание оплачивается по факту минут, без подписок на онлайн-сервисы.
Установлю и настрою под вас. Покажу на вашей записи до оплаты.
Если записей больше, чем времени их слушать
Блогерам и подкастерам
Скачайте свой канал или плейлист и получите расшифровки всех выпусков: для субтитров, описаний и переупаковки в статьи.
Авторам курсов
Папка с лекциями превращается в текстовые конспекты. Основа для методичек, лендингов и проверки материала.
Журналистам и исследователям
Часовое интервью — в текст, по которому работает поиск. Цитаты находятся за секунды, а не за прослушивания.
Тем, кто работает с ИИ
Команда merge склеивает расшифровки в один файл — готовый материал для ChatGPT, Claude и любых нейросетей: саммари, статьи, базы знаний.
Как расшифровать записи: три шага — и папка с текстами
transcrib --dir "D:\Записи"
Чанки 15/15 · 100% · OK
merge --dir "D:\Записи"
Что умеет программа для транскрибации
Что важно знать до покупки
- «Транскрибатор» устанавливается на ваш компьютер и требует доступ в интернет: распознавание речи выполняет нейросетевая модель через API-сервис, на компьютере происходит вся остальная обработка — скачивание, извлечение и сжатие аудио, сохранение текста.
- Распознавание оплачивается отдельно — напрямую провайдеру API, с вашего собственного ключа. Стоимость зависит от выбранной модели и считается по минутам аудио; на типовых задачах это единицы рублей за час записи (ориентир, не оферта — точный тариф провайдера покажу при настройке).
- Записи с государственной тайной, строгими NDA или особо чувствительными персональными данными через внешние API обрабатывать не следует — скажу об этом прямо, а не мелким шрифтом.
- Это консольная программа без «окошек». Если слово «терминал» пугает — не страшно: при установке под ключ вы получите шпаргалку из трёх команд и видеоинструкцию.
- Основная платформа — Windows. Качество распознавания зависит от качества записи: диктофон в кармане расшифруется хуже, чем петличка.
Частые вопросы
Я не программист. Справлюсь?
Да. При установке под ключ я сам ставлю программу и все зависимости, завожу ключ API, прогоняю вашу первую запись и оставляю короткую шпаргалку. Дальше вся работа — это одна команда, в которую вы подставляете путь к папке или ссылку.
Какие форматы поддерживаются?
Аудио: mp3, wav, m4a, aac, flac, ogg, wma. Видео: mp4, mkv, mov — аудиодорожка извлекается автоматически. Плюс YouTube: отдельные ролики, плейлисты и списки ссылок из файла.
На каком языке распознаёт?
Базовая настройка — русский. Под другие языки программа настраивается при установке — уточните при обращении.
Сколько стоит само распознавание?
Вы платите провайдеру API по факту минут аудио со своего ключа — без абонентской платы за «тариф». Точную стоимость на актуальной модели покажу на вашем примере при настройке: тарифы провайдера периодически меняются, обещать фиксированную цифру было бы нечестно.
Куда уходят мои записи? Это безопасно?
Аудио отправляется по защищённому соединению в API-сервис распознавания (OpenRouter) и используется для получения текста. Готовые расшифровки хранятся только у вас на диске. Для записей с повышенными требованиями к конфиденциальности внешние API — не лучший выбор, обсудим вашу ситуацию отдельно.
А есть версия для Mac или Linux?
Программа написана на Python и в принципе переносима. Основная поддерживаемая платформа — Windows; установку на Mac/Linux обсудим индивидуально.
Покажу на вашей записи — бесплатно
Напишите мне в Telegram: пришлите пример вашей записи, я расшифрую её Транскрибатором и пришлю результат. Понравится — установлю и настрою всё под ваши задачи.
Написать в TelegramКонсультация и оценка вашей задачи — бесплатно. Переходя в Telegram, вы попадаете в сторонний сервис со своими условиями.
О программе «Транскрибатор»
«Транскрибатор» — это программа для транскрибации (расшифровки) аудио и видео в текст, которая устанавливается на компьютер пользователя под Windows и работает из командной строки. Она решает задачу пакетной обработки: целая папка записей, плейлист YouTube или список ссылок превращаются в текстовые файлы .txt за один запуск. Распознавание речи выполняет нейросетевая модель через облачный API — поэтому для работы нужен интернет, а оплата идёт по минутам обработанного аудио, без месячных подписок. Типовые сценарии: расшифровка лекций и вебинаров для авторов курсов, транскрибация интервью для журналистов и исследователей, перевод выпусков подкастов и YouTube-каналов в текст для субтитров и статей, подготовка материалов для работы с нейросетями. Программа распространяется с установкой и настройкой под ключ.