Видео в текст онлайн — расшифровка и транскрибация
Перевести видео в текст онлайн: загрузите MP4, MOV, WebM или MKV — Whisper расшифрует речь прямо в браузере. Русский, английский, 16+ языков. Без регистрации, без отправки на сервер.
О расшифровке видео в браузере
Видео в текст — это автоматическая расшифровка речи из видеофайла. Загрузите MP4, MOV, WebM или MKV — браузер сам вытащит звуковую дорожку, а модель Whisper (от OpenAI) разделит её на 30-секундные окна, найдёт речь, расставит знаки препинания и выдаст текст. Дальше — копируйте, скачивайте .txt или сразу нажимайте «Перевести», чтобы открыть результат в нашем переводчике.
Под капотом — Whisper в формате ONNX, запущенный через transformers.js (Hugging Face) как WebAssembly прямо в браузере. Поддерживает 99 языков, на UI выведены 16 самых востребованных — русский, английский, немецкий, французский, испанский, итальянский, украинский, польский, чешский, турецкий, нидерландский, китайский, японский, корейский, арабский, португальский. Режим «Авто» — Whisper сам определит язык по первым секундам.
Видео не покидает ваше устройство — расшифровка идёт локально, в браузере. Модель скачивается один раз (~75 МБ для Tiny, ~145 МБ для Base) и кэшируется. Никакой регистрации, никакой загрузки на сервер. На длинных файлах (>5 минут) распознавание идёт дольше — это нормальная цена за приватность.
Где это пригодится
Расшифровать интервью с YouTube
Скачали видеоинтервью или подкаст — загрузите файл и получите готовый текст для редактуры, цитат, статьи. Whisper хорошо ставит знаки препинания и работает с типичной речью.
Сделать стенограмму вебинара
Записали Zoom-конференцию или вебинар — превратите видео в текст, чтобы быстро найти, кто что сказал, и разослать резюме команде. Точность лучше всего при чистой записи без сильного фонового шума.
Получить субтитры к видео
Снимаете видео для YouTube или TikTok — расшифруйте речь, чтобы добавить субтитры или быстро написать описание. Текст можно отредактировать прямо на странице перед скачиванием.
Перевести иностранный видеоурок
Лекция на английском, обучающее видео на немецком, фильм на испанском — сначала расшифруйте речь, потом нажмите «→ Перевести», чтобы открыть текст в нашем переводчике (он тоже работает локально).
Частые вопросы
Какие форматы видео поддерживаются?
Всё, что декодирует браузер: MP4 (H.264 + AAC — самый распространённый), MOV (с iPhone), WebM, MKV, M4V, AVI, MPEG. Сам видеоряд не нужен — мы вытаскиваем только аудиодорожку. Если ваш файл не открывается, попробуйте сначала конвертировать его в MP4, например, через наш конвертер видео.
Загружается ли видео на сервер?
Нет. Расшифровка полностью клиентская — модель Whisper скачивается на ваше устройство один раз и дальше работает локально через WebAssembly. Сам видеофайл никуда не отправляется. Можно отключить интернет после загрузки модели — расшифровка продолжит работать.
Какая точность расшифровки?
Для чистой речи — обычно 90–96% (модель Tiny) или 94–98% (модель Base). Точность падает на: фоновой музыке, нескольких говорящих одновременно, сильных акцентах, специальных терминах. Если в видео громкая музыка или эффекты — лучше предварительно вырезать только речь через наш «Аудио из видео» + редактор.
Какой максимальный размер видео?
До 500 МБ. Это покрывает большинство видео до 1–2 часов в 720p и до 30–60 минут в 1080p. Если файл больше — обрежьте его в любой видео-программе или сначала переконвертируйте в более низкое качество. Для расшифровки качество видео не важно — важно только аудио.
Сколько занимает расшифровка часового видео?
Tiny на CPU обычно работает близко к реальному времени — 1 час видео ≈ 1 час расшифровки. Base — в 1.5–2 раза медленнее, но точнее. Первый запуск дольше: нужно скачать модель (~75 МБ для Tiny, ~145 МБ для Base). Дальше модель кэшируется в браузере и при следующих файлах загрузка пропускается.
Чем это отличается от загрузки на YouTube для субтитров?
YouTube расшифровывает только публичные ролики, требует загрузки на сервер, иногда выкатывает плохие автосубтитры на русском. Здесь — приватно, без аккаунта, можно загружать любые рабочие, личные, конфиденциальные видео. Текст редактируется прямо в браузере и сразу скачивается.
Можно ли сразу перевести расшифрованный текст?
Да — после расшифровки нажмите кнопку «→ Перевести». Откроется наш текстовый переводчик с уже вставленным текстом. Перевод тоже локальный (через Bergamot WASM от Mozilla), без отправки на сервер.