ConvertiloConvertilo

Сжать изображение

Уменьшите размер изображений без потери качества

Изменить размер

Измените разрешение под веб и соцсети

Конвертировать

Конвертируйте изображения в нужный формат

Обрезать

Обрежьте изображение под нужные пропорции

Удалить фон с фото

Удалить фон с фото через ИИ — в браузере

Распознать текст с картинки

Распознать текст с картинки — OCR в браузере

Водяной знак на фото

Водяной знак на одно или несколько фото

Размыть фото

Размыть фото целиком или фон

Замазать лицо на фото

Замазать или размыть лицо на фото

Замазать часть фото

Замазать часть фото — текст, паспорт, номер

Сделать гифку

Сделать гифку из видео — MP4/MOV в GIF

Скругление

Скруглите углы изображений онлайн

Удалить метаданные

Удалите EXIF и GPS данные из фото

Соотношение сторон

Узнайте соотношение сторон фото или экрана

Favicon генератор

PNG/JPG/SVG → favicon.ico + все размеры

Фото на документы

Фото на документы 3х4, 4х6, 35х45 — белый фон + А4

Все инструменты

Видео в текст онлайн — расшифровка и транскрибация

Перевести видео в текст онлайн: загрузите MP4, MOV, WebM или MKV — Whisper расшифрует речь прямо в браузере. Русский, английский, 16+ языков. Без регистрации, без отправки на сервер.

🎬
Перетащите видео или нажмите, чтобы выбрать
MP4, MOV, WebM, MKV, M4V, AVI — до 500 МБ

О расшифровке видео в браузере

Видео в текст — это автоматическая расшифровка речи из видеофайла. Загрузите MP4, MOV, WebM или MKV — браузер сам вытащит звуковую дорожку, а модель Whisper (от OpenAI) разделит её на 30-секундные окна, найдёт речь, расставит знаки препинания и выдаст текст. Дальше — копируйте, скачивайте .txt или сразу нажимайте «Перевести», чтобы открыть результат в нашем переводчике.

Под капотом — Whisper в формате ONNX, запущенный через transformers.js (Hugging Face) как WebAssembly прямо в браузере. Поддерживает 99 языков, на UI выведены 16 самых востребованных — русский, английский, немецкий, французский, испанский, итальянский, украинский, польский, чешский, турецкий, нидерландский, китайский, японский, корейский, арабский, португальский. Режим «Авто» — Whisper сам определит язык по первым секундам.

Видео не покидает ваше устройство — расшифровка идёт локально, в браузере. Модель скачивается один раз (~75 МБ для Tiny, ~145 МБ для Base) и кэшируется. Никакой регистрации, никакой загрузки на сервер. На длинных файлах (>5 минут) распознавание идёт дольше — это нормальная цена за приватность.

Где это пригодится

Расшифровать интервью с YouTube

Скачали видеоинтервью или подкаст — загрузите файл и получите готовый текст для редактуры, цитат, статьи. Whisper хорошо ставит знаки препинания и работает с типичной речью.

Сделать стенограмму вебинара

Записали Zoom-конференцию или вебинар — превратите видео в текст, чтобы быстро найти, кто что сказал, и разослать резюме команде. Точность лучше всего при чистой записи без сильного фонового шума.

Получить субтитры к видео

Снимаете видео для YouTube или TikTok — расшифруйте речь, чтобы добавить субтитры или быстро написать описание. Текст можно отредактировать прямо на странице перед скачиванием.

Перевести иностранный видеоурок

Лекция на английском, обучающее видео на немецком, фильм на испанском — сначала расшифруйте речь, потом нажмите «→ Перевести», чтобы открыть текст в нашем переводчике (он тоже работает локально).

Частые вопросы

Какие форматы видео поддерживаются?

Всё, что декодирует браузер: MP4 (H.264 + AAC — самый распространённый), MOV (с iPhone), WebM, MKV, M4V, AVI, MPEG. Сам видеоряд не нужен — мы вытаскиваем только аудиодорожку. Если ваш файл не открывается, попробуйте сначала конвертировать его в MP4, например, через наш конвертер видео.

Загружается ли видео на сервер?

Нет. Расшифровка полностью клиентская — модель Whisper скачивается на ваше устройство один раз и дальше работает локально через WebAssembly. Сам видеофайл никуда не отправляется. Можно отключить интернет после загрузки модели — расшифровка продолжит работать.

Какая точность расшифровки?

Для чистой речи — обычно 90–96% (модель Tiny) или 94–98% (модель Base). Точность падает на: фоновой музыке, нескольких говорящих одновременно, сильных акцентах, специальных терминах. Если в видео громкая музыка или эффекты — лучше предварительно вырезать только речь через наш «Аудио из видео» + редактор.

Какой максимальный размер видео?

До 500 МБ. Это покрывает большинство видео до 1–2 часов в 720p и до 30–60 минут в 1080p. Если файл больше — обрежьте его в любой видео-программе или сначала переконвертируйте в более низкое качество. Для расшифровки качество видео не важно — важно только аудио.

Сколько занимает расшифровка часового видео?

Tiny на CPU обычно работает близко к реальному времени — 1 час видео ≈ 1 час расшифровки. Base — в 1.5–2 раза медленнее, но точнее. Первый запуск дольше: нужно скачать модель (~75 МБ для Tiny, ~145 МБ для Base). Дальше модель кэшируется в браузере и при следующих файлах загрузка пропускается.

Чем это отличается от загрузки на YouTube для субтитров?

YouTube расшифровывает только публичные ролики, требует загрузки на сервер, иногда выкатывает плохие автосубтитры на русском. Здесь — приватно, без аккаунта, можно загружать любые рабочие, личные, конфиденциальные видео. Текст редактируется прямо в браузере и сразу скачивается.

Можно ли сразу перевести расшифрованный текст?

Да — после расшифровки нажмите кнопку «→ Перевести». Откроется наш текстовый переводчик с уже вставленным текстом. Перевод тоже локальный (через Bergamot WASM от Mozilla), без отправки на сервер.

Попробуйте также