Распознать текст с картинки онлайн — OCR в браузере
Распознавание текста на фото, скане или скриншоте: русский, английский, китайский, японский. Локально в браузере, без отправки на сервер. Бесплатно.
О распознавании текста с картинки
OCR (Optical Character Recognition) — это распознавание печатного и рукописного текста с фотографий, сканов и скриншотов. Загрузите изображение — модель найдёт текст, разделит на строки и слова, и выдаст результат, который можно скопировать в Word, Google Docs или прямо передать в переводчик.
Используется движок Tesseract.js — открытая библиотека на основе многослойной LSTM-сети, обученной Google. Поддерживает 16+ языков (русский, английский, китайский, японский, корейский, арабский, украинский, немецкий, французский, испанский, итальянский, польский и др.) и режим «Авто» с предварительным определением алфавита (Cyrillic / Latin / Han / Japanese / Hangul / Arabic).
Все вычисления — локально в браузере. Картинка не покидает ваше устройство, языковые модели подгружаются один раз и кэшируются. Никакой регистрации, никаких ограничений на количество распознаваний. Распознанный текст можно сразу отправить в наш переводчик одной кнопкой.
Где это нужно
Извлечь текст со скриншота
Скриншот PDF, презентации, переписки — нужен текст, а копировать нельзя? OCR превратит изображение обратно в редактируемый текст за пару секунд.
Распознать рукописный или печатный документ
Конспекты, заметки, чек, старая книга — распознавание сильно выручает с печатным текстом и неплохо справляется с аккуратным рукописным.
Распознать иностранный текст и сразу перевести
Меню в путешествии, инструкция на китайском, надпись на немецком — распознайте текст и нажмите «Перевести», чтобы открыть его в нашем переводчике.
Извлечь текст из фото с телефона
Сфотографировали страницу учебника, расписание, объявление? OCR работает на мобильном, картинка не уходит на сервер — приватно и быстро.
Частые вопросы
Какие языки поддерживаются?
Русский, английский, немецкий, французский, испанский, итальянский, украинский, польский, португальский, чешский, китайский (упрощённый), японский, корейский, арабский. Можно выбрать комбо «Русский + English» для смешанного текста. В режиме «Авто» язык определяется по алфавиту картинки.
Загружается ли картинка на сервер?
Нет. Распознавание полностью клиентское — Tesseract.js работает в браузере как WebAssembly. Изображение не покидает ваше устройство, в логах нашего сервера нет ваших файлов и текста.
Какая точность распознавания?
Для печатного текста хорошего качества — обычно 95–99%. Точность падает на: рукописном тексте, низком разрешении (<300 DPI), сложных фонах, искажённой геометрии. Совет — снимайте перпендикулярно, при хорошем свете, с разрешением выше 1500 пикселей по короткой стороне.
Можно ли распознать рукописный текст?
Только аккуратный рукописный, и не на всех языках. Tesseract обучен в первую очередь на печатных шрифтах. Если нужно много рукописного — рассмотрите специализированные сервисы с моделями HTR (Handwritten Text Recognition).
Можно ли распознать PDF?
Да, у нас отдельный инструмент /pdf/extract-text/ — он автоматически переключается на OCR для скан-PDF (изображения внутри PDF). На этой странице — только одиночные изображения JPG/PNG/WebP.
Как сразу перевести распознанный текст?
После распознавания нажмите кнопку «Перевести» — откроется наш текстовый переводчик с уже вставленным текстом. Перевод тоже локальный, без отправки на сервер.
Сколько времени занимает распознавание?
Первый запуск с новым языком — 5–15 секунд (загрузка модели, ~5–15 МБ). Следующие распознавания того же языка — 1–5 секунд на типичную страницу. Большие изображения (>3000 пикселей) медленнее.