Распознавание напечатанного текста с картинки: рейтинг лучших программ и принципы их работы

Бесплатный сервис по распознаванию
текста из изображений

который поможет получить напечатанный текст из PDF документов и фотографий

Принцип работы ресурса

Отсканируйте или сфотографируйте текст для распознавания

Загрузите файл

Выберите язык содержимого текста в файле

После обработки файла, получите результат * длительность обработки файла может составлять до 60 секунд

  • Форматы файлов
  • Изображения: jpg, jpeg, png
  • Мульти-страничные документы: pdf
  • Сохранение результатов
  • Чистый текст (txt)
  • Adobe Acrobat (pdf)
  • Microsoft Word (docx)
  • OpenOffice (odf)

Наши преимущества

  • Легкий и удобный интерфейс
  • Мультиязычность
    Сайт переведен на 9 языков
  • Быстрое распознавание текста
  • Неограниченное количество запросов
  • Отсутствие регистрации
  • Защита данных. Данные между серверами передаются по SSL + автоматически будут удалены
  • Поддержка 35+ языков распознавания текста
  • Использование движка Tesseract OCR
  • Распознавание области изображения (в разработке)
  • Обработано более чем 5.1M+ запросов

Основные возможности

Распознавание отсканированных файлов и фотографий, которые содержат текст

Форматирование бумажных и PDF-документов в редактируемые форматы

Сегодня (3.08.2018) мы обновили наш сайт.
Обновления коснулись интерфейса и добавления нового функционала:
• загрузка файлов перетаскиванием;
• в результатах возможность экспорта документа в Doc, Google Docs, pdf;
• перевод текста;
• проверка орфографии;
Сайт стал лучше и удобнее для пользователей. Но ещё много функций и дополнений мы запланировали реализовать в будущем.

0.5.2 (26.11.2018): Добавлен функционал для удаления запросов из истории

Если Вы нашли какие-то баги, пожалуйста, сообщите нам, отправив письмо на email: web(собака)img2txt.com
Спасибо.

Поддерживаемые языки:
Русский, Українська, English, Arabic, Azerbaijani, Azerbaijani — Cyrillic, Belarusian, Bengali, Tibetan, Bosnian, Bulgarian, Catalan; Valencian, Cebuano, Czech, Chinese — Simplified, Chinese — Traditional, Cherokee, Welsh, Danish, Deutsch, Greek, Esperanto, Estonian, Basque, Persian, Finnish, French, German Fraktur, Irish, Gujarati, Haitian; Haitian Creole, Hebrew, Croatian, Hungarian, Indonesian, Icelandic, Italiano, Javanese, Japanese, Georgian, Georgian — Old, Kazakh, Kirghiz; Kyrgyz, Korean, Latin, Latvian, Lithuanian, Dutch; Flemish, Norwegian, Polish Język polski, Portuguese, Romanian; Moldavian, Slovakian, Slovenian, Spanish; Castilian, Spanish; Castilian — Old, Serbian, Swedish, Syriac, Tajik, Thai, Turkish, Uzbek, Uzbek — Cyrillic, Vietnamese

© 2014-2019 img2txt Сервис распознавания изображений / v.0.6.4.1

Распознавание напечатанного текста с картинки: рейтинг лучших программ и принципы их работы

Набор большого объема текста может занять достаточно много времени, даже если это всего лишь автоматическая перепечатка информации, например, с картинки, когда имеется фото печатного текстового материала.

Поэтому достаточно часто возникает необходимость автоматизировать этот процесс.

В этом материале будет рассмотрено, как производится автоматическое распознавание печатного текста с картинки и конвертация его в печатный формат.

Суть процедуры

О каком же процессе в данном случае вообще идет речь? Обработка картинки или фото для того, чтобы текст, запечатленный на ней, автоматически был переведен в текстовый формат.

Тоесть, технически процесс происходит следующим образом: пользователь загружает картинку на сервер, либо переносит ее в программу, софт обрабатывает изображение, используя особые алгоритмы, и выдает в виде файла или в окне программы сфотографированный текст в печатном виде.

В настоящее время разработано достаточно много таких разнообразных программ.

Они отличаются по функционалу совсем незначительно, но могут существенно отличаться по качеству обработки.

Некоторые программы допускают достаточно много ошибок в распознаваемом тексте, тогда как другие – распознают все практически идеально.

Качество распознавания зависит от изначального качества фото, но при прочих равных условиях большую роль играют алгоритмы работу и обширность базы используемого приложения или онлайн-сервиса.

Важно! Такие программы могут быть представлены самостоятельным инсталлируемым софтом, простыми мобильными утилитами, способными работать с

Важно! Такие программы могут быть представлены самостоятельным инсталлируемым софтом, простыми мобильными утилитами, способными работать с карты памяти, онлайн-сервиса, приложениями для смартфона и/или планшета. Распространяется такой софт платно или бесплатно, некоторые платные программы имеют ограниченные демо-версии.

Принцип действия

Как же работает такая программа? Какие алгоритмы используются для распознавания текста и как они взаимодействуют в софте? Чем объясняются отличия в качестве распознавания материалов разными программами?

Принцип действия программы такой:

1. В каждой программе имеется база данных, в которую занесен алфавит, при этом каждой букве, как строчной, так и заглавной, присваивается целая группа вероятных графических отображений этой буквы – различные шрифты, учет качества фото, поворота и угла камеры при съемке и т. д.;

2. Таким образом, после попадания в программу изображение анализируется с целью выявления имеющихся символов и определения их положения, то есть, фактически, определяется, где именно на фото расположены буквы;

3. Распознавание обнаруженных букв, по окончанию которого формируется печатный текст;

4. Распознавание особенностей форматирования, величины отступов и т. д. (только некоторые программы способны сохранять форматирование, при работе большинства доступных бесплатных сервисов этот пункт вовсе отсутствует);

5. Как только распознавание заканчивается, то, в зависимости от типа программы и принципов ее работы, готовый текст появляется в окне софта или создается текстовый файл с ним (того или иного формата, также в зависимости от программы).

Полученный таким образом материал остается только отредактировать.

Особенности

Каждая программа способна работать только с теми символами, которые были занесены в ее базу, только их она распознает.

В программу может быть внесено несколько алфавитов, как уже писалось выше, поэтому, при выборе подходящего софта проверьте, что бы он работал с языком, на котором напечатан текст на вашей картинке.

Если речь идет о не слишком популярных и визуально нестандартных языках, то найти подходящий софт может быть непросто.

Чем сложнее форматирование или расположение букв на фотографии, тем сложнее программе правильно распознать текст, и тем больше будет ошибок.

Ведь иногда в таком случае неточности могут возникнуть уже на стадии определения местоположения печатных символов на картинке.

Распознавание текста, напечатанного на нестандартном языке, происходит с ошибками. Причем, часто чем сложнее этот текст, тем больше ошибок может быть, так как алгоритмы распознавания могут в этом случае работать неточно.

При определении буквы программа использует определенный «алгоритм» сравнений с ее основными чертами – расположением и размером элементов (некоторые утилиты также учитывают соседние распознанные буквы и лексическую сочетаемость).

Благодаря этой особенности, даже если небольшая часть буквы стерлась или изменена, она все еще может быть распознана.

Единственный минус данного способа в том, что когда букву не удается распознать, задействуются все алфавиты из базы для определения, и в результате может быть обнаружено больше сходств с буквой, например, английского алфавита, хотя текст напечатан на русском.

Перед началом процесса распознавания, обратите внимание на качество фото.

Лучше всего определяется текст с отсканированных изображений документов, скриншотов.

Более или менее нормально может быть определен и сфотографированный на камеру текст.

Хуже всего распознаются материалы с фото плохого качества, сделанного под углом, особенно если имеет место сложное форматирование.

Художественные шрифты не распознаются.

Преимущества и недостатки

Преимущества использования таких сервисов очевидны.

Основное из них – это существенная экономия времени на обработку материала.

И хотя текст, получаемый на выходе, может иметь даже очень низкое качество, редактирование его все равно займет, в большинстве случаев, меньше времени, нежели перепечатка «с нуля».

Какие же преимущества и недостатки имеют такие программы?

Сфера применения

Какие же группы пользователей работают с таким софтом, и для кого он будет удобен?

Также софт пригодится при составлении документа или нормативного акта по образцу, который уже имеется в напечатанном виде и т. п.

Функционал

Функционал у данных программ достаточно стандартный – он позволяет произвести загрузку фото, выбор языка, запуск обработки и получение готового текста.

В некоторых утилитах текст отображается в окне, в других – оформляется в файл указанного или установленного по умолчанию формата, иногда файл также может быть создан по запросу.

В некоторых платных приложениях могут быть реализованы и другие функции, например, улучшение качества фото с целью увеличения распознаваемости текста.

Читайте также:

Программы

Какие же программы используются для распознавания?

Они делятся на две группы: платные и бесплатные установочные программы, платные и бесплатные мобильные утилиты.

Требующие установки

Такой софт подойдет тем, кто постоянно работает с изображениями с текстом.

Кроме того, такой софт, обычно, наиболее функциональный.

Таблица 1. Программы для распознавания текста с изображения

Программа Тип лицензии Функционал Особенности Рейтинг
ABBYY FineReader Платно Полный Подходит для профессионального распознавания текста 4,0
CuneiForm Бесплатно Суженный Неплохой функционал, но меньший, чем в платных аналогах 2,9
ABBYY PDF Transformer Платно Расширенный Программа предназначена для выполнения широкого спектра работ с файлами PDF, в том числе и с распознаванием текста со сканов 3,4
Readiris Pro Платно Более узкий, по сравнению с другими платными аналогами Довольно неудобное меню и управление, из-за которого программа не пользуется популярностью 3,0

Не требующие установки

Качественных мобильных утилит достаточно мало.

Они нужны тем, кто часто работает за разными компьютерами для того, чтобы не устанавливать программу на каждый.

Наиболее популярным таким софтом является утилита VueScan.

Она распространяется бесплатна и способна обрабатывать

Она распространяется бесплатна и способна обрабатывать изображения с текстом, полученные со сканеров.

Обладает достаточно широким функционалом, не ограничивающимся только распознаванием текста.

Совместима с любыми, даже устаревшими, моделями сканеров.

7 бесплатных программ и веб-сервисов для распознавания текста

С помощью этих инструментов вы сможете извлечь текстовое содержимое изображений и бумаг, чтобы работать с ним с максимальным комфортом.

1. Office Lens

  • Распознаёт: снимки камеры.
  • Сохраняет: DOCX, PPTX, PDF.

Этот сервис от компании Microsoft превращает камеру смартфона или ПК в мощный сканер документов. С помощью Office Lens вы можете распознать текст на любом физическом носителе и сохранить его в одном из «офисных» форматов или в PDF. Итоговые текстовые файлы можно редактировать в Word, OneNote и других сервисах Microsoft, интегрированных с Office Lens.

2. Adobe Scan

  • Распознаёт: снимки камеры.
  • Сохраняет: PDF.

Adobe Scan тоже использует камеру смартфона, чтобы сканировать бумажные документы, но сохраняет их копии только в формате PDF. Результаты удобно экспортировать в кросс-платформенный сервис Adobe Acrobat, который позволяет редактировать PDF-файлы: выделять, подчёркивать и зачёркивать слова, выполнять поиск по тексту и добавлять комментарии.

3. Free OCR to Word

  • Распознаёт: JPG, TIF, BMP, GIF, PNG, EMF, WMF, JPE, ICO, JFIF, PCX, PSD, PCD, TGA и другие форматы.
  • Сохраняет: DOC, DOCX, TXT.

Настольная программа Free OCR to Word распознаёт выбранные пользователем изображения, извлекая из них чистый текст без форматирования. Его можно копировать в буфер обмена, сохранять в формате TXT или экспортировать в Word.

4. FineReader Online

  • Распознаёт: JPG, TIF, BMP, PNG, PCX, DCX, PDF (не защищённые паролем).
  • Сохраняет: DOC, DOCX, XLS, XLSX, ODT, TXT, RTF, PDF, PDF/A.

Онлайновый сервис, который конвертирует не только тексты, но и таблицы. Увы, бесплатные возможности FineReader Online ограничены. После регистрации вам позволят распознать без оплаты всего 10 страниц. Зато каждый месяц будут начислять ещё по пять страниц в качестве бонуса. Поэтому сервис больше подойдёт тем, кто не нуждается в услугах распознавания слишком часто.

5. Online OCR

  • Распознаёт: JPG, BMP, TIFF, GIF, PDF.
  • Сохраняет: DOCX, XLSX, TXT.

Ещё один сайт, с помощью которого можно распознать тексты и таблицы. В отличие от FineReader, в Online OCR вполне можно обойтись без регистрации. Хотя она может понадобиться, если вы планируете загружать несколько файлов для распознавания за один раз. В то же время FineReader поддерживает больше форматов.

6. Free OCR

  • Распознаёт: JPG, GIF, TIFF BMP, PNG, PDF.
  • Сохраняет: TXT.

Free OCR — простейший онлайн-сервис, извлекающий текст из PDF-файлов и изображений. Результат распознавания — чистый текст без форматирования. Кроме того, сервис может уступать по точности вышеперечисленным аналогам. Зато Free OCR не требует регистрации и справляется с мультиязычными документами.

7. Microsoft OneNote

  • Распознаёт: популярные форматы изображений.
  • Сохраняет: файлы OneNote.

В настольной версии популярного заметочника OneNote тоже есть функция распознавания текста, которая работает с загруженными в сервис изображениями. Если кликнуть правой кнопкой мыши по снимку документа и выбрать в появившемся меню «Рисунок» → «Текст», то всё текстовое содержимое будет скопировано в буфер обмена.

Методы распознавания текста

Немного теории

Тема распознавания текста попадает под раздел распознавания образов. И для начала коротко о самом распознавании образов.
Распознавание образов или теория распознавания образов это раздел информатики и смежных дисциплин, развивающий основы и методы классификации и идентификации предметов, явлений, процессов, сигналов, ситуаций и т. п. объектов, которые характеризуются конечным набором некоторых свойств и признаков. Данное определение нам дает Wikipedia.

Также она утверждает, что можно выделить два основных направления

  • Изучение способностей к распознаванию, которыми обладают живые существа, объяснение и моделирование их;
  • Развитие теории и методов построения устройств, предназначенных для решения отдельных задач в прикладных целях.

Моя работа в рамках курсовой работы проводилась именно в направлении второго пункта.

Итак, моя тема — это распознавание текста на графических изображениях и сейчас говорить о важности данного подраздела не приходиться. Всем давно известно, что существуют миллионы старых книг, которые хранятся в хранилищах строгого режима, доступ к которым имеет только специализированный персонал. Использование этих книг запрещено по причине их ветшалости и дряхлости, так как возможно, что они могут рассыпаться прямо в руках читателя, но знания которые они хранят, представляют, несомненно, большой клад для человечества и поэтому оцифровка этих книг столь важна. Именно этим в частности занимаются специалисты в области обработки данных.

Приблизимся еще ближе к теме распознавания текста. Следует заметить, что под распознаванием текста обычно понимают три главных метода.

  • Сравнение с заранее подготовленным шаблоном;
  • Распознавание с использованием критериев, распознаваемого объекта;
  • Распознавание при помощи самообучающихся алгоритмов, в том числе при помощи нейронных сетей.

Также следует сказать, что распознавание текста почти всегда идет в купе с обнаружением текста на изображении, но так как я не ставил этой цели, этап обнаружения был опущен и заменен на легкую предобработку.

Теперь о самой работе. Было написано приложение, способное распознавать текст при использовании изображений высокого либо среднего качества, со слабым шумом либо без него. Приложение способно распознавать буквы английского алфавита, верхнего и нижнего регистра. Изображение подается для распознавания непосредственно из самого приложения.

Фильтрация и обработка

Сегментация

Непосредственно перед распознаванием изображение нормализуется и приводится до размеров шаблонов, подготовленных заранее.

Далее наступает сам процесс распознавания. Для пользователя имеется два выбора, при помощи метрик и при помощи нейронной сети.

Распознавание
Рассмотрим первый случай — распознавание при помощи метрик.

Метрика – некоторое условное значение функции, определяющее положение объекта в пространстве. Таким образом, если два объекта расположены близко друг от друга, то есть похожи (например, две буквы А написанные разным шрифтом), то метрики для таких объектов будут совпадать или быть предельно похожими. Для распознавания в этом режиме была выбрана метрика Хэмминга.

Метрика Хэмминга – метрика которая показывает, как сильно объекты не похожи между собой.

Данную метрику часто используют при кодировании информации и передаче данных. Например, после сеанса передачи на выходе имеется следующая последовательность бит (1001001), также нам известно, что должна прийти другая последовательность бит (1000101). Мы вычисляем метрику путем сравнения частей последовательности с соответствующими местами из другой последовательности. Таким образом метрика Хэмминга в нашем случае равна 2. Так как объекты отличаются в двух позициях. 2- это степень непохожести, чем больше, тем хуже в нашем случае.
Следовательно, чтобы определить какая буква изображена нужно найти ее метрику со всеми готовыми шаблонами. И тот шаблон, чья метрика окажется наиболее близкой к 0 будет ответом.

Но как показала практика подсчет одной лишь метрики не дает положительного результата, так многие буквы похожи между собой. например «j» «i», что приводит к ошибочному распознаванию.

Тогда было принято решение придумать новые метрики, позволяющие разграничить некоторое множество букв в отдельный класс. В частности, были реализованы метрики (Отражения горизонтального и вертикального, преобладания веса горизонтального и вертикального).

Экспериментом было выяснено, что такие буквы как «H» «I» «i» «O» «o» «X» «x» «l» обладают суперсимметрией (полностью совпадают со своими отражениями и значимые пиксели распределены равномерно по всему изображению), поэтому они были вынесены в отдельный класс, что сокращает перебор всех метрик примерно в 6 раз. Аналогичные действия были проведены в отношении других букв. В среднем уменьшение перебора достигает примерно 3 раза.
Также есть уникальная буква такая как «J», которая находится в своем классе одна, и значит идентифицируются однозначно. Далее, для каждого класса высчитывается метрика Хэмминга, которая на данном этапе дает лучшие показатели чем при прямом применении.
При создании шаблонов использовался шрифт «consolas», поэтому, если распознаваемый текст написан этим шрифтом, распознавание имеет точность порядка 99 процентов. При изменении шрифта, точность падает до 70 процентов.

Второй способ распознавания – при помощи нейронной сети.

Что такое нейронная сеть и в биологическом понимании, и в математическом я рассказывать не буду, так как данного материала полно в интернете и повторять его не хочется. Сказать лишь можно то, что в математическом смысле нейронная сеть — это лишь модель биологического определения.

Существуют также множества разновидностей этих моделей. В своей работе я использовал однослойную сеть Кохонена.
Принцип работы нейронной сети таков, что поучив на входной слой нейронов новое изображение сеть реагирует импульсом того или иного нейрона. Так как все нейроны поименованы значениями букв, следовательно, среагировавший нейрон и несет ответ распознавания. Углубляясь в терминологию сетей можно сказать, что нейрон помимо выхода имеет также множество входов. Данные входы описывают значение пикселя изображения. То есть, если имеется изображение 16х16, входов у сети должно быть 256.

Каждый вход воспринимается с определенным коэффициентом и в результате, по окончанию распознавания на каждом нейроне скапливается определенный заряд, чем заряд будет больше тот нейрон и испустит импульс.

Но что бы коэффициенты входов были правильно настроены необходимо сначала обучить сеть. Этим занимается отдельный модуль обучения. Данный модуль берет очередное изображение из обучающей выборки и скармливает сети. Сеть анализирует все позиции черных пикселей и выравнивает коэффициенты минимизируя ошибку совпадения методом градиента, после чего определенному нейрону сопоставляется данное изображение.

Все коэффициенты выровнены и готовы воспринимать изображения.
Точность распознавания при этом методе достигает 80 процентов. Следует заметить, что точность распознавания зависит от обучающей выборки, как от количества, так и от качества.

Распознаем текст онлайн с картинок, отсканированных документов бесплатно и без регистрации

Приветствую вас, дорогие читатели блога. Сегодня я хочу рассказать вам о некоторых сервисах, которые давно у меня лежат в закладках. Речь пойдет о сервисах распознавания текста онлайн.

Наверное, у каждого был случай, когда вы хотели переписать какой-то текст с картинки или PDF файла. Это могли быть какие-то документы или просто красивая цитата. У меня таких случаев было немало и меня всегда выручали сервисы распознавания текста. Конечно, существуют и программы для этой цели, но я предпочитаю такие простые задачи делать онлайн.

Ниже вы можете увидеть перечень сервисов, благодаря которым распознать текст с изображения проще простого. Все сервисы абсолютно бесплатны и не требуют регистрации.

Принцип сервисов весьма прост. Вы загружаете изображение, содержащее текст, сервис его обрабатывает и выдает вам готовый текст, избавляя вас от его переписывания. Качество распознавания текста с изображения напрямую зависит от качества самого изображения.

Где можно распознать текст с PDF файла, картинки или фотографии бесплатно

Итак, вот список сервисов:

www.newocr.com – позволяет распознать текст бесплатно с изображений таких форматов как: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu. Сервис поддерживает множество языков. После распознания текста с картинки, его можно скопировать и вставить в свой документ.

www.onlineocr.net — аналогичный предыдущему сервис, с тем лишь отличием, что здесь распознанный текст можно скачать в форматах Microsoft Word (docx), Microsoft Exel (xlsx), Text Plain (txt).

www.free-ocr.com – сервис, поддерживающий форматы jpg, png, bmp, pdf, jpeg, tiff, tif и gif. Языков распознавания чуть меньше чем в предыдущих сервисах, но тоже немало. Скачать распознанный тест можно в txt формате.

www.i2ocr.com – сервис, поддерживающий более 60 языков. Кроме основной функции распознавания текста с изображений, здесь есть такие инструменты как:

  • Конвертация web-страницы в PDF;
  • Преобразование web-страницы в изображение (скриншот);
  • Генератор кнопок CSS3;
  • Международные клавиатуры;
  • Преобразователь формата изображений;

Качество извлечения текста с изображений

Особой разницы в качестве распознавания текста на изображениях между сервисами я не заметил, поэтому в качестве примера покажу лишь первый сервис.

Для примера я взял несколько изображений разного размера и качества изображенного текста.

Изображение 1 (790 X 588 px)

Изображение 2 (793 X 1024 px)

Изображение 3 (600 X 350 px)

И вот результат самого текста, который сервис распознал на картинке.

Результат 1 изображения:

Шел 25 год без
собственной яхты и домика
на берегу океана, мысль о
продаже почки перестает
казаться безумной.

В первом изображении текст распознан идеально и вообще без ошибок.

Результат 2 изображения:

Меню В новогоднюю ночь
ЯТриветственный коктейль
(Шампанское советское) 150 гр.
Соленая квашенные, домашние. 60/1 гр.
Грибочки из погребка.
Яссорти аз маранованньск грибов. 64,5 гр.
ч Мясное Яссорта (ростбиф, язык буякенана) 85 гр.
Сельдь с картофелем и луком красным. 100 гр.
Лосось камчатский с травами дикими 58,5 гр.
Селедочка под шубкой. 200 гр.
Холодец, с мясом. 182 гр.
Оливье мясной 150 гр.
Салат с куриной грудкой а грибочкама 150 гр.
фруктовая ваза
(виноград, груша, бананы, яблоко, апельсин, кави) 375 гр.
Сигбная корзина 85 гр.
Кулебяка с лососем и судаком или 212 гр.
Товядана со сметаной и сыром картофельным
гратаном а соусом красное вино 247 гр.
Запеченые груши с красным вином,
мороженным и грецкими орехами 142 гр.
Напитки
Шампанское (Российское полсл. 750 гр.
7 (Водка Лунтика 500 гр.
(Вано Красное Ундурага сух, 750 гр.
Фано *Белое <Ундурага сук. 750 гр.
$ода с газом 600 гр.
Фода без газа 600 гр. ., №3
3 . , , ‘ , :Морс (промышленный) 1000 гр.»?`
Сок/‘!пельсан ( 2л. ) 2000 гр.

Здесь видно присутствие ошибок. Это связано с особенностю шрифта и контрастом текста на основном фоне.

Результат 3 изображения:

Чтобы питательные маски отдали вашей коже
есь свой полезный арсенал, важно
7 олнять их правильно. Вот моменты,
ые нужно учитывать при
Ь; _ ьэоваиии питательных масок для лица.
Йтательные маски нельзя х
ранить, они
“тотовятся непосредственно перед
Чоцедурой
е_ перед применением питательной маски
[Гдлицо необходимо очистить скрабом и слегка
вает-рить
лице питательная маска держится 20
минуъ‘после чего смывается теплой водой
в темение часа после использования
питательной маски на улицу желательно не
ьд‘выходить
стота применения питательных масок для
и лица — 2-3 в неделю
спользуйте принцип — две недели делаете

В третьем примере левая часть столбца имееет плохую контрастность, поэтому некоторы слова вообще не распознаны.

На основе этих трех примеров, можно сделать простой вывод – чем лучше и отчетливее виден текст на изображении, тем более качественное будет распознавание текста. Многое так же зависит от шрифта текста. Если шрифт простой, то его сервис прочтет без труда, ну а чем сложнее шрифт, тем больше будет ошибок при распознавании текста.

Программы для распознавания текста

Как правило, если речь заходит о программах для распознавания сканированного текста (OCR, оптическое распознавание символов), большинство пользователей вспоминают единственный продукт — ABBYY FineReader, который, бесспорно, является лидером среди такого программного обеспечения в России и одним из лидеров в мире.

Тем не менее, FineReader — не единственное такого рода решение: есть бесплатные программы для распознавания текста, онлайн-сервисы для этих же целей и, более того, такие функции присутствуют и в некоторых знакомых вам программах, которые, возможно, уже установлены на вашем компьютере. Обо все этом я и постараюсь написать в этой статье. Все рассмотренные программы работают в Windows 7, 8 и XP.

Лидер распознавания текстов — программа ABBYY Finereader

Про FineReader (произносится как Файн Ридер) слышали, наверное, большинство из вас. Эта программа лучшая или одна из лучших для качественного распознавания текстов на русском языке. Программа является платной и цена лицензии для домашнего использования составляет чуть менее 2000 рублей. Также имеется возможность скачать пробную версию FineReader или же воспользоваться онлайн распознаванием текстов в ABBYY Fine Reader Online (бесплатно можно распознать несколько страниц, далее — платно). Все это доступно на официальном сайте разработчика http://www.abbyy.ru.

Установка пробной версии FineReader не вызвала никаких проблем. ПО может интегрироваться с Microsoft Office и Проводником Windows, для того чтобы было удобнее запустить распознавание. Из ограничений бесплатной пробной версии — 15 суток использования и возможность распознать не более 50 страниц.

Снимок для тестирования программ распознавания

Так как сканера у меня нет, то для проверки я воспользовался снимком с некачественной камеры телефона, в котором немного отредактировал контрастность. Качество никуда не годное, посмотрим, кто справится.

Меню программы FineReader

FineReader может получать графическое изображение текста напрямую со сканера, из графических файлов или камеры. В моем случае, достаточно было открыть файл изображения. Результат порадовал — всего пара ошибок. Сразу скажу, что это лучший результат из всех проверенных программ при работе с данным образцом — похожее качество распознавания было только на бесплатном онлайн сервисе Free Online OCR (но в этом обзоре мы говорим только о программных средствах, не онлайн распознавании).

Результат распознавания текста в FineReader

Откровенно говоря, для кириллических текстов у FineReader, наверное, нет конкурентов. Плюсами программы является не только качество распознавания текстов, но и широкая функциональность, поддержка форматирования, грамотный экспорт во множество форматов, включая Word docx, pdf и другие возможности. Таким образом, если задачи OCR — это то, с чем вы сталкиваетесь постоянно, то не пожалейте сравнительно небольшого количества денег и это вполне окупится: вы сэкономите огромное количество времени, быстро получая качественный результат в FineReader. Я, кстати, не рекламирую ничего — действительно считаю, что тем, кому нужно распознать больше десятка страниц, стоит задуматься о покупке такого ПО.

CuneiForm — бесплатная программа для распознавания текста

По моей оценке, вторая по популярности программа OCR в России — бесплатная CuneiForm, скачать которую можно с официального сайта http://cognitiveforms.ru/products/cuneiform/.

Установка программы также очень проста, никакого стороннего софта (как многое бесплатное ПО) она установить не пытается. Интерфейс лаконичен и понятен. В некоторых случаях проще всего воспользоваться мастером, для чего предназначена первая из иконок в меню.

С образцом, которым я пользовался в FineReader, программа не справилась, или, точнее, выдала что-то плохо читаемое и ошметки слов. Вторая попытка была предпринята со скриншотом текста с сайта самой этой программы, который, правда, пришлось увеличить (ей нужны сканы с разрешением 200dpi и выше, скриншоты с толщиной линий шрифтов 1-2 пикселя она не читает). Тут она справилась хорошо (часть текста не распознана, так как был выбран только русский язык).

Распознавание текста в CuneiForm

Таким образом, можно предположить, что CuneiForm — это то, что следует попробовать, особенно если у вас качественно отсканированные страницы и вы хотите распознать их бесплатно.

Microsoft OneNote — программа, которая у вас, возможно, уже есть

В состав Microsoft Office, начиная с версии 2007 и заканчивая текущей, 2013, присутствует программа для ведения заметок — OneNote. В ней также присутствуют функции распознавания текста. Для того, чтобы воспользоваться ею, просто вставьте отсканированное или любое другое изображение текста в заметку, кликните правой клавишей мыши по ней и воспользуйтесь контекстным меню. Отмечу, что по умолчанию для распознавания установлен английский язык.

Распознавание в Microsoft OneNote

Не могу сказать, что текст распознается идеально, но, насколько я могу судить, несколько лучше даже чем в CuneiForm. Плюс программы, как уже было сказано, в том, что с немалой вероятностью она уже установлена на вашем компьютере. Хотя, конечно, ее использование в случае необходимости работы с большим количеством отсканированных документов навряд ли будет удобным, скорее она подойдет для быстрого распознавания визиток.

OmniPage Ultimate, OmniPage 18 — должно быть, что-то очень крутое

Я не знаю, насколько хороша программа для распознавания текстов OmniPage: пробных версий нет, где-то скачивать не хочу. Но, если ее цена оправдана, а она обойдется примерно в 5000 рублей в версии для индивидуального использования и не Ultimate, то это должно быть что-то впечатляющее. Страница программы: http://www.nuance.com/for-individuals/by-product/omnipage/index.htm

Цена на ПО OmniPage

Если ознакомиться с характеристиками и отзывами, в том числе и в русскоязычных изданиях, в них отмечается, что OmniPage действительно обеспечивает качественное и точное распознавание, в том числе и на русском языке, сравнительно легко разбирает не самые качественные сканы и предоставляет набор дополнительных инструментов. Из недостатков выделяют не самый удобный, особенно для начинающего пользователя, интерфейс. Так или иначе, на западном рынке OmniPage — прямой конкурент FineReader и в англоязычных рейтингах они борются именно между собой, а потому, думаю, программа должна быть достойной.

Это далеко не все программы данного типа, существуют также различные варианты небольших бесплатных программ, но, пока экспериментировал с ними нашел два главных недостатка им свойственных: отсутствие поддержки кириллицы, либо различное, не слишком полезное ПО в комплекте установки, а потому решил не упоминать их здесь.

А вдруг и это будет интересно:

Почему бы не подписаться?

Рассылка новых, иногда интересных и полезных, материалов сайта remontka.pro. Никакой рекламы и бесплатная компьютерная помощь подписчикам от автора. Другие способы подписки (ВК, Одноклассники, Телеграм, Facebook, Twitter, Youtube, Яндекс.Дзен)

12.11.2018 в 14:51

Ставил CuneiForm, — и убрал её. Качество распознавания так себе, а на Windows 10 жутко глючит при запуске.

Примечание: после отправки комментария он не появляется на странице сразу. Всё в порядке — ваше сообщение получено. Ответы на комментарии и их публикация выполняются ежедневно днём, иногда чаще. Возвращайтесь.

Распознать текст с картинки

перерыл множество тем на этом форуме да и в Инете вообще, но так и не нашел решение данной проблемы. Подскажите пожалуйста есть ли какая-нибудь стандартная библиотека, которую не нужно будет скачивать, для распознавания текста с картинки?

и было бы неплохо если бы мне помогли с кодом программы, которая будет распознавать текст с картинок и сохранять его в текстовый файл

Добавлено через 3 часа 29 минут
никто не знает как распознавать текст с картинки?

Добавлено через 2 часа 23 минуты
подскажите, как распознать текст картинки? что лучше использовать? есть ли примеры рабочего кода?

стоит ли смотреть в сторону нейронных сете? или может это слишком сложно и они медленно работают?

какими готовыми библиотеками можно воспользоваться чтобы распознавать текст с картинок?

08.10.2016, 19:15

Puma.Net, как использовать (распознать текст с картинки)
Нужно распознать текст с картинки. Нашел такую штуку, как Puma.Net, но не пойме как ей.

Распознать картинки с простой строчкой символов
Здравствуйте. Имеется картинки с простыми символами вида: Необходимо распознавать такого рода.

Распознать текст на картинке
Возникла проблема при поиске, если вырезать и перемещать поле фамилия в другие места на справке то.

Преобразование картинки в текст
Вопрос очень странный, и я не уверен, что смогу получить на него ответ. Может кто-то встречал.

Вставка картинки в текст WPF
Нужно вставлять картинки за место слов в тексте в RichTextBox, соответственно что бы обтекание было.

08.10.2016, 19:23 2

A C# Project in Optical Character Recognition (OCR) Using Chain Code
http://www.codeproject.com/Articles/. ognition-OCR-U

08.10.2016, 19:41 [ТС] 3 08.10.2016, 20:23 4
08.10.2016, 20:23
13.10.2016, 18:29 [ТС] 5

распознаю текст с картинки при помощи Windows.Media.Ocr и сохраняю распознанные символы в текстовый файл:

НО Windows.Media.Ocr как-то хреновенько распознает. Возможно ли как-то улучшить качество распознавания?

Добавлено через 2 минуты
может можно как-то загнать данные после распознавания на вход нейронной сети, сеть хорошенько обучить и тогда она более качественно будет выдавать результат распознавания?

Добавлено через 1 минуту
меня уже несколько раз «посылали» на хабрахабр, я там перечитал кучу статей, читал и про нейронные сети, смотрел видюшки на ютубе и т.д. но вот пока никак не получается сделать то что мне нужно

Анализ изображений
Технологию того как с помощью сверточных сетей классифицировать изображения обычно демонстрируют с помощью набора данных MNIST.

далее пример и ссылка, но она не работает((

Добавлено через 4 часа 44 минуты
И тишина. Никто не хочет помогать?

Ссылка на основную публикацию