Разделы
Счетчики
Попробуйте прочитать это и не только это
Демо версия программы распознавания образов. Позволяет распознавать образы очень низкого качества и низкого разрешения, может распознавать образы лучше человека.
Программа предназначена для ввода текстовой информации с графических устройств: таких как сканер и фотокамера. И позволяет распознавать образы даже очень низкого разрешения и очень низкого качества, при этом качество распознавания в несколько раз лучше, чем у программы Fine Reader, и может превосходить точность распознавания человеком, а по скорости распознавания значительно опережает его.Для просмотра необходимо запустить файл demo_ocr.exe. После старта автоматически загружается первый тест и распознается. В результатах приводиться информация: распознанная текстовая строка, информация о том с какой точностью был распознан каждый символ и проверка правильности распознавания теста. Для распознавания следующего теста достаточно нажать кнопку (Следующий файл).
В файлах BMP приведен пример реальной фотографии номера на вагоне с которой производилась деформация различными фильтрами в программе Photoshop, и это еще не предел возможностей программы, вы сами можете попробовать изменить параметры распознавания и тестовые файлы. Отзывы присылайте по адресу E-Mail: grigorlukashenko@mail.ru
Для алгоритма совершенно нет никакой разницы какие символы распознавать: цифры, буквы или любой другой язык. Для наглядности сравнения можете попытаться распознать прилагаемые тесты с помощью программы Fine Reader 4 и прочувствуйте разницу.
Если вам не поверится что программа действительно распознает образы, а просто реагирует на нажатие клавиш, то можете отредактировать тестовые файлы. При нажатии на кнопку (Распознать образ) программа распознает загруженный файл. Вы можете изменить показатель точность распознавания от 1 до 200%, который задает с какой точностью программа должна распознать символ, если символ распознан с меньшей точностью, то он будет пропущен. В данном примере последние цифры распознаются с меньшей точностью, и если заданная точность будет высокой, то эти символы будут пропущены.
Некоторые комментарии и дополнения
Иногда приходят письма от людей которые пробовали подставлять свои файлы для распознавания в программе, но у них ничего не получилось:
Привет Григорий.
Честно признаюсь я не поверил Вашим заявлениям, особенно сомневался что программа способна распознать БитМап под номером 20. Зря распознала. Решил удостоверится в её крутизне. Прорисовал ряд цифр в поинте и о чудо : не распознала. Странно. Опять же по заверениям она должна распознавать даже те образы которые человек не может распознать а тут всего на всего четкие цифры на черном фоне.
Может я не прав но у меня сложилось 100% отношение что это чистой воды подлог. А вместо распознавания подставляются числа с помощью random.
С уважением, Дмитрий.
Да, мне понятны вашы сомнения. Конечно для большей ясности в данном вопросе, требуется комментарий. Программа распознавания не делает ничего сверхъестественного, она сравнивает эталон образа с тем что видит и пытается определить что это такое. Возможности программ такого класса определяют не только алгоритм но и эталоны которые хранятся в памяти.
Для того чтобы программа работала ее необходимо предварительно обучить. В данном случае я обучил программу на базе первого образа, а дальше после применения различных фильтров, исказил исходную фотографию и сохранил в фотографиях с последующими номерами. Алгоритм пытается найти исходные образы в искаженной фотографии на базе имеющихся эталонов. Функция обучения в демонстрационной версии отключена и вы не сможете проверить ее работу, а только работу OCR алгоритма.
Проблема распознавания образов дополняется и тем, что кроме разных образов есть различные классы образов, например на фотографии 256 оттенков серого и черно-белой фотографиях, похожие символы для человека будут совершенно различными для компьютера. И если вы попытаетесь распознать чорнобелый образ, с помощью программы, которая была предварительно обучена на базе образов 256 оттенков серого, то программа выдаст неадекватный ответ. Но даже если вы попытаетесь распознать образы в формате 256 цветов, скорее всего у вас программа будет часто ошибаться. Дело в том что на класс образа влияет и оборудование с помощью которого производилась съемка и условия освещения и другие многочисленные факторы. Кроме того программа не идеальна и находится в стадии разработки.
Демонстрационной версии программы уже более 2-х лет с тех времен значительно улучшилась технология распознавания и оптимизирован алгоритм по скорости и качеству, но у меня нет пока времени, чтобы собрать в кучу новую версию. Кроме того пока и старой версии есть, что показать. В демонстрационной версии я просто хотел показать, что умеет программа и ни о каком жульничестве не было и мысли, просто сложности процесса распознавания образов требуют более детального подхода для успешного понимания.
Если посмотреть на фотографию с номером 20, то программу для распознавание такого образа я не планировал делать, и с другой стороны невозможно распознать уверенно такую фотографию, просто она демонстрирует предельные возможности программы где она начинает ошибаться. После проведения первых испытаний я увидел работоспособность моего алгоритма, которая поразила даже меня.
Не пытайтесь распознавать образы созданные в графическом редакторе программа их не распознает, если вы сомневаетесь, что программа действительно распознает файлы по содержимому а не по названию, вы можете отредактировать тестовые файлы применяя различные фильтры к существующим фотографиям, но не пытайтесь рисовать цифры или печатать их разными шрифтами, текущие эталоны не рассчитаны на распознавание образов созданных на компьютере, они были отсканированы с фотографии и могут работать только с образами данного класса.
Надеюсь этот комментарий хоть немного изменит вашу точку зрения.
Демо версия программы распознавания образов
Источник: