Содержание
Список
всех
программ
Редакторы HTML
Редакторы
CSS
Текстовые
редакторы
Чтение
текста
Распознавание текста (OCR)
Записные
книжки
Работа
с
изображениями
Создание
карты сайта
Создание
навигационных панелей (меню)
Создание
мультипликации
Создание
фотоальбомов
Видео
Создание
карты ссылок
Веб - формы
Календари
Снимки экрана
Отборщики
цвета
Комплект
инструментов
Баннеры и
эмблемы
Кнопки
Электронные
книги
Формулы
Создание
прототипов
Проверка
ссылок
Работа
с файлами
Работа
с PDF
Создание
справок
Переводчики
И другое
|
Введение
С
развитием Интернета стало широко применяться преобразование книг,
брошюр, бланков и различных документов, напечатанных на бумаге, в электронную
форму. Для этого применяются такие устройства, как сканеры.
Сканер создает точную копию сканируемых бумажных страниц со всем их содержимым -
рисунками, текстом (рукописным, машинописным или печатным), таблицами и
пр.
Иногда такого преобразования бывает достаточно, чтобы хранить документы
в электронном виде. Но чаще всего требуется, чтобы была возможность
редактирования текста, что невозможно сделать в отсканированных
документах (потому что текст в них - это часть изображения).
Чтобы решить задачу извлечения текста из изображения. применяют
программы оптического распознавания символов (программы OCR - от англ.
optical character recognition).
Программы OCR чаще всего работают в связке со сканером. Сканер
создает изображение страницы, программа OCR извлекает из этого
изображения текст (правда, при этой операции теряется все остальное
оформление страницы).
Текст как изображения можно получить не только со сканеров, но из любых
мест (например - из печатного объявления на улице). Для этого
достаточно иметь фотоаппарат или фотокамеру.
Часто извлечение текста применяется, когда нужно перевести текст с
одного языка на другой язык, используя программы-
переводчики текста.
Некоторые программы OCR совмещают функции извлечения текста и перевода.
Оптическое распознавание символов
позволяет редактировать текст, осуществлять поиск слов или фраз,
хранить текст в более компактной форме, демонстрировать или распечатывать
материал, не теряя качества, анализировать информацию, а также
применять к тексту электронный перевод, форматирование или
преобразование в речь.
Обычно программы OCR хорошо справляются со своей задачей, когда текст
напечатан типографским способом и составляет четкий контраст с бумагой
(например. текст черного цвета на белой бумаге).
Хуже, когда текст расположен на пестром многоцветном фоне, или когда
текст неразборчивый машинописный, или типографский, но очень старый. Снижает качество распознавания также
смесь шрифтов,
используемых в просматриваемых документах, например смесь курсивных и подчеркнутых
шрифтов.
И вообще беда с распознаванием и извлечением рукописного текста. В
настоящее время вряд ли найдется программа OCR, которая бы
удовлетворительно выполняла эту задачу.
В данном обзоре приведены некоторые из программ по распознаванию текста.
Обзор
программ
Список программ
|