I. ТЕХНОЛОГИИ ОБРАБОТКИ ДАННЫХ
PATTERN RECOGNITION
C. А. Усилин, Д. П. Николаев, В. В. Постников "Cognitive PDF/A — технология оцифровки текстовых документов для публикации в Интернете и долговременного архивного хранения"
III. МЕТОДЫ ПРОЕКТИРОВАНИЯ И АНАЛИЗА СЛОЖНЫХ СИСТЕМ
C. А. Усилин, Д. П. Николаев, В. В. Постников "Cognitive PDF/A — технология оцифровки текстовых документов для публикации в Интернете и долговременного архивного хранения"

Аннотация.

В работе рассматриваются вопросы перевода бумажных документов в электронных вид. Предлагается оригинальная технология оцифровки, включающая сжатие, распознавание и упаковку текстовых документов способом, пригодным для долговременного архивного хранения. Технология использует отделение цветных элементов с помощью гистограммы насыщенности, выделение текстовых блоков с опорой на преобразование Хафа и морфологическую фильтрацию, а также методы оптического распознавания.

Скачать статью в формате pdf

 

2024-74-2
2024-74-1
2023-73-4
2023-73-3

© ФИЦ ИУ РАН 2008-2018. Создание сайта "РосИнтернет технологии".