|
C. А. Усилин, Д. П. Николаев, В. В. Постников "Cognitive PDF/A — технология оцифровки текстовых документов для публикации в Интернете и долговременного архивного хранения" |
|
Аннотация.В работе рассматриваются вопросы перевода бумажных документов в электронных вид. Предлагается оригинальная технология оцифровки, включающая сжатие, распознавание и упаковку текстовых документов способом, пригодным для долговременного архивного хранения. Технология использует отделение цветных элементов с помощью гистограммы насыщенности, выделение текстовых блоков с опорой на преобразование Хафа и морфологическую фильтрацию, а также методы оптического распознавания.
|