Other видов очистки включают в себя:
Эти и другие инструменты очистки могут быть автоматизированы, указывая минимальное и /или Максимальные размеры элементов, которые будут удалены.
Основные задачи обработки изображений изображения В случае текстовых документов, изображений документ производит изображения, которые люди могут читать, но машины не могут. Для изготовления этих документов для поиска с помощью типизированных слова, текстовые знаки на изображениях, должны быть преобразованы в преобразовании машиночитаемые format.This делается с помощью таких технологий, как OCR (Optical Character Recognition) и ICR (Intelligent Character Recognition). Даже ручной печатных символов могут быть признаны в какой-то степени эти technologies.
This рода преобразования также необходимого для целей принятия изображения документа editable.Once образы текстовых документов были сделаны машиночитаемой, следующий, типичный документ Процесс визуализации является индексом им. Индексация делает документы для поиска. Полнотекстовая индексация делает их поиск по любому слову в document.Full-индексирования текста занимает много места для хранения и альтернативой является индексом по тегам и мета описания. Ключевые слова это слова, которые олицетворяют содержание документа. Описания дать краткие резюме обработке content.
The изображений документов могут пойти еще дальше. На основании запрограммированных спецификации, документы могут быть классифицированы и храниться в соответствующих repositories.In короткий, документ обработки изображений может облегчить управление контентом путем преобразования бумажных документов в категориям содержания готов быть запрошены пользователями, и все это в считанные минуты с минимальным вмеша