является основным инструментом визуализации документа. Это устройство, которое преобразует бумажные изображения, печатный текст, почерк или даже объект как украшение в цифровом изображении. Сканер считывает данные красный-зеленый-синий цвет (RGB), и эти данные затем обрабатываются с помощью алгоритма сканера для внесения корректировок для различных условий эксплуатации.
Качество изображения зависит от глубины цвета, разрешения и диапазоном плотности, а также от качества алгоритма. Продолжение исследования доработаны алгоритм в той степени, что в настоящее время изображения могут быть лучше, чем оригиналы. OCR
или оптического распознавания символов является технология преобразования изображений текстовых документов в машиночитаемой текста. В то время как высокая степень точности была достигнута в признании печатных или машинописного текста, способность распознавать различные виды почерком по-прежнему отзыв imperfect.
A человек, как правило, необходимы для обеспечения 100-процентной точностью преобразованных систем document.Computer сохранения отсканированных изображения документов, превращается в машиночитаемой текста, в их хранилищах. Но как может любой из этих конкретных документов быстро извлекается? Там, где количество документов мало, это не могло бы быть такой проблемой. Тем не менее, когда это число работает в тысячи или миллионы, находя конкретный документ действительно стать problem.It здесь индексация
входит в картину.
Данные индекса прикрепленные к документам позволяют запросы стиль поисковых быть выполнены, чтобы найти конкретные документы в массе хранимой индексации documents.Search двигателем может быть также просто, как полнотекстовой индексации - где каждое слово в документе индексируется -OR, ключевое слово или теги индексации, где только несколько метки, прикрепленные к документу индексируются. Эти теги выбран правильно определить содержимое индексация document.Tag предполагает, что все соответствующие теги будут прикреплены к каждому документу.
Если это не так, то документ не может быть найден, даже если актуальным для многих поисковых queries.Even изображений и других видов нетекстовых файлов могут быть помечены и indexed.Beyond с помощью инструментов визуализации документ для получения цифрового контент