Например, многие таблицы Excel и все реляционные каталоги, поскольку оба retrieveable от типа и может, таким образом, быстро существующей информации на личности. Все детали пропорциональны друг другу и реляционных методов управления источником данных (RDBMS) усиливаются в ответных индивидуальным запросам о деталях. Неструктурированных данных содержит мало или вообще не знакомый рамки, как правило, из-за расходящихся характеристик деталей. Корпоративный сообщество сообщает, что 80% всех полезных данных компании устанавливает в неструктурированной государства.
Электронная почта является одним из примеров. Хотя информация иногда структурированные в источнике данных, реальные предметы концепции нет. Это можно устроить координатор информации Emailer, данных и т.д., но это не возможно, чтобы выполнить вопрос об их статей. Все неструктурированные данные могут быть классифицированы как либо вещей или растровых текстовых вещей.
Растровые вещи связаны все данные не в центре таких терминов, как видео, звук и изображения, в то время как текстовые вещи согласно опубликованной терминологии, как правило найденного в файлах данных концепцию бренда и информации, среди других. Чтобы быть разумным, фраза "неструктурированные данные" могут быть чем-то неправильным, так как многое из этого на самом деле может быть похож на "полу-структурированные данные", что, однако, не быстро работать с СУБД. Препятствием на разведку неструктурированных данных устанавливает как в его перспективным для размера и его дефицита знакомого рамках.
РСУБД не может существующего детали в какой-либо значительной типа, поэтому хотим, чтобы неструктурированные данные полезные привело к системам, как Hadoop и Cloudera. "Большие Данные" и неструктурированные данные, не связанные условия, но Большой Подробности почти всегда неструктурированы. Если компания, например, Google или Myspace нужен способ, чтобы оценить индивидуальный серфинг вокруг подпрограм