* >> Чтение Образование Статьи >> science >> computers

Организованные Подробности против неструктурированных Data

<р> Большинство компаний идентифицировать все данные, структурированные или неструктурированные. Так же, как следует из названия, структурированные преимущества данных из структурировано и настроить для быстрого запросы через относительно простой вид для методов. Не неструктурированных данных нет встроенной в рамках (хотя это может быть "слабо структурированной") и часто противоречит усилиям, направленным на простой внешний вид для двигателей искать. Структурированные данные дает себя простой исследования достоинством его компании и однородной информации.

Например, многие таблицы Excel и все реляционные каталоги, поскольку оба retrieveable от типа и может, таким образом, быстро существующей информации на личности. Все детали пропорциональны друг другу и реляционных методов управления источником данных (RDBMS) усиливаются в ответных индивидуальным запросам о деталях. Неструктурированных данных содержит мало или вообще не знакомый рамки, как правило, из-за расходящихся характеристик деталей. Корпоративный сообщество сообщает, что 80% всех полезных данных компании устанавливает в неструктурированной государства.

Электронная почта является одним из примеров. Хотя информация иногда структурированные в источнике данных, реальные предметы концепции нет. Это можно устроить координатор информации Emailer, данных и т.д., но это не возможно, чтобы выполнить вопрос об их статей. Все неструктурированные данные могут быть классифицированы как либо вещей или растровых текстовых вещей.

Растровые вещи связаны все данные не в центре таких терминов, как видео, звук и изображения, в то время как текстовые вещи согласно опубликованной терминологии, как правило найденного в файлах данных концепцию бренда и информации, среди других. Чтобы быть разумным, фраза "неструктурированные данные" могут быть чем-то неправильным, так как многое из этого на самом деле может быть похож на "полу-структурированные данные", что, однако, не быстро работать с СУБД. Препятствием на разведку неструктурированных данных устанавливает как в его перспективным для размера и его дефицита знакомого рамках.

РСУБД не может существующего детали в какой-либо значительной типа, поэтому хотим, чтобы неструктурированные данные полезные привело к системам, как Hadoop и Cloudera. "Большие Данные" и неструктурированные данные, не связанные условия, но Большой Подробности почти всегда неструктурированы. Если компания, например, Google или Myspace нужен способ, чтобы оценить индивидуальный серфинг вокруг подпрограм

Page << [1] [2] >>

Организованные Подробности против неструктурированных Data

Как сделать привлекательным Website

computers

computers