Эта методика используется при индексации страницы в database.Delving поисковой системы глубокого, БИС обеспокоен не только с изучением документ для ключевых слов, и перечислить его в базе данных, но также с изучением коллекции документов и признания и определения слова которые являются общими между этими документами. Таким образом, это можно сделать вывод о семантической связи между словами используются в этих документах. Затем процесс узнает, какие другие документы включают или делает использование этих семантически близких слов.
Полученные документы индексируются, связаны или тесно отношение к связи в соответствии с скрытой семантической indexing.LSI касается документов с определенная доля слов используется часто, чтобы быть семантически близко. Если есть меньше слов, распространены среди документов, они должны быть семантически далеко. Таким образом, БИС вводит взаимозависимость меры и оценивает актуальность любого документа по шкале от 0 до 1. В отличие от обычных поиска по ключевому слову, БИС может признать меру, как близко это документ, в другой или как отношение является удостоверение к конкретному context.
Let рассмотрим пример здесь. В документе, который обсуждает Стивен Кови и его проповеди, такие слова, как «эффективных», «привычки», «взаимозависимости», «независимости», «синергетический», «парадигмы», «континуум», «общественной победе ',' частной победы »,« круг влияния »и так далее будут найдены часто.
После того, как инструмент индексирования поисковой системой, которая использует технику LSI признает эти часто используемых слов из заданного набора документов, он может найти другие документы или веб-страницы на сети, которая содержит тот же набор ключевых слов в почти одинаковой частотой и индексировать их в база данных рядом с соответствующем контексте (Стивен Кови и его проповеди), что приводит to.Now сравнить этот простой метод с подходом человеческого мозга, чтобы ис