logo
Основы_информатики

Стратегия поиска

Введенные в память ЭВМ документы обрабатываются без какого-либо предварительного ручного анализа путем использования целого ряда методов автоматического анализа текстов. В результате производится идентификация документов, которые в наибольшей степени соответствуют данному запросу. В системе «SMART» также используется метод автоматической модификации запроса, известный как релевантная обратная связь. При этом методе пользователю предоставляется некоторая предварительная выдача и он отмечает одну часть выдачи как полезную, а другую как бесполезную. Затем система автоматически изменяет поисковый запрос, увеличивая вес тех терминов в запросе, которые содержались в отмеченном множестве релевантных документов, одновременно уменьшается вес тех терминов запроса, которые содержались в нерелевантном множестве документов. Этот процесс сдвигает «вектор запроса» таким образом, чтобы он теснее примыкал к подмножеству релевантных документов, удаляясь от нерелевантного подмножества. Здесь работает КСС с весовыми коэффициентами. Для уменьшения числа необходимых сравнений между документами и запросами в данной системе были образованы группы взаимосвязанных документов на основе алгоритма автоматического сравнения документов. Для каждой группы документов выбирается общий соответствующий им «вектор группы» и запрос сначала сравнивается только с этими векторами групп, а затем запрос сравнивается только с теми отдельными документами, вектор группы которых показал высокое совпадение с запросом(ПОЗом).