Нечеткий поиск: умный поиск с учетом синонимов и обработкой ошибок пользователей | tega.fuzzysearch

Модуль Нечеткий поиск: умный поиск с учетом синонимов и обработкой ошибок пользователей | tega.fuzzysearch v2.0.0

Решение расширяет базовый функционал стандартного модуля «Поиск» от Битрикс
Тип файлов Битрикс
Файлы в формате дельт (delta.upd)
Установка на хостинг
Распаковать архив в папку /bitrix/updates и установить с помощью скрипта нативной установки
Подробнее
https://marketplace.1c-bitrix.ru/solutions/tega.fuzzysearch/
Пароль на архив
Находится во вкладке обновления
Решение расширяет базовый функционал стандартного модуля «Поиск» от 1С-Битрикс, позволяя эффективно обрабатывать синонимичные значения, опечатки и ошибки в поисковым запросе. Высокая эффективность модуля обеспечивается комбинированной работой различных алгоритмов поиска по сходству (fuzzy string search) и компьютерной лингвистики.

1.png


Расширение поисковой выборки
Исходный поисковый индекс Bitrix искусственно расширяется: строится множество «ошибочных» слов, а также слов-синонимов (опционально). Таким образом, если пользователь введет поисковый запрос с ошибкой, который ранее попал в расширенный индекс, ему будет автоматически возвращена релевантная выдача. Данный режим не требует изменений стандартных компонентов.

Поиск по сходству
При ошибочном поисковом запросе проиндексированные данные последовательно сравниваются с запрашиваемой строкой, ищутся максимально похожие на основании расстояния Левенштейна.
Доступно сравнение на основании стемминга (морфологический основ) и metaphone (фонетического звучания).
Для работы в режиме поиска по сходству, модуль использует как стандартный индекс Bitrix, так и собственные таблицы индексации.
Данный режим требует замены стандартных компонентов bitrix:catalog.search, bitrix:search.title и bitrix:search.page на одноименные компоненты модуля.

Обработка поисковых запросов пользователей
При включенной опции «Собирать статистику по поисковым фразам» модуля «Поиск» будет производиться автоматический сбор информации по поисковым запросам пользователей. Ознакомиться с собранной статистикой можно на вкладке Настройки > Поиск > Статистика > Список фраз. Модуль «Нечеткий поиск» расширяет данный функционал, выбирая из статистики те запросы, для которых не нашлось ни одного совпадения. Фразы запросов разбиваются на отдельные слова, для слов находятся морфологические основы. При индексации данных на сайте выделенные морфологические основы будут сравниваться с основами индексируемых слов, близкие основы будут добавлены в индекс.

Словарь синонимов
Модуль «Нечеткий поиск» предоставляет удобный функционал для поиска по синонимам. Синонимы добавляются к поисковому индексу в случае, если морфологическая основа какого-либо слова из индекса совпадает с основой слова из таблицы синонимов.

Вместе с модулем поставляется обширный словарь синонимов, который пользователь может добавлять самостоятельно. Список синонимов смотрите в разделе Настройки >Нечеткий поиск> Словарь синонимов.

Последние обновления

  1. Нечеткий поиск | tega.fuzzysearch v2.0.0 (19.02.2023)

    2.0.0 (19.02.2023) Добавлена функциональность настраиваемой обработки артикулов 1.7.0...
Сверху Снизу