TenderScanБлог
Семён Метелёв · Основатель TenderScan··7 мин чтения

Минус-слова в поиске тендеров: как убрать мусор

Минус-слова в поиске тендеров: как стоп-словами отсечь нерелевантные закупки, почему поиск по ключевым словам шумит и как собрать чистую выдачу.

Минус-слова в поиске тендеров: как убрать мусор

ИИ-ассистент для тендеров под ваши задачи — обсудим на бесплатной консультации

Если вы ищете закупки по ключевым словам, половина выдачи — мусор. По запросу «стол» приходят столы письменные, столы операционные, столовые приборы и «расходы на содержание столовой». Минус-слова в поиске тендеров отсекают этот шум: вы перечисляете, чего не хотите видеть, и выдача очищается. Ниже — как настроить стоп-слова, почему поиск по словам шумит в принципе и где точнее работать с характеристиками, а не с названием.

Почему поиск по ключевым словам шумит

Заказчик называет закупку как хочет. Один напишет «ноутбук», другой — «портативный компьютер», третий зашьёт ваш товар в строку «поставка офисной техники» вместе с принтерами и МФУ. Поиск по слову ловит совпадение в тексте — он не понимает, что именно вы поставляете.

Отсюда два типа потерь:

  • Ложные срабатывания — в выдачу падают чужие закупки, где ваше слово стоит случайно. «Кабель» приводит и силовой кабель, и «прокладку кабель-каналов» в смете ремонта.
  • Пропуски — нужная закупка названа иначе, и вы её не видите. «Спецодежда» не находит лот «костюм рабочий мужской», хотя это он и есть.

Минус-слова решают первую проблему — отсекают мусор. Со второй борются иначе: морфологией, синонимами и поиском по кодам. Разберём по порядку.

Что такое минус-слова и где они работают

Минус-слово (оно же стоп-слово, слово-исключение) — это термин, при наличии которого закупка выпадает из выдачи. Логика простая: «покажи всё про кабель, но убери всё, где есть слово прокладка».

В ЕИС на zakupki.gov.ru прямого поля «минус-слова» в простой строке нет. Но в расширенном поиске и конструкторе запроса есть строка для слов-исключений: вы перечисляете термины, которые не хотите видеть в наименовании и предмете закупки. Агрегаторы (Контур, СБИС, Тендерплан и другие) выносят минус-слова в отдельное поле фильтра — там с ними работать удобнее, чем в самой ЕИС.

Проверьте, по каким полям бьёт стоп-слово в вашем сервисе: только по названию закупки или ещё по предмету, документации, наименованию заказчика. От этого зависит, не отрежете ли вы лишнее. Слово в документации может встретиться в нужной закупке случайно.

Как собрать список стоп-слов: пошагово

Не выдумывайте минус-слова заранее. Соберите их из реальной грязной выдачи — так список будет точным.

  1. Запустите широкий запрос по основному слову. Например, «насос». Не сужайте — вам нужно увидеть весь мусор.
  2. Пролистайте 50–100 результатов и выпишите чужие темы. Рядом с вашими насосами всплывут «насосная станция пожаротушения», «ремонт насосной», «насос инсулиновый». Это кандидаты в минус-слова.
  3. Вычлените слова-маркеры мусора. Из «насос инсулиновый» берёте «инсулиновый», из «насосная станция» — «станция», если станции вам не нужны.
  4. Добавьте их в поле слов-исключений и перезапустите поиск. Сравните, сколько результатов ушло и не пропало ли нужное.
  5. Проверьте на ложные срезы. Откройте 10–15 отсечённых закупок. Если среди них нет ваших — стоп-слово рабочее. Если есть — формулировка слишком широкая, уточните её.

Повторяйте цикл раз в пару недель: заказчики придумывают новые формулировки, мусор мутирует.

Группируйте минус-слова по причине

Список из 40 случайных слов невозможно поддерживать. Разбейте стоп-слова на смысловые группы — так вы поймёте, что и зачем отсекаете, и быстро уберёте лишнее, если выпало нужное.

Группа Зачем отсекаем Примеры минус-слов
Чужая отрасль Ваше слово многозначно медицинский, пищевой, военный
Услуги вместо товара Вы поставляете, а не чините ремонт, монтаж, обслуживание, аренда
Комплектующие/расходники Нужен товар целиком картридж, фильтр, запчасть
Стадия не ваша Не участвуете проектирование, демонтаж, утилизация

Морфология и синонимы: чтобы не пропустить нужное

Минус-слова чистят выдачу, но не возвращают пропущенные закупки. За полноту отвечают формы слова и синонимы.

  • Учитывайте падежи и числа. Часть сервисов ищет с учётом морфологии автоматически, часть — нет. Если морфологии нет, помогает символ-маска (звёздочка): «стол*» поймает «стол», «столы», «столов», «столами».
  • Добавьте синонимы и жаргон заказчиков. «Ноутбук» и «портативный компьютер», «спецодежда» и «костюм рабочий», «ГСМ» и «дизельное топливо». Один товар — несколько строк поиска.
  • Не переусердствуйте с масками. «Кар*» поймает и «картон», и «карниз», и «каркас». Маска должна сужать, а не плодить новый мусор.

Связка простая: широкие синонимы и формы дают полноту, минус-слова режут лишнее. Одно без другого не работает — либо тонете в шуме, либо теряете закупки.

Поиск по словам против поиска по кодам

У текстового поиска есть потолок. Заказчик пишет название свободно, и никакой набор синонимов не закроет все варианты. Поэтому для узких товаров надёжнее искать по кодам — ОКПД-2 и позиции КТРУ. Код заказчик обязан проставить в извещении, и он один и тот же независимо от того, как названа закупка.

Сравним подходы:

Параметр Поиск по словам Поиск по кодам ОКПД-2/КТРУ
Полнота Зависит от формулировки заказчика Стабильна — код в извещении обязателен
Шум Высокий, нужны минус-слова Низкий, код привязан к категории
Узкие товары Легко пропустить Находит то, что текст не ловит
Настройка Быстрый старт Нужно знать свои коды

На практике связывают оба способа: коды дают каркас полноты, ключевые слова с минус-словами добавляют то, что заказчик мог отнести к смежному коду. О том, как подобрать код, мы разбирали в статье про подбор ОКПД-2 и КТРУ нейросетью.

Когда минус-слов уже не хватает

Стоп-слова отсекают мусор по тексту. Но они бессильны там, где совпадает название, а не подходит сам товар. Пример: вы ищете «кабель ВВГнг 3х2,5», в выдаче — десять закупок «кабель ВВГнг», и только в трёх нужное сечение и число жил. Минус-слово тут не поможет: слово «кабель» правильное, мимо идёт характеристика внутри.

Здесь работает уже не фильтр по словам, а сверка характеристик с требованиями закупки. TenderScan сопоставляет ваш товар с позицией КТРУ и техзаданием по характеристикам — сечению, материалу, габаритам, классу защиты — и показывает, проходите вы по требованиям или нет. Это снимает ручной разбор десятков почти одинаковых лотов: вы смотрите не «есть ли слово», а «подходит ли товар». Подробнее о логике — на главной странице сервиса.

Минус-слова и сверка по характеристикам решают разные задачи. Стоп-слова — гигиена входящего потока: убрать чужие отрасли и услуги. Сверка характеристик — точность на финише: оставить только те закупки, под которые вы реально проходите. Если боретесь с тем, что в требованиях заказчик прописывает лишние характеристики, посмотрите разбор обоснования дополнительных характеристик КТРУ.

Чек-лист настройки чистого поиска

  • Завести отдельные строки поиска под каждый синоним и жаргон заказчиков.
  • Включить морфологию или добавить маски на формы слов.
  • Собрать минус-слова из реальной грязной выдачи, а не из головы.
  • Сгруппировать стоп-слова по причине: отрасль, услуги, комплектующие, стадия.
  • Проверить отсечённые закупки — не выпало ли нужное.
  • Добавить поиск по кодам ОКПД-2/КТРУ для узких товаров.
  • Финальный отбор вести по характеристикам, а не по совпадению слов.
  • Пересматривать список минус-слов раз в пару недель.

Часто задаваемые вопросы

Чем минус-слова отличаются от стоп-слов и слов-исключений?

Это одно и то же. «Минус-слово», «стоп-слово» и «слово-исключение» — разные названия термина, при наличии которого закупка убирается из выдачи. В ЕИС поле называется «слова-исключения», в агрегаторах чаще «минус-слова».

Можно ли задать минус-слова прямо в ЕИС на zakupki.gov.ru?

В простой строке поиска — нет. В расширенном поиске и конструкторе запроса есть отдельная строка для слов-исключений. Перед использованием уточните в справке портала, по каким полям извещения бьёт исключение, чтобы не отрезать нужные закупки.

Минус-слова уменьшают число найденных закупок — не пропущу ли я нужное?

Риск есть, если формулировка слишком широкая. Поэтому после каждого нового стоп-слова откройте отсечённые закупки и убедитесь, что среди них нет ваших. Если попалась нужная — уточните минус-слово или уберите его.

Что надёжнее — искать по ключевым словам или по кодам ОКПД-2 и КТРУ?

Для узких товаров надёжнее коды: заказчик обязан проставить их в извещении, и они не зависят от формулировки названия. Текстовый поиск с минус-словами добавляет полноты там, где товар отнесли к смежной категории. На практике используют оба способа вместе.

Минус-слова убирают почти одинаковые закупки с разными характеристиками?

Нет. Стоп-слова работают по тексту названия и предмета. Если слово совпадает, а отличается характеристика — сечение, размер, материал, — фильтр по словам не поможет. Здесь нужна сверка характеристик товара с требованиями закупки.

ИИ-ассистент под ваши тендеры

Бесплатный аудит и консультация: разберём ваши тендерные процессы, найдём узкие места и что можно автоматизировать, а дальше — готовый ИИ-ассистент или разработка под вас. Без обязательств.

Нажимая кнопку, вы соглашаетесь на обработку персональных данных.

Другие статьи