TenderScanБлог
Семён Метелёв · Основатель TenderScan··7 мин чтения

Локальные нейросети для тендеров: ИИ в закрытом контуре

Локальная нейросеть для закупок: когда нужен закрытый контур, GigaChat в контуре или on-prem, требования ФСТЭК и кому это оправдано.

Локальные нейросети для тендеров: ИИ в закрытом контуре

ИИ-ассистент для тендеров под ваши задачи — обсудим на бесплатной консультации

Локальная нейросеть для закупок — это языковая модель, которая работает внутри вашего ИТ-контура, а не на чужих серверах в публичном облаке. Для большинства задач по тендерам подойдёт обычный облачный сервис. Но как только в работу попадают чувствительные данные — содержание заявок до подачи, расчёт цены, данные субподрядчиков, документы для гостайны или критической инфраструктуры — вопрос меняется. Передавать такое в публичный ChatGPT нельзя ни юридически, ни здраво. Здесь и появляется идея ИИ в закрытом контуре: модель остаётся под вашим контролем, данные не уходят наружу.

Разберём честно, какие варианты есть в 2026 году, сколько это стоит, что требует регулятор и кому это действительно нужно, а кому — избыточно.

Зачем вообще закрытый контур

Публичная нейросеть удобна, но у неё есть фундаментальное свойство: ваш запрос уходит на сторону провайдера. Для черновика пресс-релиза это не страшно. Для тендерной заявки, где указана ваша предельная цена и логика обоснования, — это утечка коммерческой тайны конкуренту, если данные где-то всплывут.

Закрытый (изолированный) контур решает три задачи сразу:

  • данные обрабатываются внутри периметра организации и не покидают его;
  • логика модели и журналы запросов остаются под вашим контролем;
  • можно выполнить требования регуляторов, для которых публичное облако в принципе недопустимо.

С 1 марта 2026 года это перестало быть только вопросом гигиены. Вступил в силу приказ ФСТЭК России № 117, заменивший прежний приказ № 17 для государственных информационных систем. В нём впервые появился отдельный блок требований к применению ИИ (пункт 60): запрет передачи информации ограниченного доступа разработчику модели, обязательный контроль наборов данных для обучения, статистические критерии достоверности и применение только доверенных технологий ИИ. Проще говоря: если вы работаете с ГИС или защищаемыми данными, отправить их во внешнюю модель уже нельзя по закону.

Три варианта развёртывания ИИ

Выбор почти всегда сводится к трём моделям размещения. Они отличаются по уровню контроля, цене и качеству ответов.

Вариант Где данные Цена входа Контроль Качество ответов
Публичное облако (ChatGPT, облачный GigaChat/YandexGPT) На серверах провайдера Низкая, оплата по токенам Минимальный Высокое, флагманские модели
Частный контур (GigaChat Enterprise, YandexGPT в изолированной сети) В выделенной защищённой среде Средняя–высокая, подписка плюс настройка Высокий, данные не уходят к разработчику Высокое, близко к облачным версиям
On-prem open-source (Qwen, LLaMA, локальные сборки) Полностью на вашем железе Высокая разово (GPU), дальше дёшево Полный Среднее, зависит от модели и дообучения

Публичное облако

Самый дешёвый и быстрый старт. Подходит для несекретных задач: разобрать описание объекта закупки, переписать сопроводительное письмо, сделать черновик вопроса заказчику. Минус один, но важный — чувствительные данные сюда нельзя.

Частный контур российских моделей

Сбер предлагает GigaChat Enterprise (GigaChat Бизнес) с развёртыванием в защищённом сетевом контуре организации — на собственном или арендованном оборудовании, без передачи корпоративных данных вовне. Аналогичную логику изоляции даёт инфраструктура Yandex Cloud для YandexGPT: трафик клиента отделён от трафика других пользователей, при строгих требованиях ресурсы разносятся по отдельным сетям.

Это золотая середина: вы получаете качество, близкое к флагманским моделям, но данные остаются внутри периметра. Платой становится подписка корпоративного уровня и работы по интеграции.

On-prem на open-source

Самый радикальный вариант контроля. Модели семейств Qwen, LLaMA, DeepSeek и совместимые российские сборки запускаются прямо на вашем сервере через движки вроде llama.cpp. Данные не покидают машину вообще.

Но у свободы есть цена. Модель уровня 7–14B параметров требует хотя бы среднюю видеокарту (например, 16 ГБ видеопамяти), более крупные модели — серьёзного GPU-сервера. Качество ответов уступает облачным флагманам, особенно на русском языке, и часто требует дообучения и квантизации. Плюс на вас ложится вся поддержка: обновления, мониторинг, безопасность.

Что нужно учесть до старта

Прежде чем закладывать бюджет, пройдитесь по реальным требованиям. Они почти всегда дороже, чем кажется на старте.

  1. Юридический режим данных. Определите, с чем работаете: коммерческая тайна, персональные данные, сведения для ГИС, гостайна. От этого зависит, допустимо ли облако вообще и какой класс защиты нужен.
  2. Соответствие ФСТЭК. Для ГИС и защищаемых систем сверьтесь с приказом № 117 и апрельским методическим документом: доверенные технологии ИИ, контроль обучающих данных, запрет передачи ограниченной информации разработчику модели.
  3. Железо. Для on-prem посчитайте стоимость GPU-сервера, электричества и места в стойке. Для частного контура — требования провайдера к инфраструктуре.
  4. Качество против контроля. Чем выше изоляция, тем обычно ниже качество «из коробки». Решите, готовы ли вы доплачивать дообучением за тот же результат, что даёт облако.
  5. Поддержка и люди. On-prem требует своей команды или подрядчика. Частный контур — обслуживания вендором. Оцените, есть ли у вас компетенции.
  6. Совокупная стоимость владения. Считайте не цену лицензии, а TCO на 2–3 года: железо, лицензии, интеграция, сопровождение, обучение сотрудников.

Закрытый контур реально нужен тем, кто работает с гостайной, критической информационной инфраструктурой, ГИС или крупными контрактами, где утечка цены и стратегии стоит дороже всей ИТ-системы. Для небольшого поставщика, который ищет тендеры и готовит типовые заявки по 44-ФЗ, разворачивать собственную нейросеть — почти всегда избыточно и нерентабельно.

Кому это оправдано, а кому нет

Граница проходит по характеру данных и масштабу, а не по размеру компании в целом.

Оправдано: госкорпорации и их «дочки», оборонные и режимные предприятия, операторы КИИ, крупные подрядчики с высокой ценой утечки, организации с собственными ГИС. Для них закрытый контур — не роскошь, а условие законной работы.

Избыточно: малый и средний бизнес без секретных данных, поставщики стандартной продукции, компании на старте автоматизации. Им разумнее использовать специализированные облачные сервисы для несекретных задач и обычную ИБ-гигиену: не загружать в публичные модели то, что нельзя показывать конкуренту.

Промежуточный путь для среднего бизнеса — частный контур российской модели по подписке. Он закрывает большинство требований по конфиденциальности без капитальных затрат на собственный GPU-парк.

Где здесь место специализированным сервисам

Важно не путать две разные задачи. Локальная нейросеть в контуре нужна там, где есть чувствительные данные внутри ваших процессов. А вот поиск и первичный анализ тендеров на публичных площадках работают с открытыми данными ЕИС — здесь закрытый контур не требуется.

Для поиска подходящих закупок, фильтрации по ОКПД-2 и регионам, отслеживания новых процедур логичнее использовать готовый инструмент вроде TenderScan: он анализирует открытые данные и не требует, чтобы вы строили собственную ИИ-инфраструктуру. Связка получается рациональной: специализированный сервис закрывает поиск и мониторинг, а закрытый контур включается только тогда, когда в работу попадают по-настоящему чувствительные сведения.

Часто задаваемые вопросы

Можно ли использовать публичный ChatGPT для тендерных заявок?

Для несекретных черновиков — да: переформулировать письмо, разобрать описание объекта. Для документов с предельной ценой, данными субподрядчиков или сведениями ограниченного доступа — нет. Эти данные уходят на серверы провайдера, а для ГИС это прямо запрещено приказом ФСТЭК № 117.

Сколько стоит развернуть локальную нейросеть on-prem?

Главная статья — GPU-сервер. Скромная конфигурация для модели на 7–14B начинается от карты с 16 ГБ видеопамяти, серьёзные модели требуют профессиональных ускорителей и стоят на порядок дороже. Добавьте лицензии, интеграцию и поддержку — и считайте совокупную стоимость владения на 2–3 года, а не разовый ценник.

GigaChat в контуре — это то же самое, что облачный GigaChat?

Это та же линейка моделей, но в варианте развёртывания внутри защищённой сети организации (GigaChat Enterprise). Данные не передаются разработчику и остаются в вашем периметре. Качество близко к облачной версии, но появляется подписка корпоративного уровня и работы по настройке инфраструктуры.

Подойдёт ли open-source модель для русского языка?

Модели Qwen, LLaMA и DeepSeek работают с русским, но качество заметно уступает флагманам и часто требует дообучения. Если русскоязычная точность критична, разумнее смотреть в сторону российских моделей в частном контуре.

Вывод

Локальная нейросеть для закупок — это инструмент для конкретной ситуации, а не универсальное решение. Сначала определите режим ваших данных. Если есть гостайна, КИИ, ГИС или высокая цена утечки — стройте закрытый контур: частный контур российской модели как разумный компромисс или on-prem на open-source для полного контроля, с поправкой на требования ФСТЭК и стоимость железа. Если секретных данных нет, не тратьте бюджет на собственную ИИ-инфраструктуру: используйте облачные и специализированные сервисы для открытых данных, а чувствительное просто не отправляйте наружу. Правильный выбор экономит и деньги, и нервы при следующей проверке.

ИИ-ассистент под ваши тендеры

Бесплатный аудит и консультация: разберём ваши тендерные процессы, найдём узкие места и что можно автоматизировать, а дальше — готовый ИИ-ассистент или разработка под вас. Без обязательств.

Нажимая кнопку, вы соглашаетесь на обработку персональных данных.

Другие статьи