Механика 10 мин чтения Роман Гачковский · 27 мая 2026

Как нейросети выбирают источники для ответов

Короткий ответ

Нейросети выбирают источники через два механизма: параметрическую память (знания из обучения, ~60% ответов ChatGPT) и RAG — поиск в реальном времени. Отбор идёт по семантическому сходству, структуре контента, авторитету источника и entity-сигналам. Ключевое отличие от SEO: AI не ранжирует страницы — он их отбирает или игнорирует.

Два механизма: параметрика и RAG

Параметрическая память

Около 60% запросов в ChatGPT обрабатываются без обращения к интернету — из знаний зашитых в веса модели при обучении. Бренды которые часто упоминались в авторитетных источниках во время обучения формируют более сильные нейронные связи и всплывают чаще.

Что делать: создавать контент который попадёт в обучающие данные следующих версий моделей — публикации в авторитетных СМИ, Wikipedia, профессиональных изданиях.

RAG — Retrieval Augmented Generation

Perplexity, ChatGPT с включённым поиском, Яндекс Нейро — ищут релевантные страницы в реальном времени перед ответом. Отбор идёт не по ключевым словам, а по семантическому сходству — запрос и контент кодируются в векторы и сравниваются.

Что делать: структурировать контент под прямые ответы, использовать Schema разметку, создавать FAQ и knowledge hub.

Что влияет на отбор источника

ФакторВлияниеКак улучшить
Семантическое сходствоКритичноЧёткие определения, релевантные заголовки
Структура контентаВысокоеFAQ, таблицы, нумерованные списки
Entity-сигналыВысокоеSchema Organization, Person, реальный автор
Авторитет источникаВысокоеВнешние упоминания, верифицируемая биография
Свежесть (для RAG)СреднееОбновлять даты, публиковать новый контент
Технические сигналыСреднееllms.txt, robots.txt, скорость загрузки
Ссылочная массаКосвенноеSEO-ссылки косвенно усиливают авторитет

Различия между платформами

ПлатформаМеханизмКлючевой фактор
ChatGPT (без поиска)Параметрическая памятьОбучающие данные — авторитетные источники
ChatGPT (с поиском)RAG через BingИндексация Bing + структура страницы
PerplexityRAG, всегдаСвежесть + семантика + структура
ClaudeПараметрика + опц. поискАвторитет + entity-сигналы
GigaChatПараметрика + RAGРунет-контент, Сбер-экосистема
Яндекс НейроRAG, Яндекс-индексЯндекс-ранжирование + региональность

Почему продающий лендинг не цитируют

AI ищет информацию, а не рекламу. Страница с текстом "Мы лучшие в своём деле, закажите прямо сейчас" не даёт модели что извлечь для ответа на вопрос пользователя. AI нужны: определения, цифры, сравнения, инструкции, факты.

Именно поэтому Wikipedia, отраслевые блоги и knowledge-сайты цитируются нейросетями значительно чаще коммерческих лендингов — они отвечают на вопросы, а не продают.

Частые вопросы

ChatGPT использует два механизма: параметрическую память (~60% ответов) и веб-поиск через Bing (~40% при включённом поиске). При поиске отбор идёт по семантическому сходству запроса и контента, авторитету источника и структуре страницы. Страницы с чёткими определениями, таблицами и FAQ отбираются чаще.
AI выбирает источники с чёткими определениями, структурированным контентом, реальным авторством и Schema разметкой. Продающие лендинги без информационного слоя AI игнорирует — там нет что процитировать.
RAG (Retrieval Augmented Generation) — механизм при котором модель перед ответом ищет релевантные источники. Используется в Perplexity, ChatGPT с поиском, Яндекс Нейро. Именно через RAG большинство сайтов может попасть в AI-выдачу без ожидания следующего обучения модели.

Проверьте видимость вашего сайта в нейросетях

Бесплатный аудит по 10 ключевым запросам

Получить аудит →