Как искусственный интеллект выбирает сайты для ответов

Искусственный интеллект не «выбирает сайты» так, как человек выбирает статью в поисковой выдаче. В большинстве современных AI-поисковиков и ассистентов работает многоступенчатая система: сначала запрос пользователя интерпретируется, затем система ищет или извлекает релевантные документы, разбивает их на смысловые фрагменты, оценивает качество и применимость этих фрагментов, а уже потом генерирует ответ с опорой на выбранные источники.

Важно понимать главное: у разных систем разные механизмы. Google AI Overviews, AI Mode, ChatGPT search, Copilot, Perplexity и корпоративные RAG-системы не используют один общий алгоритм. Но логика у них похожа: AI старается найти не просто страницу, а проверяемую информацию, которая может обосновать конкретный ответ.

1. AI-ответы бывают двух типов: из памяти модели и с поиском

Когда пользователь задаёт вопрос AI-системе, ответ может строиться двумя способами.

Первый вариант — модель отвечает на основе знаний, полученных во время обучения. В этом случае она не выбирает сайты в реальном времени. Она опирается на статистические связи, усвоенные из обучающих данных. Такой ответ может быть полезен для устойчивых знаний: например, «что такое HTTP», «как работает индекс базы данных», «что такое инфляция». Но для свежих фактов, цен, новостей, юридических изменений и конкретных характеристик товаров такой подход ненадёжен.

Второй вариант — модель использует поиск или retrieval-augmented generation, то есть RAG. В этом режиме AI сначала получает свежие или внешние источники, затем формирует ответ на их основе. Google прямо описывает RAG как технику, при которой AI-ответы улучшаются за счёт поиска релевантных актуальных страниц в поисковом индексе, а затем используются конкретные сведения с этих страниц для более надёжного ответа. Google также указывает, что AI Overviews и AI Mode могут применять query fan-out — генерацию нескольких связанных поисковых запросов по подтемам исходного вопроса.

Именно второй сценарий важен для владельцев сайтов. Если AI-система ищет источники в интернете, у сайта появляется шанс попасть в ответ, быть процитированным или использованным как опорный источник. Подробнее о продвижении в нейросетях

2. Сначала AI определяет намерение пользователя

Первый этап — не выбор сайта, а понимание задачи. AI должен понять, что именно хочет пользователь: краткое определение, сравнение, инструкцию, свежую новость, список вариантов, локальную рекомендацию, техническое объяснение или доказательство.

Например, запрос «лучшие CRM для малого бизнеса» требует сравнения продуктов, критериев выбора, актуальности и, возможно, цен. Запрос «что такое CRM» требует базового объяснения. Запрос «как подключить CRM к 1С-Битрикс» требует технической инструкции и, вероятно, предпочтения источников с документацией, кейсами, интеграционными схемами и примерами.

На этом этапе система может переписать пользовательский запрос в один или несколько более точных поисковых запросов. OpenAI в справке по ChatGPT search указывает, что поиск может использовать партнёрские поисковые провайдеры и что ChatGPT обычно переписывает пользовательский запрос в один или несколько целевых запросов, отправляемых этим провайдерам. Microsoft аналогично описывает, что Copilot при включённом веб-поиске генерирует короткий Bing-запрос на основе промпта пользователя.

Отсюда важный вывод для SEO и контент-маркетинга: AI может искать не ровно ту фразу, которую ввёл пользователь. Он может искать подзапросы, уточнения, сравнения, определения, симптомы, причины, цены, отзывы, ограничения, инструкции. Поэтому сайт должен покрывать тему не одной ключевой фразой, а полноценным смысловым кластером.

3. Затем система ищет кандидатов в индексе

AI-поиск обычно не обходит весь интернет заново при каждом вопросе. Он работает поверх поискового индекса, партнёрского поискового API, внутренней базы знаний или заранее проиндексированного корпуса документов.

В классическом поиске индекс отвечает на вопрос: «Какие страницы показать пользователю?» В AI-поиске задача усложняется: «Какие фрагменты информации можно безопасно использовать для построения ответа?» Bing в материале о развитии поискового индекса формулирует этот сдвиг как переход от ранжирования страниц к поддержке ответов: ценность смещается от документа целиком к “groundable information” — отдельным проверяемым фактам с ясным происхождением.

Это означает, что страница должна быть не только доступна для индексации, но и хорошо интерпретируема. Если важный смысл спрятан в изображениях без текста, в сложном JavaScript, в размытых маркетинговых формулировках или в неструктурированном полотне текста, AI-системе сложнее извлечь из неё пригодные фрагменты.

Для Google AI-функций официальное требование звучит прагматично: чтобы страница могла появиться как поддерживающая ссылка в AI Overviews или AI Mode, она должна быть проиндексирована и иметь право показываться в Google Search со сниппетом; специальных дополнительных технических требований для AI-функций Google не заявляет.

4. AI оценивает не только страницу, но и конкретные фрагменты

В классическом SEO мы часто думаем в категориях URL: какая страница ранжируется, на какой позиции, по какому запросу. В AI-поиске важнее становится фрагмент: абзац, таблица, определение, список шагов, характеристика, дата, цитата, блок FAQ, карточка товара.

Microsoft Advertising описывает это так: в AI-поиске ранжирование остаётся, но выбор всё меньше похож на сортировку целых страниц и всё больше связан с тем, какие части контента попадут в итоговый ответ; ассистенты разбивают контент на более мелкие структурированные части, которые можно оценить по авторитетности и релевантности.

Практически это меняет подход к написанию текстов. Страница должна содержать самодостаточные смысловые блоки. Хороший блок отвечает на конкретный вопрос без необходимости читать пять предыдущих экранов. Например, не «это решение удобно и эффективно», а «для интернет-магазина на 10 000 товаров важны три критерия: скорость индексации каталога, корректная обработка фильтров и стабильная синхронизация остатков».

AI любит фрагменты, которые можно использовать как доказательство: точные, предметные, не перегруженные рекламой, с понятным контекстом.

5. Главные сигналы выбора источников

Ни одна крупная платформа не раскрывает полный алгоритм выбора источников. Но из официальных материалов Google, Microsoft и OpenAI можно выделить несколько групп факторов.

Первая группа — релевантность. Содержимое страницы должно точно соответствовать намерению пользователя. Bing прямо называет релевантность одним из основных параметров ранжирования: учитываются соответствие контента намерению запроса, термины на странице, фразы в ссылках, семантические эквиваленты, синонимы и аббревиатуры.

Вторая группа — качество и авторитетность. AI-система стремится не просто найти совпадающие слова, а выбрать источник, которому можно доверять. В темах YMYL — медицина, финансы, право, безопасность — это особенно критично. Сайт с автором, экспертизой, прозрачными источниками, датами обновления и доказательной базой имеет больше шансов быть использованным, чем анонимный SEO-текст без фактической опоры.

Третья группа — свежесть. Для вечнозелёных тем свежесть вторична, но для цен, законов, API, интерфейсов, обзоров, новостей и технической документации она становится критичной. Bing подчёркивает, что в контексте grounding устаревшая информация опаснее, чем в обычной выдаче: в классическом поиске stale-контент ухудшает ранжирование, а в AI-ответе устаревший факт может прямо создать ошибочный ответ.

Четвёртая группа — доступность и структура. AI должен иметь возможность извлечь контент. Поэтому важны crawlability, индексируемость, корректные заголовки, внутренняя перелинковка, текстовая доступность ключевой информации, структурированные данные, совпадающие с видимым содержимым страницы. Google прямо относит к полезным практикам разрешённое сканирование, внутренние ссылки, хороший page experience, доступность важного контента в текстовой форме, качественные изображения и видео, а также соответствие structured data видимому тексту.

Пятая группа — доказуемость. AI-системе проще использовать контент, где утверждения подкреплены данными, примерами, методологией, первичными источниками или явной экспертизой. Особенно ценны страницы, которые не просто пересказывают общие знания, а добавляют собственный опыт: исследование, сравнение, тест, кейс, таблицу, расчёт, скриншоты, техническую схему.

6. Почему сайт может ранжироваться в Google, но не попадать в AI-ответ

Высокая позиция в обычной выдаче помогает, но не гарантирует включение в AI-ответ. Причина в том, что AI-ответу нужен не всегда «лучший URL целиком», а набор фрагментов, из которых можно собрать корректный и полезный ответ.

Сайт может не попасть в AI-ответ по нескольким причинам. Контент слишком общий и не добавляет ничего к уже известной информации. Страница оптимизирована под ключевые слова, но не даёт прямого ответа. Текст написан рекламно и не содержит проверяемых фактов. Материал устарел. Важные данные находятся в изображениях или скриптах. Авторство и источники неясны. Страница смешивает несколько намерений и не даёт системе понять, для какого вопроса она является лучшим источником.

Google в своём руководстве для generative AI features прямо подчёркивает важность “valuable, unique, non-commodity content” — ценного, уникального, некоммодитизированного контента. Иными словами, AI-поиск хуже относится к страницам, которые пересказывают то же самое, что уже есть у сотен конкурентов.

7. Что такое query fan-out и почему он меняет SEO

Query fan-out — один из ключевых механизмов AI-поиска. Вместо одного запроса система создаёт несколько связанных запросов. Например, пользователь спрашивает: «Как выбрать ноутбук для дизайнера?» AI может параллельно искать: «лучшие ноутбуки для Figma», «минимальные требования Adobe Photoshop 2026», «OLED vs IPS для дизайна», «сколько RAM нужно дизайнеру», «лучшие процессоры для графики», «ноутбук для дизайнера отзывы».

Google прямо указывает, что AI Overviews и AI Mode могут применять query fan-out, а в руководстве приводит пример, где исходный запрос о газоне с сорняками разворачивается в связанные подзапросы о гербицидах, удалении сорняков без химии и профилактике.

Для владельцев сайтов это означает: больше нельзя мыслить одной посадочной страницей под одну ключевую фразу. Нужно строить тематическое покрытие. Если сайт продаёт CRM, ему нужны не только страницы «купить CRM», но и материалы о сценариях внедрения, сравнении, интеграциях, безопасности, миграции данных, стоимости владения, типичных ошибках, отраслевых кейсах.

AI выбирает не «самый SEO-оптимизированный текст», а наиболее пригодные фрагменты для ответа на весь спектр подзапросов.

8. Как AI относится к брендам и авторитетным доменам

Крупные бренды часто получают преимущество, но не потому, что AI «любит бренды» как таковые. У брендов обычно больше внешних упоминаний, ссылок, поведенческих сигналов, первичных данных, авторов, регулярных обновлений, структурированных страниц и доверия со стороны поисковых систем.

Но AI-поиск также создаёт окно возможностей для нишевых сайтов. Google отмечает, что AI Overviews и AI Mode могут показывать более широкий и разнообразный набор полезных ссылок, чем классический поиск, потому что модели во время генерации ответа определяют дополнительные поддерживающие страницы.

Нишевый сайт может быть выбран, если он даёт лучший фрагмент по конкретному вопросу: более точную инструкцию, свежую таблицу, уникальный кейс, локальную экспертизу, редкое сравнение, техническое объяснение или первичные данные.

9. Что делать сайту, чтобы чаще попадать в AI-ответы

Первое — сохранить базовое SEO. Индексация, robots.txt, sitemap, canonical, внутренняя перелинковка, скорость, мобильная пригодность, корректные заголовки, понятные URL и отсутствие технических дублей остаются фундаментом. Google прямо пишет, что SEO best practices остаются релевантными для AI-функций и что специальных «AI-only» требований для появления в AI Overviews или AI Mode нет.

Второе — писать экспертно, а не компилировать. Страница должна содержать то, чего нет в типовом пересказе: опыт внедрения, цифры, ограничения, ошибки, сравнения, методику, выводы, скриншоты, исходные данные, авторскую позицию. Чем больше в тексте проверяемой конкретики, тем выше шанс, что AI сможет использовать его как источник.

Третье — структурировать контент под извлечение. Используйте понятные H1–H3, короткие смысловые блоки, таблицы, списки критериев, FAQ, определения, пошаговые инструкции. Не прячьте ключевую информацию в PDF, изображениях, слайдерах или JavaScript, если её можно дать текстом.

Четвёртое — обновлять материалы. На страницах, где актуальность важна, указывайте дату обновления и реально поддерживайте содержание. Особенно это касается статей про законодательство, цены, тарифы, API, CMS, маркетплейсы, медицинские и финансовые темы.

Пятое — укреплять авторство и доверие. Указывайте автора, должность, опыт, редакционную политику, источники, юридические реквизиты, контакты, методологию исследования. Для коммерческих сайтов это не формальность, а часть доверительной инфраструктуры.

Шестое — создавать контент под вопросы, а не только под ключевые слова. AI-системы работают с интентами. Поэтому полезны страницы формата «как выбрать», «что лучше», «сколько стоит», «как настроить», «ошибки при внедрении», «сравнение вариантов», «чек-лист», «пошаговая инструкция», «пример расчёта».

Седьмое — следить за видимостью в AI-интерфейсах. В Bing Webmaster Tools уже появился AI Performance dashboard, который показывает, когда контент сайта цитируется в AI-ответах, какие URL используются и как меняется citation activity. Google также начал тестировать дополнительные инструменты и данные для владельцев сайтов по появлению страниц в generative AI Search features.

10. Чего не стоит делать

Не стоит полагаться на «магические» файлы и новые псевдостандарты без подтверждения. Например, Google прямо указывает, что не нужно создавать специальные machine-readable файлы, AI text files, markup или Markdown для появления в Google Search и его generative AI capabilities; в частности, Google Search не использует llms.txt как специальный сигнал.

Не стоит массово генерировать однотипные статьи. AI-поиску не нужен ещё один текст «10 преимуществ CRM», если он повторяет сотни аналогичных страниц. Такой контент может индексироваться, но он плохо конкурирует за роль источника.

Не стоит скрывать важную информацию за формами, скриптами, табами, изображениями без альтернативного текста или PDF без HTML-дубля. Если система не может стабильно извлечь факт, она выберет другой источник.

Не стоит писать только для роботов. Google в рекомендациях для AI-функций делает акцент на helpful, reliable, people-first content — полезном, надёжном контенте, созданном для людей. AI-поиск усиливает это требование: слабый, водянистый текст не даёт модели надёжной опоры.

11. Главный сдвиг: от позиции к цитируемости

Классическое SEO долго вращалось вокруг позиции в выдаче: топ-1, топ-3, топ-10. В AI-поиске появляется новая метрика — цитируемость или используемость контента в ответах.

Страница может не быть первой в классической выдаче, но её конкретная таблица, определение или инструкция могут попасть в AI-ответ. И наоборот: страница может хорошо ранжироваться, но не попасть в ответ, если её нельзя удобно использовать как источник.

Поэтому задача сайта — стать не просто «релевантным документом», а надёжным поставщиком проверяемых фрагментов. Это требует другого качества контента: меньше воды, больше фактов; меньше общих утверждений, больше доказательств; меньше SEO-компиляции, больше экспертной структуры.

Искусственный интеллект выбирает сайты не по одному универсальному фактору. Он сопоставляет запрос с намерением пользователя, разворачивает его в связанные подзапросы, извлекает кандидатов из индекса или поисковых провайдеров, оценивает релевантность, качество, свежесть, структуру и доказуемость информации, а затем использует те фрагменты, которые лучше всего поддерживают ответ.

Для владельцев сайтов это означает: AI-видимость строится на фундаменте обычного SEO, но требует более высокого уровня содержательной ценности. Побеждают не те страницы, где больше ключевых слов, а те, где есть точный, свежий, структурированный и проверяемый ответ на реальную задачу пользователя.