Что такое кластеризация семантического ядра. Бесплатный сервис кластеризации поисковых запросов от SEOQUICK. Just Magic — автоматический подбор семантики для SEO и контекстной рекламы

Кластеризация запросов — это группировка семантического ядра с целью распределить все запросы по разделам сайта, либо создать правильную структуру сайта с учетом спроса в поисковых системах. В этом руководстве рассмотрим правильный пример кластеризации семантического ядра, которое мы собрали .

Смотрите видео по кластеризации запросов семантического ядра

Вернемся к работе с нашим приложением, в котором мы . Ранее мы сохранили полученные поисковые фразы отдельно для контекстной рекламу, теперь пришло время сохранить результаты для и объединить их в единый Excel файл для дальнейшей работы.

В нашем случае у нас всего две группы-маски. Объединяем информацию и убираем все ненужные столбцы. Оставляем только три из них: фразы, общая частотность, частотность в кавычках. В результате получаем следующее:

Удаляем(если не сделали это ранее) запросы с предельно низкой частотностью. И начинаем работу по группировке ключевых слов, которые остались.

Онлайн кластеризация запросов семантического ядра

Заполняем данными новый лист:

После завершения определения основных разделов сайта, пора приступить к списку страниц с фильтрами. Перейдем вновь на страницу успешного интернет-магазина женской одежды и спустимся вниз:

Перед нами открывается так называемая простыня с фильтрами. Эти страницы являются прекрасной возможностью для продвижения многочисленных запросов сайта и при этом совершенно не мешают удобству пользователей, а иногда способны помочь в навигации. В дальнейшем мы разберем, как именно создать подобную структуру на самом сайте. А пока возвращаемся к созданию его будущей структуры.

Для удобства вы можете выделить группы запросов разными цветами: пусть зелеными будут будущие разделы на сайте, а желтыми страницы фильтров и тегов. Далее добавляем их все во второй лист нашего документа.

Добавляем последний третий пункт — статьи:

Этот раздел на нашем сайте способен собрать в себя именно тот второй тип поисковых фраз — информационный. Они принесут трафик, который при грамотном маркетинге возможно преобразовать в конверсии и постоянных покупателей.

В конечном итоге у вас не должно остаться кластерных групп: все они должны быть распределены между тремя пунктами в новом листе документа. В следующих статьях и соответствующих видео смотрите про под каждую группу запросов.

А пока перед нами стоит задача создать структуру сайта, создать нужные разделы и назначить задачи по — написанию текстов и статей.

Не забудьте продумать, в каком именно формате будут подаваться статьи. На сайте конкуренте из нашей ниши можно увидеть целых 3 возможности для сбора трафика по информационным запросам:

Резюмируя, стоит отметить логическую необходимость структуризации сайта с помощью кластеризации: для нас в первую очередь важно, чтобы именно посетителям было удобно и легко ориентироваться на вашем сайта. Это позволит получить больше продаж и хорошие результаты при продвижении.

Предлагаем две бесплатные программы для Windows:

  • Majento Кластеризатор, аналогичный нашему онлайн-сервису, с возможностью ручной группировки фраз
  • кластеризатор ядра запросов на основе Excel-кластеризатора по леммам от Roman Igoshin

Majento Кластеризатор 1.4

Программа является копией нашего онлайн-сервиса, однако имеет дополнительный функционал в виде ручной группировки фраз, доступной после автоматической кластеризации поисковых запросов. Сбор данных для кластеризации берется из выдачи Яндекса и ведется с использованием лимитов Яндекс.XML . После кластеризации становится доступной функция ручной группировки запросов (перемещение запросов по группам, создание новых групп и удаление кластеров). Результаты кластериции запросов экспортируются в Excel-файл формата CSV.

В программе имеется возможность импорта данных выдачи ПС Яндекс из KeyCollector для группировки фраз без использования XML-лимитов (пример файла импорта приложен в архиве).


Основные возможности

  • Кластеризация произвольного списка запросов
  • Указание региона в Яндекс для сбора данных при кластеризации
  • Группировка запросов методами Soft и Hard, "ручное" указание порога кластеризации фраз (от 1 до 10)
  • Возможность произвольной группировки фраз
  • Импорт данных выдачи ПС Яндекс из KeyCollector для группировки фраз без использования XML-лимитов
  • Экспорт кластеризации в Excel (CSV)

Отличия от аналогов

  • Низкие требования к ресурсам компьютера, малый расход оперативной памяти
  • Кластеризация ядер любых объемов
  • Портативный формат (работает без установки на ПК или прямо со сменного носителя)
  • Бесплатное распространение

Помощь проекту

Если у вас есть желание поддержать развитие программы, вы можете перевести любую сумму одним из удобных для вас способов:

  • на кошелек WebMoney: R848899779227 (перевод производится без протекции сделки).
  • на кошелек Яндекс.Деньги (форма ниже):

Благодарим за поддержку!

История версий

Версия 1.4 (build 33), 23.11.2017:

  • добавлено отображение числа главных страниц по каждому запросу и по группе запросов в целом

Версия 1.3 (build 31), 27.09.2017:

  • добавлена возможность просмотра наиболее часто встречающихся сайтов в конкретном кластере
  • расширен список регионов Яндекс, добавлена возможность их редактирования в текстовом файле (regions.txt)
  • исправлена ситуация, когда в поле списка запросов не загружалось более 2000 строк

Версия 1.2 (build 28), 29.08.2017:

  • добавлена возможность указания региона в Яндекс для сбора данных при кластеризации
  • добавлена возможность "ручного" указания порога кластеризации фраз (от 1 до 10)
  • добавлена возможность импорта данных выдачи ПС Яндекс из KeyCollector для группировки фраз без использования XML-лимитов

Версия 1.1 (build 22), 10.08.2017:

  • добавлена возможность ручной группировки фраз
  • добавлена возможность экспорта кластеризованных групп в Excel (CSV)

Версия 1.0 (build 5), 07.06.2016:

  • возможность кластеризации по запросам из списка
  • возможность группировки запросов методами Soft и Hard

Минимальные системные требования:
- 500 МГц (рекомендуется: 1 ГГц или выше)
- 1 ГБ RAM (рекомендуется: 2 ГБ или выше)
- Microsoft Windows XP/2003/Vista/7-10
- выход в интернет

Кластеризатор по леммам

Исходя из статьи Романа Игошина (http://www.it-agency.ru/academy/excel-clusterer/), идея заключалась занести данные в таблицу, а потом уже вручную играться с параметрами, добиваясь нужного результата. Так что если идти по этому пути, то программа явно проигрывает с точки зрения удобства.

Возможно, правильней было бы улучшить изначальную идею - дописать и оптимизировать скрипты для экселя...
Поэтому полученный софт выкладывается "как есть". Если будут мысли, как докрутить до рабочего варианта - вэлкам.

Скачать кластеризатор по леммам: majento-clusterer.zip (7 Мб)

PS. Описание настроек см. в ридми + примеры включены.
PPS. Для небольшого списка запросов нужно уменьшить мин. вес до 1000000 (по логике, чем меньше запросов, тем меньше должен быть вес).

Ограничение: 5 раз в сутки для 1 IP-адреса. Для Вашего IP осталось 5 раз. Зарегистрируйтесь, чтобы снять ограничение...

Запросы для онлайн кластеризации (макс. 250) ↓


Примечание: знаки "+" из текста удаляются автоматичски

Метод кластеризации: SOFT HARD

Подобрать релевантную страницу


Защита от автоматических генераций:


Используется два метода кластеризации: Soft и Hard.

  • Soft -кластеризация: выбирается "центральный" запрос с которым сравниваются остальные запросы по количеству общих URL в ТОП-10 Яндекса. Если количество общих URL-ов превышает порог - запрос добавляется в группу.
  • Hard -кластеризация: запросы объединяются в группу, только если есть общий для всех запросов набор URL, который показывается по ВСЕМ этим запросам в ТОП-10.

При использовании сервиса кластеризации без регистрации действует ограничение - не более 250 фраз за один раз. Зарегистрированные пользователи могут группировать запросы до 500 фраз единоразово любое количество раз.

Мнения экспертов

Топвизор - один из самых динамичных инструментов на рынке поискового продвижения. Развиваясь поступательно, команда регулярно наращивает число полезных сервисов для SEO-специалистов.

Один из наиболее интересных модулей - быстрая кластеризация поисковых запросов по принципу схожести SERP’ов.

В Топвизор наша компания перешла не по какой-либо рекомендации. Мы тестировали разные сервисы мониторинга позиций, и подкупила отзывчивость разработчика.

Приятно, когда твои предложения внедряют и делают жизнь и работу легче. И спустя время эта способность выслушать и внедрить не исчезла. Это очень круто!

Давно искал удобный сервис проверки позиций, перепробовал массу! То одно не нравилось, то другое... В Топвизоре все можно настроить под себя, а дополнительные возможности радуют еще больше.

Однозначно мастхэв! Надеюсь, что будет и дальнейшее развитие!

Мы перепробовали множество сервисов-конкурентов и выбрали именно Топвизор за качество. А также за точность и скорость проверки позиций. Теперь все новые инструменты тестируем и внедряем в свой рабочий процесс.

Особенно радует отзывчивость команды сервиса и оперативная реализация идей и пожеланий пользователей.

Когда в очередной раз на Маке я не смог открыть KeyCollector, меня спас Топвизор. Здесь я быстро получил ряд данных по сематнике для одного важного исследования. Также, при необходимости я использую Топвизор для проверки позиций сайтов клиентов, очень удобно.

Создатели сервиса знакомы с потребностями рынка, поэтому делают все возможное для автоматизации множества задач, иногда не очень популярных. Приятный и удобный сервис.

Обязательно должен быть в арсенале оптимизаторов.

Для человека, который построил себе репутацию на семантике, крайне важно всегда получать точные данные; это касается и кластеризации, и съема позиций, и аналитики. Топвизор с первых дней задал высокий уровень работы относительно рынка и каждый день подтверждает своё лидерство.

Помимо удобства и точности инструментов сервиса, хочу отметить отзывчивую работу службы поддержки и руководства!

Меня Топвизор поразил своей продуманностью и многофункциональностью. Столько мелочей учтено заранее. Я часто работаю с интерфейсами самых разных SEO-сервисов, много тестирую, но подобного уровня удобства для пользователя пока не видела больше нигде.

Впечатляет подробная Справка, доброжелательность и оперативность саппорта.

Очень удобно в нем работать – снимать и расширять сем. ядро, делать кластеризацию, контролировать позиции как сайтов, так и страниц в соцсетях и видео, каналов на Youtube, следить за конкурентами, анализировать оптимизацию своего сайта. Цены, как оказалось, очень даже доступные для работы. Из этого сервиса мне точно уходить не хочется.

Топвизором пользуюсь давно - с первых недель существования - с 2013 года. И честно говоря, просто решил протестировать еще один сервис для проверки позиций, т.к. текущий на тот момент постоянно падал и тех.поддержка не отвечала совсем.

А поддержка Топвизора отвечала за 2 минуты даже в твиттере и, что очень порадовало, многие мои предложения по улучшению исполнялись чуть ли не в тот же день.

На момент написания отзыва у меня примерно 270 закрытых тикетов и многие фишки появились с моей легкой руки. Казалось бы, причем тут поддержка в сервисе по проверке позиций? Как оказалось - самая главная часть. потому что любой глюк, любую оплошность исправляют быстро и если лишнего сняли со счета - компенсируют. А что со стабильностью? тоже все отлично (ну за исключением выкатки новых фич). За 3 с лишним года с Топвизором я загружал туда сотню различных проектов с семантическими ядрами от 10 до 5000 запросов и не было почти ни одного раза, чтобы проект не снялся вовремя или что-то случилось с данными.

Топвизор - стабильный и быстрый сервис для работы с семантикой, который делает если не все, то почти все: вордстат, адвордс, подсказки, группировка и кластеризация запросов, отличная и понятная аналитика, интеграция с вебмастером, метрикой, GA. Кроме этого есть куча и маленькая тележка сопутствующих сервисов вроде мониторинг изменений на сайте или бид-менеджер для контекста. Все эти фичи я использую на полную катушку почти в каждом новом проекте.

Если вы выбираете сервис для мониторинга позиций и других задач по SEO, рекомендую присмотреться к Топвизору.

Это целый комплекс полезных инструментов: от проверки позиций со сбором сниппетов и снимков поисковой выдачи до подробного технического анализа сайта. От подбора слов, сбора поисковых подсказок до группировки по релевантности и кластеризации тремя разными методами.

Умеет работать и интегрироваться с Яндекс.Метрикой, Я.Вебмастером, Google Analytics и Google Search Console. Настоящий сервис поисковой аналитики.

Топвизор постоянно и динамично развивается, регулярно появляются новые инструменты и расширяется текущий функционал. Интерфейс удобный, интуитивно понятный и очень хорошо продуманный разработчиками сервиса. Уделите особое внимание подробным справочным материалам по инструментам и возможностям Топвизора. Уверен, что даже у новичков не возникнет проблем и вопросов с работой после прочтения.

Начали использовать Топвизор в сентябре 2014 года, как дублирующий сервис для внутренних инструментов мониторинга и аналитики. Со временем и развитием проекта часть функционала внутренних штук полностью отрабатывается не на нашей стороне.

Используем только модуль позиций, получаем статистику по удобному API, с которым отлично дружит и Power BI/Query для визуализаций готовых отчетов по параметрам количества и динамики запросов в ТОП-3..100+ за нужный период времени.

Удобно, что сервис пользуется документооборотом по безналу через Диадок, а готовые счета за неделю до расчётной даты экономят кучу времени. У Топвизора есть самое важное, что может быть в клиентском сервисе, кроме работы технических вещей - крутая поддержка. Реакция на запросы в течении 5-10 минут, видимое желание помочь и разобраться в проблеме и улучшить функционал. Так у городов России в статистике появились разные цвета на графиках, а в справке - пару дополнительных скриншотов.

Это группировка ключевых слов, которые идут просто списком, разделение их на кластеры (группы). Это то, что превращает тысячу ваших запросов в полноценную структуру, разбитую на категории, страницы, статьи и т.д. Без правильной разбивки вы будете тратить много денег и времени в "холостую", так как некоторые запросы не могут быть "посажены" на одну страницу. Либо наоборот, ключевые слова требуют, чтобы данные запросы были на одном URL.

При сборе семантического ядра (СЯ) я обычно делаю кластеризацию руками, с помощью , вот ссылки по теме:

Но все это легко и просто, когда у нас есть четкие группы запросов по разному логическому смыслу. Мы прекрасно знаем, что для запроса "Коляска для близнецов" и "Коляска для мальчика" должны существовать разные посадочные страницы.

Но бывают запросы, которые разделяются между собой не совсем явно и тяжело "по ощущениям" определить, какие запросы нужно сажать на одну страницу, а какие запросы раскидывать по разным посадочным URL.

Один из участников моего SEO марафона задал мне вопрос: "Петя, как быть с этими ключами: сажать все на одну страницу, создавать несколько, если да, то сколько?" А вот и сам отрывок из списка ключевых слов:

Одно только слово "java" использует в трех вариациях ("ява", "джава"), плюс ко всему этому народ ищет его для разных игр, устройств и т.д. Запросов там очень много и реально тяжело понять, как все-таки лучше поступить.

Как вы думаете, как правильно? Верно. Лучше всего подойдет анализ конкурентов, которые уже находятся в ТОПе по данным ключевым словам. Сегодня я расскажу вам, как можно сделать кластеризацию семантического ядра на основе данных у конкурентов.

Если у вас уже есть готовый список ключевых слов для кластеризации, вы можете сразу переходить к 4-му пункту.

1. Матрица запросов

Возьму еще другой пример: есть у меня один клиент с интернет-магазином электро- и светотехники. У магазина очень большое количество товаров (несколько десятков тысяч).

Конечно, у любого магазина есть товары, которые наиболее приоритетны для продажи. У этих товаров может быть высокая маржинальность, либо просто нужно избавиться от данного товара со склада. Так вот, пришло мне письмо, что-то вроде этого "Петя, вот список товаров, которые интересны нам". И там списком было перечислено:

  • выключатели;
  • светильники;
  • лампы;
  • прожекторы;
  • удлинители;
  • и еще несколько пунктов.

Я попросил составить так называемую "матрицу запросов". Так как владельцы магазина лучше меня знают свой ассортимент, мне нужно было собрать весь товар и основные характеристики/отличия у каждого товара.

Получилось что-то вроде этого:

При составлении матрицы, не забываем, что некоторые англоязычные бренды запрашиваются и на русском, это нужно учесть и их добавить.

Конечно, если у товара были еще и другие характеристики добавлялся столбец. Это могут быть "Цвет", "Материал" и т.д.

И такая работа была проделана для самых приоритетных товаров.

2. Перемножение запросов

Для перемножения запросов существуют много сервисов и программ. Я воспользовался этим генератором ключевых фраз http://key-cleaner.ru/KeyGenerator , вбиваем туда все наши запросы по столбцам:

Сервис перемножил всевозможные варианты со словом удлинитель. Важно: многие генераторы перемножают только подряд идущие столбцы, то есть 1 столбец со вторым, потом первые два с третьим и т.д. А этот перемножает все подряд из первого столбца с другими: первый со вторым, потом первый с третьим, четвертым; далее первый*второй*третий, первый*второй*четвертый и т.д. То есть мы получаем максимальное количество фраз с содержанием основного слова в первом столбце (это так называемый маркер).

Маркер - это основная фраза, от которого нужно генерировать ключ. Без маркера невозможно создать адекватный ключевой запрос. Нам не нужны фразы "иэк оптом", или "на катушке купить".

При перемножении важно, чтобы в каждом ключевом словосочетании был этот маркер. В нашем примере - это фраза "удлинитель". В итоге сгенерировалось в данном примере 1439 (!) уникальных ключевых фраз:

3. Очистка запросов от "мусора"

Теперь есть 2 варианта развития событий. Можно заняться кластеризацией всех этих запросов и насосоздавать огромное количество сгенерированных страниц под каждый кластер, если позволяет это сделать система вашего сайта. Конечно, у каждой страницы должны быть свои уникальные метатеги, h1 и т.д. Да и проблемно иногда подобные типы страниц засовывать в индекс.

У нас же подобной возможности в техническом плане не было, поэтому мы даже не рассматривали данный вариант. Нужно было в "полуручном" режиме создавать только самые необходимые новые посадочные страницы.

С каким типом частотности работать? Так как у нас список товаров + пересечений встречались не очень популярные (узконаправленные), я делал акцент на частотности с кавычками (без восклицательных знаков) - то есть в различных словоформах. Это ключевые фразы в разном падеже, числе, роде, склонении. Именно этот показатель позволяет более менее оценить трафик, который мы сможем получить из Яндекса в случае попадания в ТОП.

Снимаем в Key Collector частотности в кавычках у данных фраз (конечно, если у вас сезонный товар, то нужно снять частотности в "сезон"):

И удаляем все то, что равно нулю. Если у вас более популярная тематика и очень много слов с ненулевой частотностью, вы можете увеличить нижний порог до 5, или еще выше. У меня же ненулевых запросов из 1439 фраз осталось всего 43 по региону Москва и область.

Эти 43 фразы с данными частотностей я переношу в Excel:

4. Кластеризация запросов

Все это я делаю в Rush Analytics , вот алгоритм кластеризации в данном сервисе:

Под каждый запрос "выдергивается" из выдачи ТОП-10 URL по заданному региону. Далее по общим URL происходит кластеризация. Точность кластеризации можно задать самому (от 3-х до 8 общих url).

Допустим мы выставили точность 3. Система запоминает URL страниц, которые в ТОП-10 по первому запросу. Если по второму запросу из списка в ТОП-10 встречаются те же 3 URL, которые были у первого, то эти два запроса попадут у нас в 1 кластер. Количество общих URL зависит от заданной нами точности. И такая обработка происходит с каждым запросом. В итоге ключевые слова разбиваются на кластеры.

  1. Заходим в RushAnalytics -> Кластеризация, создаем новый проект (при регистрации каждый получает 200 рублей на счет для тестирования, удобно):
  2. Выбираем приоритетную поисковую систему для нас и регион:

  3. Выбираете тип кластеризации. Я выбираю в данном случае "Wordstat". Метод "Ручные маркеры" мне не подходит, так как в запросах только один маркер "удлинитель". Если же вы загружаете сразу несколько разных типов товаров (пример, удлинитель, лампочка и т.д.), то тогда вам лучше выбрать тип "Wordstat + ручные маркеры" и указать маркеры (маркеры нужно будет отметить цифрой 1 во втором столбце, а не маркеры цифрой 0, частотность уйдет в третий столбец). Маркерами будут самые основные запросы, которые логически никак не связываются между собой (не может "посадиться" запрос "удлинитель" и "лампочка" на одну страницу). В моем случае я работаю поэтапно с каждым товаром и создавал отдельные кампании для удобства. Также выбираете точность кластеризации. Если пока не знаете какой метод выбрать, можно отметить все (на цену это не повлияет никак), а дальше уже после получения результата сможете выбрать тот вариант, который лучше всего откластеризовал ваши запросы. По опыту скажу, что самый подходящий во всех тематиках - это точность = 5. Если вы делаете кластеризацию для уже существующего сайта, я рекомендую вам вбить URL вашего сайта (если ваш сайт будет в ТОП-10 по запросу, то ваш URL выделится зеленым в полученным файле):

  4. В следующем шаге загружаете файл в систему. Также можно настроить стоп-слова, у меня же файл был без них, поэтому данная функция не нужна в данном примере. Цена кластеризации - 50-30 копеек за 1 запрос (зависит от объема):
  5. Нужно будет немного подождать пока сервис Rush Analytics выполнит свою работу. Заходите в завершенный проект. Уже там можете просмотреть кластеры исходя из точности кластеризации (жирным выделено начало нового кластера и его название):
  6. Повторюсь, лучше всего использовать точность 5 для кластеризации. Он чаще всего подходит.
  7. Также в соседней вкладке можно увидеть список некластеризованных слов:

    Вы спросите, почему они не кластеризовались? Скорей всего по данным запросам выдача не очень качественная и невозможно было в автоматическом режиме отнести данные запросы к какому-нибудь кластеру. Что с ними делать? Можно кластеризовать вручную и создать отдельные посадочные страницы по логике, если это возможно. Можно даже для одного запроса создать отдельный кластер и "посадить" его на отдельную страницу. Либо же можете расширить список слов и заново произвести кластеризацию в сервисе Rush Analytics.
  8. Во вкладке "Лидеры тематики" можно увидеть ТОПовые домены по данным запросам:

  9. Кстати, в некоторых запросах вы можете увидеть вот такие пальчики вверх, выделенные "зеленым":
    Это означает что по данным запросам, у вас уже есть посадочная страница для данного кластера в ТОП-10 и нужно работать над ней.
  10. Все это дело можно скачать себе на компьютер в Excel и работать уже в данном документе. Я работаю с точностью 5, поэтому скачиваю этот файл:

  11. В Excel документе та же самая информация. Серым выделено начало каждого кластера и его название (кликните по изображению, чтобы увеличить):

  12. Помимо названия кластеров, здесь вы увидите их размеры, частотности, суммарные частотности, Top URL, релевантный URL и подсветки, что очень нужно при работе над посадочной страницей. Вот они:

    Обратите внимание, что бренд "Юниверсал" (через "Ю") тоже подсвечивается, а я даже не подозревал, что данный бренд можно прописывать итак. В подсветках также вы увидите синонимы и тематические фразы, которые крайне желательно использовать на посадочных страницах для достижения ТОПа.

Заключение

Что же дальше? Что нам даст эта кластеризация? Теперь под каждый кластер у нас на сайте должен быть отдельный, а главное релевантный url. Продвижение этих страниц полностью в наших руках и продвигаем дальше так, как умеем (оптимизация контента, внутренняя перелинковка, внешняя оптимизация, социальные факторы и т.д.).

Если же мы бы сделали неправильную кластеризацию, то очень много запросов тяжело было бы продвинуть. Это было бы "якорем", который сдерживал бы нас, несмотря на то, что мы тратили бы кучу денег на продвижение этих страниц.

Правильная кластеризация поможет вам прилично сэкономить и существенно облегчит попадение в заветный ТОП.

Что вы думаете по этому поводу? А как вы делаете кластеризацию запросов семантического ядра?


Дарим 200 лимитов на счет чтобы попробовать!

Кластеризация ключевых слов - это автоматизированное распределение запросов на группы на основе выдачи поисковых систем.

Алгоритм кластеризации Rush Analytics соберет ТОП10 URL выдачи Яндекса или Google по каждому вашему ключевому слову, сравнит результаты для каждого ключевого слова и сгруппирует запросы именно так, как они будут успешно продвигаться в поисковых системах, и как будет удобно и логично создавать страницы на сайте.

В Rush Analytics кластеризацию можно провести двумя методами: Soft и Hard

После обработки запросов, вы получите практически готовую и корректно сформированную, с точки зрения поисковых систем, структуру сайта. А основываясь на данных о частотности по каждой группе ключевых слов, вы сможете легко принять решение о создании дополнительных страниц на сайте.

Ознакомьтесь с видео руководством по функционалу кластеризации

FAQ по кластеризации: самые частые вопросы наших пользователей

Кластеризация – группировка ключевых слов на основе сравнения выдачи поисковых систем. Алгоритм соберет ТОП10 URL по вашим ключевым словам, сравнит результаты для каждого ключевого слова и сгруппирует запросы именно так , как они будут успешно продвигаться в поисковых системах, и как будет удобно и логично создавать страницы на сайте

Вам нужно загрузить в Rush Analytics список ключевых слов и их частотность (любую) или же разметить ключевые слова как главные (маркерные запросы) и все остальные.
Для использования комбинированного алгоритма кластеризации, вам понадобится и частотность и разметка маркеров. Об этом читайте немного ниже.

Точность кластеризации указывает, сколько общих URL должно быть в результатах поиска по двум запросам, чтобы мы объединили эти запросы в группу.
Иными словами - чем больше точность кластеризации (группировки), тем более похожие фразы попадут в одну группу (кластер).
Для большинства тематик будет достаточно точности = 5.

A: В каждой тематике есть свой, необходимый и достаточный порог схожести выдачи, чтобы получить качественное семантическое ядро. Например, при продвижении интернет-магазинов, будет большой проблемой, если при кластеризации запросов ключевые слова "мультиварка Redmond RX500" и "Мультиварка Redmond RX500-1" будут попадать в один кластер - т.к. это разные товары и они должны продвигаться на разные карточки товара. Здесь мы рекомендуем использовать точность = 5

Если трафик на сайт в основном российский и из Яндекса - оптимально делать кластеризацию по Яндексу, выбрав регион по которому продвигается сайт.
Можно использовать и обе поисковые системы, а потом сравнить результаты. Часто результаты очень похожи между поисковыми системами.
Если вы продвигаете сайт под другие рынки - уже сейчас доступна кластеризация для всех регионов и языков мира по выдаче Google.
В скором времени мы добавим функционал выбора страны и города для кластеризации по выдаче Google.com. Если вам интересен этот функционал - голосуйте в нашем сообществе и он появится значительно быстрее - ссылка на голосование

Да, можно. А иногда даже нужно.
Когда можно объединить два кластера в один?
Нередко такие ключевые слова как "купить мультиварки redmond" и "мультиварки redmond цена" могут попадать в разные кластеры из-за низкого качества выдачи в Яндексе и Google по этим запросам.
В таком случае нужно объединить эти кластеры в один и продвигать на страницу мультиварок redmond . Это вполне нормальная ситуация.
Когда нельзя объединять два кластера в один?
Когда в одном кластере информационные запросы, а в другом коммерческие. Например, кластеры "купить мультиварки redmond" и "обзор мультиварок redmond" нельзя объединять т.к. эти запросы должны принципиально продвигаться на разные страницы.
Я сомневаюсь объединять два кластера или нет, что делать?
Мы подробно рассказываем, что делать в таком случае в этом руководстве .

Потому, что слова из вкладки "Некластеризовано" не нашли себе пару для кластера. К сожалению, не все ключевые слова можно сгруппировать - т.к. не все они связаны между собой.
Мы руководствуемся в первую очередь тем, как ключевые слова будут продвигаться (ранжироваться) и группируем их на основе схожести поисковой выдачи.
К примеру: запросы "мобильный телефон" и "мобильные телефоны" должны продвигаться на разные страницы т.к. один запрос информационный, а второй коммерческий и они никогда не продвинутся на одну страницу.
Что делать с некластеризованными запросами?
Если в списке некластеризованных слов вы найдете ценные для вас ключевые слова - их можно в ручную добавить к уже существующим группам (могли не привязаться из-за плохой выдачи) или же создать под эти слова отдельные страницы на сайте.

Перед кластеризацией из списка будут исключены все фразы, содержащие стоп-слова. Т.е. мусорные ключевые слова не будут использоваться в кластеризации и будут отброшены еще до начала сравнения запросов.
Рекомендуем использовать данную опцию, если вы загружаете "грязный" список ключевых слов в проект по кластеризации. Функционал помогает сэкономить бюджет на кластеризацию и решает проблему ручной, утомительной очистки стоп-слов в Excel. Предлагаем воспользоваться готовыми списками стоп-слов по гео-запросам и различным тематикам, или создать свой список стоп-слов.

Пошаговый алгоритм работы с сервисом:

  1. Создание проекта. Чтобы создать проект, необходимо перейти во вкладку кластеризация и нажать "Создать новый проект"


  2. Шаг первый: Поисковая система и регион .
    Здесь необходимо ввести название проекта (обязательное поле). Можно ввести любое название, часто бывает удобно вводить название сайта, чтобы в будущем легко найти нужный проект.

    Далее мы указываем поисковую систему, по данным которой будет выполняться группировка. Можно выбрать или Яндекс или Google.
    Для Google на данный момент доступны все регионы и языки мира.

  3. Шаг второй: Настройки сбора

    Все о наших алгоритмах кластеризации

    Метод кластеризации :
    • Soft-кластеризация: в этом методе кластеризации алгоритм определяет центральные (маркерные) запросы и сравнивает с ними все остальные запросы.Алгоритм отлично подходит для кластеризации ключевых слов для трафиковых проектов: интернет-магазины, информационные сайты, сайты услуг с несильной конкуренцией.
    • Hard-кластеризация: запросы объединяются в группу, только если есть общий для всех запросов набор URL. При этом типе кластеризации группируется меньше ключевых слов, но с очень большой точностью. Идеально подходит для конкурентных высокочастотных запросов.
    Тип - выбор алгоритма кластеризации.

    У нас есть 3 алгоритма кластеризации:

    • Кластеризация с ручными маркерами
    • Кластеризация по Wordstat
    • Комбинированный алгоритм кластеризации (ручные маркеры + Wordstat)

    Работают они по одному и тому же базовому принципу - сравнению подобия ТОПов поисковых систем, но предназначены для решения несколько различных задач.

    Алгоритм с использованием ручных маркеров:

    Данный алгоритм эффективнее всего использовать, когда у вас есть готовая и довольно разветвленная структура сайта (каталога), и вы наперед знаете все маркеры и вам нужно просто понять по каким запросам вы собираетесь продвигать существующие страницы, а задачи расширения структуры сайта не стоит. В таком случае вы берете свои маркеры (названия категорий/страниц), собираете по ним подсказки, размечаете маркеры как 1, собранное облако как 0 и отправляете на кластеризацию. На выходе вы получите готовую семантику для своих категорий, а слова, которые не привязались к вашей структуре останутся некластеризованными.
    Формат загрузки данных: ключевое слово | маркер(1/0) - скачать пример входного файла

    Алгоритм кластеризации по Wordstat

    Этот алгоритм скорее решает обратную алгоритму ручных маркеров задачу: вы еще не знаете структуры своего сайта и не можете выделить маркеры - вы просто собрали Wordstat, подсказки и частотность по подсказкам. Теперь вам нужно структурировать эту семантику, чтобы получить группы запросов под страницы будущего сайта или будущих категорий существующего сайта. В таком случае алгоритм кластеризации по Wordstat подойдет как нельзя лучше, работает он следующим образом.
    Весь список ключевых слов сортируется по убыванию частотности, алгоритм пытается привязать все возможные слова из списка к самому частотному слову и формирует кластер, далее все повторяется итерационно для следующих по частотности ключевых слов.
    Не волнуйтесь за то, что ключевые слова могут при первом проходе алгоритма привязаться к неверному кластеру - мы используем алгоритмы машинного обучения, построенные на бинарных деревьях, чтобы предотвратить это:)
    Формат загрузки данных: ключевое слово | частотность (любая) - скачать пример входного файла

    Комбинированный алгоритм (ручные маркеры + Wordstat) - сочетает подходы двух предыдущих методов.

    Этот алгоритм подходит для задачи одновременного подбора ключевых слов для существующей структуры сайта и ее расширения. Работает он следующим образом: сначала мы пытаемся привязать все возможные запросы к вашим маркерным запросам и формируем готовую структуру, привязанную к вашим маркерам. Далее, все запросы, что не были привязаны к маркерам - сортируются по убыванию частотности и группируются между собой. В результате вы получаете:
    а) Готовую семантику для существующих категорий сайта
    б) Расширение семантики для вашего сайта.
    Мы настоятельно рекомендуем использовать комбинированный алгоритм - он дает наилучший результат.
    Формат загрузки данных: ключевое слово | | маркер(1/0) | частотность - скачать пример входного файла

    Все, что нужно знать про точность кластеризации

    Точность – чем больше точность кластеризации (группировки), тем более похожие фразы попадут в одну группу (кластер).
    Другими словами - данная опция отвечает за то, сколько общих URL нужно в ТОП10 поисковой системы, чтобы ключевые слова попали в один кластер.

    В каждой тематике есть свой, необходимый и достаточный порог схожести выдачи, чтобы получить качественное семантическое ядро. Например при продвижении интернет-магазинов, будет большой проблемой, если при кластеризации запросов ключевые слова "мультиварка Redmond RX500" и "Мультиварка Redmond RX500-1" будут попадать в один кластер - т.к. это разные товары и они должны продвигаться на разные карточки товара. Здесь мы рекомендуем использовать точность = 5
    Для инфо-тематик, например, для сайтов скидок или рецептов, такая точность не нужна - здесь задача получить максимальное количество сгруппированных кластеров для написания статей. Для таких сайтов мы рекомендуем точность 3 или 4. А для сайтов в очень конкурентных тематиках, где борьба за ТОП идет в основном по конкурентным ВЧ запросам - мы рекомендуем использовать повышенную точность кластеризации - 6 или 7, а под некластеризованные запросы создавать отдельные страницы.

    Рекомендуется выбирать варианты 3-6 и по результатам смотреть, какая кластеризация будет обладать достаточной полнотой и точностью для вашей семантики. Чем больше значение точности, тем более мелкие будут группы.

    Другие настройки кластеризации

    Не кластеризовать, если частотность меньше, чем - данная опция позволяет не кластеризовать ключевые слова с частотностью, менее заданной. Это избавит вас от ручной чистки низко популярных запросов – такие слова будут помещены во вкладку «Не кластеризовано».

    Определение релевантных URL для кластеров существующего сайта
    Вам достаточно ввести название нужного домена и наши алгоритмы попытаются определить релевантные URL для полученных кластеров.
    Опция работает следующим образом: если по главному (маркерному) запросу ваш сайт уже в ТОП10 - мы покажем этот URL и выделим его зеленым цветом. Иначе - подберем URL для маркерного запроса с помощью оператора site:.

    ВАЖНО: Релевантные URL подбираются для маркерных (главных) запросов кластера и присваиваются всему кластеру (всем ключевым словам кластера).

  4. Шаг третий: «Ключевые слова и цена» .
    Загружаем файл с запросами.
    Поддерживаемые форматы: xls, xlsx. Формат ввода данных: запрос;маркер или частотность. Для кластеризации по методу Wordstat + Ручные маркеры формат данных: запрос;маркер;частотность.

    Вводим стоп-слова
    Перед кластеризацией из списка будут исключены фразы, содержащие стоп-слова. Функционал помогает сэкономить бюджет на кластеризацию и решает проблему ручной очистки стоп-слов. Функционал особенно полезен, если вы кластеризуете "грязный", предварительно не очищенный список ключевых слов.

    Предлагаем воспользоваться готовыми списками стоп-слов по гео-запросам и различным тематикам, или создать свой список стоп-слов. И не забываем про "Эксперт опции" - по умолчанию применяется символьное соответствие - т.е. частичное вхождение удалит все слово / словосочетание, если вам надо точное соответствие стоп-слову - выбирайте фразовое соответствие .



  5. Нажимаем "Создать новый проект" - все, ваш проект отправлен на кластеризацию!
Теперь можно отслеживать статус проекта во вкладке "Очередь" или же в списке проектов по кластеризации.
На данный момент в Rush Analytics есть 5 статусов:
В очереди – данные еще не собираются, проект ждет своей очереди на сбор данных
Сбор данных – счетчик показывает, сколько ключевых слов обработано
Кластеринг – данные проекта уже собраны, система просчитывает все необходимые метрики, чтобы предоставить вам результат
На паузе – вы можете вручную поставить проект на паузу, если не уверены, что хотите его собирать. Или же, проект может сам встать на паузу т.к. у вас кончились деньги на балансе.
Готов – проект готов - вы можете посмотреть результаты в веб-интерфейсе или скачать в формате XLSX

Выходной файл кластеризации - описание столбцов

Результат кластеризации в формате XLSX выглядит следующим образом:


  • Запросы, выделенные серым цветом – маркерные запросы - указанные вами вручную, или определенные системой
  • Название кластера – берется название маркерного запроса
  • Размер кластера – количество ключевых слов в группе
  • Частотность ключевых слов – та частотность, которую вы задали в шаге «Ключевые слова». В зависимости от того, какую вы взяли частотность – базовую, в кавычках или с восклицательным знаком, результаты кластеризации могут незначительно отличаться
  • Общая частотность кластера – сумма частотностей всех ключевых слов кластера
  • Совпадений ТОПа – количество общих URL в поисковой выдаче по данному запросу с выдачей по эталонному (маркерному) запросу
  • Подсветки – подсветки с выдачи поисковых систем, собранные по вашему ключевому слову
  • Подсветки для кластера - подсветки без дубликатов, по всем словам данного кластера
  • Top URL - самый видимый в выдаче URL конкурента по всем запросам кластера. Здесь мы оцениваем частоту встречаемости URL конкурентов в выдаче по каждому запросу и позицию каждого URL конкурентов в выдаче
  • Релевантный URL - найденный релевантный URL для кластера, если была выбрана опция "Определять релевантные URL
    Опция работает следующим образом: если по главному (маркерному) запросу ваш сайт уже в ТОП10 - мы покажем этот URL и выделим его зеленым цветом. Иначе - подберем URL для маркерного запроса с помощью оператора site:
Примеры готовых файлов после кластеризации можно посмотреть в нашем портфолио