Как собрать и разгруппировать семантическое ядро: полная инструкция

Александр Овсянников (Интернет Мажор)
Обновлено: 27.02.2019
Рубрика: Семантика
Семантика

В этом посте мы расскажем полный алгоритм сбора семантического ядра преимущественно для информационного сайта, но данный подход можно применять и для коммерческих сайтов.

Первоначальная семантика и создание структуры сайта

После того, как выбрали нишу для нашего сайта. Теперь переходим к созданию семантики. Самый нелюбимый процесс для многих. Но тем не менее, сбор семантического ядра — это самый важный этап в построении сайта. От того как вы проработаете ядро зависит ваша структура, трафик, ваши текста, даже ваш дизайн сайта.

Под сбором семантического ядра подразумевается и его группировка. Без группировки это не семантическое ядро, а никому не нужный список запросов.

Краткий план сбора семантическое ядро у меня выглядит вот так:

  1. Парсинг поисковиков wordstat, adwords, подсказок, база ключевых слов букварикс (пока бесплатная), youtube
  2. Группировка ядра
  3. Бесплатный сбор у конкурентов + Группировка ядра
  4. Платный сбор у конкурентов + Группировка ядра

На первом этапе при сборе семантики мы уже будем иметь представление о сайте, погрузимся в нишу и её нюансы. У нас появится основная структура сайта. А также уже окончательно сделаем выводы, стоит ли вообще нам ввязываться в эту нишу.

Поэтому я регистрирую домен и заказываю хостинг, только после первого этапа сбора семантики. Это кстати иногда помогает подобрать красивый домен, потому что вы знаете уже все слова своей тематики.

На втором и третьем этапе уже можно углубляться в семантику и парсить конкурентов, искать интересные ключи.

1 и 2 этап можно менять местами, об этом будет написано ниже — в подразделе структура сайта.

Так как у нас узконишевые сайты, то надо как можно тщательнее проработать семантику и охватить все ключевые слова. От этого будет зависеть успех продвижения. Чем полнее охвачена семантика, тем выше в топе будет ваше главное ключевое слово, да и все слова получат бонус. Это и логично, как для людей, так и для поисковых систем. Если ваш сайт раскрывает полностью тематику, то значит он круче. И он должен ранжироваться лучше.

Подготовка слов для парсинга и первоначальная структура сайта

Перед тем как начать парсить слова, нам надо знать их. Поэтому нам надо составить первоначальную структуру нашего сайта и начальные слова для парсинга (их еще называют маркерами).

Первоначальную структуру и слова вы можете посмотреть:

1. Используя логику, слова из головы (если вы понимаете в теме).
2. У своих конкурентов, которых вы проанализировали при выборе ниш или введя ваш основной запрос.
3. Из википедии. Обычно это выглядит вот так:
Структура Wikipedia
4. Смотрим wordstat по вашим основным запросам и правую колонку.
5. Другие тематические книги и справочники.

Например, тема нашего сайта – болезни сердца. Понятно, что у нас в структуре обязательно должны быть все болезни сердца.

Вам не обойтись без медицинского справочника. Я бы не стал смотреть конкурентов, потому что у них могут быть представлены не все заболевания, скорее всего они не успели их охватить.

И ваши начальные слова для парсинга будут именно все болезни сердца, а уже исходя из ключей, которые мы напарсим, вы будете строить структуру сайта, когда начнете их группировать.

К тому же вы можете взять все препараты для лечения сердца, как расширение темы и т.д. Вы смотрите википедию, рубрики у конкурентов на сайте, wordstat, думаете логически и таким способом находите еще маркерные слова, которые будете парсить.

Структура сайта

Вы можете смотреть конкурентов для общего ознакомления, но не всегда вы должны делать структуру как у них. Вы должны исходить в большей степени из логики вашей целевой аудитории, они же вводят запросы, которые вы парсите у поисковиков.

Например, как поступить? Перечислить все болезни сердца, а от них уже вести симптомы, лечение. Или все-таки сделать рубрики симптомы, лечение, а от них уже вести болезни. Эти вопросы обычно решаются при группировке ключевых слов исходя из данных поисковых систем. Но не всегда, иногда вам придется делать выбор самостоятельно и решать, как сделать структуру наилучшей, потому что запросы могут пересекаться.

Вы должны всегда помнить, что структура создается на протяжении всего сбора семантики и иногда в первоначальном виде она состоит из нескольких рубрик, а уже при дальнейшей группировке и сборе она расширяется, так как вы начинаете видеть запросы и логику. А иногда вы сможете её составить и сразу не парся ключевые слова, потому что знаете хорошо тематику или она отлично представлена у конкурентов. Никакой системы по составлению структуры сайта нет, можно сказать это лично ваше творчество.

Структура может быть вашей индивидуальной (отличающейся от конкурентов), но обязательно она должна быть удобной для людей, отвечать их логике, а значит логике и поисковых систем и такой, чтобы можно было охватить все тематические слова в вашей нише. Она должна быть лучшей и удобной!

Думайте наперед. Бывает такое что берете нишу, а потом вам охота ее расширить, и вы начинаете менять структуру всего сайта. А созданную структуру на сайте, очень сложно и муторно менять. В идеале вам надо будет поменять урлы вложения и все это переклеить на самом сайте. Короче, это жесть какая нудная и очень ответственная работа, так что сразу определяйтесь окончательно по мужски, что и как у вас должно быть!

Если вы очень плохо знакомы с тематикой создаваемого сайта и не знаете, как будет строиться структура, не знаете какие начальные слова для парсинга взять, то 1 и 2 этап сбора вы можете менять местами. То есть сначала пропарсить конкурентов (как их парсить разберем ниже), посмотреть их ключи, на основе этого составить структуру и начальные слова для парсинга, а потом уже парсить wordstat, подсказки и т.д.

Для составления структуры я использую майнд менеджер — Xmind. Он бесплатен и в нем есть все основное.

Простенькая структура выглядит вот так:
Структура коммерческого сайта
Это структура коммерческого сайта. Обычно в информационных сайтах нет пересечений и всяких фильтров карточек товаров. Но и эта структура не сложная, составлялась для клиента, чтобы он понял. Обычно мои структуры состоят из множество стрелок и пересечений, комментариев — в такой структуре могу разобраться только я сам.

Можно ли создавать семантику по ходу наполнения сайта?

Если семантика легкая, вы уверены в теме и знаете её, то можно делать семантику параллельно с наполнением сайта. Но первоначальную структуру надо накидать обязательно. Я сам иногда такое практикую в очень узких нишах или в очень широких, чтобы не тратить много времени на сбор семантики, а сразу запускать сайт, но всё-таки не советовал бы так делать. Вероятность ошибок очень большая, если у вас нет опыта. Все-таки легче, когда вся семантика готова, вся структура готова и все разгруппировано и понятно. К тому же в готовой семантике вы видите каким ключам надо уделить первостепенное внимание, которые не имеют конкуренцию и принесут больше посетителей.

Еще здесь надо отталкивать от размера сайта, если ниша широкая, то нет смысла собирать семантику, лучше ее делать по ходу, потому что на сбор семантике может уйти месяц и более.

Так вот мы накидали первоначально структуру или не накидали, решили идти вторым этапом. У нас есть список начальных слов или фраз нашей тематики, которые мы можем начать парсить.

Парсинг и работа в keycollector

Для парсинга конечно же использую keycollector. Я не буду останавливаться на настройке keycollectora, вы можете почитать хелп этой программы или найти статьи по настройке в интернете, их очень много и там все подробно расписано.

При выборе источников парсинга стоит рассчитывать свои трудозатраты и их эффективность. Например, если вы будете парсить базу Пастухова или MOAB, то вы закапаетесь в куче мусорных запросов, которые надо будет отсеивать, а это время. И по моему мнению, это того не стоит, чтобы найти парочку каких-то запросиков. На тему баз есть очень интересное исследование от RushAnalytics, конечно же они там хвалят себя, но если на это не обращать внимание, весьма интересные данные по процентам плохих ключевых слов http://www.rush-analytics.ru/blog/analytica-istochnikov-semantiki

На первом этапе я парщу wordstat, adwords, их подсказки и использую базу ключевых слов Букварикс (десктопная версия бесплатна). Так же раньше просматривал подсказки из Youtube вручную. Но недавно keycollector добавил возможность их парсить, и это прелестно. Если вы полный извращенец, то можете сюда добавить другие базы ключевых слов.

Запускаете парсинг и понеслось.

Чистка семантического ядра для информационного сайта

Мы спарсили запросы и у нас получился список различных слов. В нем конечно же присутствуют нужные слова, а так же и мусорные – пустые, не тематические, не актуальные и т.д. Поэтому их надо почистить.

Ненужные слова я не удаляю, а перемещаю их в группы, потому что:

  1. Они в дальнейшем могут стать пищей для размышления и приобрести актуальность.
  2.  Исключаем вероятность случайного удаления слов.
  3.  При парсинге или добавление новых фраз, они не будут добавляться, если поставить галочку.

Галочка "не добавлять фразы"
Я иногда забывал её ставить, поэтому настраиваю парсинг в одной группе и парсю ключи только в ней, чтобы сбор не дублировался:
Настройка парсинга
Вы можете работать так или так, кому как удобно.

Сбор частотностей

Собираем у всех слов через direct, базовую частотность [W] и точную [“!W”].
Парсинг Директ
Все что не собралось, дособираем через wordstat.
Парсинг Wordstat

Чистка однословников и не формат

Фильтруем по однословникам, смотрим их и убираем не нужные. Есть такие однословники по которым нет смысла продвигаться, они не однозначные или дублируют другой однословный запрос.
Keycollector фильтр по одному слову
Например, у нас тематика — болезни сердца. По слову “сердце” нет смысла продвигаться, не понятно, что человек имеет ввиду — это слишком широкий и неоднозначный запрос.

Так же смотрим, по каким словам не собралась частотность – это либо в словах содержатся спец символы, либо слов в запросе более 7. Переносим их в неформат. Малая вероятность что такие запросы вводят люди.

Чистка по общей и точной частотности

Все слова с общей частотностью [W] от 0 до 1 убираем.

Так же убираю и все от 0 до 1 по точной частотностью [”!W”].

Разношу их по разным группам.
Общая точная частотность
В дальнейшем в этих словах можно найти нормальные логические ключевые слова. Если ядро маленькое, то можно сразу вручную все слова с нулевой частотностью пересмотреть и оставить, которые как вам кажется вводят люди. Это поможет охватить тематику полностью и возможно, по таким словам будут переходить люди. Но естественно эти слова надо использовать в последнюю очередь, потому что по ним большого трафика точно не будет.

Значение от 0 до 1 тоже берется исходя от тематики, если ключевых слов много, то можно фильтровать и от 0 до 10. То есть все зависит от широты вашей тематики и ваших предпочтений.

Чистка по полноте охвата

Теория здесь такова: например, есть слово – “форум”, его базовая частотность составляет 8 136 416, а точная частотность 24 377, как видим отличие более чем в 300 раз. Поэтому можно предположить, что данный запрос пустой, он включает очень много хвостов.

Поэтому, по всем словам, я рассчитываю, такое KEI:

Точная частотность / Базовая частотность * 100% = полнота охвата

Чем меньше процент, тем больше вероятность что слово пустое.

В KeyCollector эта формула выглядит вот так:

YandexWordstatQuotePointFreq  /  (YandexWordstatBaseFreq+0.01)  * 100

Здесь тоже все зависит от тематики и количества фраз в ядре, поэтому можно убирать полноту охвата меньше 5%. А где ядро большое то можно не брать и 10-30%.

Чистка по неявным дублям

Чтобы почистить неявные дубли, нам необходимо по ним собрать частотность Adwords и ориентироваться по ней, потому что она учитывает порядок слов. Экономим ресурсы, поэтому будем собирать этот показатель не у всего ядра, а только у дублей.
Отметить неявные дубли
Таким способом мы нашли и отметили все не явные дубли. Закрываем вкладку — Анализ неявных дублей. Они у нас отметились в рабочей группе. Теперь отобразим только их, потому что съем параметров происходит только тех фраз, которые у нас показаны в группе на данный момент. И только потом запускаем парсинг.
Парсинг в Adwords по дублям
Ждем, когда Adwords снимет показатели и заходим в анализ неявных дублей.
Удаление неявных дублей
Выставляем вот такие параметры умной групповой отметки и нажимаем – выполнить умную проверку. Таким способом у нас в группе дублей не отметятся только самые высокочастотные запросы по Adwords.

Все дубли лучше конечно еще пробежаться и глянуть вручную, вдруг там что-то выставилось не так. Особенно уделить внимание группам, где нет показателей частотности, там дубли отмечаются случайно.

Все что вы отмечаете в анализе неявных группах, это проставляется и в рабочей группе. Так что после завершения анализа, просто закрываете вкладку и переносите все отмеченные неявные дубли в соответствующую папку.

Чистка по стоп словам

Стоп слова я тоже делю на группы. Отдельно заношу города. Они могут пригодится в дальнейшем, если мы надумаем делать каталог организаций.

Отдельно заношу слова содержащие в себе слова фото, видео. Вдруг они когда-нибудь пригодятся.

А так же, “витальные запросы”, например википедия, отношу сюда и форум, а так же в мед теме сюда могут относится – малышева, комаров и т.д.

Все так же зависит от тематики. Можно еще делать отдельно и коммерческие запросы – цена, купить, магазин.
Стоп-слова
Получается вот такой список групп по стоп словам:
Группы стоп-слов

Чистка накрученных слов

Это касается конкурентных тематик, их частенько накручивают конкуренты, чтобы ввести вас в заблуждение. Поэтому необходимо собрать сезонность и отсеять все слова с медианой равной 0.

А так же, можно глянуть соотношение базовой частотности к средней, большая разница может тоже указывать на накрутку запроса.

Но надо понимать, что эти показатели могут говорить и о том, что это новые слова по которым только недавно появилась статистика или они просто сезонные.
Сезонность

Чистка по гео

Обычно проверка по гео для информационных сайтов не требуется, но на всякий случай распишу этот момент.

Если есть сомнения, что часть запросов геозависимые, то лучше это проверить через сбор Rookee, он хоть бывает и ошибается, но намного реже чем проверка этого параметра по Яндексу. Потом после сбора Rookee стоит проверить все слова вручную, которые указались как геозависимые.
Гео Rookee

Ручная чистка

Теперь наше ядро стало в несколько раз меньше. Пересматриваем его в ручную и убираем ненужные фразы.

На выходе получаем вот такие группы нашего ядра:
Готовые группы семантики
Желтый — стоит покопаться, можно найти слова на будущее.

Оранжевый — могут пригодиться, если будем расширять сайт новыми сервисами.

Красный — не пригодятся.

Анализ конкуренции запросов для информационных сайтов

Собрав запросы и почистив их теперь нам надо проверить их конкуренцию, чтобы понимать в дальнейшем — какими запросами надо заниматься в первую очередь.

Конкуренция по количеству документов, title, главных страниц

Это все легко снимается через KEI в KeyCollector.
KEI в Key Collector
Получаем данные по каждому запросу, сколько документов найдено в поисковой системе, в нашем пример в Яндексе. Сколько главных страниц в выдаче по этому запросу и вхождений запроса в заголовок.

В интернете можно встретить различные формулы расчета этих показателей, даже вроде в свежем установленном KeyCollector по стандарту встроена какая-то формула расчета KEI. Но я им не следую, потому что надо понимать что каждый из этих факторов имеет разный вес. Например, самый главный, это наличие главных страниц в выдаче, потом уже заголовки и количество документов. Навряд ли эту важность факторов, как то можно учесть в формуле и если все-таки можно то без математика не обойтись, но тогда уже эта формула не сможет вписаться в возможности KeyCollector.

Конкуренция по биржам ссылок

Здесь уже интереснее. У каждой биржи свои алгоритмы расчета конкуренции и можно предположить, что они учитывают не только наличие главных страниц в выдаче, но и возраст страниц, ссылочную массу и другие параметры. В основном эти биржи конечно же рассчитаны на коммерческие запросы, но все равно более менее какие то выводы можно сделать и по информационным запросам.

Собираем данные по биржам и выводим средние показатели и уже ориентируемся по ним.
Конкуренция на биржах
Я обычно собираю по 2-3 биржам. Главное чтобы все запросы были собраны по одним и тем же биржам и выведено среднее число только по ним. А не так, что какие то запросы собрали одними биржами, а другие другими и вывели среднее.

Для более наглядного вида можно применить формулу KEI, которая покажет стоимость одного посетителя исходя из параметров бирж:

 KEI = AverageBudget  /  ( AverageTraffic +0.01)

Средний бюджет по биржам делить на средний прогноз трафика по биржам, получаем стоимость одного посетителя исходя из данных бирж.

Конкуренция по мутаген

Сервис мутаген создан специально для анализа конкуренции информационных запросов. Работает с 2011 года, принцип алгоритма не разглашается, но вполне себе годно рассчитывает. Конкуренция рассчитывается по 25 баллам. Чем больше балл, тем больше конкуренция: 1-7 низкая конкуренция, 8-15 средняя, 16 и выше, высокая. Сервис платный, но в день можно чекать 10 запросов бесплатно. Тут сразу показываются просмотры по вордстату, ключи хвосты, клики в яндекс директ.
Мутаген конкуренция
В KeyCollector есть возможность массового сбора по мутаген.
Мутаген KeyCollector

Выводы: Если у вас бюджет ограничен то вы можете использовать первые два способа проверки конкуренции в совокупности, если готовы тратиться на анализ, то можно использовать только Мутаген или Оверлид.

Группировка семантического ядра для информационного сайта

При группировке семантического ядра я руководствуюсь здравой логикой, сравнивая её с выдачей.

Для информационных сайтов я не вижу смысла прибегать к кластеризации и четко следовать её требованиям. Поисковая система постоянно обучается и совершенствуется. Сегодня она показывает, что запросы “черный хлеб” и “ржаной хлеб” это разные продукты, а завтра покажет правильно, что это одно и тоже.

Итак, в KeyCollector у нас есть чистенький список запросов и мы собрали по нему данные из поисковой выдачи. Чтобы облегчить работу, группируем ядро средствами KeyCollector.

Заходим в анализ групп, ставим по поисковой выдаче Яндекс, сила 2. Обновляем группировку и экспортируем результаты в Excel.
KeyCollector анализ групп
Таким способом у нас получилась группировка исходя из данных поисковой системы Яндекс. Но, как я писал уже выше, что надо следовать преимущественно логике и свои предположения проверять в поисковой системе, поэтому в некоторых группах могут быть запросы, которые вообще никак к ней не относятся. Их надо все пересмотреть и доработать.

Чтобы легче было дорабатывать, лучше всего оставить несколько столбцов только с нужными данными. Обычно я оставляю: базовую частотность, точную, KEI по полноте охвата, конкуренцию.

Покажу группировку на примере, чтобы было наглядно. Например, мы создаем сайт посвященный рецептам блинов. Мы увидели, что есть множество запросов связанные с молоком. Решаем, что будем делать отдельную рубрику “Рецепты блинов на молоке”. На примере этой рубрики и рассмотрим группировку.

Смотрим первую группу:
Пример семантики 1
Видим, что в группу “простого рецепта” попал общий запрос “тесто для блинов на молоке рецепт” – этим запросом человек не обязательно хочет найти простой рецепт. По логике, лучше всего этот запрос перенести в общую группу, которая будет вести на категорию со всеми рецептами блинов на молоке.

Но так же следует и глянуть выдачу в яндексе, что там вообще находится. Смотрим и видим, что действительно в выдаче по этому запросу есть пара страниц, которые ведут не на один рецепт, а на множество. Так же видим, что в выдаче большинство страниц ведут на один рецепт, при этом на рецепты тонких блинов. Но это же тупо, человек не обязательно хочет тонкие блины. Если бы он хотел тонкие блины, то он ввёл это в запрос. А у нас общий запрос, мы должны показать ему общую страницу, а он уже на ней должен определиться какие блины он хочет на молоке – с простым рецептом или тонкие блины или в дырочку или еще какие-то. В общем я мыслю так.

Переносим лишний запрос в другую группу, а точнее создаем выше новую “Рубрика рецепты блинов на молоке” отмечаем её другим цветом, потому что это рубрика, а в неё уже будут входить рецепты в нашем случае “простой рецепт блинов на молоке”. Тем самым у нас создается структура внутри семантики.

Все данные по группе суммируем. Бюджет можно выводить средним числом, так как это взаимодополняемые запросы, вы все их продвигаете на одной странице, а не по отдельности.

KEI1 (полнота охвата) выводим по уже известной нам формуле:

[«! W»]/[W]*100

Получается вот такая красота:
Пример семантики 2
Данные по «рубрике рецепты блинов на молоке» еще не суммируем, потому что скорее всего туда добавятся еще запросы. Но и не исключено, что в “простой рецепт блинов на молоке” тоже еще добавятся запросы.

В дальнейшем, как я и предполагал мы нашли еще похожие запросы в нашу группу с простым рецептом, которые содержали дополнение “фото”. Фото, видео – это все дополнительные запросы их можно кидать в одну группу со смежными запросами. Нет же смысла делать отдельно страницу только с фотками и только с видео? Это мать его, дубли получатся.
Пример семантики 3
Видим, что и “легкий” сюда пожаловал. Простой и легкий – это одно и тоже же? Конечно же, да. Добавляем это все в нашу группу и получаем еще красивее, не забываем просуммировать новые данные.
Пример семантики 4
Дальше встречаем запрос “рецепт блинов на молоке и воде”.
Пример семантики 5
Тут уже посетитель хочет использовать не только молоко, но и воду. Понятно, что он пересекается вообще с другой рубрикой нашего сайта “рецепты блинов на воде”. Поэтому возникает задача, куда его определить в рубрику с молоком или в рубрику с водой или под него делать отдельную рубрику. Я под такие запросы делаю отдельные рубрики, потому что это логично.

К тому же тут еще и затесался запрос с “тонкие блины”. Его тоже отдельно, он будет страницей к рубрике “рецепт блинов на молоке и воде”

И таким вот способом перерабатываем все ядро, в итоге получается вот так:
Пример семантики 6
Красным шрифтом помечены дополнительные фразы, которые имеют приставки фото, видео. Для нас это не совсем актуальные фразы. Эти фразы конкурируют с сервисами поисковых систем и трафику по ним очень мало. Но эти фразы подходят по нашему смыслу, поэтому мы их добавляем в группу.

Каждая группа помечена своим цветом. Цвет является структурой сайта, то есть уровнем вложенности страницы.

Например, если бы у нас был запрос “простой рецепт блинов на скисшем молоке”. То он бы уже шёл, как подгруппа к группе “блины на скисшем молоке” и естественно был бы выделен другим цветом. Выглядело бы это вот так:
Пример семантики 7
Думаю, идея с цветом понятна. Вот так создается семантика и удобная, понятная структура сайта, где все логично и имеет свой уровень вложенности.

Новые или измененные рубрики добавляем в нашу структуру в xmind.

В общем, чтобы нормально разгруппировать ядро необходимо мыслить логически, вставать на место посетителя, отвечать на вопрос – что он хочет увидеть, введя этот запрос? А также смотреть выдачу по этому запросу и принимать решение, как поступить наилучшим образом.

Бесплатный парсинг запросов конкурентов

Чтобы парсить конкурентов, их надо знать. В анализе ниш я уже рассказывал, как определить своих конкурентов.

Выписываем всех ваших конкурентов, если вы еще этого не сделали. Надо брать только прям точных конкурентов. Например, у вас сайт по диабету, вам надо брать только сайты по диабету. Сайты, которые посвящены всей медицине с разделом диабета не подойдут, потому что у вас напарсятся другие разделы сайта, которые посвящены не диабету, и вы запаритесь их чистить.

Wizard.Sape

Заходите в KeyCollector во вкладку Wizard.Sape. Выбираем анализ доменов.
WizardSape вкладка KeyCollector
Вводим логин, пароль. Любой тематический url и своих конкурентов списком. Нажимаем начать сбор.
WizardSape парсинг KeyCollector
После сбора, в колонке частотность wordstat, появляются цифры сервиса их необходимо очистить.

Так же можно еще собрать “сбор расширений ключевых фраз” в той же самой вкладке в KeyCollector.

Megaindex

Заходим в KeyCollector во вкладку Megaindex. Вводим логин и пароль, указываем Москва, потому что Россию нельзя указать. Выбираем последнюю дату, раньше можно было парсить за весь период, но сейчас почему-то не работает, можно выбирать только определенную дату. Вбиваем домены конкурентов. И начинаем парсинг.
Парсинг конкурентов Megaindex

Rookee

Выбираем Rookee в Keycollector, составление семантического ядра.
Rookee вкладка KeyCollector
Здесь все проще, выбираем Москва, топ 10 и вводим конкурентов с http://

Можно отдельно собрать по Яндексу, потом по Гуглу.
Rookee парсинг конкурентов KeyCollector
Так же можно собрать “сбор расширений ключевых фраз” в той же самой вкладке в KeyCollector.

Top.Mail.ru

Здесь все сложнее. Необходимо перейти в рейтинг https://top.mail.ru/, и там найти ваших конкурентов с открытым счетчиком. Обычно что-то узконишевое там сложно найти, но все равно расскажу про этот способ для общего кругозора.

Вводим вашу тематику в поле поиска рейтинга.
Topmail конкуренты
Получаем сайты. Как видим нашей тематики тут нет. Замочек напротив сайта – стата закрыта. Значок рейтинга – стата открыта.
Topmail сайты
Так вот, если бы мы делали сайт не по диабету, а по косметике, то первый сайт бы нам подошел. У него открыта стата и мы можем спарсить её. Переходим на него и смотрим его id.
ID Topmail
В KeyCollector щелкаем на значок mail, сбор статистики из счетчиков TOP.Mail
Topmail кнопка keycollector
Указываем id счетчика и выставляем самый большой срок данных, 3 года.
Topmail сбор по id счетчика
Есть так же пакетный анализ, где можно указывать сразу много счетчиков.

Так же можно спарсить глобальный рейтинг top.mail по ключевым словам, в той же самой вкладке в KeyCollector.

На этом бесплатный сбор ключевых слов у конкурентов закончен. Теперь его надо очистить и оставить только нужное.

В итоге получаем готовый список ключевых слов конкурентов, которыми можем дополнить наше ядро.

Платные способы парсинга запросов конкурентов

Из платных способов, через Keycollector, мы можем спарсить запросы конкурентов через spywords.rusemrush.comserpstat.com, а так же через эти сервисы собрать расширения фраз. Еще можно сюда приплести Mutagen.ru, он тоже может расширить ядро, но делает он это не очень.

Сбор аналогичен бесплатному методу, указываете конкурентов и собираете их.
Платный парсинг конкурентов KeyCollector
Но я сейчас практически не пользуюсь этими сервисами, потому что на рынке есть лучшее решение под рунет — это сервис http://keys.so

Его нет в keycollector, но это не помеха. Без проблем все слова можно выгрузить в Excel, а потом прогнать через KeyCollector.

Чем же лучше Keyso? У него больше база по сравнению с конкурентами. Она у него чистая, нет фраз которые дублируются и пишутся в разном порядке. Например, вы не найдете там таких повторяющихся ключей “диабет 1 типа”, “1 типа диабет”.

Так же Keyso умеет палить сайты с одним счетчиком Adsense, Analytics, Leadia и др. Вы можете увидеть какие еще есть сайты, у владельца анализируемого сайта. Да, и вообще по поиску сайтов конкурентов, считаю это лучшее решение.

Как работать с Keyso?

Берем один любой сайт своего конкурента, лучше конечно побольше, но не особо критично. Потому что мы будем работать в две итерации.Вводим его в поле. Жмакаем — анализировать.
Keyso анализ
Получаем информацию по сайту, нам здесь интересны конкуренты, жмем открыть всех.
Вывод данных Keyso
У нас открываются все конкуренты.
Все конкуренты Keyso
Это все сайты, у которых хоть как-то пересекаются ключевые слова с нашим анализируемым сайтом. Здесь будет youtube.com, otvet.mail.ru и т.д., то есть крупные порталы, которые пишут обо всем подряд. Нам они не нужны, нам нужны сайты чисто только по нашей тематике. Поэтому мы их фильтруем по следующим критериям.

Похожесть – процент общих ключей от общего числа данного домена.

Тематичность – количество ключей нашего анализируемого сайта в ключах домена конкурента.

Поэтому пересечение этих параметров уберет общие сайты.

Ставим тематичность 10, похожесть 4 и смотрим, что у нас получится.

Получилось 37 конкурентов. Но все равно еще их проверим вручную, выгрузим в Excel и если надо уберем не нужные.
Тематичность и похожесть Keyso
Теперь переходим на вкладку групповой отчет и вводим всех наших конкурентов, которых мы нашли выше. Жмем – анализировать.
Групповой отчет Keyso
Получаем список ключевых слов этих всех сайтов. Но мы еще полностью не раскрыли тематику. Поэтому мы переходим в конкуренты группы.
Конкуренты групп Keyso
И теперь мы получаем всех конкурентов, тех всех сайтов которые мы ввели. Их в несколько раз больше и здесь так же много общетематических. Фильтруем их по похожести, допустим 30.

Получаем 841 конкурента.
Итог конкуренты групп Keyso
Здесь мы можем посмотреть, сколько страниц у этого сайта, трафика и сделать выводы, какой же конкурент самый эффективный.

Экспортируем всех их в Excel. Перебираем руками и оставляем только конкурентов нашей ниши, можно отметить самых эффективных товарищей, чтобы потом оценить их и глянуть какие у них есть фишки на сайт, запросы дающие много трафика.

Теперь мы опять заходим в групповой отчет и добавляем уже всех найденных конкурентов и получаем список ключевых слов.

Здесь мы можем список сразу фильтрануть по “!wordstat” Больше 10.
Запрос конкурентов Keyso
Вот они наши запросы, теперь мы можем их добавить в KeyCollector и указать, чтобы не добавлялись фразы, которые есть уже в любой другой группе KeyCollector.
Keycollector добавление ключей
Теперь мы чистим наши ключи, и расширяем, группируем наше семантическое ядро.

Заключение

На этом создание семантического ядра для информационного сайта завершено.

Советую вам мониторить историю изменений программы KeyCollector, потому что она постоянно дополняется новыми инструментами, например недавно был добавлен youtube для парсинга. С помощью новых инструментов, вы можете ещё больше расширить свое семантическое ядро.

Пожалуйста, оцените эту статью. Чтобы мы могли делать лучший контент! Напишите в комментариях, что вам понравилось и не понравилось!

Рейтинг статьи: / 5. Кол-во оценок:

Александр Овсянников ака Интернет Мажор
Занимаюсь продвижением и заработком на сайтах с 2009 года.

24
Оставить комментарий

avatar
11 Цепочка комментария
13 Ответы по цепочке
0 Последователи
 
Популярнейший комментарий
Цепочка актуального комментария
12 Авторы комментариев
SickboyShtolzёбаВиталийАндрей Авторы недавних комментариев
  Подписаться  
Уведомление о
Pasagir
Pasagir

В целом все также делаю. Только структуру сайтов стал только в этом году прорабатывать, тоже в майндмэпе, а раньше как-то так на глазок делал ))

Евгений
Евгений

Про «не добавлять ранее удаленные фразы». Не удаляем, а переносимости в группу мусор. При парсинге или ручном добавлении стоит галка, не добавлять, если есть фраза в другой группе. И можно работать в скольки хочешь группах. Единственный минус, большое количество фраз неимоверно жрет ресурсы компа.

P.s. по многодиванов помню конкурс аудитов был на вебмастерс. От туда карта осталась? )

Александр Овсянников
Александр Овсянников

Про удаление просто пример приведен, чтобы лучше понятно было, тоже не удаляю а переношу в мусор. Не понял про галку, где то есть галка которая влияет, что при удалении в одной группе в другой тоже не будет показываться?
Многодиванов, да, оттуда осталось.

Seoonly.ru
Seoonly.ru

для моих мозгов это слишком сложно. напиши про сеоспринт.

seoonly.ru
seoonly.ru

Букварикс выручает знатно) Разрабам респект-)

seoonly.ru
seoonly.ru

Убил постом бизнес семантистов))

Александр Овсянников
Александр Овсянников

Не, семантика выжигает глаза и занимает много времени, что не всем самостоятельно ее охота собирать. А так все это есть в хелпе кейколлектора 🙂 только я немного структурировал

kudros
kudros

Первый раз зашел. Полезная статья. Респект! Только что собрал и разгруппировал ядро для очередного сайта. Многое упустил, след. раз обязательно применю.

ёба
ёба

формула мутагена уже вроде как известна, так что можно этот кей и самому просчитывать

Shtolz
Shtolz

И какова формула мутагена?

Sickboy
Sickboy

C2H5OH

Алексей
Алексей

Привет. Спасибо за статью и респект) Очень доступно пишешь. Интересно, что твой метод сбора семантики более структурированный и логичный, на мой взгляд, чем платные курсы Пузата, к примеру.
Годный блог) Пиши еще!

Алексей
Алексей

Единственное, что не совсем понятно — зачем ты выставляешь регион Россия? Почему не СНГ? Или вообще регион не указывать. Русскоговорящая аудитория есть и в других странах.

Алексей
Алексей

С ограничениями пока не столкнулся, но смысл понятен. Просто нижний порог частоты «!» можно сделать чуть меньше в таком случае, и все. Верно?
Собственно, видимо, поэтому ты все, что выше 1, берешь в СЯ?

Александр Овсянников
Александр Овсянников

Беру я все ключи на будущее, чтобы потом не дополнять ядро когда ключи все кончаться частотные и всю тематику охватить, даже если статьи не будут давать трафик или 1-2 посетителя в месяц, все равно ты статьями охватываешь всю тематику ниши и за это получаешь бонус. Конечно все от ниши зависит, если у тебя миллион запросов, то и нет смысла брать маленькие, потому что ты этот миллион за 10 лет не освоишь 🙂

Алексей
Алексей

Ясно)

Андрей
Андрей

А если структуру сайта себе представляешь и уже определил (или у клиента на сайте она уже есть). Есть ли плюсы в том, чтобы парсить запросы и составлять семантику уже исходя из этой структуры. Т.е. по отдельности для каждого раздела сайта. Или лучше все-таки всю тематику одновременно парсить и собирать в одно ядро? Или не имеет значения?

Виталий
Виталий

Для новичков статья — просто находка.
Вот если бы раньше мне такие попадались.