Как Google распознает спамерские ссылки? 10 техник

  1. 1. Ограниченный PageRank
  2. 2. Участие ссылок с собственных / публичных сайтов в профиле ссылок
  3. 3. Относительная масса
  4. 4. Анализ сети ссылок, ширины сетевых уровней и расположения ее вершины
  5. 5. ТрастРанк, Анти-ТрастРанк, СпамРанк и др.
  6. 6. Измените якорь текстов с течением времени
  7. 7. Пределы приращения ссылки
  8. 8. Надежный PageRank
  9. 9. Дифференциация PageRank
  10. 10. Закон убывающих доходов
  11. Алгоритмы обнаружения спама в ссылках

Получение ссылок иногда разочаровывает : «Стоит ли попробовать ссылку с сайта X? Или, может быть, ссылка с сайта Y принесет больше преимуществ? »Популярное знание функций сильных ссылок часто не включает алгоритмы защиты от спама от Google. Между тем поисковые системы не учитывают некоторые ссылки , они понижают ценность некоторых других, а затем они просматривают все ссылки в целом и, возможно, еще больше ограничивают их ценность. Ниже приведены 10 методов обнаружения спама - проверьте, что поисковые системы будут обнаруживать в ваших ссылках .


Отказ от ответственности:

Я не являюсь сотрудником какой-либо поисковой системы, поэтому следующие утверждения следует воспринимать как предположение. Теоретически, возможно, что поисковые системы используют только некоторые из методов, представленных здесь, или даже не используют ни одну из них. Конечно, они используют дополнительные, не упомянутые мной, и более сложные приемы. Я потратил много времени на изучение научных работ и заявок на патенты, поэтому позвольте мне поделиться некоторыми более интересными методами.

1. Ограниченный PageRank

Ограниченный PageRank

Основы концепции обрезки PageRank описаны в статье. Характеристика и обнаружение веб-спама на основе ссылок , Речь идет о PageRank, рассчитываемом путем изменения потребляемой мощности сайтов, которые ссылаются непосредственно на позиционированный сайт . Как это помогает в обнаружении спама? Сайты, размещенные с использованием наивных методов (таких как массовое использование спонсируемых статей), получают свой PageRank в основном из ссылок «первого уровня». Между тем, хорошо расположенные веб-сайты также используют ссылки на более глубокие уровни. Таким образом, если PageRank сайта намного выше, чем его пониженный PageRank , это является сильным признаком его спамности для поисковых систем.

2. Участие ссылок с собственных / публичных сайтов в профиле ссылок

Ссылки могут быть разделены на три группы по происхождению :

  • ссылки с собственных веб-сайтов (т. е. распознаваемые поисковыми системами как ссылки на позиционированный веб-сайт, например, на основе номеров IP, доменов whois, высокой частоты одновременных ссылок на них),
  • ссылки с общедоступных сайтов - другие ссылки, которые, однако, приходят с веб-сайтов, которые может легко заполнить каждый, например, блоги, форумы, каталоги статей, гостевые книги и т. д.
  • ссылки с непубличных сайтов.

Не все ссылки из первой группы плохие, не все из последних - хорошие. Ссылки с ваших собственных сайтов могут быть совершенно естественными. С другой стороны, ссылки с закрытого сайта можно купить. В целом, однако, стоит знать об этой классификации, она может помочь в оценке ценности ссылок.

Как видно из приведенного выше графика, профиль ссылок одного сайта - это в основном ссылки с ваших собственных и общедоступных веб-сайтов. Тем не менее, другой сайт привлекает гораздо больше ссылок с непубличных сайтов. Если все остальные показатели обоих сайтов идентичны, второй сайт выглядит намного менее спамовым.

3. Относительная масса

Относительный вес - это процентная доля ссылок данного типа во всем профиле ссылок данного сайта . Примером этой иллюстрации могут служить вышеприведенные круговые диаграммы.

Тема относительной массы более подробно обсуждается в статье. Обнаружение ссылочного спама на основе массовой оценки , Анализ относительных масс позволяет установить порог, превышение которого рассматривается как признак спама . На приведенном выше графике красные кружки символизируют сайты спамеров. Они несут ответственность за часть власти, получаемой позиционированным (целевым) сайтом. Если доля мощности, передаваемой сайтами-спамерами, превышает установленный порог, либо (непосредственно) позиция целевого сайта, либо значение ссылок спаммера могут быть уменьшены. Конечно, на нашем графике представлена ​​беспрецедентная ситуация с нулем один (сайт, на котором есть ссылки, «полностью спам» или «свободен от каких-либо подозрений»).

Такой анализ также может быть использован для планирования тактики действий линкбилдеров. Стоит задуматься, какую часть ссылок мы хотим получить из комментариев, каталогов, статей, перехваченных сайтов, собственных сайтов, приобретенных ссылок и т. Д. Конечно, алгоритмы поисковых систем не так уж и жестки, и вы должны заслужить наказание.

4. Анализ сети ссылок, ширины сетевых уровней и расположения ее вершины

Другой метод оценки стоимости ссылок основан на анализе направления сети ссылок к целевому сайту (пирамиде ссылок) и, следовательно, количества сайтов («источников PageRank»), расположенных в одной, двух, трех и т. Д. Ссылках (переходы / уровни). Также важно, на каком «расстоянии» (в пересчете на высоту / уровень) целевой сайт имеет вершину , то есть количество прыжков, число сайтов является наибольшим.

Ниже вы можете увидеть расположение сайтов («источников») в пирамиде ссылок (сетевых ссылок) позиционируемого сайта между различными уровнями расстояния от него . Здесь вы можете увидеть различия между веб-сайтами, которые связаны со спамерскими методами и связаны правильно.

Как видите, спамерские сайты быстрее наверху . Спаммерские сайты имеют больше ссылок первого уровня (указывающих на них напрямую), в то время как по мере удаления от них «исходные» сайты быстро теряются в своих пирамидах (сетях). Такое распространение может использоваться поисковыми системами как сигнал о спаме на сайте. Количество уникальных «источников» уменьшается с увеличением расстояния, тем быстрее пирамиды / сети сайтов спамеров часто содержат одни и те же «источники» , повторяющиеся на разных уровнях.

Я думаю, что это одна из причин, почему разнообразие уникальных доменов хорошо соотносится с высокими позициями. Я не думаю, что это отношение основано только на простом подсчете связывающих доменов, а скорее на подсчете «источников» в связи с анализом усеченного PageRank.

5. ТрастРанк, Анти-ТрастРанк, СпамРанк и др.

Модель TrustRank обсуждалась много раз и стал основой таких мер, как mozTrust. Основное предположение состоит в том, что все последующие «источники» одновременно предоставляют «зараженную» и доверенную силу - оба передаются на позиционированный веб-сайт по ссылкам. Если вы близки к источнику, который в основном основан на спамере, вы, скорее всего, будете спамером, и наоборот. Важны как входящие, так и исходящие ссылки .

Я не буду вдаваться в детали, потому что об этом уже много написано, я сформулирую только четыре руководящих принципа:

  • получать ссылки с доверенных сайтов,
  • не брать ссылки со спамерских сайтов,
  • ссылка на доверенные сайты,
  • не давать ссылки на спаммерские сайты.

С помощью этой техники вы можете использовать форумы позиционирования для борьбы со спамерами ; все, что вам нужно сделать, это искалечить их и начать анализ с адресов, на которые вы ссылаетесь ...

6. Измените якорь текстов с течением времени

Мониторинг изменений в якорном тексте с течением времени может использоваться для обнаружения манипуляций. Давайте посмотрим на анализ примера сайта, который изначально принадлежал кому-то еще, а позже был перехвачен спамером из-за высокой эффективности исходящих ссылок SEO.

Об этой области поисковых систем известно, что в прошлом привлекали ссылки об якорях, как содержащих название бренда, так и тех, которые не содержат. Он внезапно прекратился, и через некоторое время, как вдруг, снова стали появляться ссылки, но с совершенно другими якорями. Этот вид анализа изменений в якорных текстах с течением времени в сочетании с ортогональными методами обнаружения спама позволяет определить момент смены владельца сайта . Ссылки, полученные на данный момент сайтом, теперь могут трактоваться иначе .

Эта техника (и несколько других интересных вещей) подробно обсуждается в статье. Оценка документов на основе критериев на основе ссылок ,

7. Пределы приращения ссылки

Позиционеры, которые получают много ссылок на свои сайты, могут быть разочарованы эффектами, потому что поисковые системы используют ограничения мощности, которые могут попасть на сайт за единицу времени . В то же время анализируются и другие факторы, которые позволяют определить, является ли внезапный скачок числа ссылок результатом, например, успешного вихревого действия или важного события или, тем не менее, уловок позиционирования.

Сильные связи, которые превышают этот предел, могут не учитываться. Более равномерный, естественный рост связей имеет меньшую вероятность превышения лимита . Более подробную информацию на эту тему можно найти в статье пт Поиск информации на основе исторических данных ,

8. Надежный PageRank

Надежный PageRank - это PageRank, который не учитывает вклад наиболее мощных ссылок .

Как видно на приведенной выше диаграмме, две самые сильные ссылки были «отключены», что привело к снижению рейтинга страницы целевого сайта. Хорошие сайты обычно имеют диверсифицированные источники энергии и не зависят от нескольких сильных ссылок (таких как ссылки с ферм ссылок). Надежный расчет PageRank является одним из методов ограничения мощности чрезмерно сильных веб-сайтов. Вы можете прочитать больше об этом в статье Надежный PageRank и локально вычисляемые функции обнаружения спама ,

9. Дифференциация PageRank

Однородность потоков PageRank на целевой сайт может быть признаком спама. Естественные профили ссылок обычно более разнообразны, когда дело доходит до PageRank . Профили спамеров имеют тенденцию быть более однородными в этом отношении.

Поэтому, если вы используете обмен, услугу или инструмент для заказа 15 ссылок о PR 4 с определенным якорным текстом, вы жертвуете небольшой вариант PageRank. Обнаружение таких методов очень просто.

10. Закон убывающих доходов

Одним из способов снижения эффективности трюков позиционирования является создание эффекта снижающийся доход , Это наиболее эффективно работает против ссылок по всему сайту , т. Е. С каждой подстраницы сайта, например, из нижних колонтитулов или блогов. Это способ исправить существующую дыру, состоящую из неограниченной силы популярности ссылок, которую было легко «прокачать» ссылками по всему сайту.

Первая ссылка из данного домена несет мощность X, а последующие ссылки из него увеличивают общую мощность, передаваемую им, но только до определенной точки. После его пересечения последующие ссылки будут давать все меньше и меньше доходов. Увеличение количества ссылок с определенного домена с 1 до 3 принесет гораздо большую прибыль, чем увеличение его с 101 до 103.

Алгоритмы обнаружения спама в ссылках

Каждый алгоритм обнаружения спама характеризуется определенным фактором релевантности и уровнем ложных срабатываний . Использование комбинации разных алгоритмов помогает повысить точность и минимизировать ложные срабатывания.

Обнаружение веб-спама менее чувствительно к ложным тревогам, чем обнаружение спама в электронной почте, поскольку почти всегда в очереди много сайтов, готовых заменить удаленные или поврежденные . Это не спам в электронной почте, который по сути нулевой (папка «Входящие» или «Спам»). Кроме того, поисковым системам не нужно выбирать между классификацией сайта как «спам» или «незапрошенный», чтобы улучшить качество результатов поиска. Используя алгоритмы защиты от спама, подобные тем, которые описаны в этой статье, поисковые системы могут просто понизить позиции сомнительных сайтов.

Эти алгоритмы также созданы, чтобы снизить окупаемость спамерских уловок, делая спам труднее и дороже . Эта статья не о том, какие ссылки работают, а какие нет - это сложно определить. Его целью является предоставление алгоритмов, которые поисковые системы решают свои проблемы, чтобы вы знали, в какой степени они влияют на методы, которые вы используете .

[Источник: Лучшее понимание методов анализа спама на основе ссылок ]

Вам понравилась статья?
Подпишитесь на рассылку,
и вы будете в курсе.