Как поисковые системы определяют дубликаты страниц?
Иллюстрация от
1. Поиск
Когда контент найден поисковым ботом идет сравнение с ранее найденными для установления дубликатов
2. Отбрасывание
В первую очередь исключаются страницы с линкофарм, MFA или черных списков
3. Разбор
Анализируют оставшиеся страницы по числу входящих ссылок, качеству сайтов, трасту, возрасту
4. Установление
По времени нахождения и тематичности ссылок устанавливают оригинал

Постовой
Читай еще по теме
3 Пингбека to “Как поисковые системы определяют дубликаты страниц?”
2 комментариев - “Как поисковые системы определяют дубликаты страниц?”
-
1. VolCh Says:
Июль 13th, 2008 at 20:26Куда интереснее как они определяют где контент, а где навигация, например. Врядли ведь будут скачивать полностью контент сайта, скорее всего сделают свой дизайн, свою навигацию так, чтобы страницы полностью не соответствовали.
Простой пример - делаю страниц на котором размещаю копипаст контент, но перед и после собственно контента, вставляю, например, пару абзацев из RSS новостей текущих
-
2. Руслан Ахметов Says:
Июль 13th, 2008 at 21:42А если довести копипаст под определенный процент, разбавить синонимами,текстовой рекламой и.т.п, то получится уникальный контент)
Могу ссылки подкинуть
Про работу - ПС
Про шинглы -
Июль 14th, 2008 at 16:02
[…] действий можно избежать проблем, связанных дубликатами. Прочтите статью Adam Lasnik (Официальный русский перевод […]
Июль 14th, 2008 at 22:11
[…] В основном алгоритмы поисковых машин сработают хорошо и верно определяют оригинал. Но система не совершенна. Michael Gray недавно описал случай, когда Google ошибся с определением версии в пользу более авторитетного ресурса. Он предложил несколько путей для того, чтобы оригинальная версия была выше в поиске. А также сослался на иллюстрацию о том, как поисковые системы определяют дубликаты. […]
Август 9th, 2008 at 14:20
[…] 3. Дубликаты Как поисковые системы определяют дубликаты страниц Дублированный контент в Google Убираем дублированный […]