Инженер Google: возраст ссылки не влияет на ее «хорошесть»

Сегодня у нас интервью с Владимиром Офицеровым, руководителем русского отдела качества поиска в крупнейшей поисковой системе Google. Пользуясь случаем на конференции SeoConference в Казани, у SeoProfy, владельца одноименной студии, получилось у взять интервью у Владиира. Сами вопросы для интервью были подготовлены коллективно друзьями в Facebook.



Как отбираются проекты для наложения ручных санкций? Каким образом? Какой есть критерий?

На самом деле есть много источников через которые эскалируются проблемы, связанные с ручными санкциями. Некоторые из антиспам алгоритмов не имеют достаточной точности с тем чтобы их внедрить в автоматическом режиме, но достаточно точны чтобы генерировать кандидаты сайтов, которые вызывают подозрения, и эти сайты могут потом быть рассмотрены вручную.

Безусловно, внизу поисковой выдачи есть кнопка «пожаловаться на спам» и эти случаи тоже рассматриваются.

Как Google различает обратные ссылки на естественные, покупные и поставленные конкурентом, чтобы специально убить сайт конкурента?

Когда дело идет о понижении ранжирования за неправильные ссылки, то есть вероятность того, что люди будут использовать этот метод для наказания конкурентов.

Достаточно надежные механизмы включены внутри алгоритма, который позволяет отобрать ссылки, которые были созданы черной оптимизацией. Их не так сложно определить и мы пытаемся такие убрать. В какой-то степени мы пытаемся выбрать самое лучшее впечатление о вашем сайте.

Но если дело доходит до ручной санкции, то вам отправляется письмо и вы можете исправить положение. А то, какие из них ручные или неручные, естественные или неестественные, то ответ вполне однозначный — если вы прилагали усилия к тому чтобы появилась эта ссылка и заплатили кому-то деньги, то она не естественная.

Разные ли алгоритмы для разных рынков и языков? Если да, то где сильнее, где слабее и в каких странах сейчас растет поисковой трафик больше всего?

Какой поисковый трафик растет больше всего я конечно не могу сказать :) Рост трафика по странам пропорционален росту интернета в стране. Большие тренды по странам можно посмотреть на Google Тренды используя популярный запрос, например [facebook].

Касательно вопроса про алгоритмы для разных языков. Безусловно, есть контекст пользователя, то есть его язык, страна, интерфейс Google, откуда этот вопрос задан. Это основные факторы, который влияет на ту выдачу, которую пользователь видит.

Наш индекс один для всех стран и языков, но многие алгоритмы имеют параметры специфичные для разных языков. Понятно, что в русском есть морфология, а в английском нет морфологии, арабский пишется справа налево. То есть эти все нюансы естественно включены в ранжирование.

Как Google учитывает ссылки сайта, которому, например 5+ лет. Ссылки плохие, но поставленные 5 лет назад. Будут ли они восприниматься Google как плохие? Например, если я купил красивый домен, но там есть какой то ссылочный профиль.

Возраст ссылки не влияет на ее «хорошесть». Им может быть и 50 лет, если эти ссылки были покупные — они покупные. Мы анализируем так называемую «покупность» ссылки на основании статистических факторов.

То есть если я купил домен, допустим Povar.com и хочу сделать кулинарный портал. А там раньше кто-то что-то делал. То есть, по сути, я не знаю истории сайта, но делаю классный контент. Как быть в этом случае?

Если там были ссылки, поставленные не естественным способом, у вас есть инструменты, чтобы эти ссылки отклонить. Если были применены меры вручную, то можно послать на пересмотр.

Конечно, в итоге после отмены ручных мер и обновлений алгоритма сайт будет точно такой же, как любой другой. Поэтому можно использовать старый домен у которого были проблемы и они устранены. Старый сайт будет ранжироваться как любой новый сайт.

Как Google относится к всплеску страничек на сайте? Например, на сайте было 3 тысячи страниц, а стало 300 тысяч?

Как я уже сказал, что индекс у нас позволяет иметь сколько угодно страниц. Пожалуй только у краулера есть ограничения на скорость скачивания, чтобы не завалить ваш сайт. Вопрос следующий: На какие запросы эти страницы будет показываться? Если страницы будут показываться на не релевантные запросы, где они не должны быть показаны, то ранжирование вашего сайта будет понижено алгоритмами и вы можете потерять тот трафик который у вас был. Если эти страницы содержат уникальный и полезный контент, который найдет свою аудиторию, то мы это только приветствуем.

Панда жесткий зверь!

:)

Какой предел допустимого прироста ссылок в месяц для сайтов, которым, к примеру, один год?

Любой прирост, который является натуральным, он хороший. Есть события, которые происходят в один день и дают тысячу ссылок в минуту.

Есть события, которые произошли много лет назад и до сих пор всплывает их актуальность. Совершенно нет никакого критерия по скорости прироста ссылок.

Единственное, что важно, чтобы они были натуральными.



Если сделать хороший новостной повод и его везде распиарят, то все будет хорошо?

Да, все будет хорошо. Ничего бояться не надо!

Я хочу привести пример. Есть много примеров вирусного видео, которые собственно говоря и раскручиваются в течение считанных дней до миллиона показов и все это только помогает их ранжированию.

Сколько обратных ссылок нормально будет на одном сайте? И как Google к этому относиться?

Вы можете ставить столько ссылок, сколько вы считаете нужным вашему пользователю. В разумных пределах любое число подойдет. Нет никаких рекомендаций по поводу того сколько ссылок размещать на сайт. Сайты от страны к стране бывают очень разные и поведение пользователей, и то, как они их используют, и то, как они воспринимают эту информацию, тоже очень разное.

И если взять средние мерки, например, на одной странице японского или китайского, азиатского контента существенно больше слов и ссылок, чем на средней английской или русской странице. Это просто культурная разница. Ничего в этом нет плохого и все они равны.

Насколько допустимо дублирование части контента от страницы к странице? Например, некоторые клиенты, на какие-то хотят ставить меню инфоблоки на страницах, а на какие-то не хотят. Это страницы, задача которых привлечь больше продаж и на них присутствует дублированный контент.

Google никогда не будет пенализировать ваш сайт за дублированный контент. В итоге это наша проблема. Но нужно понимать, что если мы видим, что страницы на сайте содержат одинаковый контент, мы с точки зрения экономии наших средств и денег, выберем из них только одну страницу, которая будет проиндексирована.

Поскольку та страница, которая будет выбрана, собственно говоря, выбор делается нашим алгоритмом, но мы выберем ту, которая, как нам кажется, более привлекательна и популярна среди пользователей.

Но с вашей точки зрения это может вполне оказаться случайная статья, либо та, либо другая. И мне кажется, что это собственно ведет к разочарованию, потому что, если мы выберем одну, а другие люди хотели другую, то они будут недовольны и наоборот.

Поэтому с поисковой машиной гораздо проще общаться на том языке, который она понимает. Сделайте один контент на одной странице, и если вы хотите этот контент менять, чтобы понять какой из них лучше, то сделайте это во времени.

Вот на эту неделю, на какую-то секцию контента мы ставим какую-то кнопку, а через неделю, сравниваем, какая из них работала лучше. Для этого необязательно иметь две одинаковые страницы, можно иметь просто группу страниц, которые приблизительно похожим образом себя ведут.

Тогда как следствие вопрос. Мэтт Каттс говорил по поводу юридических сайтов. На них находятся договора, контент в них не уникальный и Google его не учитывает как дублированный. Будет ли такое, например, в электронике, где все друг друга копируют?

Машина есть машина. Если страницы достаточно похожи, то она выберет из них одну. Если они отличаются друг от друга, на сайте их две, то сказать в какой конкретно момент произойдет этот перелом достаточно сложно, это зависит от многих факторов похожести этих страниц.

Основная рекомендация, если вы хотите иметь предсказуемый результат, то нужно давать предсказуемый вход Если случайный вход, то и результаты будут относительно случайны.



Вопрос о перелинковке. Когда ссылка на свои же сайты представляет сквозную. Допустим есть сайт А и есть сайт Б, сквозняки меняются на одном и на другом. Я не сторонник такого решения, однако, часто пожелания клиента приходится учитывать и такие сквозные ссылки оставлять. Как быть в таком случае?

Я не знаю желания клиента. Я думаю, что ориентироваться нужно в итоге на пользователя. Человек если придет и если ему нужна такая ссылка значит она хорошая, если не нужна, значит, скорее всего, лучше не использовать.

Тогда следственный вопрос. Насколько вредны nofollow ссылки на каждой странице сайта?

Nofollow ссылки — робот не видит. И основная рекомендация такая, если вы не можете модерировать свой контент, но позволяете людям ставить туда ссылки, ставьте автоматический nofollow, чтобы вас не спамили. Nofollow ссылки не вредят, но и не помогают никому.

Сколько асессоров на данный момент работает в Гугл, которые проверяют выдачу?

Я не думаю, что могу эти цифры рассказывать. Но достаточно.

Будет ли в Украине, по коммерческим тематикам как это сейчас в Google регион США? Например, по запросу auto insurance, когда заходит какой-то спамный сайт его сразу же руками удаляют.

Мы смотрим за спамом в выдаче во всех странах. И у нас есть инженеры, которые занимаются мерами, которые принимаются вручную в каждом языке. Но если они что-то не доглядели такое, то вполне возможно, что либо алгоритм доделают, либо доглядят в ближайшее время.

Сколько инженеров Google участвуют в разработке алгоритма Пингвин ?:)

Я не думаю, что могу называть эти цифры. Но это единицы.

Единицы?

Да

Круто. А Панды?

Единицы. Почти над всеми алгоритмами работают небольшие группы инженеров. Очень небольшие.

В вашем докладе речь шла также о том, что в ближайшее время алгоритм Пингвина обновиться. Чего стоит ожидать?

Те, кто был пенализирован Пингвином в прошлом, будет пенализирован существенно больше.

Понял. Напугали!

Тем, кто не был пенализирован Пингвином — нечего боятся.

Новый сайт с кучей контента, с новыми страницами почти каждый день или старый сайт с нормальным авторитетом без обновляемого контента. Какой из них имеет больше сайтов удержаться в топе при изменениях?

Вы знаете это очень сложный вопрос. Но свежесть контента — один из факторов его качества. Свежесть не в том, что надо выкладывать какую-то новую статью каждый день, а в том, что на сайте должна быть информация, которая релевантна для пользователя, ищущего эту информацию сегодня.

То есть, если статья, которая была написана 3 года назад, несет уже не актуальную информацию, то она не будет в топе. Правильно?

Свежесть является одним из важных факторов ранжирования. Мы всегда пытаемся сделать выдачу так, чтобы она была наполнена наиболее свежей информацией, которая наиболее релевантна пользователю. Вообще в поиске старый контент всегда имеет некое преимущество. Потому что у него всегда есть больше ссылок, больше информации и так далее.

И в этом плане это очень сложная проблема и она не так просто решается. Но мы всегда пытаемся принести пользователю максимально свежий контент, который релевантный его запросу.



Последний вопрос. Что вы посоветуете оптимизаторам и веб-мастерам, которые только что запустили сайт. Напутствие со стороны Google )

Я думаю, что думать о поисковой машине нужно меньше всего. Что касается новых сайтов, то, в общем, свежесть это достаточно важный фактор, особенно если сайт создан на тематику, которая интересная пользователю.

По сути нет большой разницы между новым и старым сайтом. Главное, чтобы на сайте была та информация, которая кому-то нужна. Создавать еще 150-й сайт в сегменте где и так достаточно контента, наверно, не стоит.

А если подача другая? Которая намного лучше объясняет? Приведу пример. У нас есть блог в компании. Все ведут блоги, но мало кто пытается раскрыть так, реально как оно есть. И все-таки если подача другая — есть смысл? С точки зрения трафика, не с поиска, я знаю что есть. А вообще с поиска?

То есть, понимаете как. Что значит новый сайт? Новый сайт про пластиковые окна, который еще лучше?

Да. Обычно все скучно и непонятно. А если его оживлять так, что реально всем будет интересно и весело?

Если будет всем интересно и весело, он будет в топе гарантировано

Спасибо большое вам за интервью!


1 комментарий

avatar
Правильно сказали " Главное, чтобы на сайте была та информация, которая кому-то нужна". А возраст ссылок не имеет значения…
Только зарегистрированные и авторизованные пользователи могут оставлять комментарии.