Форум

cyber · #**1311** (**permalink**) 24.12.2013, 21:35

Gozar, т.е по сути они "гуляют" по ссылкам которые находят на странице?

Gozar · #**1312** (**permalink**) 24.12.2013, 21:36

Сообщение от cyber

Gozar, т.е по сути они "гуляют" по ссылкам которые находят на странице?

Они выкачивают страницу, кормят ее парсеру, затем посылают HEAD по всем ссылкам и если оттуда прилетает что-то внятное, то выкачивают ... и так по кругу.

kobezzza · #**1313** (**permalink**) 24.12.2013, 21:41

Сообщение от cyber

Gozar, т.е по сути они "гуляют" по ссылкам которые находят на странице?

Робот видит сайт в виде исходного кода и считывает часть текста (если текста не очень много, то всю страницу целиком), поэтому даже трюк такой есть, что всю важную инфу нужно размещать как можно выше, а с помощью CSS уже ставить куда её надо.

Упрощёно да, он находит ссылки на странице и ходит по ним. Ему также можно написать sitemap.xml, где описать что и как индексировать и т.д. В случае AJAX ссылок с #, гугл (насчёт других не знаю) позволяют задать куда идти за статичным файлом, если таковой есть.

Т.е. JavaScript роботы не понимают, но если делать деградацию, то можно скармливать им статичную инфу.

Gozar · #**1314** (**permalink**) 24.12.2013, 21:47

Сообщение от kobezzza

Робот видит сайт в виде

Робот видит сайт в виде чего угодно, в зависимости от робота.

cyber · #**1315** (**permalink**) 24.12.2013, 21:50

Сообщение от kobezzza

JavaScript роботы не понимают

вроде гугловские боты понимают.
За описание спасибо, т.е по сути если негде нет ссылки на страницу то ее не получишь!!?

kobezzza · #**1316** (**permalink**) 24.12.2013, 21:54

Сообщение от cyber

вроде гугловские боты понимают.

Нет. Гугл (хотя я думаю не только гугл) для хеш ссылок (которые использовались до внедрения history api) имеет специальное АПИ, что урлы вида #! ссылаются на статичный файл, который поисковик может прочитать. С history api это стало ненужно, т.е. нужно лишь иметь статичный файлик для них и всё.

Сообщение от cyber

За описание спасибо, т.е по сути если негде нет ссылки на страницу то ее не получишь!!?

Это уже к СЕОшникам

Gozar · #**1317** (**permalink**) 24.12.2013, 21:54

Сообщение от cyber

т.е по сути если негде нет ссылки на страницу то ее не получишь!!?

По сути. Если нигде нет ссылки на страницу, то по ней не перейти, чтобы пропинговать ее, а затем узнав, что это страница, а не например jpeg скачать ее и распарсить.

cyber · #**1318** (**permalink**) 24.12.2013, 21:58

Жаль, а я думал есть какой то способ о котором я не знаю

Gozar · #**1319** (**permalink**) 24.12.2013, 22:00

Сообщение от cyber

Жаль, а я думал есть какой то способ о котором я не знаю

а еще есть

onclick="document.location.href ='/tuda'"

Gozar · #**1320** (**permalink**) 24.12.2013, 22:01

а еще webmaster.yandex.ru можно запостить ссылку напрямую, у гугла также

Форум

Справочник

Discord чат

Курсы javascript