Некие видимо боты ходят на сайт и в поиске на сайте вбивают запросы типа "Save us from Berlusconi" и прочее, порой порногорафического содеражния, в результате чего появляются страницы типа:
мойсайт.ру/page/2/?q=Save+Us+From+Berlusconi
Появляются в вебмастере в том числе, то есть индексируются. Я то от индексации их закрыл, но вот зачем это делается?
У меня на сайте проиндексировано около 100 страниц. Если посмотреть webmaster.yandex по своему сайту, то я вижу:
у всех страниц нормальный обычный индекс с html на конце адреса.
Но из всех проиндексированных страниц почему-то две страницы имеют индекс без html на конце. Индекс типа такого - "......../778"
А страница 778 как раз очень важна для меня. Мы ее хотим продвигать и ставить на неё ссылки.
Вопрос: 1. Почему так произошло и в индексе адрес стоит без html на конце?
Если учесть, что почти все остальные страницы проиндексированы с html на конце.
2. Люди, которые будут давать у себя ссылки на нашу страницу, практически всегда дают ссылки в полном формате как ......./778.html
Это приведет к тому, что эти ссылки не будут совпадать с тем адресом, который попал в индекс yandex-а. Возможно, что от этого эти ссылки не будут учитываться yandex-ом при формировании выдачи?
3. Как добиться того, чтобы страница .../778.html попала в индекс правильным полным образом вместе с html на конце? И нужно ли этого добиваться? .