March 16th, 2011

маннергейм

Спасите нас от Берлускони

Некие видимо боты ходят на сайт и в поиске на сайте вбивают запросы типа "Save us from Berlusconi" и прочее, порой порногорафического содеражния, в результате чего появляются страницы типа:

мойсайт.ру/page/2/?q=Save+Us+From+Berlusconi

Появляются в вебмастере в том числе, то есть индексируются. Я то от индексации их закрыл, но вот зачем это делается?
1

Прошу совета по индексации страницы сайта

У меня на сайте проиндексировано около 100 страниц.
Если посмотреть webmaster.yandex по своему сайту, то я вижу:

у всех страниц нормальный обычный индекс с html на конце адреса.


Но из всех проиндексированных страниц почему-то две страницы имеют индекс без html на конце.
Индекс типа такого - "......../778"


А страница 778 как раз очень важна для меня. Мы ее хотим продвигать и ставить на неё ссылки.

Вопрос:
1. Почему так произошло и в индексе
адрес стоит без html на конце?

Если учесть, что почти все остальные страницы проиндексированы с html на конце.

2. Люди, которые будут давать у себя ссылки на нашу страницу, практически всегда дают ссылки в полном формате как ......./778.html

Это приведет к тому, что эти ссылки не будут совпадать с тем адресом, который попал в индекс yandex-а.
Возможно, что от этого эти ссылки не будут учитываться yandex-ом при формировании выдачи?

3. Как добиться того, чтобы
страница .../778.html попала в индекс правильным полным образом вместе с html на конце?
И нужно ли этого добиваться?
.