Зачем нужен файл sitemap.xml

Карта сайта (sitemap.xml) для – Google, Yandex и Yahoo!

Теперь про Рамблер





Зачем нужен файл sitemap.xml


Многие слышали, что чтобы ваш сайт, особенно если он написан на php, хорошо индексировался нужно создать карту сайта.


А если не слышали, то поясню – карта сайта – это специально написанный текстовый файл, который поможет улучшить индексацию вашего сайта в поисковых системах.


Существование этого файла является обязательным для многих сайтов, написанных на php и имеющих или вообще не имеющих SEO оптимизацию под поисковики, хотя не помешают и тем, которые её имеют.

Так как поисковый бот при заходе на сайт индексирует то, что считает нужным, не всегда, особенно, если у нас сайт часто обновляется, он индексирует то, что нам надо.

Допустим у нас есть уникальный материал, а поисковик его упорно игнорирует, зато радостно индексирет всякий флуд с форума.

Вот тут нам и поможет файл карты сайта, где мы впишем ссылку на этот самый уникальный материал и поисковик наконец-то его проиндексирует.


Создать карту сайта легко, если вы используете какой-либо распространённый движок бесплатной CMS, где есть плагин, который генерирует карту сайта.


А если нет или движок самописный?

Можно прибегнуть к помощи сайтов-генераторов карты сайта.

Вот только столкнулся я с такой проблемой, что сгенерировав карту сайта с помощью около 20-ти таких сервисов, я так и не смог предложить гуглу карту сайта, которая бы его устроила. Аналогично было и с Яндексом, т.к. эти поисковики используют немного не такой как обычно вид карты сайта, а у гугла есть целый трактат о том как создать правильную карту сайта.

Я потратил на его чтение около двух недель, ну а теперь с радостью поделюсь вам инструкцией по созданию карты сайта, на прочтение которой у вас уйдёт минут 20, но зато и карту сайта вы сможете создать сразу же после прочтения.


Карта сайта (sitemap.xml) для – Google, Yandex и Yahoo!


Итак. Карта сайта – это файл с названием sitemap и расширением xml.

Файл должен быть обязательно в кодировке UTF-8.


Рекомендую создать этот файл с помощью программы Notepad++, аналогично, как и в случае с RSS-лентой сайта.


Теперь перейдём к содержимому файла.


Открываться файл должен такими строчками:








<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

Это вы сообщаете, что ваш файл является картой сайта.


Далее вы должны указывать ссылки на все страницы вашего сайта или только те, которые хотите, чтобы были проиндексированы поисковой системой в первую очередь, или те, которые всё ещё не проиндексированы оформляя это вот такими тегами:








<url>

<loc>http://jeder.ru/index.php</loc>

<lastmod>2008-10-27T18:00:15+00:00</lastmod>

<priority>1.00</priority>

<changefreq>daily</changefreq>

</url>

Вполне возможно, что вы уже догадались по этой записи, что делать дальше, но всё же расскажу, что означает каждый из тегов в этом куске кода.

Все тэги делятся на два вида – обязательные – те, без которых ваша карта не будет таковой являться, и необязательные – т.е. их наличие необходимо только если вы хотите дать поисковому боту какие-либо дополнительные команды.



































Тэг Описание
обязательные тэги
<url></url> Указывается блок, в котором будет указана ссылка некоего материала на вашем сайте
<loc></loc> Внутри этого тега вы должны указать ссылку на страницу, которая должна быть проиндексирована поисковиком
тэги, которые можно не использовать в файле карты сайта
<lastmod></lastmod> Дата когда вы создали добавляемую страницу или дата, когда вы создали файл карты сайта, обязательно должна указываться в виде:

2008-10-27T18:00:15+00:00, где

2008-10-27 – ГОД-МЕСЯЦ-ДЕНЬ

T(англ) – означает время

18:00:15 – время создания с точностью до секунды

+00:00 – сколько необходимо прибавить часов или минут к указанному вами времени относительно Гринвича
<priority></priority> Так называемая очерёдность или приоритетность ссылки – устанавливает вес ссылки относительно других ссылок в файле.

Возможные значения:

0 – низкая

0,5 – средняя

1 – высокая
<changefreq></changefreq> С какой периодичностью индексировать эту страницу заново. Хорошая функция для новостных сайтов, которые выводят новости на главной странице (для остальных страциц можете поставить daily, а когда они будут проиндексированы, убрать ссылки на них из файла)

Возможные значения:

always – всегда

hourly – ежечасно

daily – ежедневно

weekly – еженедельно

monthly – ежемесячно

yearly – раз в год

never – никогда

Таким образом вы вставляете все ссылки страниц, которые должны попасть в поисковик в обязательном порядке.


И в конце файла закрываете начальный тег:








</urlset>

Вот примерно так у вас должно получиться:








<?xml version=”1.0″ encoding=”UTF-8″?>

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>




<url>

<loc>http://jeder.ru/</loc>

<lastmod>2008-10-27T18:00:15+00:00</lastmod>

<priority>1.00</priority>

<changefreq>daily</changefreq>

</url>


<url>

<loc>http://jeder.ru/help/help.shtml</loc>

<lastmod>2008-10-19T18:00:15+00:00</lastmod>

<priority>1.00</priority>

<changefreq>daily</changefreq>

</url>


<url>

<loc>http://jeder.ru/help/linux.shtml</loc>

<lastmod>2008-10-19T18:00:15+00:00</lastmod>

<priority>1.00</priority>

<changefreq>daily</changefreq>

</url>


<url>

<loc>http://jeder.ru/help/windows.shtml</loc>

<lastmod>2008-10-19T18:00:15+00:00</lastmod>

<priority>1.00</priority>

<changefreq>daily</changefreq>

</url>


</urlset>



Затем создайте, если его нет, или откройте файл robots.txt и в него добавьте такие строчки:








Sitemap: http://jeder.ru/sitemap.xml

чтобы поисковые боты узнал о том, что у вас есть карта сайта (вместо jeder.ru – введите свой адрес).


Файл sitemap.xml как и файл robots.txt нужно закинуть на хостинг в корень директориив вашего сайта.

И ждать, когда поисковики придут на ваш сайт и увидят карту сайта.


Теперь про Рамблер


Индексирует ли Рамблер файл sitemap.xml так и не получилось узнать. Однако, при регистрации сайта в Рамблере у него есть предупреждение, что их поисковые боты могут и вовсе не индексировать сайт, если он написан на php – ошеломляющее заявление от первого поисковика Рунета в разгар 21 века, неправда ли?


И тем не менее Рамблер это около 10% постетителей на сайт от общей массы.


Что же делать?


Самый действенный метод, который могу посоветовать вам – это наряду с созданием файла sitemap.xml создать страничку html с таким же оформлением как у вашего сайта, назвать её карта сайта (sitemap.html) и согласно требованиями стандарта html также добавить туда ссылки на страницы вашего сайта, а затем забросить этот файл в корень вашего сайта на хостинге рядом с sitemap.xml.


Вот и всё. Надеюсь, что это поможет вам продвинуть свой сайт в поисковиках :)