Зачем нужен файл sitemap.xml
Карта сайта (sitemap.xml) для – Google, Yandex и Yahoo!
Теперь про Рамблер
Многие слышали, что чтобы ваш сайт, особенно если он написан на php, хорошо индексировался нужно создать карту сайта.
А если не слышали, то поясню – карта сайта – это специально написанный текстовый файл, который поможет улучшить индексацию вашего сайта в поисковых системах.
Существование этого файла является обязательным для многих сайтов, написанных на php и имеющих или вообще не имеющих SEO оптимизацию под поисковики, хотя не помешают и тем, которые её имеют.
Так как поисковый бот при заходе на сайт индексирует то, что считает нужным, не всегда, особенно, если у нас сайт часто обновляется, он индексирует то, что нам надо.
Допустим у нас есть уникальный материал, а поисковик его упорно игнорирует, зато радостно индексирет всякий флуд с форума.
Вот тут нам и поможет файл карты сайта, где мы впишем ссылку на этот самый уникальный материал и поисковик наконец-то его проиндексирует.
Создать карту сайта легко, если вы используете какой-либо распространённый движок бесплатной CMS, где есть плагин, который генерирует карту сайта.
А если нет или движок самописный?
Можно прибегнуть к помощи сайтов-генераторов карты сайта.
Вот только столкнулся я с такой проблемой, что сгенерировав карту сайта с помощью около 20-ти таких сервисов, я так и не смог предложить гуглу карту сайта, которая бы его устроила. Аналогично было и с Яндексом, т.к. эти поисковики используют немного не такой как обычно вид карты сайта, а у гугла есть целый трактат о том как создать правильную карту сайта.
Я потратил на его чтение около двух недель, ну а теперь с радостью поделюсь вам инструкцией по созданию карты сайта, на прочтение которой у вас уйдёт минут 20, но зато и карту сайта вы сможете создать сразу же после прочтения.
Карта сайта (sitemap.xml) для – Google, Yandex и Yahoo!
Итак. Карта сайта – это файл с названием sitemap и расширением xml.
Файл должен быть обязательно в кодировке UTF-8.
Рекомендую создать этот файл с помощью программы Notepad++, аналогично, как и в случае с RSS-лентой сайта.
Теперь перейдём к содержимому файла.
Открываться файл должен такими строчками:
<?xml version=”1.0″ encoding=”UTF-8″?> <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″> |
Это вы сообщаете, что ваш файл является картой сайта.
Далее вы должны указывать ссылки на все страницы вашего сайта или только те, которые хотите, чтобы были проиндексированы поисковой системой в первую очередь, или те, которые всё ещё не проиндексированы оформляя это вот такими тегами:
<url> <loc>http://jeder.ru/index.php</loc> <lastmod>2008-10-27T18:00:15+00:00</lastmod> <priority>1.00</priority> <changefreq>daily</changefreq> </url> |
Вполне возможно, что вы уже догадались по этой записи, что делать дальше, но всё же расскажу, что означает каждый из тегов в этом куске кода.
Все тэги делятся на два вида – обязательные – те, без которых ваша карта не будет таковой являться, и необязательные – т.е. их наличие необходимо только если вы хотите дать поисковому боту какие-либо дополнительные команды.
Тэг | Описание |
обязательные тэги | |
<url></url> | Указывается блок, в котором будет указана ссылка некоего материала на вашем сайте |
<loc></loc> | Внутри этого тега вы должны указать ссылку на страницу, которая должна быть проиндексирована поисковиком |
тэги, которые можно не использовать в файле карты сайта | |
<lastmod></lastmod> | Дата когда вы создали добавляемую страницу или дата, когда вы создали файл карты сайта, обязательно должна указываться в виде: 2008-10-27T18:00:15+00:00, где 2008-10-27 – ГОД-МЕСЯЦ-ДЕНЬ T(англ) – означает время 18:00:15 – время создания с точностью до секунды +00:00 – сколько необходимо прибавить часов или минут к указанному вами времени относительно Гринвича |
<priority></priority> | Так называемая очерёдность или приоритетность ссылки – устанавливает вес ссылки относительно других ссылок в файле. Возможные значения: 0 – низкая 0,5 – средняя 1 – высокая |
<changefreq></changefreq> | С какой периодичностью индексировать эту страницу заново. Хорошая функция для новостных сайтов, которые выводят новости на главной странице (для остальных страциц можете поставить daily, а когда они будут проиндексированы, убрать ссылки на них из файла) Возможные значения: always – всегда hourly – ежечасно daily – ежедневно weekly – еженедельно monthly – ежемесячно yearly – раз в год never – никогда |
Таким образом вы вставляете все ссылки страниц, которые должны попасть в поисковик в обязательном порядке.
И в конце файла закрываете начальный тег:
</urlset> |
Вот примерно так у вас должно получиться:
<?xml version=”1.0″ encoding=”UTF-8″?> <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″> <url> <url> <url> <url> </urlset> |
Затем создайте, если его нет, или откройте файл robots.txt и в него добавьте такие строчки:
Sitemap: http://jeder.ru/sitemap.xml |
чтобы поисковые боты узнал о том, что у вас есть карта сайта (вместо jeder.ru – введите свой адрес).
Файл sitemap.xml как и файл robots.txt нужно закинуть на хостинг в корень директориив вашего сайта.
И ждать, когда поисковики придут на ваш сайт и увидят карту сайта.
Индексирует ли Рамблер файл sitemap.xml так и не получилось узнать. Однако, при регистрации сайта в Рамблере у него есть предупреждение, что их поисковые боты могут и вовсе не индексировать сайт, если он написан на php – ошеломляющее заявление от первого поисковика Рунета в разгар 21 века, неправда ли?
И тем не менее Рамблер это около 10% постетителей на сайт от общей массы.
Что же делать?
Самый действенный метод, который могу посоветовать вам – это наряду с созданием файла sitemap.xml создать страничку html с таким же оформлением как у вашего сайта, назвать её карта сайта (sitemap.html) и согласно требованиями стандарта html также добавить туда ссылки на страницы вашего сайта, а затем забросить этот файл в корень вашего сайта на хостинге рядом с sitemap.xml.
Вот и всё. Надеюсь, что это поможет вам продвинуть свой сайт в поисковиках