
Sitemap.xml — это структурный файл формата xml, в котором содержится обновляемая информация о страницах веб-сайта, подлежащая индексации поисковыми системами. Сам файл располагается в корневой директории ресурса. Он может формироваться как вручную, так и автоматически скриптами или модулями CMS.
В этой статье мы постараемся максимально доступно ответить на все часто задаваемые вопросы: для чего нужен, как создать, какая структура и какие виды карты сайта xml существуют.
Итак, для чего же нужна карта сайта? Она дает возможность поисковым системам значительно ускорить индексацию страниц веб-ресурса, определить структуру вложенности, дату изменения той или иной страницы. Особенно важна в использовании такая карта для крупных веб-порталов, интернет-магазинов и других ресурсов с обширной структурой каталога.
Типы карт сайта — sitemap.xml
Как правило, создают различные sitemap.xml в зависимости от типа контента:
- sitemap-category.xml — файл, содержащий информацию о страницах каталога до четвертого уровня вложенности;
- sitemap-products.xml — карта сайта, включающая в себя информацию только о страницах карточек товаров вашего интернет-магазина;
- sitemap-images.xml — xml карта исключительно для картинок, но данный документ понимает только Google;
- sitemap.xml — главный файл карты, включающий в себя информацию о всех остальных файлах.
Все вышеприведенные файлы должны быть доступны в корне сайта, например, домен.com/sitemap-images.xml Ссылки на них размещаются в основном файле sitemap.xml
Содержание sitemap.xml
Важно, чтоб большинство файлов xml формата, в том числе и xml карта, имели определенную структуру с понятными для поисковых машин тегами. Давайте более подробно разберем структуру файла на примере вот такого кода, в котором содержится одна ссылка:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://www.домен.com</loc> <lastmod>2018-10-05</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> </urlset>
<url> — в этом блоке определяется ссылка для индексации, а также вспомогательные теги;
<loc> — адрес самой ссылки
<lastmod> — дата обновления информации на указанной странице;
<changefreq> — указывается, как часто может меняться информация на странице. Варианты: never, weekly, monthly, always, hourly, daily, yearly;
<priority> — тег определяет приоритетность между страницами. Варианты использования: от 0.1 до 1,0
Для карты сайта-изображений используется немного иная структура, в котором к указанной странице привязываются иллюстрации. Пример:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:image="http://www.google.com/schemas/sitemap-image/1.1"> <url> <loc>http://example.com/primer.html</loc> <image:image> <image:loc>http://example.com/kartinka.jpg</image:loc> </image:image> <image:image> <image:loc>http://example.com/photo.jpg</image:loc> </image:image> </url> </urlset>
В теге <loc> указывается ссылка на страницу, где находятся изображения. Ниже добавляем теги <image:image> и <image:loc>, в последнем указываем каноническую ссылку на файл изображения.
Общие требования к эффективной XML карте
Также мы подготовили для вас список основных рекомендаций по картам сайтов:
- в файлы карт сайта попадают только канонические, открытые для индексации и сканирования страницы, отдающие код ответа 200;
- в карте используется кодировка UTF-8;
- каждая из карт содержит не более 50 000 URL. Если в карте содержится более 50000 урл, тогда для остальных ссылок создается вторая карта сайта;
- Размер одной карты не превышает 50 МБ;
- Файлы карты сайта должны автоматически генерироваться при добавлении/изменении страниц, а старые несуществующие адреса страниц — удаляться;
- Для разных поддоменов желательно использовать разные карты сайта xml;
- Ссылку на основную карту нужно указать в файле robots.txt;
- Добавить ссылку на новосозданную sitemap.xml необходимо в панелях поисковых сайтов Яндекс.Вебмастера и Google Search Console;
Варианты создания файла sitemap.xml
Есть несколько способов формирования карты сайта. Мы расставили их в порядке эффективности и правильности:
- Передать требования по генерации карт сайта разработчикам — наиболее правильный вариант, так как они создадут индивидуальную и максимально правильную карту со всеми рекомендациями;
- Воспользоваться модулями для CMS, которые в автоматическом режиме будут создавать карту с указанными вами параметрами. (например, модуля для WordPress)
- Воспользоваться сервисами, которые автоматически просканируют ваш сайт и создадут sitemap.
Примеры самых популярных сервисов для генерации sitemap.xml онлайн: