คอมพิวเตอร์ Windows อินเทอร์เน็ต

XML Sitemap: คู่มือฉบับสมบูรณ์ในการใช้งาน รายงานแผนผังเว็บไซต์ วิธีตรวจสอบไฟล์แผนผังเว็บไซต์ใน Yandex

ในคู่มือนี้ เราจะครอบคลุมคำถามต่อไปนี้:

Sitemap คืออะไร?

นี่คือไฟล์ที่มีรายการลิงก์ไปยังหน้าที่สำคัญทั้งหมดของเว็บไซต์ นั่นคือเอกสารนี้ชี้นำ เครื่องมือค้นหาไปยังเนื้อหาหลักบนเว็บไซต์

แผนผังเว็บไซต์มีไว้เพื่ออะไร?

จำเป็นต้องมีแผนผังเว็บไซต์หากเว็บไซต์มีปัญหาในการจัดทำดัชนี ซึ่งเกิดจาก:
1) จำนวนมากของหน้า;
2) ไม่มีลิงก์ (ภายในหรือภายนอก) ไปยังหน้า
3) การวางซ้อนบนไซต์ (โครงสร้างที่สับสน)

แผนผังเว็บไซต์ HTML เทียบกับ XML

แผนผังเว็บไซต์เป็นประเภทต่อไปนี้:

  • HTML;

คำอธิบายที่ง่ายที่สุดสำหรับความแตกต่างระหว่างรูปแบบเหล่านี้คือแมป XML มีไว้สำหรับเครื่องมือค้นหาเป็นหลัก และ HTML มีไว้สำหรับผู้ใช้เป็นหลัก

แผนที่ HTML- นี่เป็นเพียงภาพรวมทั่วไปของไซต์ มีเฉพาะข้อมูลและหน้าที่ผู้ใช้ต้องดู หากคุณอยู่ในไซต์และกำลังมองหาส่วนใดส่วนหนึ่ง เมื่อคุณไปที่ HTML แผนผังเว็บไซต์ คุณจะพบส่วนนั้นได้ง่าย แม้ว่าแผนผังเว็บไซต์ประเภทนี้จะเน้นที่ผู้ใช้เป็นหลัก แต่ก็สามารถช่วยจัดอันดับเครื่องมือค้นหาของคุณได้ นี่เป็นหนึ่งในสัญญาณว่าคุณใส่ใจเกี่ยวกับความเป็นมิตรต่อผู้ใช้ของไซต์

เมื่อรวบรวมแผนผังเว็บไซต์ HTML ควรพิจารณา:

1. เนื้อหาที่มีโครงสร้าง

แผนผังเว็บไซต์ควรมีความชัดเจนและใช้งานง่าย ขอแนะนำให้รวมส่วน, หมวดหมู่, หมวดหมู่ย่อย ฯลฯ

2. สมอลิงค์

มาตรการ XML Mapsไซต์นี้มีไว้สำหรับหุ่นยนต์ค้นหา ไฟล์ XML มีข้อมูลเกี่ยวกับเวลาที่อัปเดต URL ครั้งล่าสุด ความสำคัญ และความถี่ของการเปลี่ยนแปลง

โดยปกติ Sitemap จะประกอบด้วยแท็ก XML ต่อไปนี้:

บังคับ:
- กำหนดมาตรฐานโปรโตคอลและสรุปไฟล์นี้
– содержит в себе информацию о URL-адресе (является родительским тегом).
https://appcube.ru/th/ – содержит абсолютный URL-адрес.

Необязательные:
– указывает дату последнего изменения файла.
– указывает частоту смены файла.
– указывает на значимость документа на сайте. Диапазон значений: от 0,1 до 1,0 (по умолчанию 0,5).

Не устанавливайте для каждого URL-адреса слишком частую смену файла и максимальный приоритет. Если метки частоты и приоритета не отражают реальность, вероятнее всего, поисковые системы будут более склонны игнорировать всю карту XML.

Другие форматы Sitemap

Помимо вышеперечисленных карт сайта, поисковые системы также поддерживают следующие форматы:

Для Google:
— RSS, mRSS и Atom 1.0;
RSS / Atom фиды должны содержать последние обновления вашего сайта. Обычно они небольшие и часто обновляются (что является плюсом).
— Сайты Google.
Для сайтов, созданных на платформе Google Сайты, Sitemap создаётся автоматически, и внести какие-то изменения невозможно.

Для Google и Яндекс:
текстовый формат (TXT).
Файл должен быть в кодировке UTF-8 и состоять только из URL-адресов.

Требования Google и Яндекса к файлам Sitemap

1. Используйте кодировку UTF-8.
2. Максимальное количество URL – 50 000.
3. Ссылки в сайтмапе должны быть на том же домене, что и файл.

4. Если файл слишком большой, разделите его на несколько и укажите их в файле индекса Sitemap.
5. Ответ сервера при обращении к файлу должен быть 200 ОК.
6. Указывайте только канонические адреса страниц (без GET-параметров и идентификаторов сессий).

1. Максимальный размер – 10 МБ.
2. Поддерживает кириллические URL.

1. Максимальный размер – 50 МБ.
2. Поддерживает только цифры и латинские буквы.

Распространённая ошибка: чтобы уменьшить требования к пропускной способности канала, используют архиватор gzip. Размер сайтмапа должен быть 50 МБ (10 МБ) до сжатия, а не после.

Совет: русские доменные имена можно преобразовать с помощью кодировки Punycode.

Как создать XML Sitemap

1. Чтобы создать карту сайта, в первую очередь нужно определить канонические адреса, которые будут добавлены в файл.

2. Определить, какой формат файла будете использовать.

3. Создать файл можно вручную или, воспользовавшись генератором Sitemap.

Google в своей справке подготовил список онлайн и десктопных, платных и бесплатных генераторов карт сайта. Ознакомиться со всем списком можно, перейдя по ссылке .

Сгенерировать Sitemap проще, чем кажется. Разберём, как сгенерировать сайтмап, на примере деcктопного приложения Majento:

1. Парсим сайт.

2. Переходим в раздел «Сайты» => «Генерировать Sitemap».

3. Сохраняем в нужном нам формате.

4. Карта сайта готова.

Из online-генераторов XML-карты сайта заслуживает внимания XML Sitemap Generator .

Расширенные возможности этого сервера позволяют установить определённые XML-теги, включить/исключить нужные документы.

Исключить ненужные страницы можно и с помощью регулярных выражений.

Google поддерживает расширенный синтаксис для изображений. Для этого вы можете создать отдельную карту сайта для изображений или добавить синтаксис в существующую. Использование расширенного синтаксиса в Sitemap предоставляет поисковой системе дополнительную информацию об изображениях на сайте. Также это может помочь Google обнаружить и проиндексировать изображения, которые он не может найти при сканировании сайта.

Как и в обычной карте сайта, есть обязательные и необязательные XML-теги.

Обязательные:
– аналогично тегу содержит в себе URL изображения и дополнительную информацию.
– URL изображения.

Необязательные:
– подпись к изображению.
– место съёмки фотографии.
– название изображения.
– URL-лицензии изображения.

Ещё один расширенный синтаксис, который поддерживает Google, – XML-карта для видео.

Плюсы добавления XML-тегов для видео:

1) даёт понять Google, какой контент на сайте;
2) даёт возможность предоставить детальное описание к файлу;
3) станет доступным для поиска в Google Видео;
4) в поисковой выдаче будет отображаться заставка видео (может повысить количество переходов из поисковой выдачи).

Карта сайта для видеофайлов состоит из следующих обязательных элементов:

– содержит URL-адрес страницы, на которой размещено видео; если на одной странице размещено более одного видео, не нужно каждый раз создавать тег , достаточно в одном теге несколько раз прописать для каждого видео на странице.
– включает в себя всю информацию о видео.
– URL к миниатюрному изображению (заставке) к видео. Рекомендованные размеры: от 160×90 пикселей до 1920×1080. Форматы изображения: .jpg, .png, or. gif
– заголовок, который должен совпадать с названием страницы, на которой отображается видео.
– описание видео. Должно соответствовать с метаописаниями страницы. Максимальное количество символов – 2048.

Заголовок и описание видео должны быть экранированы или упакованы в блок CDATA.

Со всеми XML-тегами карты сайта для видео можно ознакомиться в справке Google .

Где разместить карту сайта

Распространённые заблуждения о Sitemap

Так как у многих этот файл вызывает трудности и является «тёмным лесом», возникают определённые мифы в отношении карт сайта. Рассмотрим некоторые из них:

– «Включение URL-адреса в файл Sitemap для XML гарантирует, что он будет проиндексирован».
Нет. Важно отметить, что XML-файлы Sitemap – это только рекомендации. Карта сайта XML не гарантирует индексацию поисковыми системами страниц, указанных в файле.

– «Если я удалю URL из XML-карты, он будет удалён из индекса».
Нет. Карта сайта XML не исключает индексацию страниц, не включённых в карту сайта XML.

– «XML-файлы Sitemap трудно создавать и поддерживать»
Нет. Небольшие сайты могут легко создавать и размещать собственные XML-файлы вручную, используя приведённые выше примеры в качестве руководства по форматированию. Для более крупных сайтов и сайтов, которые изменяются чаще, плагины или модули, доступные для большинства CMS, могут автоматизировать обновление XML-файлов.

Заключение

Файл Sitemap – полезный инструмент для передачи поисковым роботам информации о структуре сайта. Используйте это руководство, чтобы понять, как работает карта сайта, как она устроена, как сгенерировать, разместить и проверить файл.

Подписаться на рассылку

Файл sitemap.xml - это инструмент, который позволяет вебмастерам информировать поисковые системы о страницах сайта, доступных к индексации. Также, в XML карте можно указывать дополнительные параметры страниц: дата последнего обновления, частота обновлений и приоритет относительно других страниц. Информация в sitemap.xml может влиять на поведение поискового краулера и, в целом, на процесс индексации новых документов. Sitemap содержит в себе директивы включения страниц в очередь на обход и дополняет robots.txt, содержащий директивы исключения страниц.

В этом руководстве вы найдете ответы на все вопросы, касающиеся использования sitemap.xml.

Нужен ли мне sitemap.xml

Поисковые системы используют sitemap для поиска новых документов на сайте (это могут быть html-документы или медиа-контент), которые недоступны через навигацию, но их необходимо просканировать. Наличие ссылки на документ в sitemap.xml не гарантирует его сканирование или индексацию, но чаще всего файл помогает большим сайтам индексироваться лучше. К тому же, данные из XML карты используются при определении канонических страниц, если это специально не указано в теге rel=canonical.

Sitemap.xml важен для сайтов, где:

  • Некоторые разделы недоступны через навигационное меню.
  • Имеется множество изолированных страниц или плохо связанных между собой.
  • Используются технологии, слабо поддерживаемые поисковыми системами (например, Ajax, Flash или Silverlight).
  • Присутствует очень много страниц и есть вероятность, что поисковый краулер пропустит новый контент.

Если это не ваши случаи, то скорей всего sitemap.xml вам не нужен. Для сайтов, где каждая важная для индексации страница доступна в пределах 2х кликов, где для отображения контента не используются технологии JavaScript или Flash, где при необходимости используются канонические и региональные теги, и свежий контент появляется не чаще, чем на сайт заходит робот, в файле sitemap.xml нет необходимости.

Для небольших проектов при наличии проблемы лишь большого уровня вложенности документов, ее легко решить с помощью HTML карты сайта, не прибегая к использованию XML карты. Но если вы решили, что sitemap.xml вам все-таки нужен, то прочитайте это руководство полностью.

Техническая информация

  • Sitemap.xml является текстовым файлом формата XML . Однако, поисковые системы также поддерживают текстовый формат (см. следующий раздел).
  • Каждый сайтмап может содержать максимум 50 000 адресов и весить не более 50Мб (10Мб для Яндекса).
  • Можно использовать gzip-сжатие для уменьшения размера файла sitemap.xml и увеличения скорости его передачи. В таком случае используйте расширение gz (sitemap.xml.gz). При этом, ограничения по весу остаются для несжатых сайтмапов.
  • Местоположение файла Sitemap определяет набор URL-адресов, которые можно включить в этот Sitemap. Карта, содержащая адреса страниц всего сайта, должна располагаться в корне. Если сайтмап располагается в папке, то и все URL в этом сайтмапе должны располагаться в этой папке или глубже ().
  • Адреса в sitemap.xml должны быть абсолютными.
  • Максимальная длина URL - 2048 символов (1024 символа для Яндекса).
  • Спецсимволы в URL (типа амперсанда "&" или кавычек) должны маскироваться в HTML-сущности.
  • Указанные в карте страницы должны отдавать 200 http-код статуса.
  • Перечисленные в карте адреса не должны быть закрыты в файле robots.txt или в meta-robots.
  • Sitemap не должен быть закрыт в robots.txt, иначе поисковая система его не просканирует. Сам файл может находиться в индексе, это нормально.

Форматы XML карт

Поисковые системы поддерживают простой текстовый формат карты сайта, где просто списком перечислены URL-адреса страниц без дополнительных параметров. В таком случае файл должен иметь кодировку UTF-8 и иметь расширение .txt .

Также поисковиками поддерживается стандартный XML-протокол . Google дополнительно поддерживает сайтмапы для изображений, видео и новостей.

Пример файла Sitemap, содержащий только один адрес.

https://сайт/!} 2018-06-14 daily 0.9

แท็ก XML
urlset
url(จำเป็น) - แท็กหลักสำหรับแต่ละ URL
loc(จำเป็น) - URL ของเอกสาร ต้องเป็นค่าสัมบูรณ์
Lastmod- วันที่แก้ไขล่าสุดของเอกสารในรูปแบบ Datetime
เปลี่ยนความถี่- ความถี่ของการเปลี่ยนแปลงหน้า (เสมอ, รายชั่วโมง, รายวัน, รายสัปดาห์, รายเดือน, รายปี, ไม่เคย) ความหมายของแท็กนี้คือคำแนะนำสำหรับเครื่องมือค้นหา ไม่ใช่คำสั่ง
ลำดับความสำคัญ- ลำดับความสำคัญของ URL ที่สัมพันธ์กับที่อยู่อื่น (ตั้งแต่ 0 ถึง 1) สำหรับลำดับการรวบรวมข้อมูล หากไม่ได้ระบุไว้ ค่าเริ่มต้นจะเป็น 0.5

แมป XML สำหรับรูปภาพ

SEO บางตัวแทรกลิงก์ไปยังรูปภาพลงใน sitemap.xml ในลักษณะเดียวกับลิงก์ไปยังเอกสาร html คุณทำได้ แต่ Google ควรใช้ส่วนขยายของโปรโตคอลมาตรฐานและส่งข้อมูลเพิ่มเติมเกี่ยวกับรูปภาพพร้อมกับ URL มีประโยชน์ในการสร้างแมปรูปภาพ XML หากจำเป็นต้องรวบรวมข้อมูลและจัดทำดัชนีรูปภาพ และในขณะเดียวกัน บอทไม่สามารถเข้าถึงรูปภาพได้โดยตรง (เช่น ใช้ JavaScript)

ตัวอย่างแผนผังเว็บไซต์ที่มีหน้าเดียวและรูปภาพที่เกี่ยวข้อง

http://example.com/primer.html http://example.com/kartinka.jpg http://example.com/photo.jpg Вид на Балаклаву Севастополь, Крым http://creativecommons.org/licenses/by-nd/3.0/legalcode

แท็ก XML
ภาพ: ภาพ(จำเป็น) - ข้อมูลเกี่ยวกับหนึ่งภาพ ใช้รูปภาพได้สูงสุด 1,000 รูป
ภาพ: loc(จำเป็น) - เส้นทางไปยังไฟล์รูปภาพ หากใช้ CDN จะอนุญาตให้อ้างอิงโดเมนอื่นหากได้รับการยืนยันในแผงควบคุมสำหรับผู้ดูแลเว็บ
ภาพ: คำบรรยาย- คำบรรยายภาพ (อาจมีข้อความยาว)
ภาพ: title- ชื่อภาพ (ปกติจะเป็นข้อความสั้น)
ภาพ: geo_location- สถานที่ถ่ายทำ
ภาพ: ใบอนุญาต- URL ใบอนุญาตรูปภาพ ใช้ในการค้นหารูปภาพขั้นสูง

แผนที่ XML สำหรับวิดีโอ

เช่นเดียวกับแผนที่สำหรับรูปภาพ Google ยังมีส่วนขยายแผนผังเว็บไซต์วิดีโอที่คุณสามารถระบุได้ รายละเอียดข้อมูลเกี่ยวกับเนื้อหาวิดีโอที่ส่งผลต่อการแสดงผลในการค้นหาวิดีโอ แผนผังไซต์วิดีโอมีความจำเป็นเมื่อไซต์ใช้วิดีโอที่โฮสต์ในเครื่อง และเมื่อสร้างดัชนีวิดีโอเหล่านี้ได้ยากเนื่องจากเทคโนโลยีที่ใช้ หากคุณฝังวิดีโอ YouTube บนไซต์ของคุณ ก็ไม่จำเป็นต้องใช้แผนผังไซต์วิดีโอที่นี่

แผนผังเว็บไซต์ข่าว

หากไซต์ของคุณมีเนื้อหาข่าวและเป็นสมาชิกของ Google ข่าวสาร การใช้แผนผังไซต์ข่าวสารเพื่อให้ Google สามารถค้นหาเนื้อหาล่าสุดของคุณได้เร็วขึ้นและจัดทำดัชนีบทความข่าวทั้งหมด ในกรณีนี้ แผนผังไซต์ควรมีเฉพาะ URL ของหน้าเว็บที่เผยแพร่ในช่วง 2 วันที่ผ่านมาและมี URL ไม่เกิน 1,000 รายการ

ใช้ไพ่หลายใบ

หากจำเป็น คุณสามารถใช้แผนผังเว็บไซต์หลายรายการ โดยรวมเป็นแผนผังเว็บไซต์ดัชนีเดียว ใช้ sitemap.xml หลายรายการเมื่อ:

  • เว็บไซต์นี้ใช้เอ็นจิ้นหลายตัว (CMS)
  • เว็บไซต์มีมากกว่า 50,000 หน้า
  • คุณต้องตั้งค่าการติดตามข้อผิดพลาดที่สะดวกในส่วนต่างๆ

ในกรณีหลัง ไซต์ขนาดใหญ่แต่ละส่วนมี sitemap.xml ของตัวเอง และทั้งหมดนั้นจะถูกเพิ่มลงในแผงควบคุมสำหรับผู้ดูแลเว็บ ซึ่งสะดวกต่อการสังเกตว่าส่วนใดมีข้อผิดพลาดมากที่สุด (ดูหัวข้อการค้นหาข้อผิดพลาด ในแผนผังเว็บไซต์)

หากคุณมีแผนผังเว็บไซต์ตั้งแต่ 2 รายการขึ้นไป จะต้องรวมกันเป็นดัชนีแผนผังเว็บไซต์ ซึ่งมีลักษณะเหมือนกับแผนผังเว็บไซต์ปกติ (ยกเว้นการมีอยู่ของดัชนีแผนผังเว็บไซต์และแท็กแผนผังเว็บไซต์แทนที่จะเป็น urlset และ url) มีข้อจำกัดที่คล้ายกันและสามารถเชื่อมโยงได้เท่านั้น แมป XML ปกติ (ไม่ได้จัดทำดัชนี) ...

ตัวอย่างดัชนีแผนผังเว็บไซต์:

http://www.example.com/sitemap-blog.xml.gz 2004-10-01T18: 23: 17 + 00: 00 http://www.example.com/sitemap-webinars.xml.gz 2005-01-01

แผนผังเว็บไซต์ดัชนี(จำเป็น) - ระบุมาตรฐานของโปรโตคอลปัจจุบัน
แผนผังเว็บไซต์(จำเป็น) - มีข้อมูลเกี่ยวกับแผนผังเว็บไซต์แต่ละรายการ
loc(จำเป็น) - ตำแหน่งแผนผังเว็บไซต์ (รูปแบบ xml, txt หรือ rss สำหรับ Google)
Lastmod- เวลาที่มีการเปลี่ยนแปลงแผนผังเว็บไซต์ ช่วยให้เครื่องมือค้นหาค้นพบ URL ใหม่บนไซต์ขนาดใหญ่ได้อย่างรวดเร็ว

วิธีสร้างแผนผังเว็บไซต์.xml

วิธีการสร้าง XML Sitemap:

  • สิ่งอำนวยความสะดวก CMS ภายใน CMS จำนวนมากรองรับการสร้างแผนผังเว็บไซต์อยู่แล้ว หากต้องการทราบ โปรดอ่านเอกสารประกอบสำหรับ CMS ของคุณ ดูรายการเมนูในแผงการดูแลระบบ หรือติดต่อฝ่ายสนับสนุนด้านเทคนิคของเครื่องยนต์ โหลดไฟล์ https: //yoursite.com/sitemap.xml บนไซต์ของคุณ อาจมีอยู่แล้วและกำลังสร้างแบบไดนามิก
  • ปลั๊กอินภายนอกหาก CMS ไม่มีฟังก์ชันการสร้างแผนผังเว็บไซต์ และสนับสนุนปลั๊กอิน ให้ google ว่าปลั๊กอินตัวใดที่ปิดปัญหา sitemap.xml สำหรับเครื่องยนต์ของคุณและติดตั้ง ในบางกรณี คุณต้องติดต่อโปรแกรมเมอร์เพื่อเขียนปลั๊กอินที่คล้ายกันให้คุณ
  • สคริปต์แยกต่างหากบนเว็บไซต์เมื่อทราบโปรโตคอลแมป XML และข้อจำกัดทางเทคนิค คุณสามารถสร้าง sitemap.xml ได้ด้วยตนเองโดยเพิ่มสคริปต์การสร้างลงใน CRON หากคุณไม่ใช่โปรแกรมเมอร์ ให้ใช้รายการอื่นๆ ในรายการนี้
  • เครื่องกำเนิดแผนผังเว็บไซต์มีตัวสร้าง sitemap.xml มากมายที่รวบรวมข้อมูลไซต์ของคุณและดาวน์โหลดแผนที่ที่เสร็จแล้ว ข้อเสียของที่นี่คือทุกครั้งที่มีการอัปเดตไซต์ แผนผังไซต์จะต้องสร้างขึ้นด้วยตนเอง
  • พาร์เซอร์โปรแกรมเดสก์ท็อปที่ออกแบบมาสำหรับการวิเคราะห์ทางเทคนิคของไซต์มักจะให้โอกาสในการดาวน์โหลด sitemap.xml ที่สร้างขึ้นจากหน้าที่รวบรวมข้อมูล ทำงานคล้ายกับตัวสร้างแผนผังเว็บไซต์ ทำงานเฉพาะในเครื่องของคุณเท่านั้น

ตัวสร้างแผนผังเว็บไซต์ออนไลน์ยอดนิยม

XML-Sitemaps.com

ช่วยให้คุณรับ sitemap.xml ได้ในไม่กี่คลิก รองรับรูปแบบ XML, HTML, TXT และ GZ สะดวกในการใช้สำหรับไซต์ขนาดเล็ก (สูงสุด 500 หน้า)

เครื่องกำเนิดที่คล้ายกัน แต่มีการตั้งค่าเพิ่มเติมเล็กน้อยและช่วยให้คุณสร้างแผนที่ได้ถึง 2,000 หน้าฟรี

มีการตั้งค่ามากมาย ให้คุณนำเข้า URL จากไฟล์ CSV สแกนได้ถึง 500 URLs ฟรี

ไม่จำกัดจำนวนหน้าในการสแกน แต่สำหรับไซต์ขนาดใหญ่ กระบวนการสร้างอาจหยุดนิ่งเป็นเวลาหลายสิบนาที

โปรแกรมท้องถิ่นสำหรับสร้าง XML Sitemap

เครื่องมือสร้างแผนผังเว็บไซต์ G-Mapper

เครื่องสร้างแผนผังเว็บไซต์รุ่นเดสก์ท็อปฟรีสำหรับ Windows

กรีดร้องกบ SEO Spider

เครื่องมือสร้างแผนผังเว็บไซต์ที่ยืดหยุ่นพร้อมการตั้งค่ามากมาย สะดวกหากคุณใช้กบหน้าจอสำหรับงาน SEO อื่นๆ อยู่แล้ว หลังจากรวบรวมข้อมูลไซต์แล้ว ให้ใช้รายการเมนู Sitemaps -> Create XML Sitemap

แมงมุมเน็ตพีค

โซลูชันที่ยืดหยุ่นน้อยลง แต่ยังสะดวกสำหรับการสร้าง sitemap.xml ที่รวดเร็ว หลังจากรวบรวมข้อมูลไซต์แล้ว คุณต้องใช้เครื่องมือ -> สร้างรายการเมนูแผนผังไซต์

แผนผังเว็บไซต์เป็นไฟล์ที่มีลิงก์ไปยังหน้าเว็บไซต์ที่แจ้งเครื่องมือค้นหาเกี่ยวกับโครงสร้างเว็บไซต์ปัจจุบัน Yandex รองรับรูปแบบ XML และ TXT รูปแบบ XML ช่วยให้สามารถถ่ายโอนข้อมูลเพิ่มเติมได้

บันทึก. ยานเดกซ์ไม่รับประกันว่า URL ทั้งหมดที่ระบุในไฟล์จะรวมอยู่ในผลการค้นหา

  1. ข้อกำหนดไฟล์
  2. คำถามและคำตอบ

คุณต้องการ Sitemap เมื่อใด

ยานเดกซ์พัฒนาอัลกอริธึมพิเศษโดยที่หุ่นยนต์สร้างดัชนีเรียนรู้เกี่ยวกับไซต์ เช่น การใช้ ลิงก์ที่เชื่อมโยงหน้าต่างๆ ของไซต์หนึ่งๆ หน้าสามารถ \ n อยู่ในไดเร็กทอรีต่างๆ ของโดเมนเดียวกันหรือในโดเมนย่อย

"}}">ภายในและ ลิงค์ที่อยู่ในเว็บไซต์อื่น "))"> ภายนอก ลิงค์ - ย้ายจากหน้าหนึ่งไปอีกหน้าหนึ่ง บางครั้งหุ่นยนต์สามารถข้ามหน้าได้ ใช้แผนผังไซต์หากไซต์ของคุณ:

    จำนวนมากของหน้า;

    แยกหน้าไม่มีลิงค์นำทาง;

    รังลึก

รูปแบบที่รองรับโดย Yandex

ข้อจำกัด Yandex Search ไม่รองรับการส่ง RSS และ Atom feeds โดยใช้ไฟล์ Sitemap

ข้อกำหนดไฟล์

    ขนาดไฟล์สูงสุดที่ไม่บีบอัดคือ 50 MB

    วางไฟล์บนโดเมนเดียวกับเว็บไซต์ที่สร้างไฟล์

    เมื่อเข้าถึงไฟล์ เซิร์ฟเวอร์ควรส่งคืนรหัส HTTP 200

วิธีสร้างไฟล์และรายงานไปยัง Yandex

คุณสามารถลบข้อมูลแผนผังไซต์ได้หากจำเป็น

คำถามและคำตอบ

แผนผังเว็บไซต์แสดงในบริการเป็นหน้าที่ยกเว้นโดยมีสถานะ "รูปแบบเอกสารไม่ถูกต้อง"

การแสดงแผนผังเว็บไซต์ (เช่นเดียวกับไฟล์ XML อื่นๆ) เป็นหน้าที่ยกเว้นมีไว้เพื่อให้ข้อมูลเท่านั้น และไม่ส่งผลต่อการจัดทำดัชนีเว็บไซต์หรือการประมวลผลแผนผังเว็บไซต์ในทางใดๆ

ไฟล์แผนผังเว็บไซต์สามารถแสดงในกลุ่มของหน้าที่แยกออกได้ เนื่องจากโรบ็อตพยายามสร้างดัชนีให้เป็นหน้าปกติ ในขณะที่ไฟล์ XML จะไม่ถูกสร้างดัชนีในเครื่องมือค้นหา Yandex และไม่รวมอยู่ในผลการค้นหา

เกิดข้อผิดพลาด "แท็กที่ไม่รู้จัก" ขณะประมวลผลแผนผังเว็บไซต์

แผนผังเว็บไซต์สามารถมีองค์ประกอบ XML บางอย่างเท่านั้น หากผู้ดูแลเว็บตรวจพบองค์ประกอบอื่นๆ ในไฟล์ (เช่น การบ่งชี้รุ่นมือถือหรือเวอร์ชันหลายภาษา ที่อยู่รูปภาพ) ผู้ดูแลเว็บจะแสดงข้อผิดพลาด "แท็กที่ไม่รู้จัก" องค์ประกอบที่ไม่สนับสนุนจะถูกละเว้นโดยโรบ็อตเมื่อประมวลผลแผนผังเว็บไซต์ ในขณะที่ข้อมูลจากองค์ประกอบที่สนับสนุนจะถูกนำมาพิจารณา ดังนั้นจึงไม่จำเป็นต้องเปลี่ยนแผนผังเว็บไซต์

หากเนื้อหาของไฟล์มีการเปลี่ยนแปลง อาจใช้เวลาถึงสองสัปดาห์ในการอัปเดตข้อมูลในเว็บมาสเตอร์

ไฟล์แผนผังเว็บไซต์มีสถานะ "ไม่ได้จัดทำดัชนี"

ไฟล์แผนผังเว็บไซต์อาจไม่ได้รับการจัดทำดัชนีด้วยเหตุผลหลายประการ:

    หุ่นยนต์เพิ่งรวบรวมข้อมูลแผนผังเว็บไซต์และยังไม่ได้ดำเนินการ รอสองสัปดาห์ หากคุณกำลังใช้ไฟล์ดัชนีแผนผังเว็บไซต์ที่มีหลายไฟล์ อาจใช้เวลาในการประมวลผลนานกว่าแผนผังเว็บไซต์เดียว

    ก่อนหน้านี้ไซต์ไม่พร้อมใช้งานสำหรับหุ่นยนต์สร้างดัชนี คุณต้องรอการเยี่ยมชมไซต์ครั้งต่อไปโดยหุ่นยนต์

หากวัตถุประสงค์หลักของ robots.txt คือห้ามการจัดทำดัชนี แผนผังเว็บไซต์ของ sitemap.xml จะทำงานตรงกันข้าม เธอมีหน้าที่รับผิดชอบในการเร่งการจัดทำดัชนีเว็บไซต์และความสมบูรณ์ของการจัดทำดัชนีเว็บไซต์

Sitemap.xml บอกเครื่องมือค้นหาถึงความถี่ที่จำเป็นในการจัดทำดัชนีหน้าใหม่ ในแง่นี้ แผนผังเว็บไซต์มีความสำคัญเป็นพิเศษสำหรับเว็บไซต์ที่มีเนื้อหาที่อัปเดตเป็นประจำ (พอร์ทัลข่าว ฯลฯ) นอกจากนี้ sitemap.xml ยังมีหน้าที่สำคัญทั้งหมดของเว็บไซต์พร้อมการระบุลำดับความสำคัญ

ข้อกำหนดแผนผังเว็บไซต์

แผนผังเว็บไซต์เป็นไฟล์ XML ที่แสดงรายการ URL ของเว็บไซต์รวมกับข้อมูลเมตาที่เชื่อมโยงกับแต่ละ URL (วันที่แก้ไขล่าสุด ความถี่ของการเปลี่ยนแปลง ลำดับความสำคัญที่ระดับเว็บไซต์) เพื่อให้เครื่องมือค้นหาสามารถรวบรวมข้อมูลเว็บไซต์นี้ได้อย่างชาญฉลาดยิ่งขึ้น

จำนวนรวมของ sitemap.xml บนไซต์ไม่ควรเกิน 1,000 รายการ ในขณะที่จำนวนรายการ (url) ในแต่ละรายการไม่ควรเกิน 50,000

หากคุณต้องการแสดงรายการ URL มากกว่า 50,000 รายการ คุณควรสร้างแผนผังเว็บไซต์หลายรายการ

แผนผังเว็บไซต์สามารถบีบอัดด้วยโปรแกรมเก็บถาวร gzip เพื่อลดขนาดได้ แต่ขนาดของแต่ละแผนผังเว็บไซต์ในรูปแบบขยาย (คลายซิป) ไม่ควรเกิน 10 เมกะไบต์

แผนผังเว็บไซต์ไม่จำเป็นต้องอยู่ในรูปแบบ xml ไฟล์... โปรโตคอลอนุญาตให้สร้างแผนที่ในรูปแบบของการรวม (RSS หรือ Atom) หรือในรูปแบบของการง่าย ไฟล์ข้อความพร้อมรายการ URL แบบบรรทัดต่อบรรทัด แต่ "แผนผังเว็บไซต์" ดังกล่าวไม่ได้รวม URL ของเว็บไซต์ทั้งหมด (ในกรณีของการเผยแพร่) หรือไม่มีข้อมูลสำคัญเพิ่มเติม (วันที่และเวลาในการแก้ไขเนื้อหาหน้า) อันที่จริงแล้ว เพื่อประโยชน์ในการใช้แผนผังเว็บไซต์ใน SEO .

โดยระบุการประทับเวลาของการเปลี่ยนแปลงล่าสุด คุณอนุญาตให้โปรแกรมรวบรวมข้อมูลของเครื่องมือค้นหาดึงเฉพาะส่วนย่อยของแผนผังเว็บไซต์ในดัชนี กล่าวคือ โปรแกรมรวบรวมข้อมูลสามารถดึงเฉพาะไฟล์เว็บไซต์ (หน้า) ที่ได้รับการแก้ไขหลังจากวันที่หนึ่งๆ กลไกนี้สำหรับการแตกไฟล์บางส่วนจาก Sitemap.xml ช่วยให้คุณค้นพบ URL ใหม่บนไซต์ขนาดใหญ่ได้อย่างรวดเร็ว นอกจากนี้ยังช่วยให้คุณลดภาระงานทั้งบนเซิร์ฟเวอร์และโปรแกรมรวบรวมข้อมูลของเครื่องมือค้นหา และพวกเขา (เสิร์ชเอ็นจิ้น) ชื่นชอบสิ่งหลังมาก

การรวมแผนผังเว็บไซต์กับ robots.txt และเมตาแท็กของโรบ็อต

เมื่อใช้อย่างถูกต้อง คำแนะนำ sitemap.xml ควรส่งเสริมซึ่งกันและกัน มีอยู่ กฎสามข้อที่สำคัญที่สุดการโต้ตอบของคำแนะนำเหล่านี้:

  • sitemap.xml, robots.txt และเมตาแท็กของโรบ็อตไม่ควรขัดแย้งกันเอง
  • หน้าเว็บทั้งหมดที่ยกเว้น (บล็อก) ใน robots.txt และเมตาแท็กของโรบ็อตควรแยกออกจาก sitemap.xml
  • หน้าที่รวบรวมข้อมูลทั้งหมดที่อนุญาตโดย robots.txt จะต้องอยู่ใน sitemap.xml

ข้อยกเว้นกฎสามข้อ

นอกจากนี้ยังมีข้อยกเว้นสำหรับกฎสามข้อนี้ และเช่นเคย พวกมันเชื่อมโยงกับหน้าการแบ่งหน้า เริ่มจากส่วนที่สองขึ้นไปบนหน้าการแบ่งหน้า เราลงทะเบียน noindex ตามด้วย meta tag ของโรบ็อต ในขณะที่หน้าการแบ่งหน้าจะไม่ถูกปิดจากการจัดทำดัชนีใน robots.txt

ตั้งค่าวันที่และเวลาของการเปลี่ยนหน้าให้เท่ากับวันที่และเวลาของการเปลี่ยนแปลงหน้าหลัก (หน้าแรก, หน้าหลัก) ของแค็ตตาล็อก โดยหลักการแล้วเราสามารถเห็นด้วยกับสิ่งนี้ได้

เครื่องมือเพิ่มประสิทธิภาพโรงเรียนเก่าแนะนำให้เพิ่มเฉพาะหน้าที่ไม่ได้จัดทำดัชนีหรือเปลี่ยนแปลงไปยังไฟล์ sitemap.xls ของคุณ หน้าที่รวมอยู่ในดัชนีควรถูกลบออกจากแผนผังเว็บไซต์ แต่ด้วยความเห็นนี้จึงยากที่จะเห็นด้วย หากมีฟิลด์ Lastmod และกรอกอย่างถูกต้อง ก็ไม่มีความจำเป็นสำหรับความสุขดังกล่าว

ปัญหาหลักเมื่อใช้ sitemap.xml

ระหว่างการดำเนินการ ฉันมักพบข้อผิดพลาดต่อไปนี้:

  1. ความไม่สอดคล้องกันของ sitemap.xml กับหน้าเว็บไซต์ แผนผังเว็บไซต์ที่ล้าสมัย ปัญหานี้เกิดขึ้นเมื่อไม่ได้สร้างแผนผังเว็บไซต์แบบไดนามิก แต่ในบางครั้ง โดยการเริ่มบริการบางอย่างใน CMS หรือแม้แต่บริการของบุคคลที่สาม ในกรณีนี้ หน้าที่ตายแล้วจำนวนมากปรากฏขึ้น ทำให้เกิดข้อผิดพลาด 404 (นี่คือถ้าหน้าถูกลบทางกายภาพหรือย้ายไปที่อื่น URL จะถูกเปลี่ยน) นอกจากนี้ หน้าใหม่จะได้รับการจัดทำดัชนีช้ากว่ามาก เนื่องจากไม่อยู่ใน sitemap.xml
  2. ข้อผิดพลาดถัดไปคือโครงสร้าง sitemap.xml ที่ไม่ถูกต้อง ข้อผิดพลาดนี้มักเกิดขึ้นใน CMS ที่ "เขียนเอง" หรือเมื่อใช้ปลั๊กอินที่ไม่ถูกต้องสำหรับ CMS ยอดนิยม สิ่งนี้สร้างไฟล์ sitemap.xml ที่ละเมิดโครงสร้างที่อธิบายโดยโปรโตคอล
  3. การแก้ไขข้อผิดพลาดนี้เป็นการจัดการวันที่แก้ไขเรกคอร์ดไม่ถูกต้อง จากมุมมองของโปรโตคอล นี่ไม่ใช่จุดบกพร่อง เนื่องจากฟิลด์ Lastmod เป็นทางเลือก จากมุมมองของ SEO และเสิร์ชเอ็นจิ้น การไม่มีค่าที่ถูกต้องในช่องนี้ (ซึ่งสอดคล้องกับการเปลี่ยนแปลงโดยตรงของเนื้อหา) จะเป็นการลบล้างความสำคัญของไฟล์ sitemap.xml ทั้งหมดโดยสิ้นเชิง เครื่องมือค้นหาจะทำดัชนีหน้าเหล่านั้นใหม่ ซึ่งช่อง Lastmod มีการเปลี่ยนแปลง จะเกิดอะไรขึ้นหากช่องนี้เปลี่ยนแปลงพร้อมกันสำหรับระเบียน (หน้า) ทั้งหมดของเว็บไซต์ นั่นคือ วันที่แก้ไขจะเหมือนกันสำหรับไฟล์ไซต์ทั้งหมด เป็นไปได้มากที่เสิร์ชเอ็นจิ้นจะไม่สนใจแผนผังเว็บไซต์และเว็บไซต์จะถูกสร้างดัชนีใหม่ ตามปกติในขณะที่หน้าที่อยู่ลึก ๆ จะไม่ถูกสร้างดัชนีใหม่เลยหรือจะถูกจัดทำดัชนีใหม่เป็นเวลานานมาก ดังนั้น คุณต้องไม่ใช้ฟิลด์ lastmod เลย (ซึ่งไม่ดี) หรือกำหนดวันที่ของการเปลี่ยนแปลงหน้าที่สำคัญครั้งล่าสุด เช่น เมื่อราคาเปลี่ยนแปลงหรือสินค้าสิ้นสุดหรือคำอธิบายมีการเปลี่ยนแปลง ...
  4. ข้อผิดพลาดกลุ่มถัดไปที่พบคือข้อผิดพลาดทางตรรกะ ซึ่งเกิดจากการละเมิดกฎสามข้อในการรวม robots.txt และ sitemap.xml ในกรณีนี้ คุณสามารถสังเกตการตีอย่างต่อเนื่องของหน้าเว็บในดัชนีและการออกจากที่นั่นทันที อย่างไรก็ตาม สิ่งนี้จะไม่ถูกสังเกตหากมีเมตาแท็ก noindex และรายการใน Sitemap.xml ในกรณีนี้ โปรแกรมรวบรวมข้อมูล (หุ่นยนต์, สไปเดอร์ PS) ที่เข้าสู่หน้าจะไม่สร้างดัชนี
  5. และข้อผิดพลาดสุดท้ายที่มักเกิดขึ้นบนไซต์คือการมี นี่คือหน้าที่มีลิงก์จากแผนผังเว็บไซต์ แต่ไม่มีลิงก์โดยตรงจากหน้าใดๆ ในไซต์ สาเหตุมักเกิดจากการที่หน้าต่างๆ ถูกลบไปอย่าง "มีเหตุผล" (เช่น ถูกวางไว้ในถังขยะใน WordPress) และไม่ใช่ทางกายภาพ นอกจากนี้ยังพบเห็นได้ในไซต์ที่เข้าถึงการ์ดผลิตภัณฑ์โดยใช้สคริปต์และตัวกรองในลักษณะที่ไม่อนุญาตให้สร้างดัชนีผลลัพธ์ของสคริปต์เหล่านี้ อาจมีสาเหตุอื่นที่ทำให้เกิดหน้าเด็กกำพร้าดังกล่าว ทั้งหมดนี้ลดความน่าเชื่อถือของเครื่องมือค้นหาไปยังไซต์และเป็นสัญญาณอันดับลบ

ตามโปรโตคอล หลังจากเปลี่ยนแผนผังเว็บไซต์แล้ว คุณสามารถ ping เครื่องมือค้นหาได้ ในการดำเนินการนี้ คุณต้องสร้างแบบสอบถามประเภทต่อไปนี้

แผนผังเว็บไซต์หรือแผนผังเว็บไซต์เป็นไฟล์ที่สร้างขึ้นเป็นพิเศษพร้อมรายการหน้าทรัพยากรที่จำเป็นต้องจัดทำดัชนี

ทำไมคุณถึงต้องการ Sitemap

Sitemap มีสองประเภท ซึ่งมีรูปแบบและวัตถุประสงค์ต่างกัน:

แผนที่ HTML

มันถูกรวบรวมสำหรับผู้ใช้เพื่อให้ง่ายต่อการนำทางไปยังหน้าต่างๆ ของเว็บไซต์ นี่เป็นองค์ประกอบที่ไม่บังคับ แผนที่ดังกล่าวสามารถคอมไพล์บนไซต์ขนาดใหญ่ที่มีลำดับชั้นที่ซับซ้อนเพื่อความสะดวกของผู้ใช้

แผนที่ XML

มันเป็นสิ่งจำเป็นสำหรับบอทการค้นหา มันเป็นสิ่งสำคัญสำหรับ SEO เนื่องจากมันช่วยให้บอทสร้างดัชนีหน้าของทรัพยากร การมีอยู่ของไฟล์นี้บอกบอทการค้นหาอย่างชัดเจนถึงวิธีการจัดระเบียบโครงสร้างของเว็บไซต์ ดังนั้น Yandex, Google, Bing และเสิร์ชเอ็นจิ้นอื่นๆ จึงมีโอกาสที่จะจัดทำดัชนีโครงการได้ดียิ่งขึ้น

ในบทความนี้เราจะวิเคราะห์การสร้าง XML Maps.

แผนผังเว็บไซต์คืออะไร:

  1. เร่งกระบวนการสร้างดัชนีแบบเต็ม.
    โปรแกรมรวบรวมข้อมูลของ Google สามารถข้ามหน้าที่สร้างหรือแก้ไขล่าสุดได้ และแผนที่จะช่วยนำทาง
  2. ให้ข้อมูลเพิ่มเติม
    คำแนะนำเพิ่มเติมสำหรับหุ่นยนต์ถูกระบุไว้ในแผนที่: พวกเขาจดบันทึกเกี่ยวกับความสำคัญของหน้า ความถี่และวันที่ของการอัปเดต
  3. แสดงจำนวน URL ที่จัดทำดัชนี
    จำเป็นต้องมีสัญญาณจากแผนผังเว็บไซต์เพื่อแสดงลิงก์ที่จัดทำดัชนีใน Search Console.
  4. เร่งกระบวนการยกเลิกการสร้างดัชนีแบทช์
    ในการดำเนินการนี้ ให้สร้างแผนผังเว็บไซต์ชั่วคราว ซึ่งรวมถึงหน้าที่จะลบ ในเรื่องนี้ เขาแนะนำว่าคุณควรระบุวันที่ของการแก้ไขหน้าเว็บครั้งล่าสุด เมื่อมีการกำหนดรหัสข้อผิดพลาด 404 หรือแอตทริบิวต์ noindex การดำเนินการนี้จะบอกให้ Google รวบรวมข้อมูลเนื้อหาของไซต์อีกครั้ง หลังจากผ่านไปสองสามเดือน แผนผังเว็บไซต์ชั่วคราวนี้สามารถลบออกได้

ในเวลาเดียวกัน แม้ว่า Google จะพบลิงก์ในแผนผังเว็บไซต์ แต่ไม่ได้อยู่ในการนำทาง จะไม่ให้น้ำหนักและดัชนีใดๆ แก่ลิงก์ ลิงก์ในแผนผังเว็บไซต์คือคำแนะนำ สิ่งสำคัญที่สุดคือการสร้างลิงก์ที่มีความสามารถ ซึ่งโรบ็อตค้นหาจะค้นหาหน้าที่จำเป็นทั้งหมด

ในกรณีส่วนใหญ่ การเชื่อมโยงหน้าภายนอกและภายในที่มีความสามารถเพียงพอสำหรับโรบ็อตการค้นหาเพื่อเรียนรู้เกี่ยวกับเนื้อหาทั้งหมดของไซต์ หน้า Landing Page, เว็บไซต์องค์กรขนาดเล็กที่มีสองหน้า, นามบัตรหน้าเดียวไม่จำเป็นต้องมีแผนผังเว็บไซต์ - บอทจะเข้าใจหน้าต่างๆ ได้โดยไม่ยาก แผนที่เป็นสิ่งจำเป็นสำหรับไซต์ที่รวบรวมข้อมูลได้ยาก ดังนั้นจึงแนะนำให้สร้างแผนที่สำหรับโครงการอื่นๆ

จำเป็นต้องมีแผนที่สำหรับไซต์ที่มีลักษณะดังต่อไปนี้:

  • โปรเจกต์เพิ่งสร้างไม่นานมานี้ ลิงค์ภายนอก... ในกรณีนี้ บอทการค้นหาจะค้นหาไซต์ได้ยากขึ้น
  • ในโครงสร้างของเว็บไซต์มีเอกสารทางเว็บจำนวนมากที่ไม่เกี่ยวข้องกัน
  • โครงการมีหน้า ส่วน และส่วนย่อยจำนวนมาก
  • โครงสร้างถูกครอบงำโดยเพจไดนามิก
  • เว็บไซต์นี้มีเนื้อหามัลติมีเดีย บอทจะสามารถรับข้อมูลเพิ่มเติมจากแผนผังเว็บไซต์เพื่อแสดงในผลการค้นหา

เสิร์ชเอ็นจิ้นอาจไม่จัดทำดัชนีหน้าที่จำเป็นทั้งหมดของเว็บไซต์ดังกล่าว หากไม่มีไฟล์แผนผังเว็บไซต์ให้โปรแกรมรวบรวมข้อมูล เรามาดูวิธีการสร้างมัน


เกณฑ์พื้นฐานสำหรับการสร้างแผนผังเว็บไซต์

เครื่องมือค้นหามีข้อกำหนดของตนเองในการจัดทำแผนผังเว็บไซต์ที่ผู้ดูแลเว็บต้องคำนึงถึง

ข้อกำหนดทั่วไปสำหรับแผนผังเว็บไซต์:

  1. จำนวน URL ในไฟล์แผนผังเว็บไซต์ต้องไม่เกิน 50,000 รายการ หากมีมากกว่านั้น จำเป็นต้องสร้างแผนผังเว็บไซต์แยกกันหลายรายการ ซึ่งลงทะเบียนไว้ในไฟล์ดัชนีแผนผังเว็บไซต์ สำหรับสิ่งนี้ การสร้างไฟล์แผนผังเว็บไซต์แยกกันหลายๆ ไฟล์ ครั้งละไม่เกิน 50,000 ลิงก์ และจำนวนลิงก์ทั้งหมดอาจเกินขีดจำกัด หลังจากนั้น ไฟล์แผนผังเว็บไซต์หลักทั่วไปจะถูกสร้างขึ้นสำหรับแผนที่หลายแห่ง
  2. ขนาดไฟล์สูงสุดคือ 50 MB ไฟล์สามารถลดขนาดลงได้โดยใช้การบีบอัด แต่ไฟล์นั้นจะต้องไม่บีบอัดให้เหลือน้อยกว่า 50 MB
  3. แผนผังเว็บไซต์ต้องอยู่ในโดเมนเดียวกับเว็บไซต์ที่สร้างขึ้น
  4. คุณสามารถใช้การเข้ารหัส UTF-8 รวมทั้งตัวอักษรละตินและตัวเลข
  5. ในการเข้าถึงไฟล์แผนผังเว็บไซต์ จะต้องมีสถานะ HTTP พร้อมรหัส 200 OK
  6. ตัวระบุ URL เซสชันไม่ควรอยู่ในแผนผังไซต์
  7. ลิงค์ต้องมีรูปแบบเดียวกัน
  8. แผนที่ประกอบด้วย URL ตามรูปแบบบัญญัติเท่านั้น
  9. แผนที่ไม่ขัดแย้งกับข้อมูลใน robots.txt - หากบางหน้าใน robots.txt ถูกปิดจากการจัดทำดัชนี ก็ไม่ควรอยู่ในแผนที่

เว็บมาสเตอร์บางคนกังวลเกี่ยวกับลำดับของลิงก์ในไฟล์ แต่ตัวแทนของ Google กล่าวว่าลำดับนั้นไม่สำคัญเลย สิ่งสำคัญคือการใส่ลิงก์ตามรูปแบบบัญญัติที่สำคัญที่สุดในแผนผังเว็บไซต์


รูปแบบแผนผังเว็บไซต์ที่ยอมรับได้

มีข้อกำหนดพิเศษสำหรับรูปแบบไฟล์แผนผังเว็บไซต์ คุณสามารถสร้างแผนผังเว็บไซต์เป็นไฟล์ XML ไฟล์ข้อความ หรือผ่าน RSS, mRSS และ Atom 1.0 ยานเดกซ์ชี้ให้เห็นว่าการค้นหาไม่รองรับการส่งฟีด RSS และ Atom โดยใช้แผนผังเว็บไซต์ หากกำหนดเป้าหมายเครื่องมือค้นหาอื่น ให้ใช้รูปแบบ XML กฎสำหรับการสร้างไฟล์มีอธิบายไว้ในมาตรฐาน

แท็กแผนผังเว็บไซต์บริการ

แท็กแผนผังเว็บไซต์ที่จำเป็น:

  • - ภาชนะที่ระบุมาตรฐานโปรโตคอล
  • - родительский тег для каждой записи URL-адреса;
  • https://appcube.ru/th/ - указание URL, начинается с префикса, к примеру, http или https.

Дополнительные теги:

  • - частота обновления веб-документа с атрибутами never, always, yearly, monthly и так далее;
  • - дата последнего обновления на странице;
  • Указание разной важности страниц ресурса от 0,1 до 1, определяет очередность обработки URL на этом сайте. Google его не поддерживает. Приоритет можно дать самым важным страницам и нет смысла указывать высокий приоритет всем ссылкам, тогда тег вообще ни на что не повлияет.

Другие языковые версии сайта указывают с помощью атрибута hreflang .

Пример Карты сайта в формате XML

Sitemap для сайт, если бы он состоял из одной страницы и содержал упомянутые теги, мог бы выглядеть так:

http://www.сайт/ 2016-03-21 daily 0.8

วิธีสร้างและจะวางแผนผังเว็บไซต์ได้อย่างไร

หากคุณต้องการ คุณสามารถสร้าง Sitemap ด้วยตนเอง แต่มันลำบากเกินไปและไร้จุดหมาย - แผนผังเว็บไซต์ควรเป็นไดนามิกหากคุณอัปเดตเว็บไซต์เป็นประจำ - เผยแพร่รายการบล็อกใหม่ พัฒนาร้านค้าออนไลน์ ดีกว่าที่จะสร้างแผนผังเว็บไซต์โดยอัตโนมัติโดยติดต่อบริการ บริการออนไลน์ฟรีและปลั๊กอินสำหรับ CMS

บริการสร้างแผนผังเว็บไซต์