Компютри Windows интернет

Как да създадете голяма xml карта на сайта. Карти на сайтове. История на развитието на картата на сайта

Картата на сайта е файл Sitemap.xml, който съдържа списък на всички страници на уебсайт, създаден за ускоряване на индексирането на ресурса. Има и карта на сайта за потребителите - тя е по-скоро като съдържание в книга. Последните се наричат ​​HTML карти и са директория от страници на проекта, които показват йерархията.

Днес ще ви кажем как сами да създадете файл Sitemap.xml, да го качите на уебсайта си и да го добавите към търсачките. Нека да разгледаме създаването на HTML карта.

Sitemap е карта на сайта, директория с връзки към категории, подкатегории, страници на проекти с поддръжка на вградена йерархия (ниво на влагане).Използвайки Sitemap.xml, можете да информирате търсачките Google и Yandex за текущата структура, ниво на влагане, брой страници и връзки към тях.

Примерна карта на сайта

Най-подробната информация за необходимостта от използване на Sitemap.xml е представена в директорията Yandex.Webmaster и Google Webmasters.

  1. Google поддържа четири формата на карта на сайта - .txt, RSS, .xml и„Google сайтове“ (ако ресурсът е направен с помощта на едноименната услуга от Good Corporation). Yandex поддържа само .xml карти.
  2. Google не поддържа маркера .
  3. За Google е задължително добавянето на линк към картата на сайта във файла robots.txt, за да укаже наличността му за разглеждане.

За да посочите пътя до файла Sitemap.xml, можете да използвате акаунта на уеб администратора или да посочите връзката в файл robots.txt. По-добре е да направите и двете. Ако имате уебсайт с огромен брой страници, може да има няколко карти на сайта. Стандартни ограничения на Google:

  • Размерът на файла с карта на сайта е до 50 мегабайта.
  • Броят на връзките е не повече от 50 000.

Търсачката Yandex поставя подобни изисквания.

Значението на картата на сайта не може да бъде подценявано. И днес това е една от първите стъпки при започване на работа по SEO промоция на уеб сайт.

Видове карти

Има два вида карта на сайта:

  1. XML Sitemaps– изчислено да търсят роботи, да събират и обработват всички връзки – категории, подкатегории, отделни страници. Това е набор от тагове, съдържащи връзки към страници и статии.
  2. HTML карта на сайта- За потребители. Това е отделна страница, състояща се от връзки, разделени според категории и подкатегории. По-рядко - като обикновен каталог на съществуващи статии, ако самите категории не са от практическа полза. Често можете да получите достъп до него от менюто на главната страница.

Също така картите могат да бъдат разделени на ръчно създадени и генерирани с помощта на онлайн услуги, плъгини или модули.

Как да създадете файл Sitemap.xml

Създаването на файл Sitemap.xml включва използването на различни методи:

  • Наръчник. Вие сами, чрез всеки редактор (например Notepad ++), задавате тагове и връзки в определен ред.
  • Услуги. Изтегляте необходимите линкове или въвеждате адреса на сайта, като в резултат получавате генериран файл sitemap.xml.
  • Плъгини/модули. Някои двигатели на уебсайтове (CMS) имат вградени плъгини, които ви позволяват да генерирате карти на сайтове с едно кликване. Други изискват допълнителна инсталация.

Няма смисъл да се разглежда в контекста на статията създаването на карта на сайта чрез ръчен метод, тъй като автоматичните правят същото. Освен това човешкият фактор е елиминиран. В крайна сметка винаги можете да направите грешка, да не затворите етикет или да направите нещо нередно.

Създаване на карта на сайта с помощта на онлайн генератор

Изключително прост процес. Просто следвайте инструкциите по-долу:


Тази услуга ви позволява да генерирате карта за сайт с размер не повече от 500 страници. Има и други аналози, които работят на същия принцип.

Връзка чрез плъгини и модули

Първо, нека разгледаме най-популярния двигател в света - WordPress. Предлагаме да изтеглите плъгина Yoast SEO; той е универсален и ще е необходим за оптимизиране на страници за промоция в резултатите от търсачките. Като приятен бонус можете да го използвате за генериране на карта на сайта. Инструкциите са както следва:


Готово Картата на сайта е създадена и е достъпна на site.com/sitemap.xml- тоест намира се в основната папка.

В DataLife Engine (DLE) генераторът на карти вече е вграден и достъпен от контролния панел на проекта; за Joomla трябва да използвате модула OSMap; в Bitrix xml файлът се генерира автоматично; в Drupal можете да използвате XMLSitemap модул за това.

Как да добавите файл Sitemap.xml към уебсайт и да го качите в търсачките

Ако файлът е създаден от CMS, той се намира в корена на сайта. Това означава, че трябва да добавите връзка към Yandex.Webmaster и Google Search Console. Нека се върнем към този процес по-късно.

Ако файлът е създаден ръчно или с помощта на генератор, трябва да го качите в основната папка на сайта, преди да го добавите към акаунта на уеб администратора. Най-лесният начин:


Същото трябва да се направи и с други сайтове, където не е осигурена възможност за автоматично генериране на карта на сайта с помощта на двигател или допълнителен модул. С изключение на това, че нивото на влагане на основните папки може да варира - на много места първо трябва да отидете на пътя public_html.

Следващото е добавянето му към Yandex.Webmaster. Инструкциите са както следва:


При успешно завършване роботът ще знае къде да търси картата и когато посещава уебсайт, ще индексира всички връзки с различни нива на влагане.

За да добавите файл с карта към Google Search Console, трябва да направите следното:


Карта на сайта XML карта на сайта

Картата на сайта е специален файл във формат .xml, съхраняван в основната директория на сървъра. Собствениците на уебсайтове често се интересуват защо е необходима Sitemap и дали наличието/отсъствието на този документ влияе върху промоцията в търсачките? За да отговорите на тези въпроси, разгледайте целта и структурата на картата на сайта.

И така, защо ви е необходима xml Sitemap, какво е това? Картата на сайта е вид директория, състояща се от списък с връзки, водещи към всички секции и страници на сайта. Файлът Sitemap помага на търсачките да индексират интернет проект по-бързо и по-ефективно. Това е особено важно, ако обемът на уеб ресурс възлиза на хиляди или десетки хиляди страници.

[yt=R09Qywy5DXI]

Още видеоклипове в нашия канал - научете интернет маркетинг със SEMANTICA

Важно е! Вашата карта на сайта трябва да включва само страници, които трябва да бъдат в индекса за търсене. Документи със забранено индексиране или частна информация не трябва да се включват в картата на сайта. Картата на сайта също не включва маркирани страници или динамични URL адреси.

Влияе ли Sitemap върху промоцията?

Търсачките няма да песимизират интернет проект поради липсата на този файл. Теоретично роботът трябва самостоятелно да обхожда всички страници на сайта и да ги включва в търсенето. Трябва обаче да имате предвид, че системата може да се срине и да не намери някои уеб документи. Обикновено „проблемните области“ са секции, които могат да бъдат достигнати само чрез дълга верига от връзки и динамично генерирани URL адреси.

От гледна точка на SEO, картата на сайта има определено въздействие, тъй като картата на сайта ускорява значително индексирането. Освен това има повишена вероятност уеб страниците да бъдат индексирани, преди безскрупулни конкуренти да имат време да копират и публикуват съдържанието. Търсачките дават предпочитание на оригиналния източник, докато копи-пейстът е песимизиран.

Как да създадете уебсайт с карта

Най-лесният начин е да използвате някоя от специализираните услуги. Например, онлайн генераторът http://www.mysitemapgenerator.com/ ви позволява да създадете безплатно карта на сайта с до 500 страници. Възможно е да генерирате платени Sitemap без никакви ограничения. Уеб администраторът ще трябва само да посочи адреса на своя сайт и след това да постави получения файл в главната папка на сървъра.

Можете да използвате програмата SiteMap Generator. В полето http:// трябва да въведете адреса на началната страница на сайта, щракнете върху бутона „старт“ и изчакайте, докато се генерира картата на сайта. След това трябва да отидете в раздела „Google Sitemap/XML“, да копирате получения код и да го поставите във файл във формат .xml.

Sitemap xml файл - налични директиви

  • Параметърът Lastmod казва на робота кога документът е актуализиран последно.
  • Тагът priory показва приоритета на документа по отношение на други страници на сайта.
  • Параметърът loc обозначава URL адреса на страницата.
  • Тагът changefreq се използва, за да покаже, че страниците са динамични (документите с параметър „0“ ще бъдат посещавани много рядко от робота).

Как да информирате търсачката за карта на сайта

За да уведомите Yandex, можете да добавите директива за карта на сайта към файла robots.txt. Кодът ще изглежда така:

Карта на сайта: http://yoursite.ru/sitemap.xml

Освен това можете да прехвърлите карта на сайта чрез интерфейса Yandex.Webmaster. За да направите това, трябва да отидете в раздела „Настройки за индексиране“ >> „Файлове на карта на сайта“ и след това да посочите адреса на картата на сайта към системата.

Можете да уведомите Google по същия начин. В лентата с инструменти за уеб администратори отидете на раздела „Обхождане“ >> „Карти на сайтове“.

Тази статия ще ви научи как да създадете карта на сайта и да я споделите с Googlebots.

Създаване и изпращане на Sitemap

Файлови формати на карта на сайта

Google поддържа няколко файлови формата на карта на сайта, описани по-долу. Всички формати трябва да използват стандартен протокол. В момента Google не зачита атрибута Във файлове с карта на сайта.

Всички формати са предмет на следните ограничения: Sitemap може да съдържа максимум 50 000 URL адреса и нейният некомпресиран размер не трябва да надвишава 50 MB. Ако размерът на файла или броят адреси, посочени в него, надвишава тези ограничения, разделете го на няколко части. Можете да създадете индексен файл на Sitemap, изброяващ всички ваши Sitemap и да ги изпратите на Google наведнъж.

Примерен URL адрес, който съдържа не-ASCII знак (ü), както и знак, който изисква екраниране (&):
http://www.example.com/ümlat.html&q=име
Същият URL адрес в кодиране ISO-8859-1 (да се хоства на сървър, използващ това кодиране) и с приложено екраниране:
http://www.example.com/%FCmlat.html&q=име
Същият URL адрес, кодиран в UTF-8 (да бъде хостван на сървър, който използва това кодиране) и с приложено екраниране:
Същият URL адрес с екранирана последователност вместо знака амперсанд:
http://www.example.com/%C3%BCmlat.html&q=име

  • Моля, имайте предвид, че не гарантираме, че ще обходим всеки URL адрес в картата на сайта. Такива файлове само помагат Google определя кои страници смятате за важни.
  • Стойностите за приоритет и changefreq се игнорират, така че няма нужда да ги добавяте.
  • Google чете стойността на lastmod, но само ако е зададена правилно.
  • Как да направите вашата карта на сайта достъпна за Google

    Картата на сайта се анализира само при първото намиране, а не при всяко обхождане на сайта. За да бъде преработен файлът, трябва да ни уведомите, че данните в него са променени. Това се прави с помощта на ping заявка. Не добавяйте една и съща карта на сайта няколко пъти и не изпращайте заявки за ping, освен ако файлът не е модифициран и е нов.

    Има няколко начина да предоставите на Googlebots достъп до вашата Sitemap:

    • Изпратете го на Google с помощта на специален инструмент в Search Console
    • Вмъкнете ред навсякъде във файла robots.txt, указващ местоположението на файла Sitemap:
      Карта на сайта: http://example.com/sitemap_location.xml
    • Използвайте ping заявка. Изпратете HTTP GET заявка:
      http://www.google.com/ping?sitemap=<polniy_url_faila_sitemap>
      Пример:
      http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

    XML карта на сайтае списък с URL адреси на уебсайт в XML формат. Файлът Sitemap е предназначен да информира търсачките (като Google, Bing, Yahoo, Yandex, MSN и други) за страниците на уебсайта, които трябва да бъдат индексирани. Sitemap значително ускорява сканирането на сайта. В допълнение, Sitemap ви позволява да предавате информация за всички страници на вашия сайт, включително тези, които търсачките не могат да получат с обичайното обхождане.

    Създаване на Sitemapе особено полезно, когато:

    • Във вашия сайт нови страници се генерират автоматично и често.
    • Вашият сайт е нов и показва малък брой връзки.
    • Вашият сайт има голям архив от страници със съдържание, които са бедни или изобщо не са свързани една с друга.

    Протокол за XML Sitemaps: Какво съдържа Sitemap?

    В съответствие с XML Sitemaps протоколи изискванията на търсачките, файлът Sitemap трябва да съдържа не повече от 50 000 страници и да не надвишава размера на 10 MB. Това означава, че ако вашият сайт съдържа повече от 50 000 страници и размер на файла Sitemap над 10 MB, трябва да създадете няколко Sitemap.

    ... https://appcube.ru/bg/URL ... ...

    В допълнение към необходимия URL параметър, протоколът XML Sitemaps предоставя допълнителни тагове за всяка страница:

    Lastmod– показва датата на последната промяна.

    Дата (ISO 8601)

    Changefreq– вероятната честота на съдържанието на страницата. Валидни стойности са:

    • винаги – при всяко зареждане на страницата
    • почасово – всеки час
    • daily – всеки ден
    • седмично – веднъж седмично
    • месечно – веднъж месечно
    • годишно – веднъж годишно
    • никога – означава, че съдържанието на страницата остава непроменено.
    Синтаксис:

    Валидна стойност

    Приоритет– приоритетът на страницата спрямо другите страници на вашия сайт. Валидният диапазон - от 0.0 до 1.0. Този маркер позволява на търсачките да знаят кои страници смятате за най-ценни.

    Десетичен знак от 0,0 до 1,0

    Файлът sitemap.xml е инструмент, който позволява на уеб администраторите да информират търсачките за страниците на сайта, които са налични за индексиране. Също така в XML картата можете да посочите допълнителни параметри на страницата: дата на последно обновяване, честота на обновяване и приоритет спрямо други страници. Информацията в sitemap.xml може да повлияе на поведението на робота за търсене и като цяло на процеса на индексиране на нови документи. Картата на сайта съдържа директиви за включване на страници в опашката за обхождане и допълва robots.txt, който съдържа директиви за изключване на страници.

    В това ръководство ще намерите отговори на всички въпроси относно използването на sitemap.xml.

    Имам ли нужда от sitemap.xml

    Търсачките използват карта на сайта, за да намерят нови документи на сайта (това могат да бъдат html документи или медийно съдържание), които не са достъпни чрез навигация, но трябва да бъдат обходени. Наличието на връзка към документ в sitemap.xml не гарантира, че той ще бъде обходен или индексиран, но най-често файлът помага на големите сайтове да бъдат индексирани по-добре. Освен това данните от XML картата се използват за определяне на канонични страници, освен ако не е изрично указано в тага rel=canonical.

    Sitemap.xml е важен за сайтове, където:

    • Някои секции не са достъпни чрез навигационното меню.
    • Има много изолирани страници или слабо свързани страници.
    • Използват се технологии, които не се поддържат слабо от търсачките (например Ajax, Flash или Silverlight).
    • Има много страници и има шанс роботът за търсене да пропусне ново съдържание.

    Ако това не е вашият случай, най-вероятно нямате нужда от sitemap.xml. За сайтове, където всяка страница, важна за индексиране, е достъпна в рамките на 2 кликвания, където JavaScript или Flash технологиите не се използват за показване на съдържание, където се използват канонични и регионални тагове, ако е необходимо, и новото съдържание се появява не по-често, отколкото роботът посещава сайта, във файла sitemap.xml не е необходимо.

    За малки проекти, ако има проблем само с голямо ниво на влагане на документи, той може лесно да бъде разрешен с помощта на HTML карта на сайта, без да се прибягва до използване на XML карта. Но ако решите, че все още имате нужда от sitemap.xml, прочетете това ръководство изцяло.

    Техническа информация

    • Sitemap.xml е текстов файл в XML формат. Търсачките обаче поддържат и текстов формат (вижте следващия раздел).
    • Всяка карта на сайта може да съдържа максимум 50 000 адресаи не тежи повече 50MB(10 MB за Yandex).
    • Можете да използвате gzip компресия, за да намалите размера на файла sitemap.xml и да увеличите скоростта му на трансфер. В този случай използвайте разширението gz (sitemap.xml.gz). В същото време ограниченията за тегло остават за некомпресирани карти на сайтове.
    • Местоположението на Sitemap определя набора от URL адреси, които могат да бъдат включени в Sitemap. Картата, съдържаща адресите на страниците на целия сайт, трябва да се намира в корена. Ако картата на сайта се намира в папка, тогава всички URL адреси в тази карта на сайта трябва да се намират в тази папка или по-дълбоко ().
    • Адресите в sitemap.xml трябва да са абсолютни.
    • Максималната дължина на URL адреса е 2048 знака (1024 знака за Yandex).
    • Специалните знаци в URL адреса (като амперсанд "&" или кавички) трябва да бъдат маскирани в HTML обекта.
    • Страниците, посочени в картата, трябва да показват 200 http статус код.
    • Адресите, посочени в картата, не трябва да се затварят във файла robots.txt или в meta-robots.
    • Картата на сайта не трябва да се затваря в robots.txt, в противен случай търсачката няма да я обходи. Самият файл може да е в индекса, това е нормално.

    Формати на XML карти

    Търсачките поддържат прост формат на текстова карта на сайта, който просто изброява URL адресите на страниците без допълнителни параметри. В този случай файлът трябва да е UTF-8 кодиран и да има разширение .текст.

    Търсачките поддържат и стандартния XML протокол. Google допълнително поддържа карти на сайтове за изображения, видеоклипове и новини.

    Примерна карта на сайта, съдържаща само един адрес.

    https://сайт/ 2018-06-14 daily 0.9

    XML тагове
    urlset
    URL адрес(задължително) - родителският таг за всеки URL.
    лок(задължително) - URL адрес на документа, трябва да е абсолютен.
    lastmod- дата на последната модификация на документа във формат Datetime.
    changefreq- честота на смяна на страницата (винаги, на час, ежедневно, седмично, месечно, годишно, никога). Значението на този етикет е препоръка към търсачките, а не команда.
    приоритет- URL приоритет спрямо други адреси (от 0 до 1) за ред на сканиране. Ако не е указано, стойността по подразбиране е 0,5.

    XML карта за изображения

    Някои оптимизатори вмъкват връзки към изображения в sitemap.xml по същия начин като връзки към HTML документи. Това може да се направи, но е по-добре Google да използва разширение на стандартния протокол и да изпраща допълнителна информация за изображенията заедно с URL адресите. Създаването на XML карти на изображения е полезно, ако изображенията трябва да бъдат сканирани и индексирани и в същото време те не са директно достъпни за бота (например се използва JavaScript).

    Пример за карта на сайта, съдържаща една страница и свързаните с нея изображения

    http://example.com/primer.html http://example.com/kartinka.jpg http://example.com/photo.jpg Вид на Балаклаву Севастополь, Крым http://creativecommons.org/licenses/by-nd/3.0/legalcode

    XML тагове
    изображение: изображение(задължително) - информация за едно изображение. Могат да се използват максимум 1000 изображения.
    изображение:лок(задължително) - път до файла с изображението. Ако се използва CDN, тогава е приемливо да се свърже с друг домейн, ако е потвърден в панела за уеб администратори.
    изображение: надпис- надпис към изображението (може да съдържа дълъг текст).
    изображение: заглавие- заглавно изображение (обикновено кратък текст).
    изображение:гео_локация- мястото на снимане.
    изображение: лиценз- URL адрес на лиценз за изображение. Използва се за разширено търсене на изображения.

    XML карта за видео

    Подобно на картата на изображението, Google също има разширение на протокола за видео карта на сайта, където можете да посочите подробна информация за видео съдържанието, което влияе върху начина, по който се показва при търсене на видео. Видео карта на сайта е необходима, когато сайтът използва видеоклипове, които се хостват локално, и когато индексирането на тези видеоклипове е трудно поради използваните технологии. Ако вграждате видеоклип от YouTube на уебсайта си, тук не е необходима видео карта на сайта.

    Карта на сайта за новини

    Ако имате новинарско съдържание на вашия сайт и участвате в Google News, е полезно да използвате Sitemap за новини, така че Google бързо ще намери най-новите ви материали и ще индексира всички новинарски статии. В този случай картата на сайта трябва да съдържа само адреси на страници, публикувани през последните 2 дни и да съдържа не повече от 1000 URL адреса.

    Използване на множество карти

    Ако е необходимо, можете да използвате няколко карти на сайта, като ги комбинирате в една индексна карта на сайта. Множество sitemap.xml се използват в случаите, когато:

    • Сайтът използва няколко двигателя (CMS).
    • Сайтът има повече от 50 000 страници.
    • Необходимо е да настроите удобно проследяване на грешки в секции.

    Във втория случай всеки голям раздел на сайта има свой собствен sitemap.xml и всички те се добавят към панела за уебмастъри, където е удобно да видите кой раздел има най-много грешки (вижте раздела за намиране на грешки в карта на сайта).

    Ако имате 2 или повече карти на сайта, те трябва да бъдат комбинирани в индексна карта на сайта, която изглежда по същия начин като обикновена карта на сайта (с изключение на наличието на маркери sitemapindex и sitemap вместо urlset и url), има подобни ограничения и може да свързва само към обикновени XML карти (не индексни карти).

    Примерен индекс на Sitemap:

    http://www.example.com/sitemap-blog.xml.gz 2004-10-01T18:23:17+00:00 http://www.example.com/sitemap-webinars.xml.gz 2005-01-01

    sitemapindex(задължително) - определя текущия стандарт на протокола.
    карта на сайта(задължително) - съдържа информация за отделна карта на сайта.
    лок(задължително) - местоположение на карта на сайта (в xml, txt или rss формат за Google).
    lastmod- време на промяна на картата на сайта. Позволява на търсачките бързо да откриват нови URL адреси на големи сайтове.

    Как да създадете sitemap.xml

    Методи за създаване на XML карта на сайта:

    • Вътрешни CMS инструменти.Много CMS вече поддържат създаване на карта на сайта. За да разберете, прочетете документацията за вашата CMS, разгледайте елементите от менюто в административния панел или се свържете с техническата поддръжка на двигателя. Качете файла https://yoursite.com/sitemap.xml на вашия сайт; той може вече да съществува и се генерира динамично.
    • Външни добавки.Ако CMS няма функционалност за генериране на карта на сайта и поддържа плъгини, Google кой плъгин покрива въпроса за sitemap.xml за вашия двигател и го инсталирайте. В някои случаи трябва да се свържете с програмисти, за да напишат подобен плъгин за вас.
    • Отделен скрипт на сайта.Познавайки протокола за XML карта и техническите ограничения, можете сами да създадете sitemap.xml, като добавите скрипт за генериране към CRON. Ако не сте програмист, използвайте другите елементи в този списък.
    • Генератори на карти на сайтове.Има много генератори на sitemap.xml, които сканират вашия сайт и ви дават готова карта за изтегляне. Недостатъкът тук е, че всеки път, когато сайтът се актуализира, трябва ръчно да генерирате карта на сайта.
    • Парсери.Настолните програми, предназначени за технически анализ на уебсайт, обикновено предоставят възможност за изтегляне на sitemap.xml, генериран на базата на обходени страници. Работи подобно на генераторите на карти на сайтове, само че работи локално на вашата машина.

    Популярни онлайн генератори на карти на сайтове

    XML-Sitemaps.com

    Позволява ви да получите sitemap.xml с няколко кликвания. Поддържа XML, HTML, TXT и GZ формати. Удобен за използване при малки сайтове (до 500 страници).

    Подобен генератор, но има малко повече настройки и ви позволява да създадете карта с до 2000 страници безплатно.

    Има много настройки, позволява ви да импортирате URL адреси от CSV файл. Сканира безплатно до 500 URL адреса.

    Няма ограничение за броя страници за сканиране. Но за големи сайтове процесът на генериране може да замръзне за няколко десетки минути.

    Локални програми за генериране на XML Sitemap

    G-Mapper Генератор на карта на сайта

    Безплатна десктоп версия на генератора на карта на сайта за Windows.

    Screaming Frog SEO Spider

    Гъвкав инструмент за генериране на карта на сайта с много настройки. Удобно, ако вече използвате screamin frog за други SEO задачи. След като сканирате сайта, използвайте елемента от менюто Sitemaps -> Create XML Sitemap.

    Netpeak Spider

    По-малко гъвкаво, но също така удобно решение за бързо генериране на sitemap.xml. След като сканирате сайта, трябва да използвате елемента от менюто Инструменти -> Генериране на карта на сайта.