Ten tekst przeczytasz w 7 minut

Sitemap – mapa strony internetowej – jak poprawnie stworzyć?

sitemap mapa strony internetowej

Dobra orientacja w terenie jest nie tylko przywarą podróżników, ale również programów komputerowych specjalnego typu – robotów sieciowych. Niestety większość z tych, które są kluczowe dla skutecznego indeksowania witryny, nie została obdarzona zmysłem nawigacji i wymagają naszej pomocy. W tym momencie, na białym koniu wjeżdża sitemap czyli mapa strony internetowej. 🙂

Optymalizacja strony internetowej składa się z wielu kroków. Doskonałe przygotowanie witryny na niewiele się jednak zda, jeśli roboty sieciowe nie dotrą do wszystkich stron, które powinny znaleźć się w indeksie… I tu na pomoc przybywają mapy, a konkretnie – sitemapy. Ten niepozorny plik XML jest niezbędną wskazówką, która pozwoli robotom sieciowym szybko odkryć każdy ważny element strony, a tym samym – przyspieszyć ich indeksację i pojawienie się w wynikach wyszukiwania.

Sitemap xml – historia protokołu

Pierwsze informacje na temat sitemapy pojawiły się na blogu Google w czerwcu 2005 roku. 

Głównym zadaniem sitemapy miało być dostarczanie do Google informacji na temat zmian na stronie oraz zwiększenie ilości zaindeksowanych podstron. Z perspektywy 15 lat można z pewnością stwierdzić, że zadanie się powiodło – sitemapa do dziś pełni swoja pierwotną rolę. 

Google nie ograniczyło się jedynie do zwiększenia swojego potencjału w zakresie crawlingu – projekt sitemap.xml został obdarzony licencją Creative Commons, tak aby mogły z niego skorzystać także inne wyszukiwarki. Rok później wsparcie dla sitemap.xml zadeklarowało Yahoo! oraz Microsoft, a w kolejnych latach dołączył do nich także Ask.com i IBM. 

Sitemapa – mapa strony internetowej – co to tak właściwie jest?

Sitemapa to lista adresów URL, które chcemy wskazać robotom sieciowym. XML (Extensible Markup Language) to z kolei uniwersalny język znaczników, umożliwiający opisanie danych w sposób uniwersalny, niezależnie od platformy i technologii, z jakiej korzysta dany system. 

Mapa strony powinna zawierać wszystkie adresy, które są ważne i publiczne – strony główne, informacyjne, strony kategorii, produktów itp. W pliku mapy można też, a nawet należy! zawrzeć adresy tych podstron, które nie są umieszczone w menu. Język XML pozwala na ich dokładne opisanie, wraz z zaznaczeniem istotnych danych, np. daty ostatniej modyfikacji podstrony. 

Taki sposób przedstawienia informacji dotyczących tego co dzieje się w obrębie Twojej strony pozwala na szybkie informowanie robotów sieciowych o powstaniu nowych podstron, czy wprowadzenia zmian na tych, które już są. Podanie robotom listy ważnych adresów domeny znacznie przyspiesza jej indeksowanie – program nie musi sam szukać wszystkich elementów, tylko korzysta z podsuniętego mu gotowca. 

Jak wygląda plik sitemap.xml?

SItemap.xml – jak wskazuje zresztą informacja w zamieszczono u góry printscreena – nie posiada wskazówek dotyczących wyświetlania (jak strony stworzone w języku html i css), stąd też jego nieprzyjazna dla zwykłego użytkownika forma. 

sitemap xml
sitemap podgląd kodu

Powyżej znajdują się dwie wersje tego samego pliku – sitemapy strony internetowej klodzko.pl. Pierwsza grafika przedstawia widok w przeglądarce, druga to podgląd kodu tego pliku. Rozszyfrujmy zawarte w nim elementy:

  • <?xml version=”1.0” encoding=”UTF-8”?> – pierwsza informacja oznacza wersję XML, która została wykorzystana do stworzenia pliku, druga dotyczy wykorzystanego standardu kodowania
  • <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9”> – tu otwiera się tag, w którym zostaną umieszczone wszystkie linki zawarte w sitemapie.
  • <loc> – adres podstrony
  • <lastmode> – dodatkowa informacja, w której zawarta jest informacja o ostatniej modyfikacji dokumentu znajdującego się pod podanym adresem.

W tym miejscu mogą znajdować się też inne informacje:

  • <priority> – zawartość tego tagu należy określić w przedziale 0.0 do 1.0, a jego zadaniem jest wskazanie robotom, które podstrony mają być indeksowane w pierwszej kolejności. 

Mapa strony internetowej – XML czy HTML

Sitemap.xml to nie jedyna “mapa strony internetowej”, która może pojawić się w obrębie witryny. Zadaniem mapy HTML jest wskazanie drogi użytkownikowi – np. poprzez zgrupowanie linków do najważniejszych produktów. Z tego rozwiązania korzystają najczęściej duże serwisy internetowe:

mapa strony internetowej html
sitemap html
sitemap

Tego typu mapy stworzone są za pomocą HTML i CSS. Nie zawierają dodatkowych informacji, a linki umieszczone są w tagach tworzących listy:

Czy mapa HTML się przydaje? Z pewnością jest miejscem, w którego stronę mogą kierować się zagubieni użytkownicy witryny. Przy okazji jest to dodatkowe miejsce, w którym znajdują się linki do różnych kategorii, opatrzonych ważnymi dla nas słowami kluczowymi… co może być niezłym wsparciem w zakresie linkowania wewnętrznego. Tworzenie mapy tego typu warto rozważyć w przypadku większych stron – dla małych serwisów nie ma takiej potrzeby.

Mapa strony dla robotów sieciowych – w jakich przypadkach warto ją stworzyć?

Głównym zadaniem pliku sitemap jest wskazanie robotom sieciowym najważniejszych elementów na stronie. Stworzenie odpowiedniego pliku jest niezbędne w kilku przypadkach:

  1. Witryna ma wiele podstron – wielostronicowe serwisy mogą mieć problem z szybkim indeksowaniem – zanim robot znajdzie wszystkie podstrony i je zaindeksuje, może minąć kilka tygodni. Mapa strony i wskazanie na niej najważniejszych punktów pozwoli na skrócenie tego czasu i szybsze umieszczenie domeny w wynikach wyszukiwania.
  2. Witryna jest nowa – świeża domena zazwyczaj nie cieszy się zbyt dużą popularnością wśród internautów i nie jest zbyt chętnie linkowana, co może utrudniać “odkrycie” jej przez roboty sieciowe. Dodanie witryny do Google Search Console a następnie stworzenie pliku XML z listą wszystkich stron, które mają zaistnieć w wyszukiwarce jest najlepszym sposobem umieszczenie witryny w wynikach wyszukiwania.
  3. Witryna ma wiele “ukrytych” podstron – niektóre witryny nie mają rozbudowanego menu i z różnych przyczyn chowają niektóre treści poza obrębem głównych kategorii. W ten sposób działają np. kategorie z archiwalnymi wpisami. Jeśli w tych miejscach również kryją się wartościowe treści, warto zaprosić na nie roboty sieciowe i umożliwić im indeksację tego fragmentu serwisu.
  4. Witryna zniknęła z wyników wyszukiwania – niekiedy zdarza się, że witryna zostanie wyindeksowana i nie wyświetla się w Google. Tego typu błędy zdarzają się nawet największym – czasem wystarczy przypadkiem zmienić tag robots na “noindex”, aby wymazać serwis z SERP-ów. W takich sytuacjach tempo ponownego zaistnienia w wynikach wyszukiwania będzie istotne, a mapa serwisu (zwłaszcza jeżeli wcześniej jej nie było) pozwoli na szybki powrót na dotychczasowe pozycje.

W przypadku małych witryn mapa nie jest konieczna – Google dobrze poradzi sobie z crawlowaniem 5-10 zakładek. Większe witryny, zwłaszcza te często aktualizowane, powinny zadbać o prawidłowe przygotowanie pliku i udostępnienie go robotom.

Sitemap – jak ją zrobić?

Przygotowanie pliku sitemap.xml jest stosunkowo proste, jednak jego ręczne uzupełnianie może być pracochłonne. Na szczęście większość CMS-ów generuje mapy samodzielnie lub umożliwia instalację dedykowanej wtyczki.

Uwaga – najpopularniejszym adresem URL pod którym umieszczane są sitemapy jest www.twoja-witryna.pl/sitemap.xml. Takie umiejscowienie i nazwanie pliku nie jest jednak obowiązkowe. Niektóre automatyczne audyty brak sitemapy pod tym adresem będą rozpatrywać jako błąd i informować o braku pliku XML. Nie należy się jednak tym przejmować. Adres, pod którym jest umieszczona mapa można wskazać w pliku robots.txt:

Jak przygotować sitemapę na stronie bez CMS-a? Najprościej skorzystać z jednego z generatorów dostępnych online. Przed umieszczeniem go na stronie, warto jednak przejrzeć wygenerowany plik – generator, tak samo jak roboty sieciowe, może mieć problem z odnalezieniem stron, które nie są podlinkowane w menu ani w innych miejscach na stronie. Jeżeli nie ma ich w pliku, należy dodać je ręcznie.

Rozmiar sitemap.xml ma znaczenie – maksymalna wielkość pliku sitemap.xml to 50MB. Nie należy również przekraczać liczby adresów przypadających na jedną mapę – tu limit wynosi 50 000 rekordów. W przypadkach, gdy domena składa się z wielu tysięcy podstron, warto plik rozbić na kilka mniejszych i stworzyć indeks map. Z takich rozwiązań korzystają m.in. wtyczki do WP (o których wspominam niżej) oraz silniki sklepowe, które automatycznie generują całe zestawy sitemap. Stworzenie indeksu z mniejszymi mapami pozwoli ominąć problem z ewentualnymi limitami oraz zachować przejrzystą strukturę pliku.

WordPress Sitemap – jak stworzyć?

Jak w przypadku większości zmian w obrębie WordPressa, także i w tym przypadku – jest na to wtyczka! A w zasadzie… cały szereg wtyczek. Tą funkcjonalność oferują chociażby najpopularniejsze wtyczki do SEO – Yoast i All-in-One SEO. 

Obie wtyczki generują kilka sitemap, a katalogi z plikami dostępne są pod adresami:

  • YOAST /sitemap_index.xml
  • All in One SEO  /sitemap.xml

Elementy składowe map można dodawać i usuwać w panelu administracyjnym w sekcjach dotyczących map oraz indeksacji.

Co powinno znaleźć się w pliku sitemap.xml, a co nie?

Stworzenie i udostępnienie robotom indeksującym mapy strony ma na celu pokazanie mocnych elementów witryny i zachęcenie do ich umieszczenia w wynikach wyszukiwania. Mając to na uwadze, warto dbać o aktualność swojej mapy oraz oo umieszczanie w niej informacji, które prowadzą prosto do pożądanych w indeksie podstron. Unikać należy:

  • umieszczania adresów zwracających błąd 404,
  • umieszczania adresów zwracających błąd 301,302,
  • umieszczania adresów niekanonicznych (których adres różni się od adresu zawartego w tagu canonical).

Dodawanie adresów tego typu może powodować problemy z właściwą oceną przez Google. Nie ma się co dziwić – konieczność przechodzenia z punktu A do punktu B nas również frustruje i obniża zaufanie do tych elementów, przez które byliśmy kierowani.

W pliku sitemapy nie warto umieszczać również adresów zablokowanych dla robotów sieciowych (opatrzonych tagiem <meta name=”robots” content=”noindex” />  lub zablokowaych w pliku robots.txt

Mam sitemap.xml, co dalej?

Stworzenie pliku sitemap.xml i umieszczenie go na serwerze to nie koniec wskazówek dla robotów sieciowych. Mapa ma też swoje specjalne miejsce w Google Search Console. 

Po wejściu na GSC należy przejść w zakładkę “MAPY STRONY”, która znajduje się w menu po lewej stronie. W zakładce należy dodać adres mapy – należy wkleić samą końcówkę URL-a, bez adresu domeny – i kliknąć “prześlij”.

Po chwili adres mapy zostanie umieszczony w tabelce “Przesłane mapy witryn”, tu też znajdą się szczegółowe informacje odnośnie mapy – data przesłania, ostatniego odczytu, stanu mapy i ilości wykrytych adresów.

Kliknięcie w adres mapy pozwala na przejście do kolejnego ekranu:

Większej szczegółowości dostarcza kliknięcie w “Zobacz stan w indeksie”, który przenosi nas do zakładki STAN:

Tu znajdują się wszystkie informacje dotyczące zaindeksowania konkretnych podstron oraz informacje o problemach, jakie napotkał Googlebot.

Sitemap.xml – o czym jeszcze warto pamiętać?

Stworzenie mapy strony internetowej to nie koniec – od czasu do czasu warto o ją zaktualizować, zwłaszcza po wprowadzeniu znaczących zmian w zakresie adresów lub struktury strony:

  • wdrożenie certyfikatu SSL i przejście na adres https wymusza konieczność zmian w wszystkich adresów na stronie, 
  • przekierowanie lub usunięcie pojedynczych adresów – wystarczy zmienić ich URL lub usunąć z pliku sitemap.xml
  • całkowita przebudowa witryny.

Aktualizacja sitemap.xml to również jedno z działań, które warto wykonać po wprowadzeniu optymalizacji pod słowa kluczowe. 

Mapa strony internetowej typu sitemap.xml może nie jest tak kolorowa, jak jej klasyczne kuzynki – jednak jej skuteczność procentuje!

Bądź pierwszym który napisze komentarz.

Powiązane artykuły

Pozycjonowanie na długi ogon
Joanna Michalska

Pozycjonowanie na długi ogon – czy warto i dlaczego tak?  Zestaw fraz zapisany w umowie na pozycjonowanie jest zazwyczaj mocno […]

Kampanie SEM – przewagi nad reklamą tradycyjną
Redakcja

Kampanie SEM – przewagi nad kampaniami tradycyjnymi Kampanie SEM zyskują coraz większą popularność wśród firm zlecających reklamę – zastanówmy się jakie […]

Jak pozycjonować stronę – 5 porad
Joanna Michalska

5 podstawowych kwestii przy pozycjonowaniu strony. Ważnym sprzymierzeńcem pozycjonera w walce o pozycje w top 10 wyszukiwarki może być właściciel […]

Speed Update, nowy czynnik rankingowy Google, a pozycjonowanie strony mobile.
Andrzej Simkowski

Szybkość, a pozycjonowanie strony mobile w wyszukiwarce Google Stało się to, o czym świat SEO oraz sami pracownicy firmy Google, […]

Nowy sposób prezentacji hoteli w wynikach organicznych
Bartek

Od kilkunastu godzin wyszukiwarka Google wprowadziła nowy widok dla poszukiwanych hoteli. Nowy widok pojawia się dla fraz związanych z hotelami […]

słownik seo
Słownik SEO – 300 pojęć z zakresu optymalizacji i pozycjonowania stron
Dominika Mączka

Przed Tobą Słownik SEO zawierający ponad 300 pojęć z zakresu pozycjonowania i optymalizacji stron internetowych. To prawdopodobnie największy zbiór krótkich […]