Ten tekst przeczytasz w 7 minut

3 komentarze

Sitemap – mapa strony internetowej – jak poprawnie stworzyć?

Sitemap – mapa strony internetowej – jak poprawnie stworzyć? - zdjęcie nr 1

sitemap mapa strony internetowej

Dobra orientacja w terenie jest nie tylko przywarą podróżników, ale również programów komputerowych specjalnego typu – robotów sieciowych. Niestety większość z tych, które są kluczowe dla skutecznego indeksowania witryny, nie została obdarzona zmysłem nawigacji i wymagają naszej pomocy. W tym momencie, na białym koniu wjeżdża sitemap czyli mapa strony internetowej. 🙂

Pozycjonowanie strony internetowej składa się z wielu kroków. Jednym z pierwszych z nich jest optymalizacja. Doskonałe przygotowanie witryny na niewiele się jednak zda, jeśli roboty sieciowe nie dotrą do wszystkich stron, które powinny znaleźć się w indeksie… I tu na pomoc przybywają mapy, a konkretnie – sitemapy. Ten niepozorny plik XML jest niezbędną wskazówką, która pozwoli robotom sieciowym szybko odkryć każdy ważny element strony, a tym samym – przyspieszyć ich indeksację i pojawienie się w wynikach wyszukiwania.

Sitemap xml – historia protokołu

Pierwsze informacje na temat sitemapy pojawiły się na blogu Google w czerwcu 2005 roku. 
Sitemap – mapa strony internetowej – jak poprawnie stworzyć? - zdjęcie nr 4

Głównym zadaniem sitemapy miało być dostarczanie do Google informacji na temat zmian na stronie oraz zwiększenie ilości zaindeksowanych podstron. Z perspektywy 15 lat można z pewnością stwierdzić, że zadanie się powiodło – sitemapa do dziś pełni swoja pierwotną rolę. 

(Dalszą część artykułu znajdziesz pod formularzem)

Wypełnij formularz i odbierz wycenę

Zapoznamy się z Twoim biznesem i przygotujemy indywidualną ofertę cenową na optymalny dla Ciebie mix marketingowy. Zupełnie za darmo.

Twoje dane są bezpieczne. Więcej o ochronie danych osobowych

Administratorem Twoich danych osobowych jest Verseo spółka z ograniczoną odpowiedzialnością z siedzibą w Poznaniu, przy ul. Węglowej 1/3.

O Verseo

Siedziba Spółki znajduje się w Poznaniu. Spółka jest wpisana do rejestru przedsiębiorców prowadzonego przez Sąd Rejonowy Poznań – Nowe Miasto i Wilda w Poznaniu, Wydział VIII Gospodarczy Krajowego Rejestru Sądowego pod numerem KRS: 0000910174, NIP: 7773257986. Możesz skontaktować się z nami listownie na podany wyżej adres lub e-mailem na adres: ochronadanych@verseo.pl

Masz prawo do:

  1. dostępu do swoich danych,
  2. sprostowania swoich danych,
  3. żądania usunięcia danych,
  4. ograniczenia przetwarzania,
  5. wniesienia sprzeciwu co do przetwarzania danych osobowych,
  6. przenoszenia danych osobowych,
  7. cofnięcia zgody.

Jeśli uważasz, że przetwarzamy Twoje dane niezgodnie z wymogami prawnymi masz prawo wnieść skargę do organu nadzorczego – Prezesa Urzędu Ochrony Danych Osobowych.

Twoje dane przetwarzamy w celu:

  1. obsługi Twojego zapytania, na podstawie art. 6 ust. 1 lit. b ogólnego rozporządzenia o ochronie danych osobowych (RODO);
  2. marketingowym polegającym na promocji naszych towarów i usług oraz nas samych w związku z udzieloną przez Ciebie zgodą, na podstawie art. 6 ust. 1 lit. a RODO;
  3. zabezpieczenia lub dochodzenia ewentualnych roszczeń w związku z naszym uzasadnionym interesem, na podstawie art. 6 ust. 1 lit. f. RODO.

Podanie przez Ciebie danych jest dobrowolne. Przy czym, bez ich podania nie będziesz mógł wysłać wiadomości do nas, a my nie będziemy mogli Tobie udzielić odpowiedzieć.

Twoje dane możemy przekazywać zaufanym odbiorcom:

  1. dostawcom narzędzi do: analityki ruchu na stronie, wysyłki informacji marketingowych.
  2. podmiotom zajmującym się hostingiem (przechowywaniem) strony oraz danych osobowych.

Twoje dane będziemy przetwarzać przez czas:

  1. niezbędny do zrealizowania określonego celu, w którym zostały zebrane, a po jego upływie przez okres niezbędny do zabezpieczenia lub dochodzenia ewentualnych roszczeń
  2. w przypadku przetwarzanie danych na podstawie zgody do czasu jej odwołania. Odwołanie przez Ciebie zgody nie wpływa na zgodność z prawem przetwarzania przed wycofaniem zgody.

Nie przetwarzamy danych osobowych w sposób, który wiązałby się z podejmowaniem wyłącznie zautomatyzowanych decyzji co do Twojej osoby. Więcej informacji dotyczących przetwarzania danych osobowych zawarliśmy w Polityce prywatności.

Google nie ograniczyło się jedynie do zwiększenia swojego potencjału w zakresie crawlingu – projekt sitemap.xml został obdarzony licencją Creative Commons, tak aby mogły z niego skorzystać także inne wyszukiwarki. Rok później wsparcie dla sitemap.xml zadeklarowało Yahoo! oraz Microsoft, a w kolejnych latach dołączył do nich także Ask.com i IBM. 

Sitemapa – mapa strony internetowej – co to tak właściwie jest?

Sitemapa to lista adresów URL, które chcemy wskazać robotom sieciowym. XML (Extensible Markup Language) to z kolei uniwersalny język znaczników, umożliwiający opisanie danych w sposób uniwersalny, niezależnie od platformy i technologii, z jakiej korzysta dany system. 

Mapa strony powinna zawierać wszystkie adresy, które są ważne i publiczne – strony główne, informacyjne, strony kategorii, produktów itp. W pliku mapy można też, a nawet należy! zawrzeć adresy tych podstron, które nie są umieszczone w menu. Język XML pozwala na ich dokładne opisanie, wraz z zaznaczeniem istotnych danych, np. daty ostatniej modyfikacji podstrony. 

Taki sposób przedstawienia informacji dotyczących tego co dzieje się w obrębie Twojej strony pozwala na szybkie informowanie robotów sieciowych o powstaniu nowych podstron, czy wprowadzenia zmian na tych, które już są. Podanie robotom listy ważnych adresów domeny znacznie przyspiesza jej indeksowanie – program nie musi sam szukać wszystkich elementów, tylko korzysta z podsuniętego mu gotowca. 

Jak wygląda plik sitemap.xml?

SItemap.xml – jak wskazuje zresztą informacja w zamieszczono u góry printscreena – nie posiada wskazówek dotyczących wyświetlania (jak strony stworzone w języku html i css), stąd też jego nieprzyjazna dla zwykłego użytkownika forma. 

sitemap xml
sitemap podgląd kodu

Powyżej znajdują się dwie wersje tego samego pliku – sitemapy strony internetowej klodzko.pl. Pierwsza grafika przedstawia widok w przeglądarce, druga to podgląd kodu tego pliku. Rozszyfrujmy zawarte w nim elementy:

  • <?xml version=”1.0” encoding=”UTF-8”?> – pierwsza informacja oznacza wersję XML, która została wykorzystana do stworzenia pliku, druga dotyczy wykorzystanego standardu kodowania
  • <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9”> – tu otwiera się tag, w którym zostaną umieszczone wszystkie linki zawarte w sitemapie.
  • <loc> – adres podstrony
  • <lastmode> – dodatkowa informacja, w której zawarta jest informacja o ostatniej modyfikacji dokumentu znajdującego się pod podanym adresem.

W tym miejscu mogą znajdować się też inne informacje:

  • <priority> – zawartość tego tagu należy określić w przedziale 0.0 do 1.0, a jego zadaniem jest wskazanie robotom, które podstrony mają być indeksowane w pierwszej kolejności. 

Mapa strony internetowej – XML czy HTML

Sitemap.xml to nie jedyna “mapa strony internetowej”, która może pojawić się w obrębie witryny. Zadaniem mapy HTML jest wskazanie drogi użytkownikowi – np. poprzez zgrupowanie linków do najważniejszych produktów. Z tego rozwiązania korzystają najczęściej duże serwisy internetowe:

mapa strony internetowej html
sitemap html
sitemap

Tego typu mapy stworzone są za pomocą HTML i CSS. Nie zawierają dodatkowych informacji, a linki umieszczone są w tagach tworzących listy:

Sitemap – mapa strony internetowej – jak poprawnie stworzyć? - zdjęcie nr 11

Czy mapa HTML się przydaje? Z pewnością jest miejscem, w którego stronę mogą kierować się zagubieni użytkownicy witryny. Przy okazji jest to dodatkowe miejsce, w którym znajdują się linki do różnych kategorii, opatrzonych ważnymi dla nas słowami kluczowymi… co może być niezłym wsparciem w zakresie linkowania wewnętrznego. Tworzenie mapy tego typu warto rozważyć w przypadku większych stron – dla małych serwisów nie ma takiej potrzeby.

Mapa strony dla robotów sieciowych – w jakich przypadkach warto ją stworzyć?

Głównym zadaniem pliku sitemap jest wskazanie robotom sieciowym najważniejszych elementów na stronie. Stworzenie odpowiedniego pliku jest niezbędne w kilku przypadkach:

  1. Witryna ma wiele podstron – wielostronicowe serwisy mogą mieć problem z szybkim indeksowaniem – zanim robot znajdzie wszystkie podstrony i je zaindeksuje, może minąć kilka tygodni. Mapa strony i wskazanie na niej najważniejszych punktów pozwoli na skrócenie tego czasu i szybsze umieszczenie domeny w wynikach wyszukiwania.
  2. Witryna jest nowa – świeża domena zazwyczaj nie cieszy się zbyt dużą popularnością wśród internautów i nie jest zbyt chętnie linkowana, co może utrudniać “odkrycie” jej przez roboty sieciowe. Dodanie witryny do Google Search Console a następnie stworzenie pliku XML z listą wszystkich stron, które mają zaistnieć w wyszukiwarce jest najlepszym sposobem umieszczenie witryny w wynikach wyszukiwania.
  3. Witryna ma wiele “ukrytych” podstron – niektóre witryny nie mają rozbudowanego menu i z różnych przyczyn chowają niektóre treści poza obrębem głównych kategorii. W ten sposób działają np. kategorie z archiwalnymi wpisami. Jeśli w tych miejscach również kryją się wartościowe treści, warto zaprosić na nie roboty sieciowe i umożliwić im indeksację tego fragmentu serwisu.
  4. Witryna zniknęła z wyników wyszukiwania – niekiedy zdarza się, że witryna zostanie wyindeksowana i nie wyświetla się w Google. Tego typu błędy zdarzają się nawet największym – czasem wystarczy przypadkiem zmienić tag robots na “noindex”, aby wymazać serwis z SERP-ów. W takich sytuacjach tempo ponownego zaistnienia w wynikach wyszukiwania będzie istotne, a mapa serwisu (zwłaszcza jeżeli wcześniej jej nie było) pozwoli na szybki powrót na dotychczasowe pozycje.

W przypadku małych witryn mapa nie jest konieczna – Google dobrze poradzi sobie z crawlowaniem 5-10 zakładek. Większe witryny, zwłaszcza te często aktualizowane, powinny zadbać o prawidłowe przygotowanie pliku i udostępnienie go robotom.

Sitemap – jak ją zrobić?

Przygotowanie pliku sitemap.xml jest stosunkowo proste, jednak jego ręczne uzupełnianie może być pracochłonne. Na szczęście większość CMS-ów generuje mapy samodzielnie lub umożliwia instalację dedykowanej wtyczki.

Uwaga – najpopularniejszym adresem URL pod którym umieszczane są sitemapy jest www.twoja-witryna.pl/sitemap.xml. Takie umiejscowienie i nazwanie pliku nie jest jednak obowiązkowe. Niektóre automatyczne audyty brak sitemapy pod tym adresem będą rozpatrywać jako błąd i informować o braku pliku XML. Nie należy się jednak tym przejmować. Adres, pod którym jest umieszczona mapa można wskazać w pliku robots.txt:

Sitemap – mapa strony internetowej – jak poprawnie stworzyć? - zdjęcie nr 12

Jak przygotować sitemapę na stronie bez CMS-a? Najprościej skorzystać z jednego z generatorów dostępnych online. Przed umieszczeniem go na stronie, warto jednak przejrzeć wygenerowany plik – generator, tak samo jak roboty sieciowe, może mieć problem z odnalezieniem stron, które nie są podlinkowane w menu ani w innych miejscach na stronie. Jeżeli nie ma ich w pliku, należy dodać je ręcznie.

Rozmiar sitemap.xml ma znaczenie – maksymalna wielkość pliku sitemap.xml to 50MB. Nie należy również przekraczać liczby adresów przypadających na jedną mapę – tu limit wynosi 50 000 rekordów. W przypadkach, gdy domena składa się z wielu tysięcy podstron, warto plik rozbić na kilka mniejszych i stworzyć indeks map. Z takich rozwiązań korzystają m.in. wtyczki do WP (o których wspominam niżej) oraz silniki sklepowe, które automatycznie generują całe zestawy sitemap. Stworzenie indeksu z mniejszymi mapami pozwoli ominąć problem z ewentualnymi limitami oraz zachować przejrzystą strukturę pliku.

WordPress Sitemap – jak stworzyć?

Jak w przypadku większości zmian w obrębie WordPressa, także i w tym przypadku – jest na to wtyczka! A w zasadzie… cały szereg wtyczek. Tą funkcjonalność oferują chociażby najpopularniejsze wtyczki do SEO – Yoast i All-in-One SEO. 

Obie wtyczki generują kilka sitemap, a katalogi z plikami dostępne są pod adresami:

  • YOAST /sitemap_index.xml
    Sitemap – mapa strony internetowej – jak poprawnie stworzyć? - zdjęcie nr 13
  • All in One SEO  /sitemap.xml
    Sitemap – mapa strony internetowej – jak poprawnie stworzyć? - zdjęcie nr 14

Elementy składowe map można dodawać i usuwać w panelu administracyjnym w sekcjach dotyczących map oraz indeksacji.

Co powinno znaleźć się w pliku sitemap.xml, a co nie?

Stworzenie i udostępnienie robotom indeksującym mapy strony ma na celu pokazanie mocnych elementów witryny i zachęcenie do ich umieszczenia w wynikach wyszukiwania. Mając to na uwadze, warto dbać o aktualność swojej mapy oraz oo umieszczanie w niej informacji, które prowadzą prosto do pożądanych w indeksie podstron. Unikać należy:

  • umieszczania adresów zwracających błąd 404,
  • umieszczania adresów zwracających błąd 301,302,
  • umieszczania adresów niekanonicznych (których adres różni się od adresu zawartego w tagu canonical).

Dodawanie adresów tego typu może powodować problemy z właściwą oceną przez Google. Nie ma się co dziwić – konieczność przechodzenia z punktu A do punktu B nas również frustruje i obniża zaufanie do tych elementów, przez które byliśmy kierowani.

W pliku sitemapy nie warto umieszczać również adresów zablokowanych dla robotów sieciowych (opatrzonych tagiem <meta name=”robots” content=”noindex” />  lub zablokowaych w pliku robots.txt

Mam sitemap.xml, co dalej?

Stworzenie pliku sitemap.xml i umieszczenie go na serwerze to nie koniec wskazówek dla robotów sieciowych. Mapa ma też swoje specjalne miejsce w Google Search Console. 

Po wejściu na GSC należy przejść w zakładkę “MAPY STRONY”, która znajduje się w menu po lewej stronie. W zakładce należy dodać adres mapy – należy wkleić samą końcówkę URL-a, bez adresu domeny – i kliknąć “prześlij”.

Sitemap – mapa strony internetowej – jak poprawnie stworzyć? - zdjęcie nr 15

Po chwili adres mapy zostanie umieszczony w tabelce “Przesłane mapy witryn”, tu też znajdą się szczegółowe informacje odnośnie mapy – data przesłania, ostatniego odczytu, stanu mapy i ilości wykrytych adresów.

Kliknięcie w adres mapy pozwala na przejście do kolejnego ekranu:

Sitemap – mapa strony internetowej – jak poprawnie stworzyć? - zdjęcie nr 16

Większej szczegółowości dostarcza kliknięcie w “Zobacz stan w indeksie”, który przenosi nas do zakładki STAN:
Sitemap – mapa strony internetowej – jak poprawnie stworzyć? - zdjęcie nr 17

Tu znajdują się wszystkie informacje dotyczące zaindeksowania konkretnych podstron oraz informacje o problemach, jakie napotkał Googlebot.

Sitemap.xml – o czym jeszcze warto pamiętać?

Stworzenie mapy strony internetowej to nie koniec – od czasu do czasu warto o ją zaktualizować, zwłaszcza po wprowadzeniu znaczących zmian w zakresie adresów lub struktury strony:

  • wdrożenie certyfikatu SSL i przejście na adres https wymusza konieczność zmian w wszystkich adresów na stronie, 
  • przekierowanie lub usunięcie pojedynczych adresów – wystarczy zmienić ich URL lub usunąć z pliku sitemap.xml
  • całkowita przebudowa witryny.

Aktualizacja sitemap.xml to również jedno z działań, które warto wykonać po wprowadzeniu optymalizacji pod słowa kluczowe. 

Mapa strony internetowej typu sitemap.xml może nie jest tak kolorowa, jak jej klasyczne kuzynki – jednak jej skuteczność procentuje!

Komentarze (3)

Wymagany, ale nie będzie opublikowany