Spis treści
Czytasz teraz:
Sitemap – mapa strony internetowej – jak poprawnie stworzyć?
Zamknij
Dobra orientacja w terenie jest nie tylko przywarą podróżników, ale również programów komputerowych specjalnego typu – robotów sieciowych. Niestety większość z tych, które są kluczowe dla skutecznego indeksowania witryny, nie została obdarzona zmysłem nawigacji i wymagają naszej pomocy. W tym momencie, na białym koniu wjeżdża sitemap czyli mapa strony internetowej. 🙂
Pozycjonowanie strony internetowej składa się z wielu kroków. Jednym z pierwszych z nich jest optymalizacja. Doskonałe przygotowanie witryny na niewiele się jednak zda, jeśli roboty sieciowe nie dotrą do wszystkich stron, które powinny znaleźć się w indeksie… I tu na pomoc przybywają mapy, a konkretnie – sitemapy. Ten niepozorny plik XML jest niezbędną wskazówką, która pozwoli robotom sieciowym szybko odkryć każdy ważny element strony, a tym samym – przyspieszyć ich indeksację i pojawienie się w wynikach wyszukiwania.
Sitemap xml – historia protokołu
Pierwsze informacje na temat sitemapy pojawiły się na blogu Google w czerwcu 2005 roku.
Głównym zadaniem sitemapy miało być dostarczanie do Google informacji na temat zmian na stronie oraz zwiększenie ilości zaindeksowanych podstron. Z perspektywy 15 lat można z pewnością stwierdzić, że zadanie się powiodło – sitemapa do dziś pełni swoja pierwotną rolę.
(Dalszą część artykułu znajdziesz pod formularzem)
Wypełnij formularz i odbierz wycenę
Zapoznamy się z Twoim biznesem i przygotujemy indywidualną ofertę cenową na optymalny dla Ciebie mix marketingowy. Zupełnie za darmo.
Administratorem Twoich danych osobowych jest Verseo spółka z ograniczoną odpowiedzialnością z siedzibą w Poznaniu, przy ul. Węglowej 1/3.
O Verseo
Siedziba Spółki znajduje się w Poznaniu. Spółka jest wpisana do rejestru przedsiębiorców prowadzonego przez Sąd Rejonowy Poznań – Nowe Miasto i Wilda w Poznaniu, Wydział VIII Gospodarczy Krajowego Rejestru Sądowego pod numerem KRS: 0000910174, NIP: 7773257986. Możesz skontaktować się z nami listownie na podany wyżej adres lub e-mailem na adres: ochronadanych@verseo.pl
Masz prawo do:
- dostępu do swoich danych,
- sprostowania swoich danych,
- żądania usunięcia danych,
- ograniczenia przetwarzania,
- wniesienia sprzeciwu co do przetwarzania danych osobowych,
- przenoszenia danych osobowych,
- cofnięcia zgody.
Jeśli uważasz, że przetwarzamy Twoje dane niezgodnie z wymogami prawnymi masz prawo wnieść skargę do organu nadzorczego – Prezesa Urzędu Ochrony Danych Osobowych.
Twoje dane przetwarzamy w celu:
- obsługi Twojego zapytania, na podstawie art. 6 ust. 1 lit. b ogólnego rozporządzenia o ochronie danych osobowych (RODO);
- marketingowym polegającym na promocji naszych towarów i usług oraz nas samych w związku z udzieloną przez Ciebie zgodą, na podstawie art. 6 ust. 1 lit. a RODO;
- zabezpieczenia lub dochodzenia ewentualnych roszczeń w związku z naszym uzasadnionym interesem, na podstawie art. 6 ust. 1 lit. f. RODO.
Podanie przez Ciebie danych jest dobrowolne. Przy czym, bez ich podania nie będziesz mógł wysłać wiadomości do nas, a my nie będziemy mogli Tobie udzielić odpowiedzieć.
Twoje dane możemy przekazywać zaufanym odbiorcom:
- dostawcom narzędzi do: analityki ruchu na stronie, wysyłki informacji marketingowych.
- podmiotom zajmującym się hostingiem (przechowywaniem) strony oraz danych osobowych.
Twoje dane będziemy przetwarzać przez czas:
- niezbędny do zrealizowania określonego celu, w którym zostały zebrane, a po jego upływie przez okres niezbędny do zabezpieczenia lub dochodzenia ewentualnych roszczeń
- w przypadku przetwarzanie danych na podstawie zgody do czasu jej odwołania. Odwołanie przez Ciebie zgody nie wpływa na zgodność z prawem przetwarzania przed wycofaniem zgody.
Nie przetwarzamy danych osobowych w sposób, który wiązałby się z podejmowaniem wyłącznie zautomatyzowanych decyzji co do Twojej osoby. Więcej informacji dotyczących przetwarzania danych osobowych zawarliśmy w Polityce prywatności.
Google nie ograniczyło się jedynie do zwiększenia swojego potencjału w zakresie crawlingu – projekt sitemap.xml został obdarzony licencją Creative Commons, tak aby mogły z niego skorzystać także inne wyszukiwarki. Rok później wsparcie dla sitemap.xml zadeklarowało Yahoo! oraz Microsoft, a w kolejnych latach dołączył do nich także Ask.com i IBM.
Sitemapa – mapa strony internetowej – co to tak właściwie jest?
Sitemapa to lista adresów URL, które chcemy wskazać robotom sieciowym. XML (Extensible Markup Language) to z kolei uniwersalny język znaczników, umożliwiający opisanie danych w sposób uniwersalny, niezależnie od platformy i technologii, z jakiej korzysta dany system.
Mapa strony powinna zawierać wszystkie adresy, które są ważne i publiczne – strony główne, informacyjne, strony kategorii, produktów itp. W pliku mapy można też, a nawet należy! zawrzeć adresy tych podstron, które nie są umieszczone w menu. Język XML pozwala na ich dokładne opisanie, wraz z zaznaczeniem istotnych danych, np. daty ostatniej modyfikacji podstrony.
Taki sposób przedstawienia informacji dotyczących tego co dzieje się w obrębie Twojej strony pozwala na szybkie informowanie robotów sieciowych o powstaniu nowych podstron, czy wprowadzenia zmian na tych, które już są. Podanie robotom listy ważnych adresów domeny znacznie przyspiesza jej indeksowanie – program nie musi sam szukać wszystkich elementów, tylko korzysta z podsuniętego mu gotowca.
Jak wygląda plik sitemap.xml?
SItemap.xml – jak wskazuje zresztą informacja w zamieszczono u góry printscreena – nie posiada wskazówek dotyczących wyświetlania (jak strony stworzone w języku html i css), stąd też jego nieprzyjazna dla zwykłego użytkownika forma.
Powyżej znajdują się dwie wersje tego samego pliku – sitemapy strony internetowej klodzko.pl. Pierwsza grafika przedstawia widok w przeglądarce, druga to podgląd kodu tego pliku. Rozszyfrujmy zawarte w nim elementy:
- <?xml version=”1.0” encoding=”UTF-8”?> – pierwsza informacja oznacza wersję XML, która została wykorzystana do stworzenia pliku, druga dotyczy wykorzystanego standardu kodowania
- <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9”> – tu otwiera się tag, w którym zostaną umieszczone wszystkie linki zawarte w sitemapie.
- <loc> – adres podstrony
- <lastmode> – dodatkowa informacja, w której zawarta jest informacja o ostatniej modyfikacji dokumentu znajdującego się pod podanym adresem.
W tym miejscu mogą znajdować się też inne informacje:
- <priority> – zawartość tego tagu należy określić w przedziale 0.0 do 1.0, a jego zadaniem jest wskazanie robotom, które podstrony mają być indeksowane w pierwszej kolejności.
Mapa strony internetowej – XML czy HTML
Sitemap.xml to nie jedyna “mapa strony internetowej”, która może pojawić się w obrębie witryny. Zadaniem mapy HTML jest wskazanie drogi użytkownikowi – np. poprzez zgrupowanie linków do najważniejszych produktów. Z tego rozwiązania korzystają najczęściej duże serwisy internetowe:
Tego typu mapy stworzone są za pomocą HTML i CSS. Nie zawierają dodatkowych informacji, a linki umieszczone są w tagach tworzących listy:
Czy mapa HTML się przydaje? Z pewnością jest miejscem, w którego stronę mogą kierować się zagubieni użytkownicy witryny. Przy okazji jest to dodatkowe miejsce, w którym znajdują się linki do różnych kategorii, opatrzonych ważnymi dla nas słowami kluczowymi… co może być niezłym wsparciem w zakresie linkowania wewnętrznego. Tworzenie mapy tego typu warto rozważyć w przypadku większych stron – dla małych serwisów nie ma takiej potrzeby.
Mapa strony dla robotów sieciowych – w jakich przypadkach warto ją stworzyć?
Głównym zadaniem pliku sitemap jest wskazanie robotom sieciowym najważniejszych elementów na stronie. Stworzenie odpowiedniego pliku jest niezbędne w kilku przypadkach:
- Witryna ma wiele podstron – wielostronicowe serwisy mogą mieć problem z szybkim indeksowaniem – zanim robot znajdzie wszystkie podstrony i je zaindeksuje, może minąć kilka tygodni. Mapa strony i wskazanie na niej najważniejszych punktów pozwoli na skrócenie tego czasu i szybsze umieszczenie domeny w wynikach wyszukiwania.
- Witryna jest nowa – świeża domena zazwyczaj nie cieszy się zbyt dużą popularnością wśród internautów i nie jest zbyt chętnie linkowana, co może utrudniać “odkrycie” jej przez roboty sieciowe. Dodanie witryny do Google Search Console a następnie stworzenie pliku XML z listą wszystkich stron, które mają zaistnieć w wyszukiwarce jest najlepszym sposobem umieszczenie witryny w wynikach wyszukiwania.
- Witryna ma wiele “ukrytych” podstron – niektóre witryny nie mają rozbudowanego menu i z różnych przyczyn chowają niektóre treści poza obrębem głównych kategorii. W ten sposób działają np. kategorie z archiwalnymi wpisami. Jeśli w tych miejscach również kryją się wartościowe treści, warto zaprosić na nie roboty sieciowe i umożliwić im indeksację tego fragmentu serwisu.
- Witryna zniknęła z wyników wyszukiwania – niekiedy zdarza się, że witryna zostanie wyindeksowana i nie wyświetla się w Google. Tego typu błędy zdarzają się nawet największym – czasem wystarczy przypadkiem zmienić tag robots na “noindex”, aby wymazać serwis z SERP-ów. W takich sytuacjach tempo ponownego zaistnienia w wynikach wyszukiwania będzie istotne, a mapa serwisu (zwłaszcza jeżeli wcześniej jej nie było) pozwoli na szybki powrót na dotychczasowe pozycje.
W przypadku małych witryn mapa nie jest konieczna – Google dobrze poradzi sobie z crawlowaniem 5-10 zakładek. Większe witryny, zwłaszcza te często aktualizowane, powinny zadbać o prawidłowe przygotowanie pliku i udostępnienie go robotom.
Sitemap – jak ją zrobić?
Przygotowanie pliku sitemap.xml jest stosunkowo proste, jednak jego ręczne uzupełnianie może być pracochłonne. Na szczęście większość CMS-ów generuje mapy samodzielnie lub umożliwia instalację dedykowanej wtyczki.
Uwaga – najpopularniejszym adresem URL pod którym umieszczane są sitemapy jest www.twoja-witryna.pl/sitemap.xml. Takie umiejscowienie i nazwanie pliku nie jest jednak obowiązkowe. Niektóre automatyczne audyty brak sitemapy pod tym adresem będą rozpatrywać jako błąd i informować o braku pliku XML. Nie należy się jednak tym przejmować. Adres, pod którym jest umieszczona mapa można wskazać w pliku robots.txt:
Jak przygotować sitemapę na stronie bez CMS-a? Najprościej skorzystać z jednego z generatorów dostępnych online. Przed umieszczeniem go na stronie, warto jednak przejrzeć wygenerowany plik – generator, tak samo jak roboty sieciowe, może mieć problem z odnalezieniem stron, które nie są podlinkowane w menu ani w innych miejscach na stronie. Jeżeli nie ma ich w pliku, należy dodać je ręcznie.
Rozmiar sitemap.xml ma znaczenie – maksymalna wielkość pliku sitemap.xml to 50MB. Nie należy również przekraczać liczby adresów przypadających na jedną mapę – tu limit wynosi 50 000 rekordów. W przypadkach, gdy domena składa się z wielu tysięcy podstron, warto plik rozbić na kilka mniejszych i stworzyć indeks map. Z takich rozwiązań korzystają m.in. wtyczki do WP (o których wspominam niżej) oraz silniki sklepowe, które automatycznie generują całe zestawy sitemap. Stworzenie indeksu z mniejszymi mapami pozwoli ominąć problem z ewentualnymi limitami oraz zachować przejrzystą strukturę pliku.
WordPress Sitemap – jak stworzyć?
Jak w przypadku większości zmian w obrębie WordPressa, także i w tym przypadku – jest na to wtyczka! A w zasadzie… cały szereg wtyczek. Tą funkcjonalność oferują chociażby najpopularniejsze wtyczki do SEO – Yoast i All-in-One SEO.
Obie wtyczki generują kilka sitemap, a katalogi z plikami dostępne są pod adresami:
- YOAST /sitemap_index.xml
- All in One SEO /sitemap.xml
Elementy składowe map można dodawać i usuwać w panelu administracyjnym w sekcjach dotyczących map oraz indeksacji.
Co powinno znaleźć się w pliku sitemap.xml, a co nie?
Stworzenie i udostępnienie robotom indeksującym mapy strony ma na celu pokazanie mocnych elementów witryny i zachęcenie do ich umieszczenia w wynikach wyszukiwania. Mając to na uwadze, warto dbać o aktualność swojej mapy oraz oo umieszczanie w niej informacji, które prowadzą prosto do pożądanych w indeksie podstron. Unikać należy:
- umieszczania adresów zwracających błąd 404,
- umieszczania adresów zwracających błąd 301,302,
- umieszczania adresów niekanonicznych (których adres różni się od adresu zawartego w tagu canonical).
Dodawanie adresów tego typu może powodować problemy z właściwą oceną przez Google. Nie ma się co dziwić – konieczność przechodzenia z punktu A do punktu B nas również frustruje i obniża zaufanie do tych elementów, przez które byliśmy kierowani.
W pliku sitemapy nie warto umieszczać również adresów zablokowanych dla robotów sieciowych (opatrzonych tagiem <meta name=”robots” content=”noindex” /> lub zablokowaych w pliku robots.txt
Mam sitemap.xml, co dalej?
Stworzenie pliku sitemap.xml i umieszczenie go na serwerze to nie koniec wskazówek dla robotów sieciowych. Mapa ma też swoje specjalne miejsce w Google Search Console.
Po wejściu na GSC należy przejść w zakładkę “MAPY STRONY”, która znajduje się w menu po lewej stronie. W zakładce należy dodać adres mapy – należy wkleić samą końcówkę URL-a, bez adresu domeny – i kliknąć “prześlij”.
Po chwili adres mapy zostanie umieszczony w tabelce “Przesłane mapy witryn”, tu też znajdą się szczegółowe informacje odnośnie mapy – data przesłania, ostatniego odczytu, stanu mapy i ilości wykrytych adresów.
Kliknięcie w adres mapy pozwala na przejście do kolejnego ekranu:
Większej szczegółowości dostarcza kliknięcie w “Zobacz stan w indeksie”, który przenosi nas do zakładki STAN:
Tu znajdują się wszystkie informacje dotyczące zaindeksowania konkretnych podstron oraz informacje o problemach, jakie napotkał Googlebot.
Sitemap.xml – o czym jeszcze warto pamiętać?
Stworzenie mapy strony internetowej to nie koniec – od czasu do czasu warto o ją zaktualizować, zwłaszcza po wprowadzeniu znaczących zmian w zakresie adresów lub struktury strony:
- wdrożenie certyfikatu SSL i przejście na adres https wymusza konieczność zmian w wszystkich adresów na stronie,
- przekierowanie lub usunięcie pojedynczych adresów – wystarczy zmienić ich URL lub usunąć z pliku sitemap.xml
- całkowita przebudowa witryny.
Aktualizacja sitemap.xml to również jedno z działań, które warto wykonać po wprowadzeniu optymalizacji pod słowa kluczowe.
Mapa strony internetowej typu sitemap.xml może nie jest tak kolorowa, jak jej klasyczne kuzynki – jednak jej skuteczność procentuje!
Mega
02 wrz 2021, 23:04
Bardzo fajny tekst. Wszystko bardzo jasno wytłumaczone.
Juchcik
07 lut 2022, 22:39
Prosto i przejrzyście opisane , dziękuję za ten wpis, dzięki któremu udało mi się dodać moją stronę do google
Tomasz
13 lut 2022, 22:21
Super wyjaśniony temat map strony