XML Sitemap je poseban dokument koji sadrži listu svih stranica na veb sajtu kako bi pružio pregled svih dostupnih sadržaja pretraživačima. Njegova implementacija se snažno preporučuje, posebno na većim veb sajtovima (sa više od 500 stranica).
Sledite sledeće najbolje prakse prilikom implementacije XML Sitemap-a:
- Održavajte XML Sitemap ažurnim sa sadržajem vašeg veb sajta
- Obezbedite da bude čist: uključite samo stranice koje treba indeksirati
- Referišite na XML Sitemap u vašem robots.txt fajlu
- Ne navodite više od 50.000 URL-ova u jednom XML Sitemap-u
- Proverite da (nekomprimovana) veličina fajla ne prelazi 50MB
- Nemojte preterivati sa svojstvima lastmod, priority i changefreq podacima
Implementacija XML Sitemap-a pomaže pretraživačima da bolje razumeju strukturu i sadržaj vašeg veb sajta, što može poboljšati vašu vidljivost na pretraživačima i povećati organski saobraćaj. Takođe, pomaže u tome da se pretraživači ažuriraju sa novim ili promenjenim sadržajem vašeg sajta. Zapamtite da čista i ažurna XML Sitemap može biti dragocen alat za SEO (optimizaciju za pretraživače) vašeg veb sajta.
Šta je XML Sitemap?
XML Sitemap je poseban dokument namenjen pretraživačima koji sadrži listu svih stranica na veb sajtu. Možemo ga uporediti sa telefonskim imenikom: on obaveštava pretraživače o dostupnom sadržaju i kako da ga pronađu. Dodatno, može pružiti dodatne informacije, kao što je datum poslednjeg ažuriranja i relativni značaj sadržaja.
XML Sitemapovi su veoma korisni za pretraživače, jer im pružaju jedinstven pregled svih dostupnih sadržaja odjednom. To im služi kao početna tačka kada prvi put prolaze kroz vaš veb sajt i kao način da brzo otkriju novi sadržaj koji je dodat.
Važno je napomenuti razliku između XML sitemapova i “običnih” sitemapova (takođe nazvanih “HTML sitemapovi”). Ti sitemapovi su namenjeni vašim posetiocima kako bi pronašli sadržaj na vašem veb sajtu, dok su XML sitemapovi namenjeni pretraživačima.
Zašto je važno brinuti o XML Sitemapu?
XML Sitemapovi pomažu pretraživačima da procene sadržaj vašeg veb sajta i služe kao mehanizam za obaveštavanje o novom ili ažuriranom sadržaju. Stoga se preporučuje da ih implementirate kad god je to moguće. Posebno za veće veb sajtove (sa više od 500 stranica), XML Sitemapovi postaju prava obavezna stavka.

Preuzeto sa: https://backlinko.com/hub/seo/sitemaps
Kako izgleda XML Sitemap?
XML Sitemap je namenjen pretraživačima, pa su formatirani u jeziku koji je lako razumljiv računarima: XML. Srećom, XML je takođe prilično čitljiv za ljude, pa hajde da pogledamo primer:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.contentkingapp.com/</loc>
<lastmod>2017-06-14T19:55:25+02:00</lastmod>
</url>
<url>
<loc>https://www.contentkingapp.com/blog/</loc>
<lastmod>2016-06-24T10:23:20+02:00</lastmod>
</url>
</urlset>
Da bismo shvatili šta se dešava, hajde da razmotrimo pojedinačne delove!
XML Sitemap je poseban dokument koji lista sve stranice na veb sajtu i namenjen je pretraživačima. Može se uporediti sa telefonskim imenikom: obaveštava pretraživače o dostupnom sadržaju i kako da ga pronađu. Dodatno, može pružiti dodatne informacije, kao što je datum poslednjeg ažuriranja i relativni značaj sadržaja.
XML Sitemapovi su veoma korisni za pretraživače jer im pružaju jedinstven pregled svih dostupnih sadržaja odjednom. To im služi kao početna tačka kada prvi put prolaze kroz vaš veb sajt i kao način da brzo otkriju novi sadržaj koji je dodat.
Važno je napomenuti razliku između XML sitemapova i “običnih” sitemapova (takođe nazvanih “HTML sitemapovi”). Ti sitemapovi su namenjeni vašim posetiocima kako bi pronašli sadržaj na vašem veb sajtu, dok su XML sitemapovi namenjeni pretraživačima.
Zašto je važno obratiti pažnju na XML Sitemap?
XML Sitemapovi pomažu pretraživačima da procene sadržaj vašeg veb sajta i služe kao mehanizam za obaveštavanje o novom ili ažuriranom sadržaju. Stoga je preporučljivo da ih implementirate kad god je to moguće. Posebno za veće veb sajtove (sa više od 500 stranica), XML Sitemapovi postaju prava neophodnost.

Kako izgleda XML Sitemap?
XML Sitemap je namenjen pretraživačima, pa je formatiran u jeziku koji je lako razumljiv računarima: XML. Srećom, XML je takođe prilično čitljiv za ljude, pa hajde da pogledamo primer:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.contentkingapp.com/</loc>
<lastmod>2017-06-14T19:55:25+02:00</lastmod>
</url>
<url>
<loc>https://www.contentkingapp.com/blog/</loc>
<lastmod>2016-06-24T10:23:20+02:00</lastmod>
</url>
</urlset>
Da bismo shvatili šta se dešava, hajde da razmotrimo pojedinačne delove:
XML Header
<?xml version="1.0" encoding="UTF-8"?>
Ništa novo ovde, kao i kod XML Sitemap fajla, prvo definišemo da je fajl u XML formatu i koja karakterna kodiranja se koristi.
Definicija URL seta
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
Sada, umesto definicije urlset-a vidimo definiciju sitemapindex-a. Ova definicija obuhvata sve sitemape koji se nalaze u sitemap index-u i ponovo definiše koja verzija XML Sitemap standarda se koristi. Baš kao što je definicija urlset-a, i definicija sitemapindex-a se zatvara na dnu dokumenta:
</sitemapindex>
Definicija pojedinačnih sitemapova
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
I onda prelazimo na suštinu: stvarnu definiciju pojedinačnih sitemapova. Baš kao i za URL-ove, svaka definicija sitemap-a mora sadržavati bar loc-tag, koji sadrži punu URL adresu pojedinačnog XML Sitemap-a.
Osim toga, definicija sitemap-a može opciono sadržavati definiciju lastmod-a. Datum kada je referencirani XML sitemap poslednji put ažuriran. Ponovo u “W3C datetime” formatu.

Gde treba da stavim svoj XML Sitemap Index?
Slično kao i kod XML Sitemapova, postoji konvencija za lokaciju i naziv XML Sitemap Index-a: /sitemap_index.xml. Ali ponovo ste slobodni da odstupite od toga, sve dok ga referišete u vašem robots.txt fajlu:
Sitemap: http://www.example.com/alternativelocation/alternativefilename.xml
Postoje li neka ograničenja za XML Sitemapove?
XML Sitemapovi imaju nekoliko ograničenja koja treba imati u vidu:
- Ne smeju sadržavati više od maksimalno 50.000 URL-ova.
- Njihova veličina fajla je ograničena na 50MB kada je nekompresovana.
Ako vaš XML Sitemap prelazi ova ograničenja, morate ga podeliti na više XML Sitemapova i koristiti XML Sitemap Index.
Šta je XML Sitemap Index?
Kada pređete ograničenja za jedan XML Sitemap, treba ih podeliti u zasebne XML Sitemape i grupisati ih sa XML Sitemap Indexom. Ovo je zaseban XML fajl koji referiše različite XML Sitemapove.
Hajde da pogledamo primer:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap2.xml.gz</loc>
<lastmod
>2005-01-01</lastmod>
</sitemap>
</sitemapindex>
Ovaj XML Sitemap Index referiše na dva XML Sitemap-a: sitemap1.xml.gz i sitemap2.xml.gz. Hajde da analiziramo i ovaj fajl!
XML Header
<?xml version="1.0" encoding="UTF-8"?>
Ništa novo ovde, kao i kod XML Sitemap fajla, prvo definišemo da je fajl u XML formatu i koja karakterna kodiranja se koristi.
Definicija Sitemap Indexa
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
Sada, umesto definicije urlset-a vidimo definiciju sitemapindex-a. Ova definicija obuhvata sve sitemape koji se nalaze u sitemap index-u i ponovo definiše koja verzija XML Sitemap standarda se koristi. Baš kao što je definicija urlset-a, i definicija sitemapindex-a se zatvara na dnu dokumenta:
</sitemapindex>
Definicija pojedinačnih sitemapova
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
I onda prelazimo na suštinu: stvarnu definiciju pojedinačnih sitemapova. Baš kao i za URL-ove, svaka definicija sitemap-a mora sadržavati bar loc-tag, koji sadrži punu URL adresu pojedinačnog XML Sitemap-a.
Osim toga, definicija sitemap-a može opciono sadržavati definiciju lastmod-a. Datum kada je referencirani XML sitemap poslednji put ažuriran. Ponovo u “W3C datetime” formatu.
Gde treba da stavim svoj XML Sitemap Index?
Slično kao i kod XML Sitemapova, postoji konvencija za lokaciju i naziv XML Sitemap Index-a: /sitemap_index.xml. Ali ponovo ste slobodni da odstupite od toga, sve dok ga referišete u vašem robots.txt fajlu:
Sitemap: http://www.example.com/alternativelocation/alternativefilename.xml
Najbolje prakse za XML Sitemap:
- Održavajte XML Sitemap ažurnim: Osigurajte da vaš XML Sitemap pruža ažuran pregled vašeg veb sajta. Kada god se stranica ukloni, trebalo bi je ukloniti i iz XML Sitemap-a. Ako koristite opcionu lastmod oznaku, pobrinite se da ažurirate vremensku oznaku svaki put kada se stranica promeni.
- Čist XML Sitemap: Uključite samo indeksirane stranice u XML Sitemap. Nemojte uključivati privremene ili skrivene stranice koje ne želite da se prikažu u rezultatima pretraživanja.
- Referenca u robots.txt fajlu: Uvek referišite svoj XML Sitemap u robots.txt fajlu kako biste obavestili pretraživače o njegovom postojanju. To olakšava pretraživačima pronalaženje i indeksiranje vašeg sajta.
- Nemojte preterivati sa brojem URL-ova: Ograničite broj URL-ova u jednom XML Sitemap-u na maksimalno 50.000 kako biste izbegli prekoračenje ograničenja i poboljšali performanse.
- Pravilna struktura URL-ova: Osigurajte da svi URL-ovi u XML Sitemap-u koriste pravilnu strukturu sa punom adresom, uključujući protokol (npr. “http://”).
- Obratite pažnju na veličinu fajla: Veličina nekompresovanog XML Sitemap-a ne sme prelaziti 50MB kako biste obezbedili brzo učitavanje i pretraživanje.
- Konsistentnost sa stvarnim sadržajem: Sadržaj u XML Sitemap-u treba biti u skladu sa stvarnim sadržajem vašeg sajta. Nemojte uključivati stranice koje ne postoje ili su privremeno nedostupne.
Prateći ove najbolje prakse, vaš XML Sitemap će pomoći pretraživačima da efikasnije indeksiraju i razumeju sadržaj vašeg sajta, što može dovesti do bolje vidljivosti na pretraživačima i poboljšati organski saobraćaj na vašem sajtu.
Vaš XML Sitemap treba da opisuje samo stranice koje su indeksirane
To znači da treba izostaviti sve URL-ove koji vode do preusmerenja (npr. statusni kod 301) i nepostojećih stranica (npr. statusni kod 404).
Takođe, ove stranice trebaju biti indeksirane, što znači da su dostupne pretraživačima (nema isključenja u robots.txt fajlu) i da nema direktiva koje zabranjuju pretraživačima indeksiranje stranice (kao što su meta robots, kanonski linkovi ili x-robots-tag).
Držite se podrazumevane lokacije i naziva fajlova
Kada god je to moguće, koristite podrazumevanu lokaciju i naziv za vaš XML Sitemap (/sitemap.xml) i XML Sitemap Index (/sitemap_index.xml). Na taj način će pretraživači najlakše moći da ih pronađu.
Referišite na XML Sitemap u vašem robots.txt fajlu
Ako odstupate od konvencionalne URL adrese vašeg XML Sitemap-a ili XML Sitemap Index-a, trebali biste ih referisati u vašem robots.txt fajlu. Međutim, čak i ako se držite standardne URL adrese, preporučuje se uključiti referencu u robots.txt kako biste osigurali da pretraživači mogu otkriti vaš Sitemap.
Nemojte previše obraćati pažnju na lastmod, priority i changefreq
Iako za svaki URL možete definisati svojstva lastmod, priority i changefreq, to je potpuno opciono. Definisanje ovih svojstava neće naškoditi, i postoji mala mogućnost da će pretraživači koristiti ove informacije, ali opšte je prihvaćeno da pretraživači (uglavnom) ne obraćaju (mnogo) pažnje na njih.
Držite se ograničenja za XML Sitemap-ove
Osigurajte da vaš XML Sitemap ne sadrži više od 50.000 URL-ova i da nekompresovana veličina fajla ne prelazi 50MB. Kada premašite bilo koje od ovih ograničenja, trebali biste podeliti XML Sitemap i koristiti XML Sitemap Index.
Šta znači ekstenzija .gz?
Ekstenzija .gz se dodaje nazivu fajla kada je XML Sitemap kompresovan (putem gzip kompresije). XML Sitemap-ovi koji sadrže mnogo URL-ova obično postaju značajnih veličina fajla, i korišćenjem kompresije može se smanjiti uticaj na skladištenje diska i vreme transfera preko mreže.