Den ultimative guide til XML sitemaps: Sådan kommer du godt i gang

Med denne guide håber jeg, at du får viden om XML-sitemaps er relevant for dit website samt best practise for, hvordan du kommer godt igang med at bruge XML-sitemaps i dit arbejde med SEO.

Den primære fordel ved XML-sitemaps er, at de sikrer at nyt indhold, opdateret indhold eller slettet indhold på dit website, bliver opfanget af Google så hurtigt som muligt og at disse ændringer på dit website, afspejler sig i Googles indeks så hurtigt som muligt. Jo større dit website er, jo flere indholds-elementer du gør brug af i form af tekst, billeder og video, desto mere relevant er det, at bruge XML-sitemaps til at fortælle de store søgemaskiner, såsom Google om præcis hvad der er ændret, samt hvornår.

Indholdsfortegnelse

Hvad er forskellen på et XML-sitemap og et HTML-sitemap?

Et XML-sitemap er ikke det samme som et traditionelt HTML-sitemap. Et HTML-sitemap er opbygget som en helt almindelige HTML side på et website, og det man typisk ser, er, at her bliver links til samtlige undersider listet, og ofte kan man også se strukturen for websitet på et HTML-sitemap. Et HTML sitemap kan for mindre websites typisk være på en enkelt HTML side, mens store websites kan vælge at opbygge deres HTML-sitemap på flere HTML sider. Hvis et website har et HTML-sitemap, så finder man ofte et link til det placeret i websitets header eller footer.

Her kan du se et eksempel på et HTML sitemap:

Eksempel på HTML-sitemap

Et XML-sitemap er, som navnet angiver, opbygget i XML-format, og her har du mulighed for at oplyse Google om de mange forskellige typer indhold, som du måtte have på dit website:

  • Almindelige HTML sider
  • Billeder
  • Videoer
  • HTML sider med nyheder
  • Indhold målrettet feature phones

Bemærk En feature phone er ikke det samme som en smart phone, forskellen er groft sagt, at du på en smart phone typisk har høj hardware ydelse og du kan downloade og installere apps. Disse muligheder har du ikke eller kun i begrænset omfang på en feature phone. Læs mere om forskellen her. XML-sitemaps til feature phones vil ikke bliver yderligere gennemgået her.

I et XML-sitemap har du mulighed for at angive forskellige oplysninger om hver enkelt type indhold på dit website, og det vi oftest ser, er, at websites laver et XML-sitemap over alle deres almindelige HTML sider, og du kan se et konkret eksempel på sådan et XML-sitemap her:

Eksempel på et XML-site til almindelie HTML sider.

Hvilke fordele giver XML-sitemaps? Opnår man bedre placeringer i Googles søgeresultater?

Hvis dit website har en god webarkitektur, hvor Googlebot uden problemer kan crawle hele dit website og finde frem til alle sider, billeder, videoer m.v. som du har på dit website, så vil du ikke opnå bedre placeringer i Googles søgeresulater ved at tilmelde et XML-sitemap til Google.

Du kan til gengæld opnå at:

  • Nyt indhold på dit website bliver indekseret hurtigere
  • Opdateret indhold på eksisterende sider bliver reindekseret hurtigere
  • Indhold der bliver flyttet til en anden URL bliver hurtigere fundet og reindekseret

Dette skyldes, at du til alle URL’er i et XML-sitemap har mulighed for at angive, hvornår indhold er blevet publiseret/opdateret, samt hvor ofte du vurderer, at det bliver opdateret.

Når dit website bliver indekseret hurtigere via et XML-sitemap, så vil du også opnå, at dit website hele tiden er opdateret og “fresh” set i forhold til Googles indeks.

Gennerelle teknisk krav til alle XML-sitemaps

  • Du kan faktisk godt tilmelde en tekstfil, hvor hver linie i filen blot indholder URL’en ind til indholdet – altså uden XML tags, og du kan også tilmelde forskellige typer RSS feeds. Dette bør du dog ikke gøre, for så udnytter du slet ikke alle de muligheder som et XML-sitemap tilbyder. Tillige ser vi også ofte, at eksempelvis RSS feeds ikke indholder links til alle siderne på et website, men blot til de 10 nyeste sider på websitet.
  • Ligesom en tekst kan være gemt i forskellige typer dokumenter, eksempelvis et Word-dokument, en PDF-fil eller et Excell-regneark, så kan en almindelig flad tekstfil til et XML-sitemap også gemmes i forskellige encodings (“formater”). Her skal du sørge for, at dit XML-sitemap er gemt med UTF8 encoding.
  • Hvis du anvender specieltegn i den tekst du skriver i XML-sitemap filen, så skal disse omskrives så de optræder som entiteter i stedet for. Det kan eksempelvis være du bruger danske specieltegn som æ, ø og å eller &-tegn i URL’erne i dit XML-sitemap eller du eksempelvis bruger sådanne specieltegn i titlen for en video i et video-XML-sitemap. Her kan du se eksempler på at specialtegn bliver omskrevet til entiteter:
    • & omskrives til &
    • ” omkskrives til "
    • æ omskrives til æ
    • ø omskrives til ø
    • å omskrives til å
    • etc.
  • Du må – ikke – medtage URL’er til indhold, som du har blokeret imod bliver indekseret. Det kan være du eksempelvis:
    • blokerer imod at dine PDF dokumenter bliver læst af Googlebot via et Disallow: /*.pdf filter i robots.txt eller
    • blokerer imod at farve-varianterne af dine produktsider bliver indekseret ved at benytte canonical

    Hvis det er tilfældet, så må du ikke medtage URL’er for denne type blokeret indhold i dit XML-sitemap.

Hvornår bør man – ikke – bruge et XML-sitemap?

Et XML-sitemap må ikke opfattes som en erstatning for en god webarkitektur, det skal i stedet opfattes som et tillæg til en god webarkitektur. Og hvis du bruger et XML-sitemap forkert, så kan du faktisk ende med at have et XML-sitemap, der “slører”, at dit website har en indekseringsbarriere.

Lad os antage at du tilmelder dit XML-sitemap til Google samtidig med du lancerer dit nye website, og at vi ligeledes antager, at Googlebot faktisk ikke kan finde alt indholdet på dit website via en almindelig gennemlæsning. Så vil Google alligevel kunne finde listen over samtlige URL’er via dit XML-sitemap og så bliver de alle indekseret på den måde. Det medfører så, at du ikke opdager, at du rent faktisk har en indekseringsbarriere på dit website.

Det er vigtigt du sikrer dig, at du ikke har nogen indekseringsbarrierer på dit website, inden du tilmelder dit XML-sitemap til Google, og årsagen er, at der gælder følgende for indhold, som kun kan findes via et XML-sitemap:

  • Google ved ikke hvor henne i din webarkitektur indholdet er placeret
  • Der er ikke noget almindeligt link på dit website, som kan sende ankertekst og PageRank videre til indholdet

Så de sider, der er “ramt” af en skjult indekseringsbarriere, vil meget sjældent opnå gode placeringer i Googles søgeresultater, og vores erfaring er, at ranking og trafik fra disse sider kun opnås på meget unikke longtail søgefraser.

Så hvis du:

  • Lancerer et helt nyt website på et domæne, eller
  • Flytter dit website til en ny teknisk platform hvor alt indholdet skifter til nye URL’er

Så bør du vente med at tilmelde et XML-sitemap til Google (og de andre store søgemaskiner), og holde øje med hvordan dit nye website bliver (re)indekseret i Google.

Hvis det viser sig, at noget af dit indhold ikke kan indekseres, så kan du her opdage det, fordi indholdet ikke bliver indekseret korrekt og ikke fremkommer i Googles søgeresultater. Og du har nu mulighed for at analysere dig frem til årsagen og få fejlene på dit website tilrettet. Først når du er 110% sikker på, at dit website fuldt ud kan gennemlæses og indekseres af søgemaskinerne, så kan du tilmelde dit XML-sitemap til Google, Bing m.v.

Lad os antage at du opdager, at du har en indekseringsbarriere på dit website, og at det af tekniske og/eller økonomisk årsager ikke er muligt at tilrette dit website, så denne indekseringsbarriere bliver fjernet. Så bør du naturligvis efterfølgende stadigvæk tilmelde dit XML-sitemap til Google, for her har du så mulighed for at give dit website “krykker” på. Det er i dette tilfælde bedre at få indekseret alt dit indhold via et XML-sitemap, end at det slet ikke bliver indekseret, og dermed aldrig vil give dig mulighed for at tiltrække organisk trafik til dit website.

Er der en risiko ved at fjerne XML sitemaps igen?

Hvis du har en god webarkitektur, og Googlebot alene via din webarkitektur kan finde og indeksere alt indholdet på dit website. Så risikerer du ikke, at dine sider pludselig forsvinder fra Googles indeks, hvis du eksempelvis ved et uheld skulle komme til at fjerne dit XML-sitemap. Den ulempe som du kan opnå her, er, at det kan tage længere tid for Googlebot at opdage indhold på dit website som er nyt, opdateret, flyttet eller slettet, og dermed er din indeksering i Google ikke så hurtig eller “fresh”, som den kunne være.

Sådan bygger du XML-sitemap til almindelige HTML-sider

Bemærk at der er specielle XML-sitemaps til billeder og video, og disse gennemgås senere i dette blogindlæg. Bemærk ligeledes at man sagtens kan sammenblande almindelige HTML-sider, videoer, billeder, nyheder m.v. i et og samme XML-sitemap. Her bliver det dog gennemgået som om, at man har separate XML-sitemaps til hver type indhold.

TagObli-
gato-
risk
Beskrivelse
<xml>Er aller første linie i dit XML-sitemap og indikerer XML-version samt encoding, eksempelvis:
  • <?xml version=’1.0′ encoding=’UTF-8′?>
<urlset>Bruges til at markere start og slut for hele dit XML-sitemap. Det er også her du angiver standardprotokollen (namespace) via xmlns-attributten. for XML-sitemaps til almindelige HTML sider understøtter Google følgende:
  • <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ >
<url>Bruges til at markere start og slut for en URL og alle de informationer du vælger at medtage for hver URL
<loc>Bruges til at angive URL’en til din HTML-side. (For billeder og video angives her den HTML-side som disse er indlejret på, mere herom senere)
<lastmod>Bruges til at angive dato og tidspunkt for hvornår HTML-siden blev oprettet eller opdateret. Formatet for dato og tidspunkt skal være som følger:
  • YYYY-MM-DDThh:mmTZD

(Hvis du anvender dette felt, så er ‘dato’ obligatorisk, mens angivelse af ‘tidspunkt’ er frivilligt)

<changefreq>Bruges til at give et hint om hvor ofte HTML-siden bliver ændret. Her kan angives følgende væerdier:
  • always (Bruges hvis man ved indholdet på HTML-siden næsten altid vil have ændret sig når man tilgår den)
  • hourly
  • daily
  • weekly
  • monthly
  • yearly
  • never (Bruges til angive at indholdet på HTML-siden er “arkiveret”)
<priority>Bruges til at beskrive den prioritet, som du selv mener denne HTML-side bør have set i forhold til de øvrige HTML-sider på dit website. Du kan angive talværdier fra 0.1 til 1.0.
  • 1.0 = Ekstrem vigtig HTML-side
  • 0.1 = Overhovedet ikke vigtig HTML-side

Så prioriteringen har kun indflydelse på dine interne HTML-sider – ikke set i forhold til eksempelvis dine konkurrenter. Gode tommelfingerregler er her:

  • Angiv en lav prioritering til HTML-sider der ikke er vigtige set i forhold til at drive trafik ind på dit website. Eksempelvis HTML-sider med dine Handelsbetingelser, din Cookie-politik etc.
  • Hvis du eksempelvis har både kategorisider og under-kategorisider, og du ofte ser, at under-kategorisider ender med at have bedre placeringer i Googles søgeresultater på bestemte søgefraser, end den overordnede kategoriside – og hvor du hellere så, at det var den overordnede kategoriside, som havde denne gode placering i Googles søgeresultater på disse specifikke søgefraser. Så overvej her at angive en højere prioritet til dine kategorisider set i forhold til dine under-kategorisider

Eksempel på XML-sitemap for almindelige HTML-sider:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://minwebshop.dk/</loc>
    <lastmod>2015-09-21T16:31TZD</lastmod>
    <changefreq>daily</changefreq>
    <priority>0.85</priority>
  </url>
  <url>
    <loc>http://minwebshop.dk/kategori/</loc>
    <lastmod>2015-09-18</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.7</priority>
  </url>
  <url>
    <loc>http://minwebshop.dk/kategori/underkategori/</loc>
    <lastmod>2015-09-20</lastmod>
    <changefreq>weekly</changefreq>
    <priority>0.6</priority>
  </url>
  <url>
    <loc>http://minwebshop.dk/produkt.html</loc>
    <lastmod>2015-08-10</lastmod>
    <changefreq>monthly</changefreq>
    <priority>0.5</priority>
  </url>
  <url>
    <loc>http://minwebshop.dk/cookie-politik.html</loc>
    <lastmod>2014-07-20</lastmod>
    <changefreq>yearly</changefreq>
    <priority>0.2</priority>
  </url>
</urlset>

Sådan bygger du XML-sitemap til billeder

Hvis du har mange billeder på dit website/-shop, og du gerne vil have mulighed for at skaffe dig mere trafik via eksempelvis Googles billedsøgning, så kan du med et XML-sitemap til billeder øge sandsynligheden for, at billederne fra dit website hurtigst muligt kan blive fundet i Googles billedsøgning.

TagObli-
gato-
risk
Beskrivelse
<xml>Er aller første linie i dit XML-sitemap og indikerer XML-version samt encoding, eksempelvis:
  • <?xml version=’1.0′ encoding=’UTF-8′?>
<urlset>Bruges til at markere start og slut for hele dit XML-sitemap. Det er også her du angiver standardprotokollen (namespace) via xmlns-attributten. For XML-sitemaps til billeder skal der tilføjes en ekstra standardprotokol (xmlns:image):
  • <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:image=”http://www.google.com/schemas/sitemap-image/1.1″ >
<url>Bruges til at markere start og slut for en URL og alle de informationer du vælger at medtage for hver URL
<loc>Bruges til at angive URL’en til den HTML-side, hvor billedet er indlejret. Så hvis et billede er indlejret på flere HTML-sider, så skal du lave et nyt <urlset> for alle de HTML-sider, hvor billedet er indlejret.
<image:image>Hvis en HTML side har flere billeder indlejret, så kan du her angive op til 1.000 billeder i hver sin <image:image>
<image:loc>Bruges til at angive URL’en til billedet. Bemærk at det er helt iorden at anvise en URL til et billede som ligger på et helt andet domæne. Eksempelvis hvis du gør brug af Content Delivery Networks (CDN) til billeder m.v. for at kunne øge loadhastigheden på dit website. Eneste krav er, at begge domæner er tilknyttet og verificeret for den samme Google Search Console konto. Husk, at ligesom det gælder for almindelige HTML sider, så vær ophyggelig med, at du ikke medtager billeder i dit XML-sitemap, som du samtidig med blokerer imod indeksering via et robots.txt filter.
<image:caption>Her kan du medtage en længere beskrivelse af, hvad der er på billedet.
<image:geo_location>Hvis det er relevant, så kan du her angive den geografiske placering for et billede. Eksempelvis “Vordingborg, Danmark”. Vær dog opmærksom på, at Google i skrivende stund ikke har anvist, om du kan medtage:
  • Fulde adresser der inkludere gade, husnummer, postnummer og by m.v.
  • Længde- og breddegrader for et billede

Dette kunne være yderst relevant, såfremt du har billeder, som du gerne så blev vist i undervisale søgninger på Google eller i lokale søgninger på Google. Det kunne eksempelvis være relevant for udlejere af sommerhuse, at deres sommerhuse kunne blive vist i universale søgninger i Google eller at billeder for for lokale seværdigheder og forlystelser kunne bliver vist ved lokale søgninger i Google – foretaget af turister som er på ferie i området.

<image:title>Kan bruges til at skrive en kort titel om, hvad der er på billedet.
<image:license>Såfremt der er en licens tilknyttet billedet, der beskriver, hvordan andre kan få lov til at bruge billedet, så kan du her angive URL’en til den side, der beskriver betingelserne herfor.

Eksempel på XML-sitemap for billeder. Her er der taget udgangspunkt i, hvordan eksempelvis Ree Safari Park i Ebeltoft kunne øge chanchen for, at billeder fra deres website, blev vist i universal søgninger samt i lokale søgninger på Google. Der er ligeledes her medtaget hele adressen til Ree Safari Park.

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9 xmlns:image="http://www.google.com/schemas/sitemap-image/1.1" ">
  <url>
    <loc>http://www.reepark.dk/dyrene/afrika/bongo-antilope/</loc>
    <image:image>
      <image:loc>http://www.reepark.dk/media/21009/bongo.jpg</image:loc>
      <image:caption>Bongo antilopen er den største og tungeste af alle skovantiloper, men også den smukkeste med sin rødbrune farve, hvide striber og de snoede horn. Se den i Ree Safari Park.</image:caption>
      <image:geo_location>Stubbe Søvej 15, 8400 Ebeltoft, Danmark</image:geo_location>
      <image:title>Bongo antilopen i Ree Safari Park</image:title>
      <image:license>http://www.reepark.dk/copyright.html</image:license>
    </image:image>
  </url>
  <url>
    <loc>http://www.reepark.dk/dyrene/afrika/gepard/</loc>
    <image:image>
      <image:loc>http://www.reepark.dk/media/20994/gepard.jpg</image:loc>
      <image:caption>Geparden adskiller sig fra andre kattedyr på flere punkter, geparden er blandt andet det eneste kattedyr, der har indrettet sig på at løbe sit bytte op. Se den i Ree Safari Park.</image:caption>
      <image:geo_location>Stubbe Søvej 15, 8400 Ebeltoft, Danmark</image:geo_location>
      <image:title>Geparden i Ree Safari Park</image:title>
      <image:license>http://www.reepark.dk/copyright.html</image:license>
    </image:image>
  </url>
</urlset>

Bemærk, du skal naturligvis kun medtage de relevante billeder på dit website. Billeder/grafik der eksempelvis bliver brugt til:

  • “Læg i kurv” knap
  • “Tilmeld nyhedsbrev” knap
  • “Login” knap
  • Etc.

skal du naturligvis ikke medtage i dit XML-sitemap til billeder.

Sådan bygger du XML-sitemap til videoer

Bemærk, her er der ikke kun tale om at du kan oplyse om videoer du måtte have uploadet til YouTube. Dette handler i lige så høj grad om at du her kan oplyse Google om alle de videoer, som du eventuelt måtte have liggende på din egen webserver eller på andre online videotjenester. Så disse med større sandsynlighed dukker op i Googles videosøgning – se et eksempel her

  • √ = Obligatorisk
  • (√) = Anbefalet
  • (*) = Kommer an på andre forhold
  • Tom = Frivilligt
TagBeskrivelse
<xml>Er aller første linie i dit XML-sitemap og indikerer XML-version samt encoding, eksempelvis:
  • <?xml version=’1.0′ encoding=’UTF-8′?>
<urlset>Bruges til at markere start og slut for hele dit XML-sitemap. Det er også her du angiver standardprotokollen (namespace) via xmlns-attributten. For XML-sitemaps til videoer skal der tilføjes en ekstra standardprotokol (xmlns:video):
  • <urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″ xmlns:video=”http://www.google.com/schemas/sitemap-video/1.1″ >
<loc>Bruges til at angive den unikke URL for landingssiden, hvor din video er indlejret og kan afspilles. Der må gerne optræde flere indlejrede videoer på en landingsside, det gør du ved at liste hver video med sit eget <video:video> element.
<video:video>Bruges til at markere start og slut for alle informationer du har om hver enkelt video.
<video:thumbnail_loc>Bruges til at angive en URL til den billedfil du ønsker at bruge som thumbnail for din video.
Her anbefales følgende tekniske formater:
  • Thumbnail skal minimim fylde 160 x 90 pixels
  • Thumbnail må maksimalt fylde 1920 x 1080 pixels
  • Anbefalede billedformater er:
    • JPG
    • PNG
    • GIF
<video:title>Bruges til at angive videoens titel og denne må maksimalt fylde 100 karakterer. Her kan du sagtens benytte specialtegn/-karakterer hvis du sørger for at disse er konverteret til HTML entiteter eller ved at benytte en såkaldy CDATA blok hertil. Nedenfor er der lavet et konkret eksempel på et video XML-sitemap, og her vil du kunne se et eksempel på, hvordan dette ser ud.
<video:description>Bruges til en længere beskrivelse af videoen og denne må maksimalt fylde 2.048 karakterer. Hvis du benytter specialtegn/-karakterer i beskrivelsen, så skal du sørge for at disse er konverteret til HTML entiteter eller ved at benytte en CDATA blok hertil.
<video:content_loc>(*)Du skal ikke kun angive hvilken landingsside din video er indlejret og kan afspilles fra, du skal også oplyse om en af følgende to ting:
  • <video:content_loc>
  • <video:player_loc>

<video:content_loc> bruges til at angive URL’en til videoens media-fil, og her kan følgende video-formater angives:

  • MPG
  • MPEG
  • MP4
  • M4V
  • MOV
  • WMV
  • ASD
  • AVI
  • RA
  • RAM
  • RM
  • FLV
  • m.fl.

Fordelen ved at angive URL’en til videoens media-fil, er, at det gør det muligt for Google:

  • at generere video thumbnails
  • at generere video previews
  • hjælper Google med at verificere videoens indhold
<video:player_loc>(*)Som nævnt ovenfor, så skal du ikke kun angive hvilken landingsside din video er indlejret og kan afspilles fra, du skal også oplyse om en af følgende to ting:
  • <video:content_loc>
  • <video:player_loc>

<video:player_loc> bruges til at angive URL’en til videoens afspiller, det er den URL, som vil vise din video i hele browservinduet, så der er altså ikke tale om den landingsside, som din video er indlejret på.

Hvis du eksempelvis ser en video på YouTube, og du går ind og vælger at se den HTML kode, som du skal bruge, for at kunne indlejre YouTube videoen på dit website. Så læg mærke til, at URL’en til YouTube videoen i indlejrings (embed) HTML-koden er forskellig fra den du normalt benytter for at se videoen på YouTube. Det er fordi YouTube her kan sammenlignes med dit website, det er begge landingssider, hvor videoen er indlejret.

Eksempelvis:

Dette tag har to yderligere attributter man kan vælge at sætte på:

allow_embed: Denne kan indholdeværdierne ‘Yes’ eller ‘No’, og bruges til at angive om Google må indlejre videoen direkte i sine søgeresultater.

autoplay: Nogle video-afspillere har en parameter, som styrer, om afspilningen af videoen skal starte automatisk eller ej, og denne kan du angive her. Hvis denne paramter eksempelvis er ap=1 så vil Google (hvis relevant) kunne tilføje den til ‘flashvars’ parameteren. Her kan du se et eksempel på at ap=1 parameteren er indsat i embed-HTML koden for en video:

<embed src=”http://www.example.com/videoplayer.swf?video=123″ autoplay=”ap=1″/>.

Hvordan skal dette oversættes og forstås? [Best practice: Ensure that only Googlebot accesses your content by using a reverse DNS lookup.]

<video:duration>(√)Bruges til at oplyse om videoens samlede længde. Tiden skal angives i sekunder og du angive op til 28.800 sekunder (8 timer)
<video:expiration_date>(√)Hvis du har en video som har en udløbsdato, så kan du angive den her (i W3C format):
  • Kun dato: YYYY-MM-DD (eksempelvis 2015-12-31)
  • Både dato, tidspunkt og tidszonen: YYYY-MM-DDThh:mm:ss+TZD (eksempelvis 2016-01-01T08:05:30+01:00).
<video:rating>Bruges til at angive videoens samlede bedømmelse som kommatal fra 0,0 til 5,0.
<video:view_count>Bruges til at angive hvor mange gange videoen har været vist.
<video:publication_date>Bruges til at angive datoen for publisering af videoen i W3C format:
  • Kun dato: YYYY-MM-DD (eksempelvis 2015-12-31)
  • Både dato, tidspunkt og tidszonen: YYYY-MM-DDThh:mm:ss+TZD (eksempelvis 2016-01-01T08:05:30+01:00).
<video:family_friendly>Bruges til at angive om en video er familievenlig eller ej. Hvis den ikke er familievenlig skal du skrive ‘No’ og herefter vil den kun kunne ses af brugere som har slået ‘SafeSearch’ indstillingen fra.
<video:tag>Bruges til at angive ‘tag’ (emner) der relaterer sig til videoen. En video der viser hvordan man griller kan ekstempelvis tag’es med ‘bøf’, ‘kød’ og ‘udenfor’. Hvis du har flere tag’s til en video, så skal du oprette et <video:tag> element for hvert tag, og du kan kan angive op til 32 tag’s.
<video:category>Bruges til at angive den primære kategori som videoen relaterer sig til, og denne må maksimalt fylde 256 karakterer.
<video:restriction>Bruges til at angive de lande som videoen må blive vist i. Du må kun angive et enkelt <video:restriction> element for en video, så hvis du har brug for at angive flere lande, så adskiller Allowed values are country codes in ISO 3166 format. Kun et tag er tilladt per video (dog gerne med flere landekoder). Hvis dette tag er udeladt, så forudsættes det, at videoen må afspilles i alle lande.

Hvis dette tag anvendes, så er der en ‘relationship’ attribut som er obligatorisk.

  • Værdien ‘allow’ angiver, om landekoderne skal opfattes som en liste over tilladte lande, hvor videoen må afspilles
  • Værdien ‘deny’ angiver, om landekoderne skal opfattes som en liste over lande, hvor videoen ikke må afspilles

Yderligere information om begrænsning (af bla. afspilning) i forhold til lande findes her.

<video:gallery_loc>Dette bruges til at angive et link til en landingsside der fungerer som et video-galleri, som videoen optræder i. Det er kun tilladt at angive et enkelt galleri-link per video. Der er en ‘title’ attribut tilknyttet som det er frivilligt at benytte og her kan man skrive navnet på video-galleriet.
<video:price>Hvis en video er gratis at se, så skal man ikke benytte dette tag.

Hvis der opkræves et beløb for at se en video, så er attributten ‘currency’ obligatorisk og skal følge ISO 4217 formatet

Attributten ‘type’ bruges til at angive om prisen for viden relaterer sig til at købe eller leje videoen, og her er følgende to værdier gyldige: ‘rent’ og ‘own’. Hvis denne attribut ikke anvendes, så formodes det at prisen for videoen relaterer sig til at eje videoen ved køb.

Attributten ‘resolution’ bruges til at angive den købte videos billedkvalitet, her er følgende værdier gyldige: ‘HD’ og ‘SD’.

Det er muligt at liste flere typer priser alt efter kombinationen af ovennævnte attributter for valuta, ejerskab og billledkvalitet.

<video:requires_subscription>Dette tag bruges til at fastsætte om visning af videoen kræver et abonnement (kan være både gratis og betalt). Gyldige værdier for dette tak er: ‘yes’ og ‘no’.
<video:uploader>Dette tag kan bruges til at navnet på det som er brugt til at uploade videoen. Det er kun muligt at angive et uploader-navn per video.

Attributten ‘info’ kan bruges til at angive URL’en for den webside, som er tilknyttet video-uploaderen. Bemærk at denne URL skal befinde sig på det samme domæne som tag’et.

<video:platform>I dette tag kan angivet en liste af platforme (adskilt med mellemrum) hvor en video må afspilles eller ikke må afspilles på. Gyldige værdier er: ‘web’, ‘mobile’, og ‘tv’. Selve tag’et kan kun anvendes en gang per video, men kan dog indeholde alle gyldige værdier hvis relevant – adskilt med mellemrum. Hvis dette tag ikke anvendes, så formodes det at videoen må afspilles på samtlige platforme.

Hvis dette tag benyttes, så er der tilknyttet en obligatorisk ‘relationship’ attribut, som bruges til at angive om de nævnte platforme er gyldige eller ugyldige at afspille videoen på: Gyldige værdier for denne attribut er: ‘allow’ or ‘deny’.

Yderligere information om begrænsning (af bla. afspilning) i forhold til platforme findes her

<video:live>Dette tag bruge til at indikere om en video afspilles som live-stream. Gyldige værdier er ‘yes’ or ‘no’.

Eksempel på XML-sitemap for Videoer:
Lad os antage at Dinero havde flere typer videoer tilkoblet deres website, hvor

  1. nogle videoer var gratis at afspille, da de er en hjælp til at bruge Dinero som software
  2. mens andre videoer lå placeret bag en betalingsmur, og kræver betalt abonnement, da de var en del af et betalt kursus, hvor man bliver uddannet indenfor bogføring samtidig med man lærer at bruge Dinero regnskabprogrammet.

Ad 1) Eksempel på Video XML-sitemap for gratis video

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
   <url>
     <loc>https://dinero.dk/support/aarsafslutningudvidet-selvangivelse-faq/</loc> 
     <video:video>
       <video:thumbnail_loc>https://i.ytimg.com/vi/YuybSWM4zJU/hqdefault.jpg?custom=true&w=196&h=110&stc=true&jpg444=true&jpgq=90&sp=68&sigh=zxVxlp7rN8vgnWl0rlQv_FPXBto</video:thumbnail_loc> 
       <video:title><![CDATA[Selvangivelse og årsregnskab for enkeltmandsvirksomheder]]></video:title>
       <video:description><![CDATA[Har du en enkeltmandsvirksomhed, skal du snart lave din selvangivelse, og det kan Dinero hjælpe dig med. Det kan være, at du får din revisor til det, og så er alt fint. Men alt for mange laver den selv, og her er chancen stor for, at du snyder dig selv for fradrag eller Skat for penge – og det kan også blive rigtig dyrt]]></video:description>
       <!-- video:content_loc>Ikke relevant her, da YouTube ikke lister placeringen for media-filen</video:content_loc -->
       <video:player_loc allow_embed="yes" autoplay="ap=1">https://www.youtube.com/embed/YuybSWM4zJU</video:player_loc>
       <video:duration>273</video:duration>
       <!-- video:expiration_date>Ikke relevant her, men kunne blive relevant ved ændring i lovgivning på bestemt dato</video:expiration_date -->
       <!-- video:rating>Ikke relevant her, da YouTube bruger likes</video:rating --> 
       <video:view_count>4288</video:view_count>
       <video:publication_date>2016-04-07T11:23:00+01:00</video:publication_date>
       <video:family_friendly>yes</video:family_friendly>
       <video:restriction relationship="allow">DA</video:restriction>
       <video:gallery_loc title="Dinero Regnskabsprogram">https://www.youtube.com/user/dinerodk/videos</video:gallery_loc>
       <!-- video:price currency="DKK">Ikke relevant her</video:price -->
       <video:requires_subscription>no</video:requires_subscription>
       <video:uploader info="https://www.youtube.com/upload">YouTube</video:uploader>
       <video:live>no</video:live>
     </video:video>
   </url> 
</urlset>

Ad 2) Eksempel på Video XML-sitemap for video som ligger gemt bag betalingsmur

<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:video="http://www.google.com/schemas/sitemap-video/1.1">
   <url>
     <loc>https://dinero.dk/online-kursus/bogforing-med-dinero/</loc> 
     <video:video>
       <video:thumbnail_loc>https://dinero.dk/online-kursus/images/introduktion-til-bogforing-thumbnail.jpg</video:thumbnail_loc> 
       <video:title><![CDATA[Dinero kursus: Introduktion til bogføring]]></video:title>
       <video:description><![CDATA[Introduktionskursus til bogføring, hvor du præsenteres for det dobbelte bogholderi og du laver din første simple kontoplan i Dinero]]></video:description>
       <!-- video:content_loc>Ikke relevant her, en video bag en betalingsmur skal ikke linke direkte til media-filen</video:content_loc -->
       <video:player_loc allow_embed="yes" autoplay="ap=1">https://vimeo.com/ondemand/introduktionbogforingdinero</video:player_loc>
       <video:duration>1831</video:duration>
       <!-- video:expiration_date>Ikke relevant her, men kunne blive relevant ved ændring i lovgivning på bestemt dato</video:expiration_date -->
       <video:rating>4.3</video:rating> 
       <video:view_count>531</video:view_count>
       <video:publication_date>2017-01-24T11:11:45+01:00</video:publication_date>
       <video:family_friendly>yes</video:family_friendly>
       <video:tag>bogføring</video:tag>
       <video:tag>kursus</video:tag>
       <video:tag>introduktion</video:tag>
       <video:tag>dinero</video:tag>
       <video:tag>kontoplan</video:tag>
       <video:category>Dinero bogføringskursus</video:category>
       <video:restriction relationship="allow">DA</video:restriction>
       <video:gallery_loc title="Bogføringskursus med Dinero">https://dinero.dk/online-kursus/videos/</video:gallery_loc>
       <video:price type="rent" currency="DKK">199.00</video:price>
       <video:requires_subscription>yes</video:requires_subscription>
       <!-- video:uploader info="Ikke relevant her">Ikke relevant her</video:uploader -->
       <video:live>no</video:live>
       <!-- video:platform>Ikke relevant her, da alle platforme må benyttes</video:platform -->
     </video:video>
   </url> 
</urlset>

Sådan bygger du XML-sitemap til nyheder

Bemærk: Det kan være udmærket at udnytte muligheden for større synlighed i Google ved at tillade at dine nyheder optræder i Google News. Men vær opmærksom på, om dine brugere skal have lov til at læse hele din nyhed på Google News, hvilket typisk betyder, at de ikke vil klikke fra Google News og ind på dit website. Det kan være du i stedet skal overveje at dine nyheder er delt op i 2 sider. Den første er blot et uddrag af hele nyheden og det er URL’en til uddraget du inkluderer i dit XML-sitemap til nyheder, og fra dette uddrag er der så et link ind til den fulde nyhedsartikel. Så kan du øge chancen for, at brugerne gerne vil læse hele nyheden og derfor klikker fra Google News og ind på dit website.

  • Dit XML-sitemap til nyheder må kun indeholder links til URL’er med nyheder som er mindre end 2 dage gamle. Selvom du fjerne nyheds URL’er som er mere end 2 dage gamle, så forbliver dine nyheder i Google News’ indeks i den normale periode på 30 dage.
  • Google anbefaler at dit XML-sitemap til nyheder bliver opdateret lige så snart du har publiseret en nyhed, dog crawler Google News bot ikke dit website oftere end det øvrige indhold på dit website, men crawler begge dele med samme hyppighed.
  • Et XML-sitemap til nyheder må kun indeholde op til 1.000 URL’er, har du løbende flere end 1.000 nyheder på dit website, så kan du splitte det op i flere XML-sitemaps der hver kan indeholder op til 1.000 nyheds URL’er, og evt. samle alle XML-sitemaps til nyheder i en overordnet XML-sitemap indeks-fil. XML-sitemap indeks-filen må indeholder op til 50.000 XML-sitemaps til nyheder. Disse maksimumsgrænser er opsat for at forebygge, at ingen webservere risikerer at blive overbelastet på grund af store og tunge XML-sitemap-filer til nyheder, når Google News bot kommer forbi.
  • Når man publiserer en ny nyhed og inkluderer den i et XML-sitemap for nyheder, eller man fjerner en nyhed fra XML-sitemap til nyheder, som er mere end 2 dage gammel, så bør man ikke generere nye XML-sitemap filer med nye filnavne. Man bør i stedet opdatere de eksisterende XML-sitemap filer til nyheder, med de for Google News bot allerede kendte filnavne. Man bør kun introducere nye XML-sitemap filer til nyheder, såfremt man overstiger det maksimale antal nyheds URL’er i et eksisterende XML-sitemap til nyheder.
  • Google’s egen manuelle Sitemap Generator bør ikke benyttes til at generere XML-sitemaps til Google News, da man risikerer at XML-sitemap til nyheder dermed kan komme til at indholde URL’er, der ikke er kan kategorieres som nyheder. Der er andre 3. parts værktøjer der kan bruges til at generere XML-sitemaps til nyheder, dog anbefales det at få programmeret websitet således, at håndteringen af XML-sitemaps til nyheder opdateres helt automatisk.

Et XML-sitemap til nyheder, der skal tilmeldes Google News, bruger samme format og felter som for et almindeligt XML-sitemap til almindeline sider på et website – og med følgende ekstra tags beskrevet nedenfor. Senere er også vist et konkret eksempel på hvordan XML kan se ud for et XML-sitemap til nyheder.

  • √ = Obligatorisk
  • (√) = Anbefalet
  • (*) = Kommer an på andre forhold
  • Tom = Frivilligt
TagBeskrivelse
<publication><publication> tag bruges til at indikere den publikation hvor en nyhedsartikel er bragt. Dette tag har endvidere to tilknyttede obligatoriske under-tags: <name> og <language>.

<name> tag bruges til at angive navnet på nyhedspublikationen. Navnet på nyhedspublikationen i <name> tag skal være fuldstændig identisk med det navn for nyhedspublikationen, som optræder inde i selve nyhedsartiklen i news.google.com, og al relateret information i eksempelvis efterfølgende paranteser skal helt udelades. Eksempelvis, hvis navnet på nyhedspublikationen optræder i Google News som “Brønderslev Lokalavis (abonnement)”, så skal du i stedet bruge navnet, “Brønderslev Lokalavis”.

<language> tag bruges til at oplyse om det sprog, som nyhedspublikationen udgives på. Den skal angives som en ISO 639 sprogkode (enten som 2 eller 3 bogstaver). Dog er der hertil følgende undtagelser for kinesisk, her skal ‘zh-cn’ bruges for ‘Simplified’ kinesisk og ‘zh-tw’ for traditionelt kinesisk.

<genres>(*)Dette tag bruges til at indikere de indholdstyper der bedst karakteriserer indholdet i nyhedsartiklen og disse angives på en liste adskilt af komma. Gyldige indholdstyper er eksempelvis ‘PressRelease’ eller ‘UserGenerated’ som er med på listen over alle gyldige Google News indholdstyper. Det er vigtigt at indholdet er relateret til så nøjagtige indholdstyper som muligt, for at give brugerne af Google News så god og konsistent oplevelse som muligt.
<publication_date>Datoen for en nyhedsartikels publisering skal opgives i W3C format, hvor der enten skal opgives komplet dato i (YYYY-MM-DD) format eller komplet dato, tidspunkt (time, minuttter og sekunder) og tidszone i (YYYY-MM-DDThh:mm:ssTZD) format. Det er vigtigt at man angiver det tidspunkt og evt. tidspunkt da nyhedsartiklen blev udgivet på websitet og ikke på det tidspunkt hvor nyhedsartiklen blev tilføjet XML-sitemap for nyheder .

Google News bot accepterer følgende formater for publisering:

Komplet dato:
YYYY-MM-DD (eksempelvis, 1997-07-16)

Komplet dato, tidspunkt (timer og minutter) samt tidszone
YYYY-MM-DDThh:mmTZD (eksempelvis, 1997-07-16T19:20+01:00)

Komplet dato, tidspunkt (timer, minutter og sekunder) samt tidszone
YYYY-MM-DDThh:mm:ssTZD (eksempelvis, 1997-07-16T19:20:30+01:00)

Komplet dato, tidspunkt (timer, minutter og sekunder (sekunder som komma-tal)) samt tidszone
YYYY-MM-DDThh:mm:ss.sTZD (e.g., 1997-07-16T19:20:30.45+01:00)

<title>Dette tag bruges til nyhedsartiklens titel. Bemærk: En titel kan godt optræde i Google News i indskrænket længde af hensyn til pladsen der er tilrådighed. Nyhedsartiklens titel skal være identisk imellem websitet, hvor nyhedsartiklen er udgivet, og i det XML-sitemap til nyheder hvor nyhedsartiklen listes. Man skal være omhyggelig med ikke at inkludere følgende i nyhedsartiklens titel: Navnet på forfatteren/skribenten, navnet på nyhedspublikationen, samt publikations dato/tidspunkt.
<keywords> Her kan man angive søgeord som beskriver indholdet i nyhedsartiklen (adkilt af komma). Her man man vælge at angive både sine egne søgeord samt de nuværende officielle Google News søgeord.
<stock_tickers> Bruges til at angive en liste af op til 5 aktie-tickers (adskilt af komma). Eksempelvis virksomheder, investeringsselskaber eller andre finansielle institutionersom er medtaget i indholdet i nyhedsartiklen. Dette tag er især relevant for erhvervs nyhedsartikler. Hver eneste aktie-ticker, skal have navnet på den børs hvor aktien handles markeret som prefix, og skal tillige være identisk med samme angivelser i Google Finance. Eksempelvis “NASDAQ:AMAT” (men ikke “NASD:AMAT”) eller “BOM:500325” (men ikke “BOM:RIL”).

Eksempel på XML-sitemap for nyheder:

Her er der med vilje taget udgangspunkt i et ikke-nyheds website, så man kan få et godt indtryk af at XML-sitemaps til nyheder gælder for alle virksomheder der har en nyhedssektion. Her er der igen taget udgangspunkt i Dinero.dk og med to af deres tidligere nyheder:

  1. Dinero annoncerer de har integration med MobilePay, så deres kunders kunder, kan betale fakturaer med MobilePay
  2. Dinero udsender pressemeddelelse om, at virksomheden er blevet solgt til Visma

Ad 1) Eksempel på erhvers-/finansnyhed inklusive aktie-ticker

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
  <url>
    <loc>https://dinero.dk/vigtig-servicebesked-dinero-solgt-visma/</loc>
    <news:news>
      <news:publication>
        <news:name>Dinero</news:name>
        <news:language>da</news:language>
      </news:publication>
      <news:genres>PressRelease, Blog</news:genres>
      <news:publication_date>2016-11-17T15:42:16+01:00</news:publication_date>
      <news:title>Dinero solgt til Visma</news:title>
      <news:keywords>Dinero, Visma, opkøb,</news:keywords>
      <news:stock_tickers>BRS:VIS</news:stock_tickers>
    </news:news>
  </url>
</urlset>

Ad 2) Eksempel på nyhed uden aktie-ticker

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
  <url>
    <loc>https://dinero.dk/dinero-nu-med-mobilepay/</loc>
    <news:news>
      <news:publication>
        <news:name>Dinero</news:name>
        <news:language>da</news:language>
      </news:publication>
      <news:genres>PressRelease, Blog</news:genres>
      <news:publication_date>2016-12-06T13:55:47+01:00</news:publication_date>
      <news:title>Dinero – nu med MobilePay</news:title>
      <news:keywords>Dinero, MobilePay</news:keywords>
      <!-- news:stock_tickers>Ikke relevant her</news:stock_tickers -->
    </news:news>
  </url>
</urlset>

Sådan bygger du XML-sitemap til internationale websites (hreflang)

Hvis du er en internationalt orienteret virksomhed der opererer i flere lande, eksempelvis hvis man har 3 webshops der dækker alle landene i Skandinavien (Danmark, Norge og Sverige), så er det en god ide at implementere support for hreflang, som en vigtig international SEO funktion der understøttes af Google og andre store søgemaskiner. Kort fortalt er hreflang en måde hvor du for en specifik side kan oplyse søgemaskiner om, at siden har andre oversatte søskende sider og linke direkte til dem. Dette er især anvendeligt:

  • hvis der er to sprog der ligner hinanden meget, eksempelvis dansk og norsk
  • hvis der tales flere sprog i samme land, eksempelvis Schweiz hvor der både tales tysk, fransk og italiensk
  • hvis det samme sprog tales i flere lande, eksempelvis tysk, der tales i blandt andet Tyskland, Østrig og Schweiz

Den måde hreflang hjælper her er eksempelvis:

  • Sidder en bruger i Norge og søger, så er der langt større chance for at det norske website bliver vist i Googles søgeresultater, også selvom det danske website måske er stærkere. Hreflang gør her det at den oversatte norske søskendeside nedarver styrken fra et danske website
  • Sidder en bruger i Schweiz og søger på tysk, så er der større chance for at et website der kun findes på tysk til alle tysktalende lande også bliver i Googles søgeresultater i Schweiz fordi hreflang ikke er sat op med landekoder, men kun med sprogkode for tysk.

Hvis dit website imidlertid er bygget på et lukket system, hvor du ikke har mulighed for at installeret et hreflang-plugin eller du ikke har mulighed for selv at få programmet dit website til at understøtte hreflang. Så kan du vælge at implementere hreflang i dine XML-sitemap filer, og dette er især relevant til XML-sitemaps for helt almindelige HTML sider. Disse sider kan være placeret på samme domæne (eksempelvis et .com domænet) eller på tværes af flere domæner (eksempelvis .dk, .no og .se).

Der er dog den uhensigtsmæssighed ved at implementere support for hreflang i XML-sitemaps set i forhold til at få det implementeret direkte i <head> sektionen på de enkelte HTML sider. Årsagen er at det er vores erfaring at blandt andet Google er langsom til at opfange hreflang-signalerne fra XML-sitemaps, og at Google tillige kan melde om hreflang fejl via Google Search Console, som det viser sig ikke er fejl alligevel.

Så hvis man ønsker at implementere hreflang, så anbefales det klart at få dem lagt direkte ind på HTML siderne i <head> sektionen og ikke vælge at benytte XML-sitemaps hertil.

Eksempel på XML-sitemap med support for hreflang:

Det antages at Dinero har udvidet deres regnskabsprogram:

  • Det er oversat i brugergrænsefladen til norsk og svensk
  • Det overholder bogførings-/regnskabs praksis og regler i alle tre skandinaiske lande Danmark, Norge og Sverige
  • Dinero vælger en international domænestrategi hvor de får rettighederne over country code Top Level Domains (ccTLD) således at:
    • Danmark = Dinero.dk
    • Norge = Dinero.no
    • Sverige = Dinero
  • Der er så stor en sammenhæng imellem land og sprog, at der kan anvendes en kombination af hreflang sprog- og landekode for alle tre lande

Her er der et eksempel på hvordan en Dinero side, hvor en bruger kan finde en ny revisor og det er her vist hvordan siderne hver især skal kryds-pege på hinanden som oversatte søskende-sider:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xhtml="http://www.w3.org/1999/xhtml">
  <url>
    <loc>https://dinero.dk/find-revisor/</loc>
    <xhtml:link 
      rel="alternate"
      hreflang="da-dk"
      href="https://dinero.dk/find-revisor/"
    />
    <xhtml:link 
      rel="alternate"
      hreflang="no-no"
      href="https://dinero.no/finne-revisor/"
    />
    <xhtml:link 
      rel="alternate"
      hreflang="sv-se"
      href="https://dinero.se/hitta-revisor/"
    />
  </url>

  <url>
    <loc>https://dinero.no/finne-revisor/</loc>
    <xhtml:link 
      rel="alternate"
      hreflang="da-dk"
      href="https://dinero.dk/find-revisor/"
    />
    <xhtml:link 
      rel="alternate"
      hreflang="no-no"
      href="https://dinero.no/finne-revisor/"
    />
    <xhtml:link 
      rel="alternate"
      hreflang="sv-se"
      href="https://dinero.se/hitta-revisor/"
    />
  </url>

  <url>
    <loc>https://dinero.se/hitta-revisor/</loc>
    <xhtml:link 
      rel="alternate"
      hreflang="da-dk"
      href="https://dinero.dk/find-revisor/"
    />
    <xhtml:link 
      rel="alternate"
      hreflang="no-no"
      href="https://dinero.no/finne-revisor/"
    />
    <xhtml:link 
      rel="alternate"
      hreflang="sv-se"
      href="https://dinero.se/hitta-revisor/"
    />
  </url>
</urlset>

Sådan bygger du XML-sitemap indeks-fil

Har du mange individuelle XML-sitemaps på dit website, de kan være fordelt på indholdselementer såsom HTML-sider, billeder, videoer og nyheder som er blevet vist ovenfor. Det kan også være man har opdelt yderligere på forretningsområder eller bestemte sidetyper m.v. Det kan også være man står i den situation at man har så meget indhold at man overskrider grænserne for hvor mange URL’er eller hvor mange MB en XML-sitemap fil må fylde.

I sådan en situation kan det være en god ide at samle alle sine forskellige XML-sitemaps ind i en samlet XML-sitemap indeks-fil.

Fordelen er at så behøver langt de fleste kun at tilmelde en enkelte XML-sitemap indeks-fil til søgemaskinerne, da søgemaskinerne så via XML-sitemap indeks-filen vil kunne finde frem til alle de øvrige XML-sitemap filer man måtte have tilknyttet sit website.

Hvis man sørger for at placere sine XML-sitemaps, herunder XML-sitemap indeks-filer i den samme mappe på site website, så kan man bla. få lov til at tilmelde op til 500 XML-sitemap indeks-filer til Google via eksempelvis Google Search Console.

Det er også muligt at få lov til at samle flere af sine XML-sitemaps, der er fordelt på tværes af flere forskellige domæner, hvis de alle er verificeret og er tilknyttet den samme konto hos Google Search Console.

  • √ = Obligatorisk
  • (√) = Anbefalet
  • (*) = Kommer an på andre forhold
  • Tom = Frivilligt
TagBeskrivelse
<sitemapindex>Bruges til at indikere start of slut tag for samtlige XML-sitemaps i hele indeks-filen.
<sitemap>Bruges bruges til at indikere start og slut for hver enkelt XML-sitemap, der listes i indeks-filen.
<loc>Bruges til at indikere URL’en for et XML-sitemap fil
<lastmod> Dette tag bruges til at indikere dato og eventuelt tidspunktet for hvornår et XML-sitemap blev genereret og publiseret eller hvordan det senest er blevet opdateret.

Eksempel på XML-sitemap indeks-fil.

Her antages det, at Dinero har opdelt deres indhold i to XML-sitemaps

  1. Almindelige HTML sider
  2. Nyhedssider
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>http://dinerodk/sitemaps-xdhjd/sitemap.xml.zip</loc>
    <lastmod>2017-01-16</lastmod>
  </sitemap>
  <sitemap>
    <loc>http://dinerodk/sitemaps-xdhjd/sitemap-nyheder.xml.zip</loc>
    <lastmod>2017-01-25T18:23:17+01:00</lastmod>
  </sitemap>
</sitemapindex>

Hvor stor må XML sitemap være?

XML-sitemap typeMaksimum antal URL’erMaksimum MB
(ikke-komprimeret)
Beskrivelse
Almindelige HTML sider50.00010 
Billeder50.0001101Der kan listes op til 1.000 billeder per HTML side
Videoer50.00050Hvis XML-sitemap indeks-filer er placeret i den samme undermappe på et website, så kan der tilmeldes op til 500 indeks-filer til Google Search Console
Nyheder1.000101Der må listes op til 50.000 XML-sitemaps for nyheder, i en XML-sitemap indeks fil
Indeks-filer50.0001101 

Ad 1) Der er ikke angivet særlige regler for maksimum antal URL’er og/eller maksimum antal MB, så her følges standard for almindelige HTML sider.

Et XML sitemap kan maksimalt indeholde 50.000 filer eller maksimalt fylde 50Mb, så store sitemaps kan splittes op i flere sub sitemaps. Det gavner ikke kun Googlebot når den læser dine sitemap-filer, det hjælper også din egen webserver, at det indhold, som den skal levere per request, ikke fylder alt for meget.

Hvordan oplyser man Google om placeringen af et XML sitemap?

Du kan oplyse Google om hvor dine XML-sitemaps er placeret på følgende måde:

Tilmeld XML-sitemap til Google via Robots.txt
Fordelen ved at tilmelde et XML-sitemap via robots.txt, er, at så kan alle søgemaskiner finde dine XML-sitemaps uden at du skal bruge tid på at tilmelde dem enkelte vis til hver af de store søgemaskiner, herunder Google.

Dette gør du ved at placere en linie per XML-sitemap i din robots.txt fil, eksempelvis:

Sitemap: http://minwebshop.dk/sitemap_categories.xml
Sitemap: http://minwebshop.dk/sitemap_products.xml
Sitemap: http://minwebshop.dk/sitemap_news.xml

Hvis du har alle dine XML-sitemaps placeret i en XML-sitemap indeks-fil, så behøver du kun liste indeks-filen i robots.txt, så skal søgemaskinerne nok finde frem til alle dine XML-sitemaps.

Ulemper:

  1. Der er en stor ulempe ved at liste dine XML-sitemaps i robots.txt eller ved at have dem liggende med standard-filnavne såsom http://minwebshop.dk/sitemap.xml og det er at det gør det meget lettere for eventuelle konkurrenter at kunne anvende dem til overvågning, ikke mindst hvis du forsyner dine URL’er i dine XML-sitemaps med dato og tidspunkt for oprettelse/opdatering. Så er det let for konkurrenter at spotte hvornår du har opdateret indholdet og præcist på hvilke sider, det kan også bruges til at lave målrettet overvågning af prisændringer på produkter på en webshop.
  2. En anden ulempe er at XML-sitemaps der er tilmeldt via robots.txt filer ikke bliver vist i Google Search Console, og kan dermed ikke overvåges

Ulemperne, især med konkurrent overvågningen, gør, at det anbefales ikke at anvende denne metode, men i stedet at følge anbefalingerne ved at tilmelde dine XML-sitemaps direkte til Google Search Console.

Tilmeld XML-sitemap til Google via Google Ping
Du kan fortælle Google om placeringen af dine XML-sitemaps, samt direkte fortælle Google at netop i dette øjeblik er dit XML-sitemap blevet opdateret. Og dette kan gøres både for enkelte XML-sitemaps eller XML-sitemap indeks-filer.

Dette gøres via Google Ping, eksempelvis

http://google.com/ping?sitemap=http://www.example.com/my_sitemap.xml

Og herefter vil du få en status fra Google om at de har modtaget din anvisning om at dit XML-sitemap er enten genereret og sendt til Google første gang eller du oplyser om at det er blevet opdateret for kort tid siden.

Eksempel på status besked fra Google Ping (XML-sitemaps)

Som ved Robots.txt tilmelding, så bliver XML-sitemaps der tilmeldes til Google alene via Google Ping ikke listet i Google Search Console og kan dermed ikke overvåges. Så skal du have det fulde udbytte af Google Ping, så sørg for at tilmelde hver enkelte XML-sitemap fil – gør det evt. let ved at have en XML-sitemap indeks-fil – så skal du kun tilmelde en enkelte XML-sitemap til til Google Search Console. På den måde kan du aktivt oplyse Google når et af dine XML sitemaps er blevet opdateret og samtidig med kan du overvåge den via Google Search Console.

Tilmeld XML-sitemap til Google via Google Search Console
Den bedst løsning er at tilmelde dine XML-sitemaps til Google via Google Search Console. Men inden du gør det, så sørg for at beskytte dine XML-sitemap filer imod at kunne bliver misbrugt af dine konkurrenter til overvågning. Og en måde at gøre dette på er at placere alle dine XML-sitemaps herunder dine XML-sitemap indeks-filer i en undermappe og/eller med filnavne som er nærmest umulige at gætte, eksempelvis

http://minwebshop.dk/sitemaps/xytde5g6w/categories.xml
http://minwebshop.dk/sitemaps/categories-xytde5g6w.xml

Og derefter KUN tilmelder dem til søgemaskiner via deres webmaster værktøjer såsom Google Search Console.

Google har også et direkte links ind til det sted i Google Search Console hvor man tilmelder, opdaterer, sletter og overvåger sine XML-sitemaps som kaldes Google Sitemap Reports.

Inde i Google Search Console skal du vælge ‘Crawl’ -> ‘Sitemaps’ og derefter klikke på den røde ‘Add/Test sitemap’ knap.

Eksempel på tilmelding af XML-sitemap i Google Search Console

Både i forbindelse med tilmelding af et helt nyt XML-sitemap eller opdatering af et eksisterende XML-sitemap, så kan du teste at alle tekniske formaliteter for dit XML-sitemap er iorden inde i Google Search Console.

Eksempelvis for et eksisterende XML-sitemap inde i Google Search Console, her skal man først vælge det eksisterende XML-sitemap man ønsker at arbejde med. Hvis der er tale om en XML-sitemap indeks-fil, så vil man komme et niveau længere ned og man får en liste over alle de XML-sitemaps som indeks-filen indehodler.

Eksempel på test og gentilmelding af XML-sitemap i Google Search Console #2

Brug bagefter disse knapper til enten at teste eller at gentilmelde dit XML-sitemap.

Eksempel på test og re-submit af XML-sitemap i Google Search Console

Hvor ofte skal man opdatere sit XML sitemap?

XML-sitemaps bør ikke blive udarbejdet manuelt, men bør blive genereret og opdateret automatisk af den platform du benytter til dit website eller din webshop. Google skal nok løbende besøge sine XML-sitemaps for at se om der er foretaget ændringer. Er der imidlertid sket store ændringer og du gerne vil gøre Google opmærksom på dette nu og her, så kan du gøre det via Google Search Console. Du kan også være så heldig at dit website eller din webshop har en indbygget funktion der med relevante mellemrum automatisk adviserer Google om at et XML-sitemap er blevet opdateret via Google Ping. Og her “stresser” man Google meget mindre hvis man pinger om, altid er en XML-sitemap indeks-fil.

Hvordan kan man følge med i indekseringen af indholdet i et XML-sitemap?

Hvis du gerne vil overvåge et bestemt XML-sitemap, så kan du gøre dette inde i Google Search Console. Her kan du overvåge:

  • Indekseringsgraden
  • Fejl i dit XML-sitemap
  • Indekseringsproblemer relateret til de URL’er der er listet i dit XML-sitemap

Eksempel på monitorering af XML-sitemap i Google Search Console

Grosen Friis
Skrevet af
Grosen Friis
Brugbar artikel? Del gerne med dit netværk

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *

Mød vores team

Meet out team