Test af hreflang og canonical til international SEO

Google’s hreflang funktion til international SEO har nu været tilgængelig i mere end et år, og derfor synes vi det var på tide at få lavet en klinisk SEO test heraf i større scala.

Udover at teste om Googles hreflang har en effekt på hvordan ens websites ranker i Google’s landespecifikke indeks, så har vi også testet om hreflang kan kombineres med canonical i tilfælde af at man har problemer med dublicate content.

Hvorfor teste kombinationen af hreflang og canonical?

Sidstnævnte er meget interessant for de webshops som eksempelvis har samme engelsk fordelt på forskellige subdomæner eller country code top level domains (ccTLD) som kunne være mitdomæne.co.uk til Storbritannien og mitdomæne.ie til Irland.

Der er to store fordele ved at kunne benytte flere webshops målrettet forskellige lande, til trods for at deres indhold måtte være næsten 100% identisk og derfor har store problemer med dobbeltindhold.

  1. Man kan få en langt bedre landespecifik repræsentation i Googles søgeresultater, noget brugerne sikkert sætter pris på. Det er uden tvivl bedre at få sit mitdomæne.co.uk vist i søgeresultater på Google.co.uk
  2. Har man en webshop, så får man Google til at hjælpe en med at sende brugerne ind på den mest relevante shop set i forhold til den pris der bliver vist på websitet og hvorfra levering er mest sandsynlig kan foretages. Har man sin webshop på mitdomæne.com og mitcomæne.co.uk og det er mitdomæne.com som bliver vist i Googles Google.co.uk søgeresltater, så sender men brugeren ind på en webshop der måske vil vise brugeren de forkerte priser, måske kan levering til Storbritannien slet ikke foretages fra mitdomæne.com. Her skan man som webshop ejer i hvert fald have meget tydelige flag eller lignende som kan guide brugeren hen til den relevante webshop, og det kan være nødvendigt at prøve at spore hvor I verden brugeren sidder alt efter hans/hendes IP adresse og så prøve automatisk at redirecte brugeren hen til det domæne man mener er mest relevant.

Grunden til at vi ønskede at teste om hreflang kunne kombineres med canonical var også at vi havde erfaret fra Googles egne medarbejdere, at det bør man gøre hvis man har problemer med dobbeltindhold, til gengæld har vi talt med mange branchekolleger som var meget i tvivl herom.

Men det giver dog meget god mening at kunne kombinere hreflang og canonical, har man domæner med unikt indhold målrettet forskellige lande, så har man jo ikke brug for canonical, til gengæld har man via hreflang mulighed for at fortælle Google hvordan ens forskellige domæner hænger sammen – på tværs af mange lande – eksempelvis fra kategoriside til kategoriside og fra produktside til produktside. Har man derimod, som nævnt ovenfor, identiske sprog på tværs af flere domæner som er målrettet flere lande som benytter samme sprog, ja så giver det rigtig god mening at man kan kombinere hreflang med canonical.

Test foretaget på .com domæne med tilhørende subdomæner

Vi har anvendt følgende (sub)domæner til testen som du er velkommen til at gå ind og kigge nærmere efter i sømmene

LandSprog(Sub)domæne
Ikke valgtEngelskhttp://href-lang.com
AustralienEngelskhttp://au.href-lang.com
StorbritannienEngelskhttp://uk.href-lang.com
IrlandEngelskhttp://ie.href-lang.com

Opbygningen af test websites

Når man ser på et testsite alene, så er der ingen af siderne der har dobbeltindhold, for hver enkelt side indeholder 1-2 afnit med gibberish engelsk, som er automatisk og tilfældigt udvalgte engelske ord. Sammenligner man derimod de enkelte testsites vil man se at de er 100% identiske på tværs af de fire (sub)domæner.

Hver enkelt testsite er opbygget således

  • 5 niveauer:
    • Forside
    • Under forsiden er der 3 niveauer og der er 9 under-sider under hver side på hvert niveau
    • Sidste niveau er en linke-ud-side
  • Placeret på 1 .com hoveddomæne og 3 subdomæner
  • Hostet på IP adresse relateret til Danmark (77.66.30.208) Test selv via ipligence.com/geolocation
  • Eneste linkbuilding foretaget er fra websites relateret til Danmark
  • Vi valgte bevidst at bruge subdomæner fremfor ccTLD’s, da ccTLD’s i sig selv giver Google et alt for kraftig signal om sprog og land, det gør et subdomæne derimod ikke
  • Da site: kommandoen efterhånden bliver udvandet af Google og ikke viser et godt billede af hvordan indeksering forløber, så valgte vi at tilmelde alle 4 test websites til samme Google Webmaster Tools konto. Her foretog vi INGEN indstillinger, herunder pillede vi naturligvis ikke ved indstilling for mål-land. Vi brugte det kun til at monitorere indekseringen af hver enkelt test website

Opbygning og indhold på en side på et test website

Hver enkelt side indeholder følgende:

  • Titel
  • Meta description
  • Hreflang og canonical
  • Brødkrumme-sti
  • Hovedoverskrift pakket ind i <h1>
  • Underoverskrift pakket ind i <h2>
  • 1-3 afsnit pakket ind i <p>
  • Navigation

Konfiguration af hreflang og canonical på en side

Konfiguration af hreflang og canonical på en side er som følger

LandSprog(Sub)domænehreflangcanonical
Ikke valgtEngelskhttp://href-lang.comenPeger http://href-lang.com
AustralienEngelskhttp://au.href-lang.comen-auPeger på http://href-lang.com
StorbritannienEngelskhttp://uk.href-lang.comen-gbPeger på http://href-lang.com
IrlandEngelskhttp://ie.href-lang.comen-iePeger på http://href-lang.com

Example:

<link rel="alternate" hreflang="en" href="http://href-lang.com/chordospartium-pane.html" />
<link rel="alternate" hreflang="en-ie" href="http://ie.href-lang.com/chordospartium-pane.html" />
<link rel="alternate" hreflang="en-au" href="http://au.href-lang.com/chordospartium-pane.html" />
<link rel="alternate" hreflang="en-gb" href="http://uk.href-lang.com/chordospartium-pane.html" />
<link rel="canonical" href="http://href-lang.com/chordospartium-pane.html" />

Her kan du se den komplette opsætning af en side – klik på billedet for at se det i stor størrelse

Eksempel på opsætning af test-side

Indekseringsforløbet i Google fra start til nu

Vi lavede både site: søgninger i Google og vi holdt øje med indekseringen i Googles Webmaster Tools (GWT)

I starten blev både hoveddomænet og subdomænerne indekseret i Google, men da subdomænerne nåede op på at ca. 80-110 sider var indekseret, så stopppede indekseringen og begyndt at gå tilbage. Jeg formoder det skyldes at det tager lidt tid fra Googles søgerobot kommer forbi og crawler siderne, mens der er andre rutiner der på et senere tidspunkt laver analyser af eksempelvis hreflang og canonical, hvorfor Google søgeresultater ikke afspejler brugen af hreflang og canonical med det samme. I skrivende stund viser GWT at der er gennemgået ca. 870 af de 901 sider der er på hvert subdomæne og der er nu kun ca. 16-31 sider tilbage af sider på subdomænerne som stadigvæk er indekseret i Google, men det forventer vi naturligvis tilpasser sig yderlere om kort tid. Det var et forløb som vi forventede at se

Klik på billedet for at se det i stor størrelse

Indekseringsforløb af uk-href-lang-com i GWT

Indekseringen af hoveddomænet var derimod lidt af en overraskelse, for det virkede hurtigt som om, at brugen af hreflang og canonical fik GWT til at opfatte de 4 test websites som et stort domæne. Samlet udgør de 4 test websites af 4 x 901 sider = 3604 sider, og i skrivende stund mener GWT at 4.409 sider er gennemgået, det er jo ca. 800 sider mere end der fysisk findes på de 4 test websites og jeg har ikke umiddelbart nogen ide eller fornemmelse af hvorfor.

Klik på billedet for at se det i stor størrelse

Indekseringsforløb af href-lang-com i GWT

Nedenfor finder du en oversigt over hvor mange sider GWT har gennemgået for hvert website samt maksimum antal sider der har været indekseret undervej og hvor mange sider der p.t. er indekseret i Google i henhold til GWT.

Land(Sub)domæneAntal sider
gennemgået
Antal sider
indekseret
(maksimum)
Antal sider
indekseret
(skrivende stund)
Ikke valgthttp://href-lang.com4.4091.129895
Australienhttp://au.href-lang.com87111034
Storbritannienhttp://uk.href-lang.com8708316
Irlandhttp://ie.href-lang.com8697419

Testresultater

Vi har foretaget test via mange forskellige kilder:

  • Impersonal.me
  • Software der måler placeringer af ens domæne på udvalgte søgeord i udvalgte Google indeks
  • Via manuelle tests igennem VPN/proxy som har udgangspunkt i et relevant land
  • Manuelle tests foretage af venlige branchekolleger som befandt sig på relevante geo-IP’ere

… og herfra skal lyde en stor tak-for-hjælpen med søgninger på Google i forskellige lande:

Følgende søgefraser blev testet i Googles landespecifikke indeks. Prøv selv ved at copy/paste søgefraserne fra felterne nedenfor og afprøv dem i Google (medtag dobbelt anførselstegn, så bliver søgningerne mere præcise).

Niveau på
test website
Søgefrase
1.
1.5
1.6.5
1.7.1.8

og alle fremviste de forventede (sub)domæner i søgeresultaterne:

Geo-IP(Sub)domæne i SERPs
USAhttp://href-lang.com
Canadahttp://href-lang.com
Australienhttp://au.href-lang.com
Storbritannienhttp://uk.href-lang.com
Irlandhttp://ie.href-lang.com
Danmarkhttp://href-lang.com

Konklusion

  • Kan man bruge Googles hreflang til international SEO? Ja
  • Hvis man har problemer med dobbeltindhold, bør man så kombinere hreflang med canonical? Ja
  • Hvis man IKKE har problemer med dobbeltindhold, bør man så også kombinere hreflang med canonical? Nej

Som en afslutning vil jeg nævne at tidligere var det ikke nogen god ide at lade ovennævnte tre subdomæner eller tilsvarende ccTLD’ere blive indekseret af Google på grund af problemerne med dobbeltindhold, og det ville på samme tidspunkt være næsten umuligt at få andre end hoveddomænet til at fremkomme i alle søgeresultaterne, selv i søgninger i Googles landespecifikke indeks. Men takket være hreflang og canonical, så er dette nu heldigvis blevet muligt

/Grosen Friis

Grosen Friis
Skrevet af
Grosen Friis
Brugbar artikel? Del gerne med dit netværk

16 svar til “Test af hreflang og canonical til international SEO

  1. Meget interessant læsning – men jeg har et spørgsmål

    Jeg har et hoveddomæne http://www.esmad.com – som jeg vil lægge 15 subdomains på, som indeholder SAMME tekst, men oversat til de 15 forskellige sprog.

    http://eurojackpot.de.esmad.com/ er f.eks. den tyske (eller det bliver det)
    http://eurojackpot.da.esmad.com/ er den danske.

    Hvis man kommer til http://www.esmad.com/ vil man blive smidt gennem en GEOIP mølle og bliver vist det sprog der nu passer til en.

    I head – er der denne:

    Skal jeg så bruge rel canonical til det relevante sprogs forside, eller til http://www.esmad.com forsiden der geoiper?

    1. i head er denne (prøver lige igen)
      [link rel=”alternate” hreflang=”da” href=”http://eurojackpot.da.esmad.com/” /]
      [link rel=”alternate” hreflang=”fi” href=”http://eurojackpot.fi.esmad.com/” /]
      [link rel=”alternate” hreflang=”es” href=”http://eurojackpot.es.esmad.com/” /]
      [link rel=”alternate” hreflang=”en” href=”http://eurojackpot.en.esmad.com/” /]
      [link rel=”alternate” hreflang=”de” href=”http://eurojackpot.de.esmad.com/” /]

    2. Hej Tom Frank Christensen

      Hvis sproget er oversat er der – ikke – tale om duplicate content og derfor skal du her kun bruge hreflang og – ikke – kombinere det med hreflang.

      /Grosen Friis

  2. Virkelig højt niveau !!

    Bare lige så jeg forstå reultatet 100 % har jeg to spørgsmål:

    1.
    Når vi kombinerer canonical med hreflang kan vi trods duplicate content få indekseret indholdet, der passer til det pågældende land?

    2.
    Hvis det er tilfældet, er det virkelig interessant, da det gør os i stand at bruge topleveldomæner, hosting etc. i det pågældende land for øget relevans for søgeren uden at skulle lave nyt unikt indhold.
    Men vil Google så stadig se sitet som værende et samlet site? Jeg mener er du kun grundet canonical, at Google ser sitet som et samlet site?

    1. Hej Nikolaj Mogensen

      Tak 🙂

      Ad 1) Ja, det er korrekt. Eksempelvis er der canonical på alle siderne på au.href-lang.com subdomænet så ingen af dem bliver indekseret. Men fordi vi kombinerer med hreflang, så optræder au.href-lang.com subdomænet i søgninger der foretages i Google.com.au

      Ad 2) Helt enig, det er et godt tiltag Google er kommet med her. Bemærk dog, at Google opfatter det som et samlet website fordi du – kombinerer – hreflang og canonical, ikke hvis du kun bruger canonical. Og har du unikt indhold, så skal du ikke bruge canonical, men bør stadigvæk benytte hreflang.

      /Grosen

  3. Tak for den gode artikel.
    Jeg ved ikke om der er en dybere grund med den canonical jeg ikke kan læse ud fra artiklen, men så hvidt jeg kan finde mig frem til anbefaler google ikke at have nogen canonical sammen med alternate-hreflang.

    Er der noget jeg misser her?

    Se her: http://googlewebmastercentral.blogspot.com.au/2011/12/new-markup-for-multilingual-content.html
    note: Update: to simplify implementation, we no longer recommend using rel=canonical.

    1. Hej Ole Dallerup

      Interessant, sidst jeg kiggede og envidere læste en længere debat på Google+ hvor Googles egne medarbejdere deltog, der anbefalede de at kombinere hreflang og canonical hvis man havde problemer med dobbeltindhold 🙂

      Det er kun godt hvis Google nu selv kan styre det alene ved hreflang, det gør det langt simplere for hjemmesideejere. Men testen viser dog, at man stadigvæk sagtens kan kombinere hreflang og canonical og opnå de ønskede resultater.

      /Grosen Friis

        1. Ja ok, kan godt se det er noget af en bog man åbner her. Der er godt nok mange forskellige vinkler på det.


          Actually when rel canonical and hreflang are both present, URLs w/ rel canonical ARE pulled from the index. hreflang simply allows the display URL to fire at search time. The title and snippet text are taken from the rel canonical target.

          You need to be very careful here and understand the functions of these annotations, both separately and in tandem. I’ve spoken in detail about this w/ Google’s team. This is how it works and why it’s so important to watch rel canonical carefully, because it can and will yank an international site from the correct regional index. No one wants their US title and snippet text showing for their UK site. The URL is only 1 element of a successful search presentation, and in the case of hreflang, the URL is simply a display element fired at search time.

          https://plus.google.com/107360801496590056394/posts/SpSnNfv3f1a

          Hvis dette er står der er sandt, så giver det meget god mening at jeres test også virker især i jeres tilfælde hvor alle jeres sites har samme sprog.

          1. Hej Ole

            Helt enig i at her skal man holde sig LANGT væk fra canonical. Canonical skal KUN benyttes hvis man virkelig har problemer med dobbeltindhold, og det uanset om man bruger hreflang eller ej.

            /Grosen

          2. Hej Grosen

            Det er slet ikke sådan jeg læser Googles documentation.
            Hvis du har dobbelt indhold problemer og bruger hreflang så skal du aldrig bruge canonical. Hvis du gør får du problemer især hvis det er flere sproget.
            Ifølge googles officelle documentation så kan man bruge hreflang til at løse dobbelt indholds problemer.

            /Ole

          3. Hej Ole

            Ja efter introduktionen kan du vælge enten at bruge x-defalt eller canonical. Det kommer an på hvilke sites der er tale om og hvordan indholdet er bygget op.

            /Grosen

  4. Nu kommer jeg ud fra siden af. Skal det forstås at hvis man har en hjemmeside i England og så en i Australien så behøver man ikke at bruge et subdomæne men kan evt bruge com.au et australsk hoveddomæne men så lave en href-lang til et .com domæne og så spiller det ??

    Hvad med links er til .com domænet vil det også automatisk følge med til de forskellige sider ??.

    Rigtig spændene test takker.

    Michael

    1. Hej Michael Agerup

      Tak for din kommentar (og beklager jeg først svarer nu)

      Svaret på spørgsmål 1. er ja. Dertil kommer at Google nu er ude med endnu en ting man kan bruges sammen med hreflang til at forebygge eventuelt dobbeltindhold og det er x-default. Du kan læse mere om det her:

      http://support.google.com/webmasters/bin/answer.py?hl=en&answer=189077

      Til dit 2. spørgsmål om links til .com domænet – når du bruger canonical på de sider der er kopier, så bliver disse kopi-sider ikke indekseret. Og skulle du få links til kopi-siderne så ryger alt PageRank videre til den URL som canonical peger på.

      Ved en søgning i Google.com.au er følgende:

      – Titel og meta description tages fra .com, ikke fra .com.au
      – Men det er URL’en fra .com.au man ser i SERP’s og det er også det domæne brugeren bliver dirigeret hen til.

      Hvor vidt dette også er tilfældet for x-default ved jeg ikke med sikkerhed endnu, for jeg har ikke testet dette (endnu) 🙂

      /Grosen Friis

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *

Mød vores team

Meet out team