Door Michel op 5 maart 2010 - Categorie(ën): SEO, SES Londen

Tijdens Search Engine Strategies werd er aandacht besteed aan duplicate content. Duplicate content kan bijvoorbeeld ontstaan op het moment dat een pagina op meerdere URL's bereikbaar is of als teksten op meerdere pagina's worden gebruikt. Tijdens de sessie Duplicate Content & Multiple Site Issues werd hier over gesproken, het panel bestond uit vier bekendheden uit de SEO wereld waaronder de flamboyante Mikkel deMib Svendsen uit Denemarken en Ralph Tegtmeier, (Fantomaster) uit Duitsland.

De oplossing om Duplicate content tegen te gaan was vrij simpel volgens Tegtmeier, hij begon zijn presentatie met: "If you don't want duplicate content, don't create it in the first place". En dat is natuurlijk ook zo, voorkomen is beter dan genezen maar dat is niet altijd mogelijk bijvoorbeeld in het geval van een weblog of een webshop. Een product in een webshop kan op meerdere manieren bereikbaar zijn doordat deze in meedere categorieën valt. Hetzelfde geldt voor berichten in een weblog.

Canonical tag

Een eerste oplossing hiervoor is het gebruik van de zogenaamde canonical tag die begin vorig jaar werd geïntroduceerd. Dit is een HTML code die wordt toegevoegd aan een pagina en aangeeft wat de originele URL moet zijn voor de pagina. Het probleem is dat deze tag geen officiële richtlijn is maar slechts een hint voor de zoekmachines. Google ondersteunt de tag volledig en over meerdere domeinen, Yahoo en Bing ondersteunen de tag nog niet over meerdere websites. Wordt er gekozen om de canonical tag te gebruiken moet er goed gekeken worden naar de implementatie om eventuele problemen te voorkomen.

De tweede tip is om te voorkomen dat de zoekmachines toegang hebben tot de dubbele content en zodoende niet wordt geïndexeerd. Zijn de problemen ontstaan door bepaalde parameters in de URL dan kun je deze filteren met behulp van de parameterverwerking tool in het Webmaster Centrum van Google. Dit werkt uiteraard niet voor Bing en Yahoo.

301 redirects

Het gebruik van 301 redirects wordt aangeraden in de strijd tegen duplicate content. Bijvoorbeeld om te voorkomen dat een website bereikbaar is op 'domein.nl' en op 'www.domein.nl'. Het is verstandig om altijd een keuze te maken of een website juist  bereikbaar met of zonder 'www' ervoor. Voorzie eventuele testdomeinen van een wachtwoord zodat deze content niet geïndexeerd kan worden.

Het overnemen van content van een website en plaatsen op een andere website wordt sterk afgeraden. Zorg altijd voor unieke content!.

Index.html

Op de homepage kan ook dubbele content voorkomen doordat de homepage bereikbaar is op 'domein.nl' en op 'domein.nl/index.html'. Google heeft officieel aangegeven dat dit normaal gesproken geen probleem is. De zoekmachine zal de index pagina op dezelfde manier behandelen als het domein en wordt niet gezien als dubbele content. Het kan wel gebeuren dat Google Webmaster Tools een melding geeft over het feit dat het domein en de index pagina dezelfde titel en omschrijving hebben maar dit kan genegeerd worden en verdwijnt vanzelf weer.

Script

Oplossing die werd aangedragen door Mikkel deMib Svendsen is het gebruik van een script. Dit script moet de originele URL van de pagina laden variabele. Daarna check via welke URL de pagina werd opgeroepen, inclusief alle parameters, etc. Als de beide URL's niet overeenkomen maak een 301 redirect die verwijst naar de originele URL.

Bron foto: Flickr - State of Search

Reactiemogelijkheid is uitgeschakeld.