Google straffar duplicerat innehåll
2008-02-02 @ 15:24Något som många inte vet är att det finns nackdelar med att, i sina webbplatser, ha indentiskt innehåll på flera ställen. Jag har sett en mängd olika företag som i hopp om att få fler kunder, skapar flera indentiska webbplatser. Google straffar duplicerat innehåll genom att sänka placeringen på Google, sänka pageranken, eller i värsta fall helt plocka bort sidan från att bli indexerad. Straffet kallas ”Duplicate content”.
Vad gör man då om man har t ex domäner med unikt innehåll och ändå vill behålla dessa? Jo, man gör en omdirigering.
Välj rätt typ av omdirigering
Det finns flera sätt att omdirigera en hemsida och dessvärre är det bara ett sätt som är bra ur sökmotorssynpunkt.
- Omdirigering genom DNS kan ofta göras genom administrationen för det webbhotell man använder sig av. Den typ av dirigering ser bara till att innehållet läses in från samma plats och på så sätt skapas en spegling av webbplatsen. Det är ingen bra metod eftersom Google ser det som en kopia av webbplatsen och därmed kommer den med stor sannorlikhet att straffas för det.
- Omdirigering med Javascript är en oldschool-metod som har hängt med länge. Exempel på denna typ är vanligtvis att man får en nedräkning på skärmen och efter att den gått till 0 så kastas man till en annan webbplats. Detta är inte att rekommendera eftersom Google inte kan läsa Javascript.
- Omdirigering med ”Redirect 302? är en metod som visar att innehållet flyttats tillfälligt till en annan plats. Det gör t ex att pagerank inte flyttas över och är ingen bra metod för permanent flytt.
- Omdirigering med ”Redirect 301” är det enda sättet som fungerar på ett bra sätt ur sökmotorsynpunkt. Pagerank ska (finns aldrig några garantier) flyttas över och personen som går in på en plats där det ligger en redirect 301 kommer automatiskt att hamna på den rätta platsen. Redirecten kan göras både från en undersida till en annan, eller på hela domänen om så önskas. Man kan t ex låta test.nu och test.com ”peka” på test.se genom en redirect 301. En guide för hur man gör rent praktiskt finns på Webconfs.
WWW eller utan WWW, det är frågan
Ett flertal hemsidor har både en adress med www framför och en utan www. Enligt egna erfarenheter verkar inte Google straffa den typen av duplicerat innehåll. Det är ändå vettigt att bestämma sig om adressen ska ha www eller ej. Min hemsida skulle annars ha två olika adresser: http://www.jenst.se och http://jenst.se. Hur ska en besökare kunna veta vilket som är originalet? Google kan också ge ett sämre resultat om man inte är konsekvent. Det kan också vara svårare för användare att memorera sidan om man inte är konsekvent. Även här görs en ”Redirect 301? när man bestämt sig för vilken form man vill använda.
Använd robots.txt
Det är en fil som läggs i roten på domänen och den kan användas för att förhindra att sökmotorer indexerar vissa sidor. Vet man om att man har duplicerat innehåll på sin hemsida kan detta vara en metod att stänga ute sökmotorerna från vissa av sidorna och därmed få problemet med duplicerat innehåll ur världen.
Det kan vara vettigt att läsa mer om Googles riktlinjer.
Noindex och nofollow
Yttligare ett sätt att förhindra att sökmotorerna, främst Google, är att sätta noindex och nofollow på länken. Ett exempel på det kan se ut så här: <a href=”test.html” rel=”noindex, nofollow”>Test</a>. Ett annat exempel är att i metadatan ange <meta name=”robots” content=”noindex, nofollow”> på den sidan som inte ska indexeras. Mer om det kan läsas på Wikipedia Nofollow och Wikipedia Noindex.
Exempel på egna fällor
Även jag gör misstag ibland och har också drabbats av ”duplicate content”-straffet. Det viktigaste är att man lär sig av sina misstag och inte gör om samma misstag, kanske dessutom räddar någon annan från att begå samma misstag.
- Roliga klipp är ett praktexempel på hur man inte ska göra. Rent användarmässigt tycker jag den är ganska optimal. Man har alltid en god översikt över både de klipp som visas men också hur folk har röstat, senaste klipp, senaste kommentarer, kategorier osv. Felet som gjorts är att dessa platshållare förekommer på alla sidor för att göra dem lätt åtkomliga. Det gör att Google kommer se det som indentiskt innehåll mot alla andra sidor. Det som skiljer innehållet åt är klippet och informationen om klippet. Om man inte skriver väldigt mycket text i informationen om klippet så kommer sidan procentuellt sätt att vara näst intill identisk alla andra undersidor. Därför kommer den långt ner i sökmotorn på grund av duplicerat innehåll. Mitt tips är därför att undvika att ha för många platshållare, samt se till att innehållet i text räcker för att göra sidan unik.
- Jenst.se har vad jag vet inget duplicerat innehåll men hade jag inte passat mig så hade det kunnat drabba sidan. Risk förekommer i kommentarerna på WP YouTube. Eftersom jag satt en begränsning på 50 kommentarer kommer resterande kommentarer visas på andra sidor tillsammans med inlägget. Inlägget är då en duplicering medan kommentarerna på varje sida är unika. Att jag valt antalet 50 är ingen slump. Hade jag valt 5 kommentarer per sida kanske sidorna blivit för indentiska och därmed riskerat Google-straff.
- Yttligare en risk för duplicerat innehåll kunde finnas på en annan del av kommentarerna, nämlingen ”Visa alla”. Den risken finns då något inlägg fått samma antal kommentarer som begränsningen ligger på, i mitt fall 50. Det skulle innebära att båda sida 1 med kommentarer och ”Visa alla” kommer vara identiska och därmed löper risk för ”Duplicated content”. Denna risk har ordnats på det sätt att jag helt enkelt tog bort möjligheten att visa alla inlägg.
- Även vad det gäller kategorisidorna finns en överhängande risk för duplicerat innehåll. Tänk att jag har två kategorier, den ena heter ”Windows” och den andra heter ”Operativsystem”. Där är fem inlägg om Windows skapat och eftersom de både relaterar till ”Windows”-kategorin och ”Operativsystem”-kategorin läggs de där. Vad händer? Jo, saknas tidigare inlägg i dessa kategorier kommer de att bli identiska och därför riskerar straff från Google.
Sammanfattningsvis så hoppas jag den här artikeln leder till ett minskande missbruk av duplicerat innehåll, samt lite mer inblick för den som är ny på området.