(17 perc olvasás)
Tartalomjegyzek
- Mi az a duplikált tartalom?
- A duplikált tartalom forrásai és típusai
- Miért jelent problémát a duplikált tartalom?
- Hogyan találd meg a duplikált tartalmat a weboldaladon?
- Hogyan kezeljük az ismétlődő tartalmat?
- Összefoglalás
Legyen szó akár termékleírásról, kategórialeírásról, a weboldal egy menüpontjáról vagy blogcikkről, elég nehéz olyan témát találni és szöveget írni, amit már ne írtak volna meg valahol. Az természetesen elkerülhetetlen, hogy ugyanazokat a témákat különböző weboldalak és tartalomkészítők egyaránt feldolgozzák, viszont arra már könnyebb odafigyelni, hogy adott weboldalon belül ne jöjjön létre duplikált tartalom. Vagy, ha elengedhetetlen, tudjuk hogyan kell azt a SEO és a Google algoritmus igényeit is figyelembe véve, jól kezelni.
Hogy mi tartozik a duplikált tartalom kategóriájába, azt sokan keverik a mai napig, hiszen, amikor a keresőoptimalizálás is bekerül az egyenletbe, máris komplexebbé válik a kérdés. Főleg azért, mert, ha egy adott weboldalon belül elő a duplikáció, annak előbb-utóbb az lesz a vége, hogy a Google algoritmus hátrébb sorolja a keresési találatok között a tartalmat.
Mi az a duplikált tartalom?
A fogalom jelentését illetően, a "duplikált" szó megkettőzést, duplázást, kétszerezést jelent. Ezért, amikor duplikált tartalomról esik szó, SEO szemszögből elsősorban olyan tartalmakra gondolunk, mint például termékleírások vagy blogcikkek, amelyek ugyanolyan vagy némileg módosított változatban több URL-cím alatt is megtalálhatók a weboldalon belül. Ebben az összefüggésben különbséget kell tennünk a belső duplikált tartalom (ugyanannak a tartalomnak a megjelenése a weboldal több oldalán) és a külső duplikált tartalom (ugyanaz a tartalom több különböző weboldalon való megjelenése) között. Például, a blogcikkek esetében ez azt jelentheti, hogy azok nem csak a weboldalon belül, hanem kívülről nézve, más weboldalakon is megtalálhatóak lehetnek.
Ennek alapján felmerül a kérdés, hogy vajon minden idézet vagy weboldalon belüli tartalomátvétel duplikált kontentnek minősül és bünteti a Google? Mára annyit finomodott a Google algoritmusa, hogy John Mueller, a Google egyik vezető szakembere így nyilatkozott:
„Önmagában a duplikált tartalomért nem jár büntetőpont. Sőt, ha pontosan ugyanazt az információt találjuk több weboldalon az interneten, és valaki kifejezetten erre az információra keres rá, akkor megpróbáljuk megtalálni a számára legrelevánsabb weboldalt.
Tehát, ha ugyanaz a tartalom több weboldalon is elérhető, akkor nem jelenítjük meg a felhasználónak az összeset. Ehelyett megpróbálunk kiválasztani egyet közülük, és azt megmutatni. Viszont még ilyenkor sem arról van szó, hogy az így talált duplikált tartalomhoz bármilyen negatív jelzés kapcsolódna. Sok esetben normális, hogy bizonyos mennyiségű megosztott tartalom van a különböző weboldalakon.”
A duplikált tartalom forrásai és típusai
A legnagyobb tanulság az, hogy kis odafigyeléssel már el lehet kerülni a duplikált tartalom létrehozását a weboldalon, igaz, ehhez a technikai részletekre is érdemes odafigyelni egy kicsit. Máris mutatjuk, hogy technikai szempontból mi okozhat galibát.
-
URL változatok
Az URL változatok és variánsok gyakran okoznak fejtörést, különösen egyedi CMS rendszerek esetén, ahol automatikusan generálódhatnak olyan URL-ek, amelyek felesleges részleteket, mint a termék nevét és kategóriáját, is tartalmaznak. Az online marketing tevékenységek, mint a követő paraméterek használata (pl. UTM paraméterek, Facebook Pixel kódok) létfontosságúak a kampányok és tartalmak teljesítményének mérésében, de ezek helytelen használata duplikált tartalomhoz vezethet. Különösen fontos figyelni a paraméterek sorrendjére, mivel eltérések – például a kampánynév és forrás pozíciójának cseréje – duplikációt eredményezhetnek, vagy ha a paraméterezett és az eredeti URL ugyanarra az oldalra mutat.
Az URL felépítések kapcsán fontos információ, hogy mivel csak a HTTPS-t védi SSL/
Ugyanez vonatkozik a www előtagra is a domain név kapcsán. Abban az esetben, ha a weboldal elérhető az előtaggal (például www.whitepress.hu) és anélkül is (whitepress.hu), a Google keresőbotjai ezt duplikált tartalomnak minősíthetik. Végeredményben, ha HTTP és HTTPS, valamint www. és www nélküli verzióban is elérhető a honlap, duplikált tartalomról beszélhetünk.
-
Termékleírások
A duplikált tartalom nemcsak a blogbejegyzéseket vagy szerkesztői tartalmat foglalja magában, hanem a termékinformációs oldalakat, például a webshopok termékleírásait is. Bár a gyártó által szolgáltatott leírások használata kényelmes, ez gyakran vezet azonos tartalmak megjelenéséhez különböző e-kereskedelmi oldalakon. Ezáltal a webshopok könnyen duplikált tartalmat generálhatnak, ami csökkentheti a weboldaluk keresőmotorokban való láthatóságát. A megoldás érdekében fontos saját, egyedi termékleírásokat készíteni, amelyek nem csak a SEO szempontjából előnyösek, hanem hozzáadott értéket is nyújtanak a vásárlók számára.
Másolt és átvett tartalom
Google fejlett algoritmusainak köszönhetően képesek vagyunk azonosítani és kiszűrni a másolt tartalmakat, beleértve azokat is, amelyek hivatkozások és forrásmegjelölések nélkül kerülnek felhasználásra. Azonban a duplikált tartalom más forrásból is származhat, például amikor harmadik felek lemásolják és saját weboldalukon teszik közzé a tartalmad. Ez különösen akkor jelent problémát, ha a weboldalad alacsony domain authority-t produkál, a tartalmat másoló weboldal viszont magasabbat. A magasabb domain authority-vel rendelkező weboldalakat gyakrabban térképezik fel, ami azt eredményezi, hogy a duplikált tartalom először a tartalmat másoló honlapján kerül feltérképezésre, ezért előfordulhat, hogy a keresőbotok a másolókat tekintik az eredeti szerzőnek.
A tartalom jogos tulajdonosaként lépéseket tehetsz a másolt tartalom kezelésére. Kezdésként érdemes felvenni a kapcsolatot a másoló weboldal üzemeltetőjével, és kérni a tartalom eltávolítását vagy az eredeti forrás megjelölését egy hivatkozással, ami közvetlenül a saját oldaladra mutat. Ha ez nem vezet eredményre, akkor a szerzői jogi védelem érdekében fordulhatsz a DMCA-hoz (Digital Millennium Copyright Act) és benyújthatsz egy "takedown request"-et a Google felé, hogy távolítsák el a jogtalanul másolt tartalmat. Szükség esetén jogi úton is érvényesítheted a jogaidat.
Duplikált tartalom nemzetközi weboldalakon
Többnyelvű weboldalaknál a duplikált tartalom kezelése különösen kihívást jelenthet, mivel a weboldal különböző nyelvű változatai gyakran azonos tartalommal kerülnek feltöltésre. Ez akkor változik meg, ha az egyes régiók vagy országok szerint eltér a kínált termékek és szolgáltatások sora. Több esetben azonban a vállalatok azonos termékpalettával operálnak különböző nyelveken, ami versenyt eredményezhet a hasonló tartalmú oldalak között.
Miért jelent problémát a duplikált tartalom?
Miért jelent problémát SEO szempontból a duplikált tartalom? Azért, mert a sok hasonló felépítésű tartalom rontja a keresőbotok hatékonyságát. Ha a duplikált tartalmak közül nekik kell kiválasztani a megfelelőt, az azt jelenti, hogy a keresőbotoknak kell megállapítaniuk, hogy melyik az eredeti és melyik a másolt tartalom.
Ebben az esetben sajnos előfordulhat, hogy a keresett kulcsszóra rossz oldalt rangsorol előre az algoritmus, vagy mindkét oldalt hátrább sorolja, vagy egyszerűen nem jelenik meg egyik oldal sem a keresési találatok között.
Emellett a duplikált tartalom akadályozhatja a felhasználói élményt és az érdeklődők elköteleződését is. Abban az esetben ugyanis, ha azonos vagy hasonló tartalommal találkozik különböző weboldalakon, az alááshatja a felhasználók webhelye iránti bizalmát, és elriaszthatja a weboldal/
Ezen felül, a weboldalon belüli duplikált tartalom is összezavarhatja a keresőmotorokat. Egyfelől, a kulcsszavak kannibalizálása gyakori SEO probléma, amely akkor fordul elő, ha a weboldalon több oldal is ugyanazt vagy hasonló kulcsszavakat céloz meg. Ez megzavarhatja a keresőmotorokat és a felhasználókat, és negatívan befolyásolhatja a rangsorolást, a forgalmat és a konverziókat. Ebben az esetben ugyanis a weboldal különböző tartalmai/
Ehhez kapcsolódik az úgynevezett link equity vagy link juice jelenség is. Ezt magyarul kb. linkérték néven fordíthatnánk le és egy olyan rangsorolási szempont a keresőmotorok számára, amely arra vonatkozik, hogy az adott link/
Gyakorlatilag a duplikált tartalom miatt ahelyett, hogy egyetlen hiteles oldal lenne, amely az összes linkelőnyt felhalmozná, az érték több hasonló oldal között oszlik meg, csökkentve a visszamutató hivatkozások hatását.
Hogyan találd meg a duplikált tartalmat a weboldaladon?
A duplikált tartalom kezelése során a keresőoptimalizálás első és legfontosabb lépése az, hogy felismerjük: valóban áll-e fenn a probléma, és ha igen, pontosan mely részein a weboldalunknak. Ennek érdekében alapos elemzésre és a tartalom átvizsgálására van szükség, amely segítségével azonosíthatók a duplikálódás esetei. Csak így biztosítható, hogy a weboldal tartalma egyedi maradjon, és elkerülhetőek legyenek a keresőmotorok általi negatív értékelések.
Az egyik leggyorsabb (de nem a teljes weboldalt lefedő) módja annak, hogy ellenőrizd, van-e duplikált tartalmad, ha körülbelül tíz szót lemásolsz a weboldaladon található szöveg, majd azt idézőjelekkel beilleszted a Google keresőjébe. Valójában ez a Google által javasolt legelemibb ellenőrzési módszer.
Azonban ez a manuális módszer, amelyet az oldalak és tartalmak széles körére ismételgetve alkalmazhatsz, időigényes és egy összetett weboldal esetében nem nyújt teljeskörű megoldást. Különösen nagyobb, dinamikusabb weboldalaknál, ahol a tartalom folyamatosan bővül és változik, ez a technika nem praktikus. Ilyen esetekben érdemes további eszközökre támaszkodni a duplikált tartalom hatékonyabb felismeréséhez. Szerencsére számos speciális eszköz áll rendelkezésre, mint például a Siteliner, Senuto és a Google Search Console, amelyek segítségével átfogóbb elemzést végezhetünk.
-
A Siteliner használata egyszerű módszert kínál a weboldalon belüli duplikált tartalom azonosítására. Az eszköz átvizsgál minden oldalt, és kiemeli a duplikált szövegblokkokat, megjelenítve a duplikáció mértékét az egész oldalra vonatkozóan. Ez alapvetően fontos a webmesterek számára, akik egyedi tartalom fenntartására törekednek
-
A Senuto nem csak a duplikált tartalom azonosítását teszi lehetővé, hanem átfogó elemzést kínál a weboldal keresőmotorokban való láthatóságáról is. A Cannibalization eszköz különösen hasznos a duplikált kulcsszavak azonosításában, amelyek versenyt eredményezhetnek a saját oldalain belül, károsítva ezzel a SEO teljesítményt. A kulcsszavak használatának elemzése és a tartalmi átfedések azonosítása révén a Senuto segít finomhangolni a tartalomstratégiát a duplikáció elkerülése és a weboldal általános minőségének és felhasználói élményének (UX) javítása érdekében.
-
A Google Search Console (GSC) elsősorban a weboldal Google keresési eredményekben való teljesítményének nyomon követésére szolgál, de létfontosságú eszköz a weboldal hibáinak és problémáinak, beleértve a duplikált tartalommal kapcsolatos kérdéseket is, azonosítására. A GSC figyelmezteti a webmestereket a hasonló vagy azonos tartalomra, amely duplikációs problémákat okozhat, lehetőséget biztosítva ezeknek a problémáknak a kijavítására, mielőtt azok befolyásolnák a keresési rangsorolást.
Ezek az eszközök együttesen kínálnak komplex megoldásokat a duplikált tartalom azonosítására és kezelésére, segítve ezzel a weboldalak SEO teljesítményének javítását.
Hogyan kezeljük az ismétlődő tartalmat?
A duplikált tartalom kezelése kulcsfontosságú SEO gyakorlat, amellyel elősegíthetjük weboldalunk jobb indexelését és rangsorolását a keresőmotorokban. Ahogy korábban már szóba került, számos módszer áll rendelkezésre a duplikált tartalom problémájának kezelésére. Ebben a szekcióban néhány alapvető technikát és eszközt ismertetünk, amelyek központi eleme, hogy jelezzük a Google számára, melyik a preferált, azaz az eredeti tartalom. Ez különösen fontos, amikor ugyanaz a tartalom több különböző oldalon jelenik meg egy weboldalon belül.
301-es átirányítás
A 301-es átirányítás egy állandó módszer, amely révén a látogatók automatikusan egy másik URL-re kerülnek átirányításra, elkerülve a duplikált tartalom megjelenését. Ez a technika segít megszüntetni az ugyanazon tartalommal rendelkező aloldalak közötti versengést, mivel minden link ugyanarra az oldalra mutat majd. Ennek eredményeképp az eredeti URL kapja a legnagyobb linkerőt, ami jelentősen javíthatja a weboldal Google keresőranglistáján elfoglalt helyezését, különösen a rangsor első helyeinek megcélzása esetén.
Ellentétben a 301-es átirányítással, a 302-es átirányítás ideiglenes megoldást kínál, és nem alkalmas a duplikált tartalom problémájának hosszú távú kezelésére. A 302-es átirányítások fő célja a felhasználói élmény javítása ideiglenes tartalomváltozások esetén, nem pedig a keresőmotorok számára történő állandó cím változtatások kommunikálása. Ezért a duplikált tartalom kezelésére a 301-es átirányítás a megfelelő választás, mivel az állandó átirányítást jelöl, segítve ezzel az eredeti tartalom megerősítését és a keresőmotorokban való helyes indexálást.
rel=”canonical” címke
A rel="canonical" címke (kanonikus tag) alapvetően a duplikált tartalom kezelésére jött létre. Ezzel a taggel jelölhetjük meg az eredeti, vagyis a kanonikus tartalmat, létrehozva ezzel a kanonikus URL-t, amely világossá teszi a keresőmotorok, például a Google számára, hogy a több, hasonló tartalmat közlő oldalak közül melyik tekintendő az eredetinek. Ennek eredményeképpen a keresőmotorok előnyben részesítik az így megjelölt oldalt az indexálás és a rangsorolás során, míg a többi, duplikált tartalmat tartalmazó oldalt alárendeltként kezelik, vagy elhagyják a keresési találatokból.
A rel="canonical" taget a weboldal HTML kódjának <head> szekciójába helyezzük el. Ez az attribútum közvetíti a keresőmotorok felé azt az üzenetet, hogy az adott oldal egy másik, preferált URL másolata. Fontos, hogy a kanonikus URL-re mutató tag minden egyes, a duplikált tartalmat megjelenítő oldalon szerepeljen a forráskódban, így biztosítva, hogy a keresőmotorok az eredeti tartalom alapján indexeljenek és rangsoroljanak minden egyes esetben.
noindex címke
A noindex tag használata azt jelzi a Google-nek, hogy ne indexelje a duplikált tartalmakat tartalmazó oldalakat. Ez azt jelenti, hogy a keresőmotorok nem fogják rangsorolni a felhasználói keresések során az ezzel az attribútummal jelölt oldalakat.
A noindex címke kifejezetten hasznos a szezonális vagy időszakos kampányok alatt, melynek során a különböző marketingcsatornákhoz különböző céloldalakra van szükség. Például a PPC kampányok esetében az egyszerűbb landing oldalak jobban konvertálnak, míg a SEO-nak több tartalomra van szüksége a rangsoroláshoz. Ebben az esetben a PPC kampány landingje „noindex”-el jelölhető.
Tartalomoptimalizálás
A tartalomoptimalizálás az a folyamat, amely biztosítja, hogy a tartalom úgy legyen megírva és optimalizálva a weboldalon, hogy az a lehető legszélesebb célközönséget érje el anélkül, hogy duplikált tartalmakkal rontanánk az oldal rangsorolását.
A tartalomoptimalizálási folyamatnak éppen ezért magában kell foglalnia minden olyan stratégiát és technikát, ami segít a weboldal tartalmát egyedivé és persze megkülönböztethetővé tenni.
Ez nemcsak az egyedi és minőségi tartalomgyártást foglalja magában, hanem például a kapcsolódó kulcsszavak biztosítását, azok helyes használatát például az olyan metaadatokban, mint a meta leírás vagy a H1, a különböző címkék, képek esetében pedig az alt tagek stb. Hasznos lehet továbbá a releváns hivatkozások elhelyezése is.
Emellett, a tartalmakat időről időre felül kell vizsgálni egy viszonylag összetett módon: megkeresni például a hibás hivatkozásokat, új backlinkeket szerezni hozzájuk, de akár a tartalmat is újra lehet írni, esetleg bővíteni friss információkkal, kulcsszavakkal.
Összefoglalás
A duplikált tartalom szerencsére olyan probléma, amit nem büntet a Google, azonban a rangsorolásra, az oldal láthatóságára és a felhasználói élményre mégis hatással lehet. Maga a duplikált tartalom két vagy több különböző URL-címen megjelenő hasonló, vagy megegyező tartalmat takar, ami a turpisságot illeti, ezek nemcsak az adott weboldalon belül, hanem egymástól független weboldalakon is megjelenhetnek.
Annak érdekében, hogy elkerüld vagy orvosolni tudd a duplikáció problémáját, többféle módszert is bevethetsz. Az egyik a 301-es átirányítás, a másik a kanonikus címkék használata, amelyek segítségével jelezhetjük a Google-nek, hogy melyik az általunk preferált, illetve eredeti tartalom, amit a keresési találatok között szeretnénk látni.
A noindex címke ezzel szemben abban fog segíteni, hogy a Google ne vegye figyelembe a duplikált tartalmat az oldalak indexelése során. Természetesen a különböző tartalomoptimalizálási technikák is segítik elkerülni a duplikált kontentek kialakulását azzal, hogy egyedivé és megkülönböztethetővé teszik az egyes aloldalakon található tartalmakat például a releváns kulcsszavak megfelelő használatával és a metaadatok segítségével.