เนื้อหาคอนเทนต์ที่ซ้ำ (Duplicate Content)

เนื้อหาคอนเทนต์ที่ซ้ำกัน

เนื้อหาคอนเทนต์ที่ซ้ำกัน คือ เนื้อหาที่มีความคล้ายกันหรือเป็นสำเนาที่เหมือนกัน ของเนื้อหาที่ปรากฏในเว็บไซต์อื่นๆ หรือตามหน้าต่างๆ ในเว็บไซต์เดียวกัน การที่มีเนื้อหาซ้ำในปริมาณมาก อาจส่งผลลบต่อการจัดอันดับของเว็บไซต์ใน Google

พูดอีกอย่างก็คือ:

เนื้อหาที่ซ้ำกันก็คือเนื้อหาที่มีคำเหมือนกันทุกคำจากหน้าอื่น

Duplicate content

หรือแม้กระทั่งเนื้อหาที่ถูกเขียนใหม่เล็กน้อยก็อาจถือว่าเป็นเนื้อหาซ้ำได้

Similar content

เนื้อหาคอนเทนต์ที่ซ้ำ มีผลกระทบต่อ SEO อย่างไร?

โดยทั่วไปแล้ว Google ไม่ต้องการจัดอันดับหน้าเว็บที่มีเนื้อหาซ้ำกัน

ในความเป็นจริง Google ระบุว่า:

“Google พยายามอย่างมาก ที่จะจัดทำ INDEX และแสดงหน้าเว็บที่มีข้อมูลที่แตกต่างกัน”

ดังนั้น หากเว็บไซต์ของคุณมีหน้าเว็บที่ไม่มีข้อมูลเฉพาะ หรือที่แตกต่างกันอย่างชัดเจน นั่นอาจส่งผลลบต่ออันดับในการค้นหาผ่านเครื่องมือค้นหา

ปัญหาหลักสามอย่าง จากการมีเนื้อหาคอนเทนต์ที่ซ้ำกัน

การเข้าชมแบบออร์แกนิกที่ลดลง: นี่เป็นเรื่องที่เข้าใจได้ง่าย Google ไม่ต้องการจัดอันดับหน้าเว็บที่ใช้เนื้อหาที่คัดลอกมาจากหน้าอื่นๆ ในอินเด็กซ์ของ Google

(รวมถึงหน้าเว็บ ในเว็บไซต์ของคุณเองด้วย)

ตัวอย่างเช่น คุณมีหน้าเว็บ สามหน้าในเว็บไซต์ของคุณ ที่มีเนื้อหาคล้ายกัน

Three pages with similar content

Google อาจไม่แน่ใจว่าหน้าใดเป็นหน้า “ต้นฉบับ” ทำให้ทุกหน้า ต้องเจอกับปัญหาในการจัดอันดับ

Three duplicate pages will all struggle to rank

บทลงโทษ (หายากมาก): Google ได้ระบุว่า เนื้อหาคอนเทนต์ที่ซ้ำกัน อาจนำไปสู่การลงโทษ หรือแม้กระทั่งการนำเว็บไซต์ออกจากการอินเด็กซ์ทั้งหมด

Rare penalty

อย่างไรก็ตาม เรื่องนี้เกิดขึ้นน้อยมาก และจะเกิดขึ้นในกรณีที่เว็บไซต์จงใจคัดลอกหรือขโมยเนื้อหาจากเว็บไซต์อื่น ๆ

Super rare penalty

ดังนั้น หากคุณมีหน้าเนื้อหาคอนเทนต์ที่ซ้ำกัน ในเว็บไซต์ของคุณ ไม่จำเป็นต้องกังวลเรื่อง “บทลงโทษเนื้อหาซ้ำกัน” มากนัก

จำนวนหน้าที่ถูกอินเด็กซ์น้อยลง: เรื่องนี้สำคัญมาก สำหรับเว็บไซต์ที่มีจำนวนหน้ามาก (เช่น เว็บไซต์อีคอมเมิร์ซ)

บางครั้ง Google ไม่เพียงแค่ลดอันดับของเนื้อหาที่ซ้ำกัน แต่ยังปฏิเสธที่จะจัดทำอินเด็กซ์เนื้อหานั้นด้วย

Google refuses to index pages with duplicate content

ดังนั้น หากคุณพบว่า หน้าบางหน้าของเว็บไซต์ของคุณไม่ได้ถูกอินเด็กซ์ อาจเป็นเพราะงบประมาณการรวบรวมข้อมูล (crawl budget) ถูกใช้ไปกับเนื้อหาที่ซ้ำกัน

แนวปฏิบัติที่ดีที่สุด

เฝ้าระวังเนื้อหาที่เหมือนกันใน URL ต่างๆ

นี่เป็นสาเหตุที่พบบ่อยที่สุดที่ทำให้เกิดปัญหา Duplicate content

ตัวอย่างเช่น หากคุณมีเว็บไซต์อีคอมเมิร์ซที่ขายเสื้อยืด

Example product page

หากตั้งค่าถูกต้อง ทุกขนาดและสีของเสื้อยืดนั้น ควรอยู่ภายใต้ URL เดียวกัน

Good example where all variations are on one URL

แต่บางครั้ง คุณอาจพบว่าเว็บไซต์สร้าง URL ใหม่ขึ้น สำหรับแต่ละรุ่นของผลิตภัณฑ์ ซึ่งส่งผลให้มีหน้าเนื้อหาซ้ำกันนับพันหน้า

Bad example where all variations have own URL

อีกตัวอย่างหนึ่ง:

หากเว็บไซต์ของคุณ มีฟังก์ชันการค้นหา หน้าแสดงผลการค้นหา ก็สามารถถูกอินเด็กซ์ได้เช่นกัน สิ่งนี้อาจเพิ่มจำนวนหน้าในเว็บไซต์ของคุณ ได้อย่างง่ายดายถึง 1,000 หน้าหรือมากกว่า ซึ่งทั้งหมดนั้นมีเนื้อหาซ้ำกัน

ตรวจสอบจำนวนหน้าที่ถูก Index

วิธีง่ายๆ ที่จะตรวจสอบว่าเว็บไซต์ของคุณมีเนื้อหาคอนเทนต์ที่ซ้ำกัน หรือไม่ คือการดูจำนวนหน้าที่ถูกอินเด็กซ์ใน Google

คุณสามารถทำได้โดยการค้นหาด้วยคำว่า site:example.com ใน Google

Backlinko index search

หรือไปที่ Google Search Console เพื่อตรวจสอบจำนวนหน้าที่ถูกอินเด็กซ์

Google Search Console – Indexed

ไม่ว่าจะตรวจสอบด้วยวิธีใดก็ตาม จำนวนหน้าที่ถูกอินเด็กซ์ ควรตรงกับจำนวนหน้าที่คุณสร้างขึ้นด้วยตนเอง

ตัวอย่างเช่น หากเว็บไซต์ SEOGURU มีหน้า 112 หน้า ที่ถูกอินเด็กซ์

Backlinko – Indexed Pages SERP

ซึ่งเป็นจำนวนหน้าที่สร้างขึ้นจริง

หากตัวเลขนั้นเป็น 16,000 หรือ 160,000 ก็หมายความว่ามีหน้าจำนวนมากที่ถูกเพิ่มขึ้นมาโดยอัตโนมัติ และหน้าพวกนั้นอาจมีเนื้อหาซ้ำกันในปริมาณมาก

ตรวจสอบว่าเว็บไซต์ของคุณ เปลี่ยนเส้นทางอย่างถูกต้อง

บางครั้งปัญหาที่เกิดขึ้นไม่ได้มีเพียงหลายเวอร์ชันของหน้าเดียวกัน… แต่ยังรวมถึงหลายเวอร์ชันของเว็บไซต์เดียวกันด้วย

แม้ว่าเรื่องนี้จะไม่เกิดขึ้นบ่อย แต่ก็เป็นปัญหาที่พบเห็นได้บนโลกของเว็บไซต์

ปัญหานี้เกิดขึ้นเมื่อเวอร์ชัน “WWW” ของเว็บไซต์ของคุณ ไม่ได้เปลี่ยนเส้นทางไปยังเวอร์ชันที่ไม่มี “WWW”

(หรือในทางกลับกัน)

ยังอาจเกิดขึ้นหากคุณเปลี่ยนเว็บไซต์ของคุณไปใช้ HTTPS แต่ไม่ได้เปลี่ยนเส้นทางจาก HTTP ให้ถูกต้อง

สรุปก็คือ เวอร์ชันที่แตกต่างกันของเว็บไซต์ของคุณทั้งหมด ควรจบลงที่ตำแหน่งเดียวกัน

All versions of your site should end up in the same place

ใช้ 301 Redirects

การใช้ 301 redirects เป็นวิธีที่ง่ายที่สุด ในการแก้ปัญหาเนื้อหาซ้ำกันบนเว็บไซต์ของคุณ

(นอกเหนือจากการลบหน้าทิ้งทั้งหมด)

ดังนั้น หากคุณพบหน้าที่มีเนื้อหาซ้ำกันจำนวนมาก บนเว็บไซต์ของคุณ ควรทำการเปลี่ยนเส้นทางกลับไปยังหน้าต้นฉบับ

Use 301 redirects to fix duplicate content issues

เมื่อ Googlebot แวะมาตรวจสอบ มันจะประมวลผลการเปลี่ยนเส้นทาง และทำอินเด็กซ์เฉพาะเนื้อหาต้นฉบับเท่านั้น

(ซึ่งจะช่วยให้หน้าต้นฉบับ เริ่มติดอันดับได้)

ระวังเนื้อหาที่คล้ายกัน

เนื้อหาซ้ำกัน ไม่ได้หมายถึงเนื้อหาที่ถูกคัดลอกคำต่อคำ จากที่อื่นเท่านั้น

อันที่จริง Google ได้ให้คำจำกัดความของเนื้อหาซ้ำไว้ว่า:

Match content or similar

ดังนั้น ถึงแม้ว่าเนื้อหาของคุณอาจจะดูแตกต่างในเชิงเทคนิค แต่คุณก็อาจประสบปัญหาเนื้อหาซ้ำกันได้

สำหรับเว็บไซต์ส่วนใหญ่ ปัญหานี้ไม่ใช่เรื่องใหญ่ เพราะเว็บไซต์ส่วนมากมีเพียงไม่กี่สิบหน้า และพวกเขาเขียนเนื้อหาที่ไม่ซ้ำกันในแต่ละหน้า

แต่ในบางกรณี เนื้อหาที่คล้ายกันมากๆ ก็สามารถกลายเป็นปัญหาได้

ยกตัวอย่างเช่น หากคุณมีเว็บไซต์ที่สอนการพูดภาษาฝรั่งเศส และคุณให้บริการในพื้นที่บอสตัน

คุณอาจมีหน้าบริการที่หนึ่ง สำหรับ “การเรียนภาษาฝรั่งเศส ในบอสตัน”

Optimized around the keyword "Learn French Boston"

และอีกหน้าหนึ่งที่พยายามจะติดอันดับ สำหรับ “การเรียนภาษาฝรั่งเศส ในเคมบริดจ์”

Optimized around the keyword "Learn French Cambridge"

บางครั้ง เนื้อหาจะต่างกันในเชิงเทคนิค เช่น หนึ่งหน้าอาจมีที่อยู่ ที่ระบุสถานที่ในบอสตัน และอีกหน้าหนึ่ง มีที่อยู่ในเคมบริดจ์

แต่โดยรวมแล้ว เนื้อหานั้นคล้ายกันมาก

Technically different pages may have very similar content

ซึ่งถือว่าเป็นเนื้อหาซ้ำกันในเชิงเทคนิค

ใช่ มันอาจเป็นเรื่องที่เหนื่อยในการเขียนเนื้อหาที่ไม่ซ้ำกัน 100% ในแต่ละหน้าในเว็บไซต์ของคุณ แต่ถ้าคุณจริงจังกับการจัดอันดับหน้าในเว็บไซต์ของคุณ นั่นคือสิ่งที่จำเป็นต้องทำ

ใช้ Canonical Tag

แท็ก rel=canonical เป็นการบอกกับเสิร์ชเอนจิ้นว่า:

“ใช่ เรามีหลายหน้าที่มีเนื้อหาซ้ำกัน แต่หน้านี้เป็นหน้าต้นฉบับ คุณสามารถเพิกเฉยหน้าอื่นๆได้”

Use a canonical tag to differentiate between duplicate and original pages

Google ยังกล่าวว่าการใช้ canonical tag นั้นดีกว่า การบล็อกหน้าที่มีเนื้อหาซ้ำกัน

Canonical tag

(เช่น การบล็อก Googlebot ด้วยการใช้ robots.txt หรือการใช้แท็ก noindex ใน HTML ของหน้าเว็บ)

ดังนั้น หากคุณพบหน้าหลายหน้า ที่มีเนื้อหาซ้ำกันในเว็บไซต์ คุณมีตัวเลือกดังนี้:

  • ลบหน้าเหล่านั้น
  • เปลี่ยนเส้นทางกลับไปยังหน้าต้นฉบับ
  • ใช้ canonical tag

ใช้เครื่องมือ

มีเครื่องมือ SEO หลายตัว ที่ถูกออกแบบมาเพื่อค้นหาเนื้อหาที่ซ้ำกัน

เช่น Siteliner ที่สามารถสแกนเว็บไซต์ของคุณ เพื่อหาหน้าที่มีเนื้อหาซ้ำกันจำนวนมาก

Siteliner

รวมหน้าเว็บ

อย่างที่ได้กล่าวไปแล้ว หากคุณมีหลายหน้าที่มีเนื้อหาซ้ำกัน คุณอาจต้องเปลี่ยนเส้นทางกลับไปยังหน้าเว็บเดียว

(หรือใช้ canonical tag)

แต่ถ้าหน้าเหล่านั้น มีเนื้อหาคล้ายกันมาก ๆ?

คุณสามารถเลือกที่จะเขียนเนื้อหาใหม่ ที่แตกต่างกันไปสำหรับแต่ละหน้า.. หรือรวมเนื้อหาเหล่านั้น ให้กลายเป็นหน้าเดี่ยวที่มีเนื้อหาครบถ้วนและน่าสนใจ

ยกตัวอย่างเช่น คุณมีบล็อกโพสต์ 3 โพสต์ที่มีเนื้อหาที่แตกต่างกันทางเทคนิค แต่เนื้อหาจริง ๆ แล้วคล้ายกันมาก

Different But Similar Blog Posts

คุณสามารถรวมทั้ง 3 โพสต์นั้น ให้กลายเป็นโพสต์บล็อกที่ดีที่สุดและมีเนื้อหาที่ไม่ซ้ำกัน 100%

Combine Similar Posts Into One Unique

เมื่อคุณลบเนื้อหาที่ซ้ำออกจากเว็บไซต์ หน้านั้น จะมีโอกาสติดอันดับได้ดีกว่าหน้าเก่า 3 หน้าเดิมรวมกัน

ใช้ Noindex สำหรับ Tag หรือ Category ใน WordPress

หากคุณใช้ WordPress คุณอาจจะสังเกตว่า มันสร้างหน้าแท็กและหน้าหมวดหมู่อัตโนมัติ

WordPress tag name

หน้านี้เป็นแหล่งของเนื้อหาซ้ำกันขนาดใหญ่

แม้ว่าหน้าเหล่านี้จะมีประโยชน์สำหรับผู้ใช้งาน แต่การเพิ่มแท็ก noindex เข้าไปในหน้าเหล่านั้นจะช่วยให้เสิร์ชเอนจิ้นไม่ทำอินเด็กซ์

คุณสามารถตั้งค่า WordPress ให้ไม่สร้างหน้าแท็กและหมวดหมู่เหล่านั้นตั้งแต่ต้นได้

สรุป เนื้อหาที่ซ้ำกัน ส่งผลต่อการทำ SEO หรือไม่

เนื้อหาที่ซ้ำกัน เป็นปัญหาที่หลายคนมองข้าม แต่ความจริงแล้วมันมีผลกระทบต่ออันดับใน Google อย่างมาก เมื่อมีเนื้อหาซ้ำกันไม่ว่าจากการคัดลอก หรือแม้แต่เนื้อหาที่คล้ายกันเล็กน้อย Google ก็อาจไม่รู้ว่าหน้าไหนคือหน้าต้นฉบับ และอาจทำให้ทุกหน้ามีโอกาสติดอันดับยากขึ้น และถ้าหากคุณต้องการปรึกษาใน หรือสงสัยในส่วนไหนสามารถ ติดต่อ SEOGURU ให้ช่วยคุณได้เลย ด้วย บริการรับทำ SEO ที่ครบวงจร ของเรา