Trong bài viết lần này, chúng ta hãy cùng tìm hiểu Google Panda, một trong những bản cập nhật thuật toán quan trọng của Google. Bài viết sẽ giúp bạn nắm được Google Panda là gì? Nguyên nhân và cách khắc phục khi website của bạn bị ảnh hưởng bởi thuật toán này.

1. Google Panda là gì?

Google Panda là cơ chế thuật toán xếp hạng tìm kiếm của Google, được ra mắt vào đầu năm 2011 nhằm sử dụng để kiểm tra và lọc chất lượng của các trang nội dung trang web.. Đây là khởi đầu cho một loạt các thuật toán nâng cao sau này nhằm kiểm soát chất lượng nội dung của Google. 

Google Panda đã loại bỏ các trang web có nội dung spam, cấu trúc nghèo nàn ra khỏi kết quả tìm kiếm và tạo điều kiện để các trang web có chất lượng xếp hạng cao hơn. Đây là một thuật toán bổ trợ cho thuật toán Google Penguin , nếu bạn bị cả 2 thuật toán kết hợp sẽ rất khó khăn để SEO sau này. 

2. Nguồn cấp và cơ chế hoạt động từ nguồn cấp dữ liệu Google Panda

Google Panda không ngừng nâng cao cơ chế hoạt động và nguồn cấp dữ liệu

Google Panda không ngừng nâng cao cơ chế hoạt động và nguồn cấp dữ liệu

Để có thể hoạt động theo nguyên tắc nhất định thì Google Panda phải dựa vào nguồn cấp dữ liệu và được thiết lập cơ chế hoạt động từ Google . Các cơ chế hoạt động và nguồn cấp dữ liệu như :

2.1 Cơ chế hoạt động của Google Panda

  1. Tiến hành nghiên cứu định tính (đây là về lượng khách truy cập duy nhất, không phải là phân tích dữ liệu khổng lồ) để phân tích đặc điểm của các trang web chất lượng thấp thông qua dữ liệu người dùng độc lập.
  2. Lọc ra các trang nội dung chất lượng thấp thông qua cơ chế của Google Panda. Thực hiện nhiều bài thử để thiết lập và cải thiện cơ chế xét duyệt Unique nội dung đồng nhất.

Cơ chế sàng lọc của nó chủ yếu dựa trên lưu lượng nhấp chuột (Clickstream), nội dung trang (page content) và hồ sơ liên kết (link profiles), miễn là hiệu suất của ba dữ liệu này tốt, nó sẽ không bị xếp vào loại trang web spam. Từ nhiều phân tích, Google Panda hiện có thể áp dụng cho xếp hạng chất lượng trang, và nó không được tinh chỉnh cho các từ khóa trong bài viết. Vì vậy, chỉ cần toàn bộ trang bị ảnh hưởng, chỉ cần trang web có quá nhiều trang spam, nó sẽ mang lại rất nhiều tác động tiêu cực cho trang web theo kiểu cộng dồn.

2.2 Nguồn cấp dữ liệu cho Google Panda hoạt động

Clickstream Clickstream (giá trị tham chiếu: tỷ lệ thoát, thời gian ở lại của người dùng, tỷ lệ truy cập trở lại của người dùng và độ sâu của lượt truy cập)

Nguồn dữ liệu: Google Analytics, Thanh công cụ của Google, Google Chrome

Đánh giá chất lượng nội dung của bên thứ ba (tham khảo phiếu bầu của người dùng)

Nguồn dữ liệu: WOT, Trust My Web, Webutation, Personal Blocklist, v.v.

Mức độ phổ biến của liên kết xã hội

Nguồn dữ liệu: Google + 1, lượt thích trên Facebook, Tweet trên Twitter

2. Nguyên nhân website bị dính thuật toán Panda của google?

Từ trước đến nay, Google vẫn luôn thay đổi các thuật toán để đánh giá một website có giá trị hay không. Trong bản những lần cập nhật Google Panda trước tới thời điểm hiện tại những website có nội dung như sau sẽ bị dính phạt:

Nguyên nhân website bị dính thuật toán Panda của Google 

Nguyên nhân website bị dính thuật toán Panda của Google  

  • Nội dung mỏng (Thin content): Công cụ tìm kiếm cần có content để đánh giá một website có liên quan đến những gì người dùng đang tìm kiếm hay không. Nếu có ít content công cụ tìm kiếm sẽ không thể hiểu nội dung website của bạn là gì. Các trang web có nội dung mỏng là các trang chỉ có vỏn vẹn vài câu hoặc nội dung thiếu chuyên sâu, không đem lại giá trị gì cho người đọc, nội dung không liên quan đến chủ đề của website.
  • Nội dung bị trùng lặp (Duplicate content): Sao chép nội dung trên internet xảy ra rất phổ biến, nhiều khi nội dung bị sao chép y nguyên không có chút thay đổi gì so với bản gốc. Ngoài ra nội dung trùng lặp cũng xảy ra trong một website với nhiều trang tương tự nhau. Ví dụ: một công ty váy cưới kinh doanh ở nhiều tỉnh thành và họ tạo ra nhiều trang kiểu như “Dịch vụ váy cưới ở Hà Nội”, “Dịch vụ váy cưới ở Đà Nẵng”, “Dịch vụ váy cưới ở TP. Hồ Chí Minh”,… chúng giữ nguyên nội dung và chỉ thay đổi tên tỉnh thành.
Duplicate content khiến Google Panda phạt

Duplicate content khiến Google Panda phạt

  • Website không có Authority, độ tin tưởng thấp: Nếu bạn muốn người dùng ở lại và quay lại trang web thì nội dung phải đáng tin cậy. Nội dung không được xác minh chính xác hoặc thiếu thẩm quyền (authority) sẽ bị giảm thứ hạng trong kết quả tìm kiếm. Bạn nên xây dựng thương hiệu như một thực thể có thẩm quyền trong lĩnh vực của bạn để người dùng có thể tin tưởng được.
  • Content Farming: đây là những website tổng hợp nội dung của các website khác, hoặc đi thuê nhiều người viết về vô vàn chủ đề khác nhau, nhưng về cơ bản đây là những nội dung không có giá trị mà chỉ nhằm mục đích đạt được thứ hạng cho nhiều từ khóa khác nhau. 
Content farming

Content farming sẽ bị phạt như thế nào

  • Spin content tạo ra những bài viết mới khi đi link: đây thường là những nội dung do phần mềm tự động tạo ra nhằm lấp đầy nội dung cho trang web, nhồi nhét từ khóa nhưng không đem lại giá trị gì cho người đọc.
  • Từ khóa cạnh tranh lẫn nhau – Keyword Cannibalization: Tương tự như nội dung bị trùng lặp, vấn đề phát sinh ở đây là các trang web này cùng xếp hạng cho một từ khóa giống nhau, gây ra tình trạng gọi là “ăn thịt từ khóa”.
  • Time on site thấp: còn được gọi là thời lượng phiên, là tổng thời gian người dùng xem trang web của bạn, tính từ lúc bắt đầu truy cập cho đến lúc rời khỏi trang web. Nếu thời lượng phiên không đến 10 giây, thì chắc chắn người dùng không thực sự đọc bài viết. Đây là một dấu hiệu cho Google thấy nội dung không thật sự có giá trị và thu hút người đọc.
  • Bounce Rate cao: Theo định nghĩa của Hubspot, Bounce rate (hay tỉ lệ thoát) trang là phần trăm số người truy cập vào website và rời đi mà không click vào bất kỳ thứ gì khác, hoặc đi đến những trang khác của website. Bounce rate cao có thể là do yếu tố kỹ thuật như trang web không tối ưu cho thiết bị di động, nhưng đôi khi nguyên nhân là vì nội dung trên trang web không đủ chuyên sâu và người đọc không tìm được câu trả lời phù hợp. Đây là một trong những tín hiệu để Google Panda “ghé thăm” website của bạn.

3. Dấu hiệu website bị google panda phạt

Bạn có thể nhận ra website bị dính phạt của Panda thông qua những dấu hiệu sau:

  • Nhận được thông báo từ google khi sử dụng search console: ( có thể có hoặc không ): Bạn có thể kiểm tra xem website có dính Google Panda không trong phần “Manual Action” của Google search console
  • Organic Traffic của site giảm dần: Sẽ mất khoảng vài tháng để nhận thấy lưu lượng tìm kiếm tự nhiên sụt giảm. Là do thuật toán Panda chưa ghé thăm website của bạn hoặc do tỷ lệ trùng lặp nội dung của bạn chưa tới ngưỡng để nhận án phạt. 
  • Traffic website giảm đi 1 nửa: Nếu bạn thấy lượng truy cập sụt giảm lớn thì có nhiều khả năng trang web của bạn bị ảnh hưởng hoặc bị phạt bởi bản cập nhật Panda mới nhất của Google.  
  • Mất index trang số lượng lớn: Hãy bắt đầu thử nghiệm bằng những trang có lưu lượng thấp và không phổ biến trên trang web của bạn, nếu bạn thấy chúng hoàn toàn không xuất hiện trên Google sau khi đã đăng một thời gian dài thì nhiều khả năng là bạn đang bị ảnh hưởng bởi thuật toán Panda. Hãy tiếp tục với các trang khác để xem website có được index hay không
  • Nặng nhất khi đưa vào google sandbox: Trường hợp xấu nhất là dù bạn đã gõ từ khóa cạnh tranh thấp, thêm backlink cho trang mà vẫn không thấy trang web của mình trên SERP. Google dường như đang kìm hãm website của bạn xuất hiện trên kết quả tìm kiếm. Nếu nó xảy ra đúng vào thời điểm update thuật toán Panda thì nhiều khả năng là website đang nhận án phạt. 
Dấu hiệu website bị Google Panda phạt

Dấu hiệu website bị Google Panda phạt

4. Các giải pháp khắc phục website bị dính thuật toán Panda hiệu quả

Do thuật toán Google Panda liên quan chủ yếu đến chất lượng nội dung, nên cách tốt nhất là quay trở lại tối ưu các bài viết của bạn trở nên hữu ích và đáng tin cậy hơn và đặc biệt tránh lỗi trùng lặp nội dung với người dùng.

Giải pháp khắc phục website bị dính thuật toán Panda hiệu quả

Giải pháp khắc phục website bị dính thuật toán Panda hiệu quả

4.1. Cải thiện nội dung content mỏng

Nếu bạn có nhiều trang có thể hợp nhất với nhau thì hãy sử dụng 301 để chuyển hướng đến phiên bản tốt hơn. Với những bài viết mà bạn muốn viết lại thì cách tốt nhất là sử dụng thẻ meta noindex. 

Bạn nên giữ lại các URL này trong sitemap để sau này Google có thể lập chỉ mục lại. Còn những nội dung bạn muốn loại bỏ hoàn toàn thì sao? Bạn nên sử dụng 404 cho chúng, ban đầu có thể bạn sẽ nhận cảnh báo trong Google Console nhưng không sao cả, quá trình lập chỉ mục vẫn diễn ra bình thường.

Đối với những nội dung quan trọng của website, bạn nên audit lại một cách toàn diện và sửa lại. Cần nhớ những yếu tố quan trọng đó là Chuyên gia (Expertise), Thẩm quyền (Authority), Độ tin cậy (Trust). 

4.2. Sử dụng kỹ thuật Noindex & thẻ Canonical

Như đã trình bày một phần ở trên, các phần nội dung không quan trọng của website và đồng thời chúng lại ít nội dung thì cách tốt nhất là bạn nên dùng thẻ Noindex cho các trang này. 

Trong trường hợp có nội dung trùng lặp mà bạn không thể dùng đến cách 301 thì còn một cách khác là đặt thẻ rel = canonical để đảm bảo không gặp phải hiện tượng “ăn thịt từ khóa”.

4.3. Không đặt quảng cáo nhiều trên trang

Các trang chủ yếu dựa trên quảng cáo trả phí thay vì nội dung gốc bị Google Panda trừng phạt nghiêm khắc. Bởi vì chúng không chỉ làm gián đoạn trải nghiệm người dùng mà còn không mang lại giá trị gia tăng nào cho trang web. Google đã có những hướng dẫn để tích hợp quảng cáo vào các trang web một cách hợp lý mà nên xem xét ở đây.

Không đặt nhiều quảng cáo trên trang

Không đặt nhiều quảng cáo trên trang

5. Công cụ hỗ trợ khắc phục website bị google pandas phạt

Một số công cụ sẽ giúp ích cho việc khắc phục án phạt Google Panda. Trong đó 2 công cụ được sử dụng phổ biến là Copyscape và Siteliner:

Copyscape

Copyscape check uniqe content tránh Google Panda phạt

Copyscape check uniqe content tránh Google Panda phạt

Copyscape là một công cụ phát hiện đạo văn trực tuyến phổ biến trên thế giới, giúp bạn phát hiện ra những nội dung trùng lặp. Bạn cũng có thể cài đặt để nó kiểm tra trực tiếp trang web của bạn bằng cách thêm sitemap vào tool của Copyscape. Copyscape sau đó cho phép bạn xem và so sánh các trang web có nội dung lặp lại. Bạn hãy tập trung vào phần đánh dấu đỏ trong cột Risk và chỉnh sửa lại để tránh bị Google Panda nhòm ngó

 

Siteliner

iteliner công cụ check nội dung trùng lặp

iteliner công cụ check nội dung trùng lặp

Siteliner cũng là một công cụ check nội dung trùng lặp. Nó cho biết có bao nhiêu trang trong website của bạn có nội dung trùng lặp với nhau. Điều này giúp cho mỗi trang trên website sẽ có nội dung khác biệt. Sự khác nhau với Copyscape là ở chỗ Siteliner chỉ kiểm tra được trùng lặp nội dung trong nội bộ website

6. Một số câu hỏi thường gặp về Google Pandas

Một số câu hỏi thường gặp về Google Pandas

Một số câu hỏi thường gặp về Google Pandas

6.1. Sự ra đời của thuật toán Google Panda

Google Panda được phát hành lần đầu tiên vào tháng 2 năm 2011, là một sự thay đổi lớn trong thuật toán xếp hạng kết quả tìm kiếm của Google. Thực trạng lúc bấy giờ là nhiều “trang web chất lượng thấp” , “trang web nội dung mỏng”, và đặc biệt là hình thức “trang trại nội dung” đang trở nên phổ biến và gây ảnh hưởng nghiêm trọng tới trải nghiệm người dùng. Điều đó đã trở thành chủ đề tranh cãi trong cộng đồng, đã đến lúc Google cần phải thay đổi.

6.2. Mục tiêu của google khi xây dựng thuật toán Panda?

Bản cập nhật này được tạo ra để giảm thứ hạng cho các trang web chất lượng thấp – các trang web không gia tăng giá trị cho người dùng, sao chép nội dung từ các trang web khác hoặc các trang web không hữu ích lắm. Đồng thời, nó sẽ cung cấp thứ hạng tốt hơn cho các trang chất lượng cao – các trang có nội dung và thông tin gốc như những nghiên cứu, báo cáo chuyên sâu, phân tích chi tiết, v.v.

6.3. Thuật toán google panda đánh giá những yếu tố nào, phạt những site nào?

Những yếu tố mà Google Panda sẽ dùng để đánh giá:

  • Nội dung không có giá trị gia tăng.
  • Tín hiệu tiêu cực của người dùng.
  • Quảng cáo chiếm tỉ lệ cao so với nội dung.
  • Mật độ từ khóa cao.
  • Meta title và description không liên quan đến nội dung.
  • Liên kết đến website có chất lượng kém.

Những website có nội dung mỏng, chất lượng kém và đặc biệt là những website content farming sẽ bị trừng phạt nghiêm khắc nhất bởi Google Panda.

KẾT LUẬN

Sau nhiều bản cập nhật thì đến nay, Google Panda đã được tích hợp vào trí tuệ nhân tạo trong phần lõi của Google. Thuật toán Panda liên quan đến chất lượng nội dung nên bạn cần một kế hoạch làm nội dung chuẩn ngay từ đầu, đồng thời bạn cũng cần tối ưu toàn diện cả hai mặt Onpage và Offpage.

Hãy tiếp tục theo dõi blog của chúng tôi để có thêm nhiều thông tin hữu ích về chủ đề SEO!