
Ngày 28/4, Brian Dean từ Backlinko đã công bố một nghiên cứu về các yếu tố xếp hạng, gây ra khá nhiều tranh cãi trong cộng đồng SEO. SEJ (Search Engine Journal) đã hợp tác với Bill Slawski để phản bác, tiếp đến là nhiều luồng ý kiến phẫn nộ trên Twitter, và cuối cùng Gary Illyes đã xác nhận rằng tốc độ trang chỉ là một yếu tố xếp hạng “rất nhỏ bé”.
Thật dễ để gạt bỏ các nghiên cứu về yếu tố xếp hạng sang một bên. Một số lý lẽ phổ biến thường được đưa ra là:
- Tương quan không đồng nghĩa với nhân quả.
- Google không sử dụng các yếu tố xếp hạng.
- Không ai có thể phân tích quy mô dữ liệu như Google, do đó không mẫu thử nào đủ lớn.
Dù tất cả các lý lẽ trên đều có phần đúng, nhưng chúng cũng là cách dễ dàng để né tránh vấn đề. Thứ nhất, mọi mối quan hệ nhân quả đều có sự tương quan ở đâu đó. Thứ hai, chỉ có một vài người trên thế giới biết được “thuật toán cốt lõi” của Google trông như thế nào, nhưng chắc chắn phải có một danh sách các yếu tố ảnh hưởng đến thứ hạng. Vì vậy, việc chúng ta gọi chúng là tín hiệu, yếu tố hay bộ lọc không thay đổi bản chất của vấn đề. Thứ ba, từ chối bất kỳ dữ liệu nào chỉ vì không có mẫu thử khổng lồ là cách tiếp cận sai lầm đối với các nghiên cứu. Trong sinh học, y học hay khoa học xã hội, người ta luôn suy luận từ các mẫu nhỏ hơn và không bao giờ coi một nghiên cứu là kết luận cuối cùng. Nhiều nghiên cứu chỉ ra cùng một kết quả sẽ làm tăng độ tin cậy trong việc tiếp cận chân lý, và đó cũng là cách mà chúng ta nên áp dụng khi đánh giá các nghiên cứu.
Tôi đã dành vài giờ để xem xét kỹ lưỡng dữ liệu từ nghiên cứu của Backlinko và xây dựng một bài phân tích chi tiết hơn. Chúng ta hãy cùng tách biệt giữa những dữ liệu thực tế và những câu chuyện suy diễn.
Nội dung nghiên cứu
Trước tiên, tôi sẽ cung cấp một số thông tin cơ bản:
- Nghiên cứu: Backlinko Study
- Phương pháp: Phương pháp nghiên cứu
- Phương pháp chi tiết: Báo cáo chi tiết
Sự kiện xảy ra – chỉ là những sự thật
Bây giờ, hãy tập trung vào những gì đã xảy ra mà không đưa ra phán xét hay suy diễn.
Brian và đội ngũ của mình đã phân tích 11,8 triệu từ khóa để tìm hiểu các yếu tố xếp hạng có tương quan với thứ hạng trên trang kết quả tìm kiếm. Nghiên cứu được thực hiện với sự hỗ trợ của AHREFS (cung cấp dữ liệu liên kết) và Clearscope (cung cấp dữ liệu điểm nội dung).
Những kết quả chính được tóm tắt như sau:
- DR (Domain Rating) của AHREFS có tương quan mạnh với thứ hạng cao hơn.
- Các trang xếp hạng #1 có lượng backlink nhiều gấp 3,8 lần so với các trang xếp hạng #2-10.
- Nội dung có điểm số cao từ Clearscope vượt trội hơn các nội dung có điểm thấp.
- Tốc độ trang cao hơn trên Alexa không có tương quan với thứ hạng tốt hơn.
- Độ phổ biến của tên miền cao hơn dẫn đến thứ hạng tốt hơn.
- “Đa số các thẻ tiêu đề trên Google hoàn toàn hoặc một phần khớp với từ khóa mà chúng xếp hạng. Tuy nhiên, chúng tôi phát hiện ra rằng không có mối tương quan nào giữa việc sử dụng từ khóa trong thẻ tiêu đề và thứ hạng cao hơn trên trang đầu tiên.”
- Page Authority (PA) của AHREFS có tương quan yếu với thứ hạng.
- Số lượng từ trong nội dung được phân bố đều trong top 10 kết quả.
- Kích thước HTML của trang không tương quan với thứ hạng.
- URL ngắn có xu hướng xếp hạng cao hơn một chút so với URL dài hơn.
- Schema Markup không tương quan với thứ hạng cao hơn.
- Thời gian trên trang lâu hơn có tương quan với thứ hạng cao hơn.
Phương pháp:
- Đội ngũ đã quét hơn 1 triệu trang để lấy dữ liệu về các yếu tố trên trang.
- Các URL lớn như amazon.com hoặc youtube.com không được quét (các “tên miền lớn”).
- 6% số URL không thể quét được do lỗi kỹ thuật (7,6 triệu URL đã được quét và sử dụng).
- API của Alexa được sử dụng để lấy dữ liệu về tốc độ trang và thời gian trên trang.
- Clearscope cung cấp điểm nội dung cho 1.000 từ khóa có lượng tìm kiếm cao.
- AHREFS cung cấp 1,1 triệu từ khóa với 11,8 triệu kết quả xếp hạng (10 triệu URL duy nhất).
Phê bình nghiên cứu
Bây giờ, Infinity sẽ đưa ra những đánh giá của riêng mình về các kết quả này.
Trước hết, Brian đã sử dụng ngôn ngữ như “[…] rất khó để xác định nguyên nhân cơ bản của mối quan hệ này chỉ từ dữ liệu của chúng tôi”. Anh ấy cố gắng cẩn thận với các tuyên bố tuyệt đối, nhưng cá nhân tôi nghĩ anh ấy có thể làm tốt hơn. Tất nhiên, việc luôn phải đưa ra sự thận trọng và thừa nhận rằng không thể đưa ra kết luận chắc chắn sẽ không hấp dẫn người đọc. Nhưng đó là cách tiếp cận khoa học mà chúng ta nên áp dụng.
Một trong những điểm phê bình lớn nhất đối với nghiên cứu này là các phát biểu tổng quát hóa quá mức, và tôi đồng ý rằng các kết quả của nghiên cứu được diễn đạt theo cách gây chú ý hơn là cần thiết.
Dữ liệu chung
Theo phong cách khoa học, một điều khiến tôi băn khoăn là các hệ số tương quan/thống kê và ý nghĩa của chúng không được hiển thị. Việc chỉ đọc rằng một số tương quan là mạnh hay yếu không mang lại nhiều thông tin hữu ích như việc nhìn vào giá trị thực tế.
Loại trừ tên miền
Tôi nghĩ nghiên cứu đã loại bỏ quá nhiều tên miền lớn. Các URL như amazon.com hay youtube.com không được quét. Danh sách đầy đủ bao gồm:
- en.wikipedia.org
- youtube.com
- amazon.com
- facebook.com
- pinterest.com
- yelp.com
- tripadvisor.com
- ebay.com
- reddit.com
- linkedin.com
- twitter.com
- walmart.com
- imdb.com
- yellowpages.com
- mapquest.com
- quora.com
- etsy.com
- target.com
- instagram.com
Những tên miền lớn này chiếm 2,1 triệu URL trong tổng số 10 triệu URL duy nhất.
Không có gì lạ khi Wikipedia thường bị loại ra khỏi các nghiên cứu về yếu tố xếp hạng vì tên miền này có thể làm lệch kết quả rất nhiều. Tuy nhiên, chúng ta cần tự hỏi liệu việc loại trừ toàn bộ các tên miền lớn như vậy có còn phản ánh chính xác tình hình web không?
Tôi cho rằng việc loại bỏ tất cả các tên miền lớn là một sai lầm vì nó có thể làm méo mó kết quả và tạo ra một bức tranh không chính xác về các yếu tố xếp hạng.
Backlink
Hơn 95% URL có 0 backlink, theo kết quả phân tích. Bỏ qua tất cả các lý thuyết về yếu tố xếp hạng và thuật toán học sâu, đây là một thực tế rất thú vị (nếu dữ liệu là chính xác).
Tuy nhiên, điều này khiến tôi đặt câu hỏi: Nếu hơn 95% URL không có backlink, thì làm thế nào để DR của AHREFS có thể có tương quan cao với thứ hạng? Có vẻ như các trang không có backlink đã bị bỏ qua, và điều này lại làm sai lệch kết quả một lần nữa.
Kết luận
Tóm lại, chúng ta không thể đơn giản bác bỏ nghiên cứu này, nhưng rõ ràng nó vẫn đưa ra một số kết luận đáng nghi ngờ.
Một vài bài học tôi rút ra từ nghiên cứu này:
- Độ Uy Tín của Tên Miền (Domain Authority) có thể quan trọng hơn Độ Uy Tín của Trang (Page Authority).
- Các công cụ như Clearscope đáng để thử nghiệm cho việc tối ưu hóa nội dung.
- Chúng ta cần nhiều nghiên cứu về các yếu tố xếp hạng hơn và nên tìm kiếm các điểm chung giữa chúng.
Bạn nghĩ gì về nghiên cứu này?