Trong năm qua, tôi đã chứng kiến nhiều ý kiến phản đối việc “đào sâu” vào 2.595 trang tài liệu bị rò rỉ. Nhưng câu hỏi duy nhất chúng ta nên tự hỏi là: “Làm thế nào để tôi có thể thử nghiệm và học hỏi nhiều nhất có thể từ những tài liệu này?” SEO là một khoa học ứng dụng, nơi lý thuyết không phải là mục tiêu cuối cùng mà là nền tảng cho các thí nghiệm.
1001 ý tưởng thử nghiệm
Bạn không thể yêu cầu một nền tảng tốt hơn cho các ý tưởng thử nghiệm. Nhưng chúng ta không thể thử nghiệm mọi yếu tố theo cùng một cách. Chúng có các loại khác nhau (số/số nguyên: phạm vi, Boolean: có/không, chuỗi: từ/danh sách) và thời gian phản ứng (tức là tốc độ mà chúng dẫn đến thay đổi thứ hạng hữu cơ). Do đó, chúng ta có thể thử nghiệm a/b các yếu tố nhanh và chủ động trong khi chúng ta phải thử nghiệm trước/sau các yếu tố chậm và thụ động.

Thử nghiệm các yếu tố xếp hạng một cách hệ thống bằng cách:
- Chọn một yếu tố xếp hạng
- Chọn chỉ số ảnh hưởng (thành công)
- Xác định nơi bạn thử nghiệm
- Xác định loại thử nghiệm
Các yếu tố xếp hạng
Hầu hết các yếu tố xếp hạng trong bản rò rỉ là số nguyên, nghĩa là chúng hoạt động trên một phổ, nhưng một số yếu tố Boolean dễ thử nghiệm:
- Nén hình ảnh: Có/Không?
- Quảng cáo xen kẽ gây phiền nhiễu: Có/Không?
- Core Web Vitals: Có/Không?
Các yếu tố bạn có thể kiểm soát trực tiếp:
- Trải nghiệm người dùng (UX): Điều hướng, kích thước phông chữ, khoảng cách dòng, chất lượng hình ảnh.
- Nội dung: Mới mẻ, tiêu đề tối ưu, không trùng lặp, giàu thực thể liên quan, tập trung vào một ý định người dùng, nỗ lực cao, ghi nguồn gốc, sử dụng dạng chuẩn của từ thay vì tiếng lóng, chất lượng UGC cao, tác giả chuyên gia.
- Tương tác người dùng: Tỷ lệ hoàn thành nhiệm vụ cao.
Các yếu tố xếp hạng “giáng cấp” (tiêu cực):
- Liên kết từ các trang và tên miền chất lượng thấp
- Anchor text quá “hung hãn” (trừ khi bạn có hồ sơ liên kết cực kỳ mạnh)
- Điều hướng kém
- Tín hiệu người dùng kém
Các yếu tố bạn chỉ có thể ảnh hưởng thụ động:
- Sự phù hợp tiêu đề và liên quan giữa nguồn và tài liệu liên kết
- Số lần nhấp vào liên kết
- Liên kết từ các trang mới và đáng tin cậy
- Độ uy tín tên miền
- Nhắc đến thương hiệu
- PageRank của trang chủ
Bắt đầu bằng việc đánh giá hiệu suất của bạn trong lĩnh vực bạn muốn thử nghiệm. Một trường hợp sử dụng đơn giản là Core Web Vitals.
Số liệu (Metrics)
Chọn chỉ số phù hợp cho yếu tố phù hợp dựa trên mô tả trong tài liệu rò rỉ hoặc hiểu biết của bạn về cách một yếu tố có thể ảnh hưởng đến chỉ số:
- Tốc độ thu thập dữ liệu (Crawl rate)
- Lập chỉ mục (Có/Không)
- Thứ hạng (cho từ khóa chính)
- CTR
- Tương tác (Engagement)
- Từ khóa mà trang xếp hạng
- Nhấp chuột tự nhiên
- Hiển thị (Impressions)
- Rich snippets
Nơi thử nghiệm
Tìm nơi phù hợp để thử nghiệm:
- Nếu bạn hoài nghi, hãy sử dụng một tên miền cụ thể theo quốc gia hoặc một trang web mà bạn có thể thử nghiệm với rủi ro thấp. Nếu bạn có trang web bằng nhiều ngôn ngữ, bạn có thể triển khai thay đổi dựa trên các rò rỉ ở một quốc gia và so sánh hiệu suất tương đối với quốc gia chính.
- Bạn có thể giới hạn thử nghiệm cho một loại trang hoặc thư mục con để cô lập tác động tốt nhất có thể.
- Giới hạn thử nghiệm cho các trang nhắm đến một loại từ khóa cụ thể (ví dụ: “tốt nhất x”) hoặc ý định người dùng (ví dụ: “đọc đánh giá”).
- Một số yếu tố xếp hạng là tín hiệu toàn trang web, như độ uy tín trang, và những yếu tố khác là cụ thể trang, như tỷ lệ nhấp chuột.
Cân nhắc
Các yếu tố xếp hạng có thể hoạt động cùng hoặc chống lại nhau vì chúng là một phần của phương trình. Con người nổi tiếng là kém trong việc hiểu trực quan các hàm với nhiều biến số, nghĩa là chúng ta có thể đánh giá thấp mức độ cần thiết để đạt được điểm số xếp hạng cao, nhưng cũng đánh giá thấp cách một vài biến số có thể ảnh hưởng đáng kể đến kết quả. Sự phức tạp cao của mối quan hệ giữa các yếu tố xếp hạng không nên ngăn cản chúng ta thử nghiệm.
Các trang “tổng hợp” (Aggregators) có thể thử nghiệm dễ dàng hơn các trang “tích hợp” (Integrators) vì họ có nhiều trang tương đương dẫn đến kết quả đáng kể hơn. Integrators, những người phải tự tạo nội dung, có sự khác biệt giữa mỗi trang làm loãng kết quả thử nghiệm.
Thử nghiệm yêu thích của tôi: Một trong những điều tốt nhất bạn có thể làm để hiểu về SEO là đánh giá các yếu tố xếp hạng theo nhận thức của bạn và sau đó thách thức và thử nghiệm giả định của mình một cách hệ thống. Tạo một bảng tính với mỗi yếu tố xếp hạng, cho nó một số từ 0 đến 1 dựa trên ý tưởng của bạn về tầm quan trọng của nó, và nhân tất cả các yếu tố lại với nhau.
Hệ thống giám sát
Thử nghiệm chỉ cho chúng ta câu trả lời ban đầu về tầm quan trọng của các yếu tố xếp hạng. Giám sát cho phép chúng ta đo lường mối quan hệ theo thời gian và đưa ra kết luận vững chắc hơn. Ý tưởng là theo dõi các chỉ số phản ánh các yếu tố xếp hạng, như CTR có thể phản ánh tối ưu hóa tiêu đề, và biểu đồ chúng theo thời gian để xem liệu tối ưu hóa có mang lại kết quả hay không. Ý tưởng không khác gì so với giám sát thường xuyên (hoặc nên là thường xuyên), ngoại trừ việc thêm các chỉ số mới.
Bạn có thể xây dựng hệ thống giám sát trong:
- Looker
- Amplitude
- Mixpanel
- Tableau
- Domo
- Geckoboard
- GoodData
- Power BI
Công cụ không quan trọng bằng chỉ số và đường dẫn URL phù hợp.
Ví dụ về chỉ số
Đo lường các chỉ số theo loại trang hoặc một tập hợp URL theo thời gian để đo lường tác động của tối ưu hóa. Lưu ý: Tôi sử dụng ngưỡng dựa trên kinh nghiệm cá nhân mà bạn nên thách thức.
Tương tác người dùng:
- Số lần nhấp trung bình vào điều hướng
- Độ sâu cuộn trang trung bình
- CTR (từ SERP đến trang web)
Chất lượng backlink:
- % liên kết có phù hợp chủ đề / tiêu đề cao giữa nguồn và đích
- % liên kết từ các trang trẻ hơn 1 năm
- % liên kết từ các trang xếp hạng ít nhất một từ khóa trong top 10
Chất lượng trang:
- Thời gian dừng trung bình (so sánh giữa các trang cùng loại)
- % người dùng ở lại ít nhất 30 giây trên trang
- % trang xếp hạng trong top 3 cho từ khóa mục tiêu
Chất lượng trang web:
- % trang mang lại lưu lượng tự nhiên
- % URL không có nhấp chuột trong 90 ngày qua
- Tỷ lệ giữa trang được lập chỉ mục và không được lập chỉ mục
Thật trớ trêu khi vụ rò rỉ xảy ra ngay sau khi Google bắt đầu hiển thị AI Overviews (AIOs), vì chúng ta có thể sử dụng AI để tìm khoảng trống SEO dựa trên bản rò rỉ. Một ví dụ là sự phù hợp tiêu đề giữa nguồn và đích cho backlink. Với các công cụ SEO thông thường, chúng ta có thể lấy tiêu đề, anchor text và nội dung xung quanh liên kết cho các trang giới thiệu và trang đích.
Sau đó, chúng ta có thể đánh giá mức độ gần gũi chủ đề hoặc sự trùng lặp token với các công cụ AI thông thường, tích hợp Google Sheets/Excel hoặc LLM cục bộ và các lệnh đơn giản như “đánh giá mức độ gần gũi chủ đề của tiêu đề (cột B) so với anchor (cột C) trên thang điểm từ 1 đến 10, với 10 là hoàn toàn giống nhau và 1 là không liên quan chút nào.”

Lịch sử các sự việc rò rỉ lớn
Vụ rò rỉ các yếu tố xếp hạng của Google không phải là lần đầu tiên hoạt động nội bộ của thuật toán một nền tảng lớn được công khai:
1/ Tháng 1/2023, một vụ rò rỉ của Yandex tiết lộ nhiều yếu tố xếp hạng mà chúng ta cũng tìm thấy trong vụ rò rỉ Google mới nhất. Phản ứng “hời hợt” khiến tôi ngạc nhiên như lúc đó.
2/ Tháng 3/2023, Twitter công bố hầu hết các phần của thuật toán của mình. Tương tự như vụ rò rỉ của Google, nó thiếu “ngữ cảnh” giữa các yếu tố, nhưng vẫn rất thú vị.[1]
Biểu đồ hệ thống thuật toán của Twitter
3/ Cũng trong tháng 3/2023, Adam Mosseri, giám đốc Instagram, đăng một bài viết chi tiết về cách nền tảng xếp hạng nội dung trong các phần khác nhau của sản phẩm. [2]
Mặc dù có các vụ rò rỉ, không có trường hợp nào được biết đến về người dùng hoặc thương hiệu “hack” nền tảng một cách sạch sẽ, đạo đức. Càng nhiều nền tảng thưởng cho tương tác trong thuật toán, càng khó để “lách luật”. Tuy nhiên, vụ rò rỉ thuật toán của Google khá thú vị vì nó là một nền tảng dựa trên ý định, nơi người dùng thể hiện sự quan tâm thông qua tìm kiếm thay vì hành vi. Do đó, biết được “nguyên liệu” làm bánh là một bước tiến lớn, ngay cả khi không biết sử dụng bao nhiêu cho mỗi loại.
Tôi không thể hiểu tại sao Google lại giữ bí mật về các yếu tố xếp hạng trong suốt thời gian qua. Tôi không nói họ nên công bố chúng ở mức độ như vụ rò rỉ. Họ có thể đã khuyến khích một web tốt hơn với các trang nhanh, dễ điều hướng, đẹp mắt và cung cấp thông tin. Thay vào đó, họ để mọi người đoán mò quá nhiều, dẫn đến rất nhiều nội dung kém chất lượng, dẫn đến các bản cập nhật thuật toán khiến nhiều doanh nghiệp mất rất nhiều tiền.
Tham khảo:
1. https://github.com/twitter/the-algorithm/blob/main/docs/system-diagram.png
2. https://about.instagram.com/blog/announcements/instagram-ranking-explained