Có hai xu hướng tác động đến cách Google lập chỉ mục. Trong khi web mở đã thu hẹp, Google cần phải thu thập thông tin qua các nền tảng nội dung lớn như Youtube, Reddit và TikTok, thường được xây dựng trên các khuôn khổ JS “phức tạp”, để tìm nội dung mới. Đồng thời, AI đang thay đổi động lực cơ bản của web bằng cách làm cho nội dung tầm thường và kém trở nên thừa thãi.
Trong quá trình làm việc với một số trang web lớn nhất trên web, gần đây tôi nhận thấy mối quan hệ nghịch đảo giữa các trang được lập chỉ mục và lưu lượng truy cập tự nhiên. Nhiều trang hơn không tự động là tệ nhưng thường không đáp ứng được kỳ vọng về chất lượng của Google. Hay nói cách khác, định nghĩa về chất lượng đã thay đổi. Rủi ro đối với SEO là rất cao: mở rộng quá mức và toàn bộ tên miền của bạn có thể bị ảnh hưởng. Chúng ta cần thay đổi tư duy về chất lượng và phát triển các hệ thống giám sát giúp chúng ta hiểu được chất lượng tên miền ở cấp độ trang.
Google đã ăn no
Google đã thay đổi cách xử lý tên miền, bắt đầu từ khoảng tháng 10 năm 2023: Không có ví dụ nào cho thấy mối quan hệ nghịch đảo trước tháng 10. Ngoài ra, Google đã gặp sự cố lập chỉ mục khi họ tung ra bản cập nhật thuật toán cốt lõi vào tháng 10 năm 2023, giống như những gì đã xảy ra trong bản cập nhật tháng 8 năm 2024.
Trước khi thay đổi, Google đã lập chỉ mục mọi thứ và ưu tiên nội dung chất lượng cao nhất trên một tên miền. Hãy nghĩ về nó giống như việc đãi vàng, khi bạn đổ đầy một chiếc chảo bằng sỏi, đất và nước rồi xoay và khuấy cho đến khi chỉ còn lại vật liệu có giá trị.
Bây giờ, một tên miền và nội dung của nó cần phải chứng minh được bản thân trước khi Google thậm chí cố gắng đào vàng. Nếu tên miền có quá nhiều nội dung chất lượng thấp, Google có thể chỉ lập chỉ mục một số trang hoặc không lập chỉ mục nào trong trường hợp cực đoan.
Một ví dụ là doordash.com , đã thêm nhiều trang trong 12 tháng qua và mất lưu lượng truy cập tự nhiên trong quá trình này. Ít nhất một số, có thể là tất cả, các trang mới không đáp ứng được kỳ vọng về chất lượng của Google.
Nhưng tại sao? Cái gì đã thay đổi? Tôi lý luận rằng:
- Google muốn tiết kiệm tài nguyên và chi phí khi công ty hướng tới trạng thái hiệu quả hoạt động.
- Chỉ mục một phần hiệu quả hơn đối với nội dung chất lượng thấp và thư rác. Thay vì lập chỉ mục và sau đó cố gắng xếp hạng các trang mới của một tên miền, Google quan sát chất lượng chung của một tên miền và xử lý các trang mới với sự hoài nghi tương ứng.
- Nếu một tên miền liên tục tạo ra nội dung chất lượng thấp, nó sẽ không có cơ hội làm ô nhiễm thêm chỉ mục của Google.
- Tiêu chuẩn chất lượng của Google đã tăng lên vì có nhiều nội dung hơn trên web, đồng thời cũng để tối ưu hóa chỉ mục cho RAG ( AI Overviews) và các mô hình đào tạo.
Sự nhấn mạnh vào chất lượng tên miền như một tín hiệu có nghĩa là bạn phải thay đổi cách giám sát trang web của mình để tính đến chất lượng. Nguyên tắc chỉ đạo của tôi: “Nếu bạn không thể thêm bất cứ điều gì mới hoặc tốt hơn vào web, thì có lẽ nó không đủ tốt.”
Thực phẩm chất lượng (content)
Chất lượng tên miền là thuật ngữ của tôi để mô tả tỷ lệ các trang được lập chỉ mục đáp ứng tiêu chuẩn chất lượng của Google so với không. Lưu ý rằng chỉ các trang được lập chỉ mục mới được tính là chất lượng. Tỷ lệ phần trăm tối đa các trang “xấu” trước khi Google giảm lưu lượng truy cập vào một tên miền vẫn chưa rõ ràng, nhưng chúng ta chắc chắn có thể thấy khi nào đạt được:
Tôi định nghĩa chất lượng tên miền là tín hiệu bao gồm 3 lĩnh vực: trải nghiệm của người dùng, chất lượng nội dung và điều kiện kỹ thuật:
- Trải nghiệm của người dùng: người dùng có tìm thấy những gì họ đang tìm kiếm không?
- Chất lượng nội dung: information gain, thiết kế nội dung, tính toàn diện
- Tối ưu hóa về mặt kỹ thuật: nội dung trùng lặp, hiển thị, nội dung trên trang theo ngữ cảnh, “ crawled, not indexed / discovered”, soft 404s

Sự gia tăng đột ngột trong các trang được lập chỉ mục thường chỉ ra một vấn đề kỹ thuật như nội dung trùng lặp từ các tham số, quốc tế hóa hoặc phân trang bị hỏng. Trong ví dụ bên dưới, Google đã ngay lập tức giảm lưu lượng truy cập tự nhiên vào tên miền này khi logic phân trang bị hỏng, gây ra nhiều nội dung trùng lặp. Tôi chưa bao giờ thấy Google phản ứng nhanh với các lỗi kỹ thuật, nhưng đó là trạng thái SEO mới mà chúng ta đang trải qua.
Trong những trường hợp khác, sự gia tăng đột biến trong các trang được lập chỉ mục cho thấy một trò chơi SEO theo chương trình, trong đó tên miền đã khởi chạy nhiều trang trên cùng một mẫu. Khi chất lượng nội dung trên các trang theo chương trình không đủ tốt, Google sẽ nhanh chóng tắt vòi lưu lượng truy cập.
Để đáp lại, Google thường giảm số lượng từ khóa xếp hạng ở 3 vị trí đầu. Số lượng từ khóa xếp hạng ở các vị trí khác thường tương đối ổn định.
Kích thước làm tăng vấn đề: chất lượng tên miền có thể là vấn đề lớn hơn đối với các trang web lớn hơn, mặc dù các trang web nhỏ hơn cũng có thể bị ảnh hưởng.
Thêm trang mới vào tên miền của bạn không phải là xấu. Bạn chỉ cần cẩn thận về điều đó. Ví dụ, việc xuất bản nội dung tiếp thị sản phẩm hoặc tư duy lãnh đạo mới không nhắm trực tiếp vào từ khóa vẫn có thể rất có giá trị đối với khách truy cập trang web. Đó là lý do tại sao việc đo lường mức độ tương tác và sự hài lòng của người dùng trên các số liệu SEO là rất quan trọng.
Chế độ ăn kiêng
Cách quan trọng nhất để tránh “béo phì” (các trang chất lượng thấp) và giảm nguy cơ bị ảnh hưởng bởi bản cập nhật Core là thiết lập hệ thống giám sát phù hợp. Thật khó để cải thiện những gì bạn không đo lường.
Trọng tâm của hệ thống giám sát chất lượng tên miền là bảng điều khiển theo dõi số liệu cho từng trang và so sánh chúng với mức trung bình. Nếu tôi chỉ có thể chọn ba số liệu, tôi sẽ đo tỷ lệ thoát ngược, chuyển đổi (mềm và cứng) và nhấp chuột + xếp hạng theo loại trang trên mỗi trang so với mức trung bình. Lý tưởng nhất là hệ thống của bạn sẽ cảnh báo bạn khi tỷ lệ thu thập dữ liệu tăng đột biến, đặc biệt là đối với các trang mới chưa được thu thập dữ liệu trước đó.
Như tôi đã viết trong bài “Cách các công ty đo lường chất lượng nội dung“:
1/ Đối với chất lượng sản xuất, hãy đo các số liệu như điểm biên tập SEO, điểm Flesch/khả năng đọc hoặc # lỗi chính tả/ngữ pháp
2/ Đối với chất lượng hiệu suất, hãy đo các số liệu như # 3 thứ hạng cao nhất, tỷ lệ thời gian trên trang so với thời gian đọc ước tính, tỷ lệ thoát ngược, độ sâu cuộn hoặc giá trị đường ống
3/ Đối với chất lượng bảo quản, hãy đo lường các số liệu hiệu suất theo thời gian và năm này qua năm khác
Bỏ qua các trang như Điều khoản dịch vụ hoặc Giới thiệu khi theo dõi trang web của bạn vì chức năng của chúng không liên quan đến SEO.
Giai đoạn tăng
Giám sát là bước đầu tiên để hiểu chất lượng tên miền của trang web của bạn. Bạn không phải lúc nào cũng cần thêm nhiều trang hơn để phát triển. Thông thường, bạn có thể cải thiện kho trang hiện có của mình, nhưng trước tiên bạn cần một hệ thống giám sát để tìm ra điều này.
Adidas là một ví dụ điển hình về một tên miền có thể tăng lượng truy cập tự nhiên chỉ bằng cách tối ưu hóa các trang hiện có.
Một ví dụ khác là Redfin, công ty này duy trì số lượng trang nhất quán trong khi vẫn tăng đáng kể lượng truy cập tự nhiên.
Trích dẫn lời của Giám đốc phát triển sản phẩm cấp cao trong bài phân tích sâu về Redfin của tôi về việc đáp ứng tiêu chuẩn chất lượng phù hợp:
Mang chuyên môn địa phương của chúng tôi vào trang web – trở thành đơn vị có thẩm quyền về thị trường nhà ở, giải đáp thắc mắc về cuộc sống ở một khu vực, cung cấp đầy đủ thông tin về nhà ở để bán và cho thuê trên khắp Hoa Kỳ.
Duy trì sự xuất sắc về mặt kỹ thuật – trang web của chúng tôi lớn (hơn 100 triệu trang) nên chúng tôi không thể ngủ quên trên những thứ như hiệu suất, tình trạng thu thập dữ liệu và chất lượng dữ liệu. Đôi khi những nỗ lực “ít hấp dẫn” nhất có thể có tác động lớn nhất.
Các công ty như Lending Tree hoặc Progressive đã đạt được những thành quả đáng kể khi giảm các trang không đạt tiêu chuẩn chất lượng của họ (xem ảnh chụp màn hình từ Deep Dives bên dưới).


Phần kết luận
Google thưởng cho các trang web luôn phù hợp. Vào năm 2020, tôi đã viết về việc chỉ mục của Google có thể nhỏ hơn chúng ta nghĩ . Kích thước chỉ mục từng là mục tiêu ban đầu. Nhưng ngày nay, mục tiêu không còn là lập chỉ mục càng nhiều trang được lập chỉ mục càng tốt mà là lập đúng trang. Định nghĩa về “tốt” đã thay đổi. Google kén chọn hơn về việc ai được phép vào câu lạc bộ.
Trong cùng bài viết, tôi đưa ra giả thuyết rằng Google sẽ chuyển sang API lập chỉ mục và để chủ sở hữu trang web chịu trách nhiệm lập chỉ mục. Điều đó vẫn chưa thành hiện thực, nhưng bạn có thể nói rằng Google đang sử dụng nhiều API hơn để lập chỉ mục:
- Thỏa thuận trị giá 60 đô la/năm giữa Google và Reddit cung cấp một phần mười kết quả tìm kiếm của Google (giả sử Reddit có mặt trong top 10 cho hầu hết mọi từ khóa).
- Trong thương mại điện tử , nơi nhiều danh sách tự nhiên hiển thị ở vị trí cao hơn trong kết quả tìm kiếm , Google dựa nhiều hơn vào nguồn cấp dữ liệu sản phẩm trong Merchant Center để lập chỉ mục cho các sản phẩm mới và chỉnh sửa Biểu đồ mua sắm.
- Các tính năng SERP như Tin tức hàng đầu, rất quan trọng trong ngành Tin tức , là những dịch vụ nhỏ có logic lập chỉ mục riêng.
Nhìn về tương lai, câu hỏi lớn về lập chỉ mục là nó sẽ thay đổi như thế nào khi nhiều người dùng tìm kiếm thông qua Tổng quan AI và chatbot AI. Giả sử LLM vẫn cần có khả năng hiển thị các trang, công việc SEO kỹ thuật vẫn là điều cần thiết—tuy nhiên, động lực lập chỉ mục thay đổi từ việc hiển thị kết quả web sang đào tạo mô hình. Do đó, giá trị của các trang không có gì mới để cung cấp sẽ thậm chí còn gần bằng không hơn hiện nay.