
Google chỉ xác nhận công khai 10 Yếu tố xếp hạng SEO trong lịch sử của mình. Trong bài viết này, tôi sẽ làm rõ những yếu tố nào là thật và yếu tố nào chỉ là suy đoán, mức độ quan trọng của từng yếu tố, và bằng chứng chúng ta có được về chúng.
SEO đã trở nên cực kỳ phức tạp và mang tính kỹ thuật cao trong những năm gần đây. Tôi đã nghe rằng tìm kiếm tự nhiên (Organic Search) từng có khoảng 200 Yếu tố xếp hạng, giờ đã lên đến hơn 500 yếu tố, thậm chí còn nhiều hơn. Nhưng đó chỉ là suy đoán—chỉ có một vài tín hiệu xếp hạng từng được Google xác nhận chính thức. Một số yếu tố đã được “phát hiện” thông qua các nghiên cứu, nhưng phần lớn đều dựa trên giả định hoặc kinh nghiệm cá nhân. Điều này tạo ra quá nhiều không gian cho sự bất định, suy đoán và thông tin sai lệch.
Khám phá sâu hơn: (dành cho người mới bắt đầu) SEO ranking factor là gì?
Yếu tố xếp hạng SEO là một tín hiệu mà Google sử dụng để xếp hạng các trang web trong kết quả tìm kiếm Google Search.
Google áp dụng “Tín Hiệu Xếp Hạng” cho cơ sở dữ liệu tài liệu web của mình để trả về kết quả phù hợp nhất khi người dùng thực hiện tìm kiếm. Điều quan trọng là phải phân biệt giữa việc lập chỉ mục (indexing) và xếp hạng (ranking). Google tạo lập chỉ mục cho các trang thông qua việc sử dụng liên kết để thu thập dữ liệu (crawl) trên toàn bộ web. Xếp hạng không xảy ra trong bước này. Nhiều người nghĩ rằng khi Google không thể lập chỉ mục chính xác một trang, chẳng hạn như vì trang đó sử dụng Javascript không tương thích, điều đó sẽ ảnh hưởng đến xếp hạng. Nhưng không phải vậy.
Tín hiệu xếp hạng sẽ cân nhắc nhiều tham số khác nhau, cả trong và ngoài tài liệu web: nội dung, liên kết, cấu trúc, v.v. Mục tiêu của chúng ta với tư cách là các chuyên gia SEO là tìm ra các Yếu tố xếp hạng mà Google sử dụng để tối ưu hóa trang web nhằm đạt thứ hạng cao hơn trong tìm kiếm tự nhiên.
Chúng ta cần có sự rõ ràng hơn về những điều chúng ta biết và chưa biết trong SEO để cải thiện độ tin cậy, có các cuộc thảo luận tốt hơn và đạt được kết quả tốt hơn. Việc Google sử dụng Machine Learning đang khiến việc hiểu các tín hiệu xếp hạng và cập nhật thuật toán trở nên khó khăn hơn. Điều này sẽ không dễ dàng hơn và việc suy đoán chỉ làm tăng thêm tiếng ồn.
Thay vì so sánh theo phép loại suy, chúng ta cần phải lập luận từ các nguyên tắc cơ bản.
Làm thế nào chúng ta phát hiện các Yếu tố xếp hạng trong SEO?
Câu hỏi “Những Yếu tố xếp hạng nào mà chúng ta thực sự biết chắc chắn?” không hề đơn giản. Google là một hộp đen và sẽ không tiết lộ bí mật về thuật toán trị giá hàng tỷ đô của mình. Việc tạo ra các điều kiện kiểm nghiệm để cô lập một yếu tố và đo lường tác động của nó lên xếp hạng là điều gần như bất khả thi (dù có người đã thử). Hơn nữa, các Yếu tố xếp hạng không còn “rõ ràng” như trước đây. Chúng đã thay đổi rất nhiều theo thời gian và giờ đây thậm chí dường như được cân nhắc khác nhau tùy theo từng truy vấn. Tuy nhiên, có những hệ thống tương tự đã được giải mã thành công. Điều đó không phải là bất khả thi.
Để nâng cao sự hiểu biết của mình, chúng ta có thể rút ra bằng chứng từ 7 nguồn:
- Blog của Google
- Các tuyên bố công khai của nhân viên Google (Googler), chẳng hạn trên Twitter, trong các buổi thuyết trình hoặc phỏng vấn
- Các nghiên cứu/ phân tích Yếu tố xếp hạng
- Hướng dẫn dành cho Người Đánh Giá Chất Lượng của Google
- Hướng dẫn cơ bản về SEO của Google
- Các bằng sáng chế mà Google đã đăng ký hoặc mua lại
- Các giai thoại (người thử nghiệm và đưa ra kết luận)
Không có nguồn nào trong số này là hoàn hảo, nhưng khi kết hợp lại, chúng mang đến cho chúng ta bức tranh rõ ràng nhất có thể. Luôn có một góc độ mà bạn có thể tiếp cận từ đó. Ví dụ, các tín hiệu đã được xác nhận chính thức vẫn không nói cho chúng ta biết cách chúng được tính trọng số trong tổng số tất cả các tín hiệu. Các tuyên bố trên Twitter thường rất chung chung. Và chúng ta thậm chí thấy dữ liệu đôi khi mâu thuẫn với những gì Google nói. Nhưng, chúng ta phải làm việc với những gì mình có ¯_(ツ)_/¯.
Thiết lập các nguyên tắc cơ bản trong SEO
Nguyên tắc cơ bản là những khối xây dựng nhỏ nhất; những điều và luật mà chúng ta biết chắc chắn là đúng. Việc thiết lập các nguyên tắc cơ bản đi kèm với ba ràng buộc. Thứ nhất, chúng ta phải phân biệt giữa tác động trực tiếp và gián tiếp. Việc tối ưu hóa mô tả meta có thể tác động tích cực đến lưu lượng truy cập tự nhiên, nhưng không có tác động trực tiếp đến xếp hạng. Thứ hai, các câu hỏi “tác động bao nhiêu” và “trong trường hợp nào” là rất quan trọng. Không phải Yếu tố xếp hạng nào cũng áp dụng cho mọi truy vấn theo cùng một cách. Ví dụ, QDF (“Query Deserves Freshness” – Truy vấn Cần Tính Mới Mẻ) và HTTPS chỉ áp dụng cho một số từ khóa nhất định. Thứ ba, chúng ta phải phân biệt giữa các Yếu tố xếp hạng tích cực và tiêu cực (ví dụ: lỗi 404 hoặc “nội dung mỏng”).
Mục tiêu mà tôi muốn đạt được với bài viết này là gì? Mục tiêu là làm sắc bén cảm quan về những sự thật đã được chứng minh trong thời kỳ bất định. Việc Google ngày càng sử dụng machine learning khiến cho việc hiểu thuật toán trở nên khó khăn hơn bao giờ hết. Nhưng bằng cách quay lại những nguyên tắc cơ bản, chúng ta sẽ có thể tập trung vào kết quả thay vì những chi tiết suy đoán.
Các Yếu tố xếp hạng được xác nhận chính thức
Chúng ta có thể chia tín hiệu xếp hạng thành ba nhóm:
- Xác nhận chính thức bởi Google
- Được phát hiện thông qua phân tích
- Suy đoán
Tôi sẽ chỉ đề cập đến các tín hiệu đã được xác nhận và được phát hiện trong bài viết này. Tôi không thấy ý nghĩa của việc tăng cường những suy đoán về các tín hiệu xếp hạng bằng cách nhắc đến chúng trong bài viết.
Thứ tự mà các Yếu tố xếp hạng được nhắc đến trong bài này là theo hiểu biết cá nhân của tôi về mức độ quan trọng của chúng. Tôi cho rằng nội dung là tín hiệu quan trọng nhất trong danh sách này và E-A-T là yếu tố ít quan trọng nhất. Tuy nhiên, không yếu tố nào là không quan trọng.
Yếu tố xếp hạng 1: Nội Dung
Trả về kết quả tìm kiếm phù hợp nhất là mục tiêu của mọi công cụ tìm kiếm. Việc triển khai thuật toán Hummingbird vào năm 2013 là một cột mốc quan trọng trong việc giúp Google tiến gần hơn đến mục tiêu đó: Google chuyển trọng tâm sang các thực thể (entities) và mối quan hệ của chúng, điều này giúp Google hiểu rõ hơn về ngữ cảnh và mức độ liên quan.
Trong những ngày đầu của tìm kiếm, chỉ cần đề cập đến từ khóa nhiều lần trên trang là đủ để đạt được sự phù hợp. Nhưng bây giờ, nội dung cần có mức độ phù hợp cao với truy vấn, có chiều sâu thông tin, trả lời tất cả các câu hỏi về chủ đề đó và khớp với ý định tìm kiếm (user intent). Vì vậy, “Nội dung là Yếu tố xếp hạng” có nghĩa là chiều dài, chiều sâu, và mức độ liên quan của nội dung chính (body content) với truy vấn mục tiêu.
Phân tích sâu hơn: những sắc thái của nội dung
Nội dung không chỉ là văn bản; nó còn bao gồm hình ảnh, video, ảnh GIF và nhiều loại hình khác. Tất cả những yếu tố này kết hợp với nhau (xem thêm ở phần “Ý định người dùng”). Việc xếp hạng trong tìm kiếm hình ảnh của Google không phải là lợi ích duy nhất của việc tối ưu hóa hình ảnh. Việc thêm thẻ alt (alt-tag) mô tả và tên tệp (file name) phù hợp làm tăng mức độ liên quan của nội dung, đặc biệt là đối với các truy vấn cần nhiều kết quả hình ảnh, như “hình nền Star Wars”.
Ngoài ra, có sự khác biệt giữa nội dung chính (main content) và nội dung bổ sung (supplementary content), chẳng hạn như văn bản trong footer, header hoặc các phần khác của trang ngoài “phần thân”. Có thể thấy rằng chủ đề “nội dung” mang nhiều sắc thái khác nhau, nhưng tôi đang cố gắng giữ ở mức độ tổng quát.
Cuối cùng, việc “cắt giảm” những nội dung kém chất lượng (content pruning) đã được chứng minh là có hiệu quả nhiều lần. Ý tưởng là giảm số lượng nội dung kém chất lượng trên một tên miền bằng cách cải thiện hoặc loại bỏ chúng (noindex, 404 hoặc redirect). Điều này cho thấy Google có thể đo lường chất lượng nội dung ở cấp độ tên miền, ít nhất là ở một mức độ nào đó. Lưu ý rằng đây không phải là một Yếu tố xếp hạng chính thức, nhưng John Mueller đã đề cập đến chủ đề này trong một buổi Họp Mặt Quản Trị Web, ông nói:
“Vì vậy, nhìn chung, khi nói đến nội dung kém chất lượng, chúng tôi thấy rằng trang web của bạn đang cung cấp thứ gì đó nhưng nó không thực sự hữu ích lắm. Và có hai cách để giải quyết vấn đề này. Một mặt, bạn có thể cải thiện nội dung và từ quan điểm của tôi, nếu bạn có thể cải thiện nội dung thì đó có lẽ là cách tiếp cận tốt nhất vì lúc đó bạn sẽ có thứ gì đó thực sự hữu ích trên trang web và bạn đang mang lại điều có ích cho web nói chung. […] Việc dọn dẹp có thể được thực hiện bằng noindex hoặc 404, tùy vào cách bạn muốn làm điều đó.”
Làm thế nào để biết điều này là đúng?
- Google SEO Starter Guide
- “Việc tạo ra nội dung hấp dẫn và hữu ích có thể sẽ ảnh hưởng đến trang web của bạn nhiều hơn bất kỳ yếu tố nào khác được thảo luận ở đây.” [2]
- “[…] việc tối ưu hóa tên tệp hình ảnh và thẻ alt giúp Google Tìm Kiếm Hình Ảnh (Google Image Search) hiểu rõ hơn về hình ảnh của bạn.”
- “Nếu bạn quyết định sử dụng một hình ảnh làm liên kết, việc điền thẻ alt sẽ giúp Google hiểu thêm về trang bạn đang liên kết. Hãy tưởng tượng bạn đang viết văn bản neo (anchor text) cho một liên kết văn bản.”
- Bài viết:
- “Cách Google Hoạt Động”: “Khi chúng tôi lập chỉ mục một trang web, chúng tôi thêm nó vào mục nhập của tất cả các từ mà nó chứa.” [1]
- “Matt Cutts: Tốc độ có quan trọng hơn sự liên quan không?” [24]
- “Cách Google đang tái tạo chính mình để trở thành công ty dẫn đầu về machine learning” [31]
- “Hiểu rõ hơn về trang web của bạn” [32]
Yếu tố xếp hạng 2: liên kết ngoài và liên kết nội bộ
Các liên kết vẫn có ảnh hưởng đáng kể đến thứ hạng, nhưng các nghiên cứu về Yếu tố xếp hạng và tuyên bố của Google đã chỉ ra rằng tầm quan trọng của chúng đang giảm dần theo thời gian. Liên kết vẫn đóng vai trò trong việc xếp hạng và lập chỉ mục các tài liệu web. Và cũng giống như “nội dung” là một tín hiệu xếp hạng, các liên kết cũng có nhiều sắc thái hơn. Chất lượng của chúng phụ thuộc vào nhiều yếu tố như văn bản neo (anchor text), mức độ mạnh của nguồn liên kết và mức độ phù hợp giữa nội dung của nguồn liên kết và mục tiêu.
Liên kết nội bộ cũng là tín hiệu xếp hạng mạnh. Chúng chuyển giá trị liên kết (link equity) từ trang này sang trang khác. Văn bản neo nội bộ giúp Google hiểu chủ đề và ngữ cảnh của nội dung giống như liên kết bên ngoài. Ngay từ năm 2008, Google đã khuyến nghị “giữ các trang quan trọng trong phạm vi vài lần nhấp từ trang chủ”. Vì vậy, cấu trúc URL có tác động tích cực đến thứ hạng vì nó là một chỉ báo của hệ thống phân cấp thông tin rõ ràng (taxonomy). Tối ưu hóa URL xoay quanh việc duy trì cấu trúc thư mục sạch sẽ, mô tả mà không có bản sao hoặc tham số dư thừa.
Phân tích sâu hơn: Tuổi đời như một chỉ số chất lượng cho liên kết và nội dung
Tôi muốn đề cập đến một bằng sáng chế được phát minh bởi Matt Cutts (một số người có thể còn nhớ ông ấy) và Jeff Dean (hiện là trưởng bộ phận AI của Google), cùng những người khác. Nó mô tả việc sử dụng thông tin lịch sử trong xếp hạng, nhưng tôi muốn thu hẹp lại vào yếu tố tuổi đời của tài liệu và tác động của nó đến chất lượng liên kết. Sự gia tăng đột ngột về số lượng backlink có thể chỉ ra một nỗ lực spam hoặc là điều bình thường tùy thuộc vào tuổi đời của một trang/website.
Yếu tố xếp hạng 3: Ý định người dùng (User Intent)
Tôi đã viết về các loại ý định người dùng khác nhau và cách xác định chúng cho một tập hợp lớn các truy vấn trong bài viết “User Intent mapping on steroids”:
“Ý định người dùng” là mục tiêu mà người dùng đang cố gắng đạt được khi tìm kiếm trực tuyến. SEO truyền thống phân biệt giữa “ý định giao dịch” (transactional), “ý định điều hướng” (navigational) và “ý định thông tin” (informational). Người dùng hoặc muốn mua hàng, truy cập vào một trang cụ thể, hoặc tìm hiểu thêm về một chủ đề nào đó.
Điều này không thay đổi nhiều, nhưng trong phiên bản 2017 của Hướng Dẫn Đánh Giá Chất Lượng của Google (Google Quality Rater Guidelines), Google phân biệt rõ hơn thành bốn ý định chính:
- Biết (Know)
- Làm (Do)
- Website
- Tìm Kiếm Địa Điểm (Visit-in-person)
Sự khác biệt giữa mức độ liên quan của nội dung và ý định người dùng
Mức độ liên quan của nội dung và ý định người dùng có mối liên quan mật thiết nhưng không phải là một. Trước tiên, nếu ý định người dùng không được đáp ứng, một trang sẽ không xếp hạng, trong khi mức độ liên quan của nội dung thì tồn tại trên một dải phổ. Ví dụ, một bài viết trên blog không thể xếp hạng cho một truy vấn yêu cầu danh sách, chẳng hạn như việc làm hoặc bất động sản. Hoặc khi bạn tìm kiếm “Sushi”, kết quả tìm kiếm sẽ là các kết quả địa phương. Google hiểu rằng trong trường hợp này, nhiều người dùng đang tìm kiếm nhà hàng hơn là muốn có một lời giải thích hay định nghĩa.
Với một số truy vấn, hình ảnh là định dạng tốt hơn so với văn bản, chẳng hạn như “hình xăm đẹp” (tattoo inspiration). Trong trường hợp này, bạn nên tạo một bộ sưu tập hình ảnh để xếp hạng cao, thay vì một bài viết dài dòng.
RankBrain là công cụ hỗ trợ việc hiểu rõ ý định người dùng
RankBrain là công cụ hỗ trợ chính để Google hiểu rõ ý định người dùng và là tín hiệu xếp hạng mạnh thứ ba theo tuyên bố của Google:
“Trong hàng trăm tín hiệu mà Google sử dụng khi xếp hạng (một tín hiệu có thể là vị trí địa lý của người dùng hoặc việc tiêu đề trên một trang có khớp với văn bản trong truy vấn hay không), RankBrain hiện được đánh giá là tín hiệu hữu ích thứ ba.”
RankBrain được mô tả là đánh giá “mức độ phù hợp của một tài liệu trong kết quả xếp hạng với truy vấn” (Jeff Dean, trưởng bộ phận AI của Google trong một bài báo của Wired năm 2016 [31]).
Làm thế nào để biết điều này là đúng?
- Bài viết:
- “FAQ: Tất cả về thuật toán Google RankBrain” [23]
- “Cách Google Hoạt Động”: “Việc hiểu ý nghĩa của truy vấn tìm kiếm là điều cốt lõi để trả về câu trả lời tốt. Để tìm các trang có thông tin phù hợp, bước đầu tiên của chúng tôi là phân tích những từ trong truy vấn của bạn có ý nghĩa gì. Chúng tôi xây dựng các mô hình ngôn ngữ để giải mã những chuỗi từ mà chúng tôi nên tìm kiếm trong chỉ mục.” […] “Điều này bao gồm các bước đơn giản như giải thích lỗi chính tả và mở rộng đến việc cố gắng hiểu loại truy vấn bạn đang nhập bằng cách áp dụng một số nghiên cứu mới nhất về hiểu ngôn ngữ tự nhiên.” [1]
Yếu tố xếp hạng 4: Tỷ lệ nhấp (Click-through Rate – CTR)
Tỷ lệ nhấp là tỷ lệ giữa số lần nhấp và số lần hiển thị trong kết quả tìm kiếm của Google. Nó bị ảnh hưởng bởi:
- Nhận diện thương hiệu
- Mức độ liên quan của tiêu đề, mô tả và URL đối với truy vấn
- Có đoạn trích phong phú (rich snippet) hay không
- Các tính năng khác được hiển thị trong kết quả tìm kiếm (và chúng là gì)
Cách thức mà CTR được sử dụng trong xếp hạng không hoàn toàn rõ ràng. Nó thường rơi vào dạng phản hồi tổng quát trong kết quả tìm kiếm. Những câu hỏi ở đây bao gồm: mức độ mạnh của CTR so với các tín hiệu khác như thế nào, nó có ảnh hưởng đến thứ hạng trong thời gian thực không (rất có thể là không), hay liệu có thời gian tích lũy hay không. Bên cạnh việc Google chưa rõ ràng về cách sử dụng, hai nghiên cứu chỉ ra bằng chứng mạnh mẽ cho thấy Google đang sử dụng CTR để xếp hạng các trang.
Ngoài ra, có bằng chứng cho thấy Google có khả năng phân biệt nhiều hơn giữa các nhấp chuột dài và ngắn: “[…] thay vì chỉ đơn thuần phân biệt giữa các nhấp chuột dài và ngắn, một loạt các thời gian xem có thể được đưa vào đánh giá chất lượng kết quả, trong đó các thời gian xem dài hơn trong khoảng thời gian đó sẽ được đánh giá cao hơn so với các thời gian ngắn hơn.” [15]
Làm thế nào để biết điều này là đúng?
- Bằng sáng chế:
- “Sửa đổi thứ hạng kết quả tìm kiếm dựa trên yếu tố thời gian của phản hồi người dùng” [15]
- “Kết hợp số lần nhấp, sự chú ý và mức độ hài lòng vào một Mô Hình Đánh Giá Kết Quả Tìm Kiếm” [26]
- Bài thuyết trình:
- Gary Illes’ tại SMX Munich 2015 [16]
- Cách Google hoạt động [18]
Yếu tố xếp hạng 5: Trải nghiệm người dùng (User Experience)
Trải nghiệm người dùng là một trong những tín hiệu xếp hạng khó định nghĩa nhất vì nó quá mơ hồ và chồng chéo với nhiều tín hiệu khác. Nó có thể bao gồm tất cả các điểm chạm (touchpoints) mà người dùng có với một công ty, nhưng điều đó là không thể đo lường đối với một công cụ tìm kiếm. Nó quá mềm để định lượng. Thay vào đó, chúng ta cần tìm kiếm các yếu tố “cứng” hơn:
- Tính dễ tiếp cận (Accessibility): Một trang được coi là dễ tiếp cận khi nó tải nhanh chóng, không có vấn đề và hiển thị đầy đủ. Một cách để tối ưu hóa cho trường hợp cụ thể này là cung cấp kích thước hình ảnh để tránh “nhảy” khi trang tải. Áp lực từ quảng cáo và tính xâm nhập của quảng cáo cũng thuộc phạm vi này.
- Tính dễ sử dụng (Usability): Mức độ tương thích với các thiết bị khác nhau, tính năng tìm kiếm trên trang, và các lỗi 404 là các chỉ số cho khả năng sử dụng.
- Thiết Kế (Design): Đây là yếu tố mà hầu hết mọi người nghĩ đến khi nhắc tới “trải nghiệm người dùng” và nó thực sự mang một số ý nghĩa nhất định. Ví dụ: nếu một trang trông có vẻ spam, người dùng sẽ thoát ra, điều này có thể ảnh hưởng đến thứ hạng. Các yếu tố quan trọng cho “thiết kế” bao gồm khả năng người dùng dễ dàng tìm thấy và tiêu thụ thông tin, cũng như mức độ tin cậy mà trải nghiệm mang lại.
Các chỉ số tốt để đánh giá trải nghiệm người dùng bao gồm các tín hiệu từ người dùng (tỷ lệ thoát, thời gian ở lại trang, số trang truy cập mỗi phiên) và tín hiệu tương tác (lượt chia sẻ trên mạng xã hội, độ sâu cuộn trang).
Làm thế nào để biết điều này là đúng?
- Bài viết:
- “Cách Google Hoạt Động”: “Các thuật toán này phân tích hàng trăm yếu tố khác nhau để cố gắng hiển thị thông tin tốt nhất mà web cung cấp, từ độ mới mẻ của nội dung, đến tần suất xuất hiện của các thuật ngữ tìm kiếm và liệu trang đó có mang lại trải nghiệm người dùng tốt hay không.” [1]
Yếu tố xếp hạng 6: Thẻ tiêu đề (Title Tag)
Thẻ tiêu đề đã là một trong những tín hiệu xếp hạng mạnh nhất từ trước đến nay. Nó là một chỉ báo mạnh mẽ về mức độ liên quan và cũng ảnh hưởng đến tỷ lệ nhấp (CTR). Việc có từ khóa trong tiêu đề vẫn là một yêu cầu để xếp hạng, ngay cả khi Google đã hiểu ngữ cảnh của các truy vấn. Google xem xét “… mức độ thường xuyên và vị trí mà những từ khóa xuất hiện trên một trang, cho dù trong tiêu đề, tiêu đề phụ hay nội dung chính của văn bản.”
Làm thế nào để biết điều này là đúng?
- Bài Viết:
- “Cách Google Hoạt Động” [1]
- Google SEO Starter Guide [2]
Yếu tố xếp hạng 7: Tốc độ tải trang (Page Speed)
Google lần đầu tiên xác nhận tốc độ tải trang ảnh hưởng đến thứ hạng vào năm 2010 [22] và lần thứ hai vào năm 2018 [21]. Trong khi lần đầu tiên liên quan đến các thiết bị máy tính bàn, lần thứ hai tập trung vào tìm kiếm trên thiết bị di động (không có gì bất ngờ).
Mười năm trước, tốc độ tải trang là một chỉ số đơn giản. Ngày nay, chúng ta cần đo lường nhiều chỉ số khác nhau để có được sự hiểu biết đầy đủ, vì các trang web đã trở nên phức tạp hơn rất nhiều. Công cụ kiểm tra tốc độ của Google, WebPageTest, khuyến nghị “Speed Index” là chỉ số tổng hợp. Nó tích lũy các chỉ số như TTFB (time to first byte), TTFP (time to first paint), TTFMP (time to first meaningful paint), và thời gian tải DOMContent.
Làm thế nào để biết điều này là đúng?
- Bài viết:
- “Sử dụng tốc độ tải trang trong xếp hạng tìm kiếm trên thiết bị di động” [21]
- “Sử dụng tốc độ tải trang trong xếp hạng tìm kiếm trên web” [22]
- “Google Technology Overview” [36]
Yếu tố xếp hạng 8: Độ mới mẻ (Freshness) và QDF (Query Deserves Freshness)
Các kết quả mới mẻ là một mục tiêu hàng đầu của các công cụ tìm kiếm, sau mức độ liên quan. Như đã đề cập trong Hướng Dẫn SEO của Google:
“Đánh giá kết quả tìm kiếm truyền thống thường tập trung vào mức độ liên quan của kết quả, và tất nhiên đó cũng là ưu tiên hàng đầu của chúng tôi. Nhưng người dùng tìm kiếm ngày nay kỳ vọng nhiều hơn ngoài mức độ liên quan. Kết quả có mới và kịp thời không?”
Khái niệm “Freshness” và thuật toán Caffeine của Google
Khái niệm “freshness” trong tìm kiếm đã được thúc đẩy mạnh mẽ khi Google giới thiệu hệ thống lập chỉ mục mới “Caffeine” vào năm 2010 [37]. Nó cho phép Google lập chỉ mục (index) các trang mới trong vòng vài giây và mở đường để chỉ định cho một truy vấn “sự tươi mới”: mức độ liên quan cao hơn theo thời gian. Ví dụ, truy vấn “Bitcoin” hiện rất nhạy cảm với tin tức và thông tin mới, điều này không xảy ra hai năm trước đây.
“Query Deserves Freshness” (QDF)
QDF là tín hiệu xếp hạng mà Amit Singhal, cựu trưởng bộ phận tìm kiếm tại Google, đã đề cập từ năm 2007: “Giải pháp QDF xoay quanh việc xác định xem một chủ đề có đang “hot” hay không. Nếu các trang tin tức hoặc các bài viết trên blog đang tích cực viết về một chủ đề, mô hình sẽ nhận định rằng người dùng có khả năng muốn có thông tin cập nhật hơn. Mô hình cũng kiểm tra dòng truy vấn khổng lồ của chính Google.”
Sự khác biệt giữa “Freshness” và QDF là QDF đo lường sự tăng đột biến trong khối lượng tìm kiếm để xác định xem một truy vấn có đang “hot” không. Nó xếp hạng các nội dung mới cao hơn và hiển thị nhiều tích hợp tin tức hơn trong SERP như một kết quả. Freshness, ngược lại, đề cập đến việc cập nhật nội dung bằng cách bổ sung các dữ kiện hoặc phát hiện mới. Công cụ tìm kiếm luôn muốn hiển thị nội dung được cập nhật nhất có thể, nhưng đó không giống với một truy vấn bất ngờ có mức độ quan tâm cao đột ngột. Hai khái niệm này khác nhau về cường độ tác động.
Làm thế nào để biết điều này là đúng?
- Bằng sáng chế:
- “Truy xuất thông tin dựa trên dữ liệu lịch sử” [40]
- Bài viết:
- “Cách Google Hoạt Động”: “Chúng tôi lưu ý các tín hiệu chính — từ từ khóa đến độ mới mẻ của trang web — và chúng tôi theo dõi tất cả trong chỉ mục Tìm Kiếm.” [1]
- “Google SEO Starter Guide” [2]
- “Mang đến cho bạn những kết quả tìm kiếm mới hơn và gần đây hơn”: “Các truy vấn khác nhau có yêu cầu độ mới mẻ khác nhau. Sự cải tiến thuật toán này được thiết kế để hiểu rõ hơn cách phân biệt giữa những loại tìm kiếm này và mức độ mới mẻ mà bạn cần, và đảm bảo rằng bạn nhận được những câu trả lời cập nhật nhất.” [19]
- New York Times: “Google Tiếp Tục Điều Chỉnh Công Cụ Tìm Kiếm Của Mình” [38]
- Video:
- Matt Cutts “Query Deserves Freshness. Thực Tế Hay Hư Cấu?” [39]
Yếu tố xếp hạng 9: E-A-T (Chuyên môn, uy tín, đáng tin cậy)
E-A-T (“expertise, authority, trustworthiness”) là một tín hiệu rộng khác, giống như trải nghiệm người dùng. Để tối ưu hóa cho E-A-T, bạn cần thêm thông tin vào trang web của mình giúp Google hiểu liệu bạn có phải là một chuyên gia hay không, chẳng hạn bằng cách thêm một trang “giới thiệu” (about page) hoặc cung cấp địa chỉ đầy đủ và chính xác. Nội dung của bạn cần đạt được mức độ chuyên môn yêu cầu cả về chất lượng lẫn độ dài. Viết về khoa học tên lửa sẽ khác hoàn toàn với viết về nhạc rap (không đánh giá gì cả!). Google cũng sẽ xem xét các đề xuất và sự công nhận từ các trang trung lập khác. Đúng, điều này cũng bao gồm cả các liên kết từ các trang uy tín như Wikipedia.
E-A-T bao gồm các yếu tố như độ tuổi của tên miền, danh tiếng, đánh giá và xếp hạng. Một số người trong chúng ta có thể nhớ đến thời của thẻ rel=author, một nỗ lực của Google để đo lường mức độ chuyên môn của con người về các chủ đề cụ thể. Google đã loại bỏ rel=author, nhưng ý tưởng này vẫn còn đó.
Làm thế nào để biết điều này là đúng?
- Bài viết:
- “Cách Google Hoạt Động”: “Để đánh giá mức độ đáng tin cậy và uy tín của một chủ đề, chúng tôi tìm kiếm những trang web mà nhiều người dùng đánh giá cao cho các truy vấn tương tự. Nếu các trang web nổi bật khác trên cùng chủ đề liên kết đến trang, đó là dấu hiệu tốt cho thấy thông tin đó là chất lượng cao.” [1]
- “Hướng Dẫn Đánh Giá Chất Lượng Tìm Kiếm của Google (2017)”: “Mức độ chuyên môn, uy tín và đáng tin cậy (E-A-T) mà một trang web hoặc một trang cung cấp là rất quan trọng. Chất lượng nội dung chính và số lượng, thông tin về trang web và danh tiếng trang web đều ảnh hưởng đến E-A-T của một trang web.” [30]
- Bài thuyết trình:
- Cách Google hoạt động [18]
- Bài viết:
- “Đạt Được Các Kết Quả Tìm Kiếm Có Uy Tín” [28]
Yếu tố xếp hạng 10: Mã hóa SSL (SSL Encryption)
Google xác nhận SSL là một tín hiệu xếp hạng vào năm 2014, sau khi chính Google chuyển sang https hai năm trước đó. Một lần nữa, câu hỏi đặt ra là tín hiệu này có tác động mạnh đến đâu. Khi Google triển khai, HTTPS ảnh hưởng đến khoảng 1% truy vấn và dường như mang ít trọng lượng hơn so với nội dung:
“Hiện tại, nó chỉ là một tín hiệu rất nhẹ—ảnh hưởng đến ít hơn 1% các truy vấn toàn cầu, và mang ít trọng lượng hơn so với các tín hiệu khác như nội dung chất lượng cao—trong khi chúng tôi cho các quản trị viên web thời gian để chuyển sang HTTPS. Nhưng theo thời gian, chúng tôi có thể quyết định tăng cường tín hiệu này, và chúng tôi muốn khuyến khích tất cả các chủ sở hữu trang web chuyển từ HTTP sang HTTPS để giữ an toàn cho mọi người khi truy cập web.”
Việc mã hóa đóng vai trò quan trọng hơn đối với các ngành như bảo hiểm, tài chính và thương mại điện tử so với những lĩnh vực khác. Nó cũng có tính ứng dụng cao hơn trong phần thanh toán/check-out hoặc đăng nhập của trang web so với phần blog, chẳng hạn. Google dường như cung cấp mức độ liên quan cao hơn cho HTTPS trong một số truy vấn và phần của trang web. Điều đó không có nghĩa là HTTPS không quan trọng trong các trường hợp khác: Google thường nhấn mạnh lợi ích của HTTPS cho vấn đề bảo mật nói chung.
Làm thế nào để biết điều này là đúng?
- Bài Viết:
- “HTTPS như một tín hiệu xếp hạng” [25]
- “Google I/O 2014 – HTTPS Everywhere” [43]
Phân tích siêu nghiên cứu các yếu tố xếp hạng (ranking factor meta-analysis)
Bằng chứng mạnh nhất trong nghiên cứu khoa học đến từ một nghiên cứu meta-analyses. Nó xem xét dữ liệu từ nhiều nghiên cứu khác nhau về cùng một chủ đề để hình thành cái nhìn toàn diện. Tôi đã thực hiện một “nghiên cứu giả định meta-analyses về các Yếu tố xếp hạng”, trong đó tôi so sánh kết quả từ 7 nghiên cứu trong 2 năm qua của Searchmetrics, SEMrush và Backlinko*. Đây là “giả định” vì tôi không thể tiếp cận dữ liệu thô của các nghiên cứu, vì vậy tất cả các nhà khoa học trong khán giả có thể yên tâm ;-). (Nếu bất kỳ nhà cung cấp nghiên cứu về Yếu tố xếp hạng nào muốn chia sẻ dữ liệu với tôi – tôi luôn sẵn lòng!).
Trên biểu đồ, bạn thấy các Yếu tố xếp hạng top 10 từ mỗi nghiên cứu. Tôi đã nhóm chúng thành năm nhóm lớn hơn (có màu), để chúng ta có thể thấy các điểm trùng lặp.
(liên kết = màu cam, nội dung = màu vàng, hành vi người dùng = màu xanh lam, xã hội = màu xanh lá, kỹ thuật = màu xám)
Khi chúng ta xem xét các Yếu tố xếp hạng qua các nghiên cứu khác nhau – tôi nghĩ rằng chưa ai từng làm điều này trước đây – chúng ta sẽ thấy trước hết là một sự hỗn độn lớn. Khi nhìn kỹ hơn, tôi thấy có một chút ưu thế của mức độ liên quan và độ dài nội dung kết hợp với hành vi người dùng. Backlinks (liên kết ngược) dường như đứng ở cuối bảng xếp hạng top 10.
Khi nói đến backlinks, số lượng liên kết và số lượng tên miền liên kết dường như vẫn là yếu tố nổi bật nhất.
Chúng ta có thể tranh luận về ý nghĩa và diễn giải các nghiên cứu về Yếu tố xếp hạng đối với ngành SEO, nhưng tôi luôn sẵn lòng học hỏi từ các tập dữ liệu lớn. Phân tích nhỏ này chỉ đơn thuần giúp chúng ta nhìn thấy bức tranh tổng thể hơn.
*Lưu ý thêm: Hãy lưu ý đến tính kịp thời của các nghiên cứu. Các Yếu tố xếp hạng dường như thay đổi (hoặc thích nghi?) nhanh hơn trong những tháng gần đây. Cuối cùng, một số nghiên cứu tập trung vào các bộ từ khóa rộng trong khi các nghiên cứu khác lại xem xét các ngành cụ thể. Điều này khiến chúng chỉ có thể so sánh đến một mức độ nhất định.
Ma trận yếu tố xếp hạng SEO (SEO Ranking Factor Matrix)
Ngoài việc so sánh các nghiên cứu nhỏ ở trên, tôi cũng đưa các Yếu tố xếp hạng vào một ma trận để làm rõ sự khác biệt giữa tín hiệu tích cực so với tiêu cực và đã được xác nhận so với chưa được xác nhận.
(in đậm = các Yếu tố xếp hạng được nhắc đến trong các nghiên cứu, gạch chân = các Yếu tố xếp hạng được đề cập trong các bài blog, tại các hội thảo hoặc trong các diễn đàn)
Tôi không đi sâu vào chi tiết từng tín hiệu để tránh làm quá tải. Chỉ riêng backlinks cũng đã có hơn mười yếu tố chất lượng khác nhau. Điều thú vị là việc đánh giá rất nhiều tín hiệu mà Google đang thực hiện để cung cấp trải nghiệm tìm kiếm tốt. Tìm kiếm đã trở nên rất phức tạp và tinh vi.
Vậy chúng ta rút ra điều gì từ tất cả những điều này?
Tìm kiếm tự nhiên là một hệ thống phi tuyến tính
Tìm kiếm tự nhiên là một hệ thống phi tuyến tính, có nghĩa là tổng thể lớn hơn tổng các phần của nó. Một số yếu tố dường như cộng hưởng, trong khi một số yếu tố khác có vẻ được thúc đẩy bởi các ngưỡng nhất định. Việc có nội dung tuyệt vời, liên kết và trải nghiệm người dùng dường như có tác động mạnh hơn so với từng yếu tố riêng lẻ. Google cũng dường như đo lường các yếu tố tiêu cực bằng cách đặt ra các ngưỡng: một vài lỗi 404 sẽ không gây hại, nhưng sau một tỷ lệ nhất định, Google dường như củng cố các hậu quả tiêu cực. Tôi chỉ có bằng chứng quan sát cho điều này, vì vậy tôi rất tò mò về trải nghiệm của các bạn!
Thực tế là chúng ta không biết mối quan hệ chính xác giữa từng Yếu tố xếp hạng. Và, nếu thực sự có 200 (hoặc nhiều hơn) Yếu tố xếp hạng, chúng ta phải thừa nhận rằng hầu hết đều không được biết đến với chúng ta. Điều đó không có nghĩa là chúng ta không thể bàn luận về chúng hoặc tiến hành các thí nghiệm, nhưng chúng ta phải trung thực về những gì chúng ta biết và không biết.
Nhưng ngay cả khi không có kiến thức đó, chúng ta vẫn có thể tập trung vào những phần mà chúng ta biết là tạo ra sự khác biệt – vào những nguyên tắc cơ bản của SEO:
- Nội dung
- Liên kết nội bộ và liên kết bên ngoài
- Ý định của người dùng
- CTR
- Trải nghiệm người dùng
- Thẻ tiêu đề
- Tốc độ trang
- Độ mới mẻ
- E-A-T
- Mã hóa SSL
Bạn không bao giờ có thể làm tốt các nguyên tắc cơ bản này một cách đủ tốt.
Nguồn tham khảo
- Cách Google Hoạt Động: Thu Thập, Lập Chỉ Mục và Xếp Hạng
- Google SEO Starter Guide
- Nghiên Cứu Yếu tố xếp hạng Backlinko
- Các Yếu tố xếp hạng Google Backlinko
- Các Yếu tố xếp hạng SEMrush
- Nghiên Cứu Các Yếu tố xếp hạng Searchmetrics
- Các Yếu tố xếp hạng Tài Chính Searchmetrics
- Các Yếu tố xếp hạng Du Lịch Searchmetrics
- Các Yếu tố xếp hạng Truyền Thông Searchmetrics
- Các Yếu tố xếp hạng Y Tế Searchmetrics
- Báo Cáo Thu Nhập Quý 4/2017 của Alphabet
- Bài Luận Nổi Tiếng về PageRank của Stanford
- Bằng Sáng Chế của Google về Các Yếu Tố Click Trong Kết Quả Tìm Kiếm
- Các Công Nghệ Đằng Sau Việc Xếp Hạng của Google
- Gary Illes’ Presentation tại SMX Munich 2015
- Gary Illyes – Google Xác Nhận Về CTR Tại Hội Thảo SMX Munich 2015
- Tại Sao Google Sử Dụng Dữ Liệu Lịch Sử Để Đánh Giá Kết Quả Tìm Kiếm
- Google SEO Starter Guide – Các Yếu tố xếp hạng Được Google Khuyến Nghị
- Cập Nhật Về Thuật Toán “Query Deserves Freshness” Của Google
- Công Bố Thuật Toán RankBrain: Cách Google Xếp Hạng Và Xử Lý Truy Vấn
- Google Sử Dụng Tốc Độ Trang Làm Yếu tố xếp hạng
- Tốc Độ Tải Trang Trên Di Động Là Yếu tố xếp hạng
- Công Bố Về RankBrain: Yếu tố xếp hạng Hàng Đầu Của Google
- Cách Google Làm Việc Với Các Thuật Toán Mới
- Hướng Dẫn Google Về HTTPS Và Tính Bảo Mật
- Patents: Điều Chỉnh Kết Quả Tìm Kiếm Dựa Trên Phản Hồi Người Dùng
- Giới Thiệu Thuật Toán Mới Của Google RankBrain
- Google Quality Rater Guidelines – Tiêu Chuẩn Đánh Giá Chất Lượng Kết Quả
- Google Khuyến Nghị Cấu Trúc Liên Kết Nội Bộ
- Các Cập Nhật Về Tính Mới Mẻ Của Nội Dung
- Google Xây Dựng Cơ Sở Tìm Kiếm Trên AI
- Google I/O 2014 – Tính Bảo Mật Và HTTPS
- Các Hướng Dẫn Về Tìm Kiếm Của Google
- Các Bằng Sáng Chế Của Google Về Nhận Dạng Dữ Liệu Lịch Sử
- Patents Của Google Về Hệ Thống Lập Chỉ Mục Caffeine
- Các Phương Pháp Tối Ưu Hóa Tốc Độ Trang Web
- Công Bố Bằng Sáng Chế Về Dữ Liệu Lịch Sử
- Các Thông Tin Về Các Yếu Tố Chất Lượng Liên Kết
- Video Về Các Yếu tố xếp hạng Của Google