
Trích dẫn từ Search Engine Land (đã được nhấn mạnh):
Prabhakar Raghavan, người trước đây phụ trách mảng quảng cáo và thương mại (từ năm 2018), sẽ thay thế Ben Gomes làm trưởng bộ phận Search và Google Assistant. Bộ phận Search bao gồm cả News (Tin tức), Discover, Podcasts và Google Assistant. Raghavan đã có một lịch sử lâu dài với lĩnh vực tìm kiếm, từng làm việc tại IBM vào năm 1995, sau đó đảm nhận vị trí tại Stanford, nơi ông giảng dạy khóa học đầu tiên về tìm kiếm trong khoa Khoa học Máy tính. Ông cũng là tác giả của một cuốn sách nền tảng trong lĩnh vực này.
Trích dẫn từ CNBC:
Google đã thông báo về sự tái cơ cấu vào thứ Năm vừa qua, trong đó các lãnh đạo phụ trách Search, Assistant và mảng quảng cáo sẽ báo cáo trực tiếp với Prabhakar Raghavan – người đứng đầu bộ phận Search mới.
Raghavan sẽ báo cáo trực tiếp với CEO Sundar Pichai.
Động thái này diễn ra khi Google dự đoán sẽ phải đối mặt với áp lực từ các nhà quản lý chống độc quyền, những người đang nhắm vào các mảng Search, quảng cáo và hệ điều hành Android của công ty. Bộ Tư pháp Hoa Kỳ cùng gần 50 tổng chưởng lý đang dự định khởi kiện trong vài tháng tới và đã bàn thảo về các biện pháp có thể chia tách công ty.
Có rất nhiều điểm thú vị cần nhắc đến trong sự thay đổi này.
Đầu tiên, việc Search bao gồm các mảng Tin tức, Discover, Podcasts và Google Assistant cho thấy rõ những ưu tiên sắp tới của SEO (không nên đánh giá quá cao vai trò của Assistant).
Thứ hai, Prabhakar Raghavan là một người có năng lực xuất chúng và là một trong những người quan trọng nhất trong lĩnh vực truy xuất thông tin và tìm kiếm trên toàn cầu. Ông từng xuất bản các cuốn sách như An Introduction to Information Retrieval vào năm 2009, một tác phẩm nền tảng với phần mục lục trải dài đến 5 trang. Ông cũng đã đăng tải rất nhiều bài báo khoa học và có trong tay vô số bằng sáng chế.
Một trong những bằng sáng chế quan trọng nhất của ông là một sáng tạo mang tên User-Sensitive PageRank. Đúng vậy, chúng ta phải cẩn trọng với các bằng sáng chế vì không ai biết chắc liệu Google có sử dụng công nghệ đã được mô tả hay không. Tuy nhiên, chúng có thể giúp chúng ta mở rộng sự hiểu biết về SEO.
Sau nhiều giờ nghiền ngẫm, tôi nghĩ rằng bằng sáng chế này đã mô tả rất nhiều xu hướng mà chúng ta hiện thấy trong tìm kiếm ngày nay. Tôi cho rằng điều này là vô cùng quan trọng.
Tại sao?
Bởi khi chúng ta nhìn vào bằng sáng chế, nó được nộp vào năm 2009… và chỉ được cấp vào tháng 11 năm 2016.
Cuối năm 2016 cũng là khoảng thời gian mà RankBrain xuất hiện cùng nhiều bản cập nhật khác được triển khai, như tôi đã mô tả trong bài viết Impact Analysis of the May Core Update 2020 (hoặc tập #89).
Vậy, hãy cùng “mổ xẻ” bằng sáng chế này (theo nghĩa bóng nhé).
User-Sensitive PageRank – PageRank nhạy cảm với người dùng
Ý tưởng cốt lõi của User-Sensitive PageRank là PageRank truyền thống có nhiều khuyết điểm. Nó nghe có vẻ ổn trên lý thuyết, nhưng lại không thực tế.
Bằng sáng chế đã chỉ ra 4 lý do sau:
- Mô hình Người Duyệt Web Ngẫu Nhiên (Random Surfer Model) cho rằng tất cả các liên kết trên một trang đều có khả năng được nhấp vào với xác suất như nhau. Nhưng thực tế không phải như vậy. Một số liên kết như “điều khoản sử dụng” hay “chính sách bảo mật” hiếm khi được nhấp vào.
- Người dùng bắt đầu một phiên duyệt web mới trên tất cả các trang với khả năng như nhau. Tuy nhiên, một số trang web có xác suất được truy cập cao hơn vì chúng được tin tưởng nhiều hơn, chẳng hạn như Wikipedia.
- Ý tưởng về TrustRank được xây dựng để chống lại spam liên kết, chứ không phải để xếp hạng tài liệu hay theo dõi hành vi người dùng.
- PageRank được tổng hợp ở cấp độ toàn trang (“PageRank Blocks”), nhưng kích thước và tính động của web đòi hỏi PageRank cũng cần được đo lường ở cấp độ tài liệu (trang riêng lẻ).
Điều cuối cùng đặc biệt thú vị vì đó là mô hình T (tên đầy đủ – True Internal PageRank – do tôi viết tắt):
PageRank tồn tại giữa và trong các trang web. Giá trị PageRank của một trang sẽ thay đổi hoàn toàn khi chúng ta thêm liên kết ngược vào tính toán PR nội bộ.
Lưu ý rằng các liên kết đi vào và đi ra có thể là liên kết nội bộ (trên cùng một trang web) hoặc liên kết bên ngoài (từ các trang web khác). Khi xét đến các liên kết đi ra, không quan trọng là liên kết đó trỏ đến một trang trên cùng miền hay một miền khác. Tuy nhiên, với các liên kết đi vào, sự khác biệt có thể rất lớn.
Để có giá trị chính xác hơn, chúng ta cần hợp nhất dữ liệu liên kết ngược với dữ liệu PR nội bộ. Đó chính là những gì “T” hướng đến.
Chúng ta có thể tóm gọn các vấn đề của PageRank truyền thống như sau: khuyết điểm lớn của PageRank truyền thống nằm ở việc đánh giá liên kết một cách đồng đều và Mô Hình Dịch Chuyển Đồng Nhất. Không phải liên kết nào cũng như nhau, và không phải phiên duyệt web nào cũng có xác suất như nhau.
Ví dụ: nếu ai đó đọc một định nghĩa trên một trang web và sau đó nhấp vào liên kết dẫn đến Wikipedia để tìm hiểu thêm, điều đó sẽ mang lại cho Wikipedia một giá trị Authority cao hơn.
Giá trị Authority
Khái niệm Authority Value là việc kết hợp dữ liệu hành vi người dùng với các mô hình PageRank truyền thống.
Đúng vậy, bạn không đọc nhầm đâu.
Giá trị Authority là tổng của ba thành phần. Tôi đã cố gắng hình dung khái niệm này qua sơ đồ dưới đây:
- Bắt đầu với một tài liệu (“1. Doc”).
- Thành phần đầu tiên là đo lường khả năng người dùng ở lại trên tài liệu này hoặc nhấp vào một liên kết đi ra đến nhóm tài liệu thứ nhất hoặc thứ hai. Google đánh giá mỗi liên kết dựa trên tần suất nhấp chuột và mức độ liên quan chủ đề của liên kết với trang đích.
- Thành phần thứ hai là khả năng người dùng bắt đầu một phiên mới và đi đến các nhóm trang khác. Hãy tưởng tượng việc bạn tìm kiếm thứ gì đó, nhấp vào một kết quả và sau đó rời khỏi trang đó để đến một trang khác (bằng cách nhấn nút quay lại trên trình duyệt hoặc nhập một URL mới).
- Thành phần thứ ba là giá trị Authority của tài liệu đầu tiên, khá giống với PageRank truyền thống.
Toàn bộ tiền đề ở đây là liệu người dùng có nhấp vào một liên kết hay không và việc đo lường hành vi người dùng là chìa khóa. Tuy nhiên, điều này chỉ khả thi trên các trang có lưu lượng truy cập cao. Bằng sáng chế xác định một yếu tố “tự tin” điều chỉnh các tín hiệu hành vi người dùng dựa trên lượng lưu lượng truy cập mà tài liệu đó nhận được. Những tín hiệu này có thể là nhấp chuột vào liên kết, thời gian trên trang, số lần truy cập gần đây và thời gian lưu lại trang.
Thậm chí, bằng sáng chế còn đi xa hơn khi cho rằng một số người dùng có thể có trọng số cao hơn những người khác dựa trên phân khúc nhân khẩu học của họ. Dữ liệu có thể được tổng hợp dựa trên các yếu tố như nhân khẩu học, hồ sơ, đặc điểm, thiết bị, v.v.
Một phần khác của giá trị Authority là thời gian. Các trang hoặc trang web có liên kết cũ và không có lượt truy cập gần đây sẽ dần mất giá trị theo thời gian.
Nó cũng đề cập rằng Authority Value có thể là một yếu tố chính ảnh hưởng đến việc trình thu thập dữ liệu web hoạt động, phù hợp với ý tưởng rằng ngân sách thu thập dữ liệu bị tác động mạnh bởi PageRank.
Tóm lại…
Chúng ta cần lưu ý rằng các bằng sáng chế chỉ giúp chúng ta tham khảo, nhưng từ những gì được mô tả, chúng ta có thể rút ra một số ứng dụng thực tiễn như sau:
- PR sculpting (điều chỉnh PageRank) = hết thời. Đây không phải là điều mới mẻ, nhưng tôi vẫn thấy nhiều trang web áp dụng thẻ nofollow cho các liên kết nội bộ. Bằng sáng chế này một lần nữa khẳng định rằng phương pháp này không còn hiệu quả.
- Theo dõi lượng nhấp chuột trên các trang có lưu lượng truy cập cao: Hãy chú ý hơn đến các liên kết mà bạn đặt trên những trang có nhiều người truy cập và kiểm tra xem liệu các liên kết đó có thực sự được nhấp vào hay không. Các công cụ như bản đồ nhiệt (heatmaps) hoặc dữ liệu giới thiệu từ Google Analytics (GA) có thể hữu ích trong việc phân tích.
- Tạo các liên kết ngược mới cho trang của bạn: Đừng để một trang có nhiều liên kết ngược bị “khô héo” mà không được cập nhật thêm. Hãy cố gắng duy trì dòng chảy của liên kết ngược mới để giữ vững giá trị Authority của trang đó.
- Theo dõi lưu lượng truy cập trực tiếp đến các trang không phải trang chủ: Lưu lượng truy cập trực tiếp có thể đến từ các nguồn như đánh dấu trang (bookmarks), URL đã được lưu trong thanh trình duyệt, hoặc các nguồn khác (gọi là “dark traffic”), và có thể là một chỉ báo tiềm năng cho hiện tượng “Teleportation”.
Vậy chúng ta có thể hiểu rằng, giá trị Authority không chỉ dựa trên số lượng liên kết ngược mà một trang nhận được mà còn phụ thuộc vào cách người dùng tương tác với những liên kết đó và cách các liên kết nội bộ giữa các trang được thiết lập. Điều này đồng nghĩa với việc các nhà làm SEO cần chú ý đến cả yếu tố kỹ thuật (cấu trúc liên kết nội bộ) lẫn yếu tố hành vi người dùng (click, thời gian trên trang, v.v.) khi xây dựng chiến lược SEO tổng thể của mình.
Bằng sáng chế User-Sensitive PageRank của Prabhakar Raghavan đã vạch ra một lộ trình mới cho SEO hiện đại và cung cấp một cách nhìn sâu hơn về cách mà các tín hiệu người dùng có thể tác động đến thứ hạng tìm kiếm. Và với việc ông đảm nhận vai trò mới tại Google, chúng ta có thể dự đoán rằng những xu hướng này sẽ tiếp tục được phát triển và áp dụng vào trong các thuật toán tìm kiếm của Google trong tương lai.
Ứng dụng thực tiễn cho SEOer
- Cải thiện cấu trúc liên kết nội bộ: Hãy phân tích kỹ lưỡng các trang có lưu lượng truy cập cao và đảm bảo rằng các liên kết nội bộ trên những trang này đang dẫn đến các trang quan trọng khác một cách hiệu quả. Sử dụng bản đồ nhiệt để theo dõi các liên kết nào đang thu hút sự chú ý của người dùng và tối ưu hóa chúng.
- Tăng cường xây dựng liên kết mới: Đừng để một trang web có nhiều liên kết bị “cũ kỹ”. Hãy cố gắng xây dựng thêm các liên kết ngược mới để duy trì sự phát triển ổn định của Authority Value cho trang đó.
- Tận dụng lưu lượng truy cập trực tiếp: Theo dõi lưu lượng truy cập trực tiếp để xác định các trang mà người dùng truy cập mà không cần thông qua các liên kết, từ đó cải thiện cấu trúc liên kết nhằm gia tăng thêm giá trị Authority cho trang đó.
Nhìn chung, các nhà làm SEO cần phải cập nhật liên tục và nắm bắt các khái niệm như User-Sensitive PageRank để có thể áp dụng một cách hiệu quả và linh hoạt trong việc cải thiện thứ hạng tìm kiếm. Cùng với sự lãnh đạo của Prabhakar Raghavan tại Google, chúng ta có thể mong đợi những thay đổi đáng kể trong cách Google đánh giá và xếp hạng các trang web dựa trên hành vi người dùng và cấu trúc liên kết nội bộ trong thời gian tới.
Kết luận:
Việc bổ nhiệm Prabhakar Raghavan – người đã phát triển khái niệm User-Sensitive PageRank – vào vị trí trưởng bộ phận Search của Google cho thấy một bước ngoặt lớn trong chiến lược SEO của Google. Từ đây, Google có thể sẽ tập trung hơn vào việc khai thác hành vi người dùng để đánh giá các liên kết và trang web, mang lại những thay đổi quan trọng trong cách mà các SEOer cần điều chỉnh chiến lược của mình.
Chúng ta hãy cùng chờ đợi và theo dõi các động thái tiếp theo của Google dưới sự dẫn dắt của Prabhakar Raghavan để thấy được sự chuyển biến này sẽ tác động ra sao đến toàn bộ ngành SEO trong tương lai.
Tổng kết: Những kiến thức và hiểu biết sâu sắc về bằng sáng chế User-Sensitive PageRank sẽ giúp bạn không chỉ tối ưu hóa các yếu tố SEO truyền thống mà còn tiếp cận được với các yếu tố mới như hành vi người dùng, tương tác với liên kết và cấu trúc liên kết nội bộ.