Tối ưu hóa liên kết nội bộ sẽ không hoàn thiện nếu không tính đến các liên kết ngược (backlinks). Trong bài viết này, tôi sẽ giới thiệu một mô hình có tên là T, giúp tối ưu hóa cấu trúc liên kết nội bộ trên website của bạn.
Một khi bạn hiểu rõ khái niệm về các nguyên lý Pareto (power laws), bạn sẽ thấy chúng xuất hiện khắp nơi. Một số ít người nắm giữ phần lớn tài sản. Một số khoản đầu tư startup mang lại tỷ suất lợi nhuận cao nhất. Chúng còn được gọi là Định luật Pareto hay nguyên tắc 80/20.
Liên quan gì đến SEO?
Các nguyên lý Pareto cũng tồn tại trong lĩnh vực SEO. Một số ít từ khóa ngắn (short-head keywords) có lượng tìm kiếm tương đương với hàng nghìn từ khóa dài (long-tail keywords). Một số trang thu hút phần lớn lượng truy cập và nhận được nhiều backlink nhất. Và một số trang được thu thập thông tin thường xuyên hơn.
Sự mất cân đối này là điều chúng ta nên tối ưu hóa, đặc biệt là khi nói đến cấu trúc liên kết nội bộ của trang web.
Chúng ta đều biết PageRank là một trong những yếu tố xếp hạng quan trọng trong SEO, nhưng nhiều khi ta quên rằng PageRank không chỉ chảy qua các trang web mà còn chảy giữa các trang web! Việc tối ưu hóa liên kết nội bộ mà không tính đến các backlink là một sai lầm phổ biến, và có thể dẫn đến những quyết định không chính xác.
Trong bài viết này, tôi sẽ giới thiệu mô hình T để lấp đầy khoảng trống này.
Tối ưu hóa cấu trúc liên kết nội bộ là một đòn bẩy mạnh mẽ trong SEO
SEO đã trở nên phức tạp hơn rất nhiều trong 5 năm qua. Để thành công trong môi trường phức tạp này, bạn cần tập trung vào những yếu tố mà bạn biết chắc là có tác động mạnh mẽ. Tối ưu hóa liên kết nội bộ là một trong những yếu tố đó. Nó hoàn toàn nằm trong tầm kiểm soát, có thể đo lường và mang lại kết quả tích lũy theo thời gian.
Chìa khóa để tối ưu hóa liên kết nội bộ một cách hiệu quả là hiểu rõ cách PageRank lưu thông qua một trang web và hướng nó đến những trang mà người dùng có khả năng chuyển đổi cao.
Khi trang web của bạn đạt đến một quy mô nhất định, chẳng hạn >1.000 trang, thì liên kết nội bộ sẽ có tác động mạnh mẽ hơn. Những trang lớn thường có nhiều backlink hơn, và số lượng anchor text từ các liên kết nội bộ sẽ cung cấp cho Google thêm nhiều điểm neo (anchor points) để hiểu rõ hơn về mức độ liên quan của một trang với một chủ đề nhất định. Ngược lại, nếu trang web của bạn chỉ có vài trang, chẳng hạn 100-200 trang, thì các chiến thuật trong bài viết này sẽ có tác động hạn chế.
Khái niệm CheiRank Bị lãng quên
Giống như một mạng lưới các trang web được kết nối, các trang trong một trang web tạo thành một biểu đồ liên kết. Trên biểu đồ đó, một số trang mạnh hơn và một số trang yếu hơn, tùy thuộc vào PageRank mà chúng nhận được và số lượng liên kết đi mà chúng có. Cái sau được gọi là CheiRank hoặc PageRank ngược và mô tả mức độ liên kết ra của một trang so với toàn bộ biểu đồ liên kết của một trang web.
CheiRank là một vectơ riêng với giá trị riêng thực cực đại của ma trận Google được xây dựng cho một mạng có hướng với các hướng liên kết đảo ngược. Nó tương tự như vectơ PageRank, xếp hạng các nút mạng theo tỷ lệ trung bình với số lượng liên kết đến là vectơ riêng cực đại của ma trận Google G với hướng liên kết ban đầu cho trước. Do hướng liên kết đảo ngược, CheiRank xếp hạng các nút mạng theo tỷ lệ trung bình với số lượng liên kết đi . Vì mỗi nút đều thuộc về cả vectơ CheiRank và PageRank nên thứ hạng của luồng thông tin trên mạng có hướng trở thành hai chiều . (Nguồn: https://en.wikipedia.org/wiki/CheiRank )
Nếu bạn muốn tìm hiểu sâu hơn về toán học, hãy xem bài báo này . Nếu bạn muốn tránh xa toán học (không phán xét), điều bạn cần ghi nhớ là CheiRank của trang càng cao thì PageRank càng nhiều. CheiRank cao thường chỉ ra các trang trung tâm. Điều đó có thể tốt hoặc xấu, tùy thuộc vào lượng PageRank mà chúng nhận được. Các trang cũng có thể cho đi quá nhiều PageRank và khi đó sẽ là vấn đề. Nhìn chung , bạn muốn PageRank (PR) và CheiRank (CR) cân bằng ở một mức nào đó để có cấu trúc liên kết nội bộ tối ưu.
Ba thách thức trong tối ưu hóa cấu trúc liên kết nội bộ
Khi chúng tôi thêm một lớp các loại trang, như trang chủ, trang danh mục hoặc trang sản phẩm, vào biểu đồ, chúng tôi nhận thấy rằng một số loại trang có PageRank trung bình cao hơn các loại khác. Thường thì trang chủ có PR cao nhất, mặc dù không phải trong mọi trường hợp. Ví dụ, trên www.atlassian.com , trang đích sản phẩm Jira có PR cao hơn trang chủ.
Biểu đồ liên kết nội bộ được tối ưu hóa phân phối PageRank cho các trang chuyển đổi. Để điều đó xảy ra, chúng ta cần biết và điều chỉnh PR và CR của từng trang. Biểu đồ liên kết luôn thay đổi vì một liên kết duy nhất có thể thay đổi giá trị của từng trang.
Điều đó đặt chúng ta trước ba thách thức:
- PageRank nội bộ không chính xác nếu không tính đến các liên kết ngược
- Các trang chuyển đổi không phải lúc nào cũng là những trang cần PageRank nhất
- Phân phối PageRank nội bộ tối ưu phụ thuộc vào mô hình kinh doanh của bạn
Hãy để tôi giải thích chi tiết từng thách thức và cách chúng ta có thể giải quyết chúng.
PageRank nội bộ không hoàn chỉnh nếu không có Backlinks
Thách thức đầu tiên là giá trị PR nội bộ không chính xác. Đây là điều mà tôi muốn giải quyết với mô hình T. Các công cụ và phương pháp hiện có để tối ưu hóa dòng chảy PageRank nội bộ đều hữu ích, nhưng lại thiếu một thành phần quan trọng: backlinks.
Hãy cùng quay lại một bước.
Bạn có thể đã quen thuộc với các biểu đồ như thế này:
Nó minh họa cho khái niệm liên kết nội bộ. Mỗi trang có một số lượng liên kết vào (incoming links) và ra (outgoing links) nhất định. Chúng ta có thể tính PR của từng trang từ mô hình này bằng cách áp dụng thuật toán PageRank. Chúng ta cũng có thể thu thập dữ liệu trang bằng một công cụ như Screaming Frog, Botify, Audisto, Searchmetrics, v.v. để tính PR nội bộ cho từng URL.
Tuy nhiên, giá trị đó không chính xác vì PR (và CR) của một trang được quyết định bởi cả liên kết nội bộ lẫn liên kết bên ngoài.
PageRank tồn tại cả bên trong và giữa các trang web. Giá trị PR của một trang sẽ thay đổi hoàn toàn khi chúng ta thêm backlinks vào tính toán PR nội bộ.
Chúng ta cần kết hợp dữ liệu backlink với PR nội bộ để có được giá trị chính xác hơn. Đó chính là điều mà T hướng đến.
Mô hình T – True Internal PageRank
T hay True Internal PageRank (do tôi viết tắt) là một khái niệm giúp chúng ta tiếp cận gần hơn với giá trị PageRank thực của một trang. Nó kết hợp bốn dòng dữ liệu: PageRank, CheiRank, Backlinks và tệp nhật ký (log files).
T giúp xây dựng một biểu đồ liên kết nội bộ chính xác hơn bằng cách kết hợp PR, CR và backlinks. Dữ liệu từ tệp nhật ký (log files) cũng được sử dụng để đo lường tiến trình theo thời gian, vì việc thu thập thông tin của Google Bot có sự tương quan cao với PageRank. Google đã nhiều lần nói rằng họ sử dụng PR làm thước đo cho ngân sách thu thập thông tin.
“Một trình thu thập thông tin trên web có thể sử dụng PageRank như một trong những số liệu quan trọng để xác định URL nào cần được truy cập trong quá trình thu thập dữ liệu trên web. Một trong những bài báo nghiên cứu ban đầu được sử dụng trong việc tạo ra Google có nhắc đến việc sử dụng một số số liệu quan trọng khác nhau để quyết định mức độ sâu và phạm vi mà Google sẽ thu thập dữ liệu trên một trang web. PageRank được đề cập là một trong số những số liệu quan trọng này, mặc dù còn có các yếu tố khác như số lượng liên kết vào và ra của một URL, và khoảng cách từ thư mục gốc trên một trang web đến URL đó.”
(Nguồn: https://en.wikipedia.org/wiki/PageRank)
Tuy nhiên, đây không phải là yếu tố duy nhất.
“Cần lưu ý rằng tần suất thu thập thông tin không chỉ dựa vào PageRank. Cả Andrey Lipattsev và Gary Illyes của Google đã nhấn mạnh trong các buổi hội thảo gần đây rằng PageRank không phải là yếu tố duy nhất quyết định tần suất thu thập thông tin hay xếp hạng, với Lipattsev nói rằng: ‘PageRank chỉ là một trong nhiều yếu tố quan trọng.'”
(Nguồn: https://searchengineland.com/crawl-budget-url-scheduling-might-impact-rankings-website-migrations-255624)
Cách xây dựng mô hình T Cho trang web của bạn
Để xây dựng mô hình T, bạn cần thực hiện theo 5 bước:
- Thu thập dữ liệu trang web
Thực hiện việc thu thập dữ liệu toàn bộ trang web của bạn để có danh sách các trang, tốt nhất là với giá trị PR và CR nội bộ của từng trang. Bạn có thể sử dụng phương pháp của Paul Shapiro với Screaming Frog hoặc các công cụ như Botify, Searchmetrics, ContentKing, Audisto, Ryte, v.v. - Tính toán PageRank và CheiRank nội bộ
Sử dụng kết quả thu thập dữ liệu để tính toán giá trị PR và CR cho từng URL trên trang của bạn. Điều này giúp bạn xác định mức độ quan trọng và liên kết ra của mỗi trang trong biểu đồ liên kết nội bộ. - Kéo dữ liệu backlinks theo URL
Kết hợp dữ liệu backlinks từ các công cụ như Ahrefs, Moz hoặc SEMrush để có được thông tin về số lượng liên kết đến mỗi URL và chất lượng của các liên kết này. - Sử dụng tỷ lệ thu thập thông tin (crawl rate) theo URL để theo dõi tác động theo thời gian
Xuất tệp nhật ký (log files) của bạn và trích xuất tỷ lệ thu thập thông tin theo từng URL từ Google. Bạn muốn theo dõi tỷ lệ thu thập thông tin theo tuần hoặc theo tháng trên từng URL và cập nhật thường xuyên để đánh giá tác động của những thay đổi mà bạn thực hiện dựa trên mô hình T. - Sắp xếp và xếp hạng các chỉ số
Bạn sẽ có một bảng tính với các cột URL, PageRank, CheiRank, DomainPop hoặc số lượng backlinks, và tần suất thu thập thông tin. Với mỗi cột, bạn cần xếp hạng từ cao đến thấp, nghĩa là giá trị PageRank cao nhất sẽ xếp thứ nhất. Sau đó, tính trung bình của mỗi hàng và sắp xếp danh sách từ mạnh đến yếu.
Khi bạn muốn kết hợp nhiều giá trị ở các thang đo khác nhau, chẳng hạn như lượt truy cập của Google Bot và PageRank, thì việc xếp hạng là một công cụ hữu ích. Lưu ý rằng chúng ta có thể áp dụng các trọng số khác nhau cho từng yếu tố, và tôi vẫn đang thử nghiệm để tìm ra sự cân bằng phù hợp nhất.
Tối ưu hóa cấu trúc liên kết nội bộ cho các trang chuyển đổi
Sau khi hoàn thành các bước trên, bạn sẽ có một danh sách các URL được xếp hạng từ mạnh đến yếu. Vậy bạn nên làm gì với danh sách này?
Một cấu trúc liên kết tối ưu hướng đến trạng thái được xác định bởi ba yếu tố sau:
- Không có trang nào tích trữ PageRank quá mức (nhiều liên kết vào nhưng ít liên kết ra).
- Không có trang nào cho đi quá nhiều PageRank (ít liên kết vào nhưng nhiều liên kết ra).
- Ưu tiên PageRank cho các trang chuyển đổi.
Trang chuyển đổi là những trang mà người dùng có hành động chuyển đổi như đăng ký, điền form, hoặc mua hàng.
Hai yếu tố đầu tiên ám chỉ vấn đề chung của các biểu đồ liên kết nội bộ: chúng vốn dĩ mất cân đối. Tôi đã nhắc đến điều này trước đó khi nói về nguyên lý Pareto trong SEO.
Về cơ bản, bạn nên hướng đến một sự phân bổ PageRank cân bằng hơn, với một chút ưu tiên dành cho các trang chuyển đổi. Tôi gọi đây là “Nguyên tắc Robin Hood”: bạn lấy PageRank từ những trang mạnh và phân phối lại cho những trang yếu.
So sánh các trang tập trung và phân tán
Tùy thuộc vào mô hình kinh doanh của một trang web, bạn có thể có một trong hai loại trang chuyển đổi:
- Trang chuyển đổi tập trung: Một vài trang đích sản phẩm cụ thể, chẳng hạn như Salesforce hoặc Atlassian.
- Trang chuyển đổi phân tán: Nhiều trang, hoặc trường hợp, là một phần của sản phẩm, chẳng hạn như Pinterest hoặc Trello.
Cấu trúc tập trung thường xuất hiện ở các công ty SaaS hoặc doanh nghiệp lớn, trong khi cấu trúc phân tán thường gặp ở các công ty hướng đến người tiêu dùng như mạng xã hội hoặc trang thương mại điện tử. Tuy nhiên, cả hai cấu trúc này không hoàn toàn chỉ thuộc về một ngành nghề cụ thể.
Cấu trúc tập trung có một vài trang chuyển đổi chính mà người dùng có thể đăng ký qua form hoặc trải nghiệm thử sản phẩm. Những trang này nhắm đến các từ khóa thương hiệu (ví dụ: “Jira”) và các từ khóa giao dịch (ví dụ: “công cụ quản lý dự án”). Các từ khóa này rất cạnh tranh, do đó các trang đích cần nhiều PR để xếp hạng cao.
Cấu trúc phân tán thì ngược lại, nhắm đến các trang như các bảng (board) trên Pinterest, nơi mà mỗi bảng đều có thể là một trang để người dùng đăng ký. Hoặc một trang thương mại điện tử có hàng trăm ngàn sản phẩm. Với cấu trúc phân tán, bạn muốn sự phân phối PR cân bằng hơn giữa các trang.
Điều quan trọng là bạn phải hiểu rõ sự khác biệt này khi tối ưu hóa liên kết nội bộ để đưa ra những quyết định đúng đắn.
Phân phối PageRank tối ưu phụ thuộc vào dữ liệu và mô hình kinh doanh phù hợp
Tôi đã đề cập đến ba thách thức trong việc tối ưu hóa liên kết nội bộ:
- PageRank nội bộ không chính xác nếu không tính đến backlinks.
- Các trang chuyển đổi không phải lúc nào cũng là những trang cần nhiều PageRank nhất.
- Phân phối PageRank nội bộ tối ưu phụ thuộc vào mô hình kinh doanh của bạn.
Mô hình T, kết hợp với sự nhận thức về nguyên lý Pareto và các cấu trúc trang chuyển đổi khác nhau, sẽ giúp bạn đưa ra lựa chọn đúng đắn và giải quyết những thách thức này.
Để tổng kết, việc áp dụng một phương pháp tối ưu hóa liên kết nội bộ theo kiểu “mẫu số chung” là không hiệu quả. Chúng ta cần thu thập dữ liệu chính xác nhất và áp dụng nó vào mô hình kinh doanh của mình. Các mô hình PR hiện tại đều dựa trên tính toán từ biểu đồ liên kết nội bộ và sẽ không hoàn chỉnh nếu không tính đến backlinks. Một khi mô hình chính xác được thiết lập và các thay đổi được thực hiện, việc theo dõi tệp nhật ký (log files) sẽ là công cụ tuyệt vời để giám sát thành công.