Trong thời qua, tôi đã lấp đầy những khoảng trống đáng kể trong hiểu biết của mình về các Chatbot AI.
Trong thời gian qua, tôi cũng đã có một số nghiên cứu để có được một sự hiểu về mình về các công cụ Chatbot AI như Chat GPT, Gemini, Perplexity, Google AIO.
Phải thừa nhận rằng:
- Việc sử dụng Chat AI đã trở thành công cụ thiết yếu.
- Chatbot AI gửi nhiều lượt giới thiệu (referral traffic) hơn đến các trang web theo thời gian.
- Lưu lượng truy cập giới thiệu từ AI Chatbots có chất lượng cao hơn từ Google
Bạn có thể đọc tất cả về nó trong bài viết về AI Chatbots và SEO .
Nhưng không có nhiều nội dung về các ví dụ và yếu tố thành công của nội dung thúc đẩy trích dẫn và đề cập trong AI Chatbots.
Để có được câu trả lời, tôi đã phân tích hơn 7.000 trích dẫn trên 1.600 URL đến các trang web có nhiều nội dung trong AI Chatbots (Chat GPT, Perplexity, AI Overviews)
Mục tiêu của tôi là tìm ra:
- Tại sao một số trang được trích dẫn nhiều hơn những trang khác để chúng ta có thể tối ưu hóa nội dung cho AI Chatbots
- Liệu các yếu tố SEO truyền thống có quan trọng đối với khả năng hiển thị của AI Chatbot hay không, để chúng ta có thể ưu tiên
- Những sai lầm cần tránh để chúng ta không phải học lại nhiều lần
- Nếu các yếu tố khác nhau ảnh hưởng đến việc đề cập và trích dẫn, chúng ta có thể nhắm mục tiêu tốt hơn trong các nỗ lực của mình
Sau đây là những phát hiện của tôi:
Yếu tố quyết định lượt trích dẫn: Nội dung chuyên sâu
Factor | Chat GPT | AI Overviews | Perplexity | AVG |
---|---|---|---|---|
Word Count | 0.047 | 0.153 | 0.191 | 0.130 |
Sentence Count | 0.046 | 0.105 | 0.155 | 0.102 |
Domain Rating | 0.161 | 0.034 | 0.074 | 0.090 |
Flesch Score | 0.115 | -0.037 | 0.113 | 0.064 |
URL Rating | 0.066 | -0.001 | 0.024 | 0.030 |
Response Time | 0.048 | -0.021 | -0.006 | 0.007 |
Domains | -0.037 | -0.032 | 0.005 | -0.021 |
Total Backlinks | -0.030 | -0.021 | -0.024 | -0.025 |
Total Keywords | -0.046 | -0.044 | 0.002 | -0.030 |
Total Traffic | -0.026 | -0.041 | -0.023 | -0.030 |
Bối cảnh: Chúng ta biết rằng Chatbot AI sử dụng RAG (Retrieval Augmented Generation – Tạo sinh dựa trên truy xuất tăng cường) để so sánh câu trả lời với kết quả từ Google và Bing. Tuy nhiên, liệu điều đó có nghĩa là các yếu tố xếp hạng SEO truyền thống cũng được chuyển thành trích dẫn của Chatbot AI không? Không.
Phân tích tương quan của tôi cho thấy không có chỉ số SEO truyền thống nào có mối quan hệ chặt chẽ với trích dẫn. Các mô hình ngôn ngữ lớn (LLMs) có sự ưu tiên khác nhau:
- Perplexity và AI Overviews ưu tiên số lượng từ và câu nhiều hơn.
- ChatGPT thiên về chỉ số độ mạnh tên miền (domain rating) và độ dễ đọc (Flesch Score).
- AI Overviews ưu tiên thẩm quyền và uy tín tên miền kết hợp với trích dẫn từ báo chí.
Bài học rút ra: Các chỉ số SEO truyền thống gần như không quan trọng đối với các lượt đề cập và trích dẫn của Chatbot AI. Điều tốt nhất bạn có thể làm để tối ưu hóa nội dung là hướng đến chiều sâu, tính toàn diện và khả năng đọc hiểu (mức độ dễ hiểu của văn bản).
Phân tích tương quan chung không đưa ra đủ thông tin và để lại quá nhiều câu hỏi bỏ ngỏ. Vì vậy, tôi đã xem xét những gì mà nội dung được trích dẫn nhiều nhất làm khác so với phần còn lại. Cách tiếp cận đó cho thấy các mẫu rõ ràng hơn nhiều.

Vì phân tích tương quan thống kê không mang lại nhiều giá trị, tôi muốn xem nhóm 10% nội dung được trích dẫn nhiều nhất so với 90% còn lại như thế nào. Hiệu số càng lớn thì yếu tố đó càng quan trọng với nhóm 10% hàng đầu. Nói cách khác, hệ số nhân (trục x trên biểu đồ) cho thấy những yếu tố mà Chatbot thưởng bằng lượt trích dẫn.
Kết quả:
- Hai yếu tố nổi bật là số lượng câu và số từ , tiếp theo là Điểm Flesch . Các số liệu liên quan đến backlink và lưu lượng truy cập dường như có tác động tiêu cực, điều này không có nghĩa là Chatbot AI đánh giá thấp chúng mà chỉ đơn giản là chúng không quan trọng đối với lượt đề cập hoặc trích dẫn.
- 10 % trang được trích dẫn nhiều nhất trên cả 3Chatbot AIđều có lưu lượng truy cập thấp hơn nhiều, xếp hạng cho ít từ khóa hơn và nhận được ít backlink hơn . Điều này có lý không? Dường như việc mạnh về các chỉ số SEO truyền thống lại không tốt cho khả năng hiển thị của Chatbot AI.
Nhân tiện, Copilot (không được đưa vào biểu đồ) có sự chênh lệch rõ nhất. Nhóm 10% hàng đầu có nhiều hơn 17,6 lượt trích dẫn so với 90% còn lại. Tuy nhiên, nhóm 10% cũng xếp hạng nhiều hơn 1,7 lần về từ khóa trong tìm kiếm tự nhiên. Vì vậy, Copilot có vẻ ưu tiên rõ ràng hơn so với các chatbot AI khác.
Việc phân chia dữ liệu theo AI Chatbot sẽ cho bạn thấy yếu tố được riêng của chúng:
Bài học rút ra: Độ sâu nội dung (số lượng từ và câu) và khả năng đọc hiểu (Điểm Flesch) có tác động lớn nhất đến số lần trích dẫn trong Chatbot AI . Điều quan trọng cần hiểu là: Nội dung dài hơn không tốt hơn vì nó dài hơn, mà vì nó có khả năng trả lời câu hỏi cụ thể được đưa ra trong Chatbot AI cao hơn.
Yếu tố quyết định lượt đề cập thương hiệu: Độ phổ biến
Bối cảnh: Chúng ta vẫn chưa biết rõ giá trị của việc một thương hiệu được nhắc đến bởi Chatbot AI. Nghiên cứu ban đầu cho thấy giá trị này rất cao, đặc biệt là khi lời nhắc cho thấy ý định mua hàng. Tuy nhiên, tôi muốn đi sâu hơn một chút bằng cách tìm hiểu điều gì dẫn đến việc nhắc đến thương hiệu trong Chatbot AI ngay từ đầu.
Sau khi so sánh nhiều chỉ số với khả năng hiển thị của AI Chatbot, tôi tìm thấy một yếu tố nổi bật hơn bất kỳ yếu tố nào khác: Lượng tìm kiếm thương hiệu. Số lần đề cập đến AI Chatbot và lượng tìm kiếm thương hiệu có mối tương quan là .334 – khá tốt trong lĩnh vực này. Nói cách khác, mức độ phổ biến của một thương hiệu quyết định phần lớn mức độ hiển thị của thương hiệu đó trong AI Chatbot .
Mức độ phổ biến là yếu tố dự báo quan trọng nhất cho Chat GPT, cũng là yếu tố gửi lưu lượng truy cập nhiều nhất và có mức sử dụng cao nhất trong tất cả các Chatbot AI. Khi phân tích theo Chatbot AI, tôi thấy Chat GPT có hệ số tương quan cao nhất với .542 (mạnh), nhưng Perplexity (.196) và Google AIO (.254) có hệ số tương quan thấp hơn.
Nói rõ hơn, có rất nhiều sắc thái ở cấp độ lời nhắc và danh mục. Nhưng nhìn chung, mức độ hiển thị của một thương hiệu dường như bị ảnh hưởng nghiêm trọng bởi mức độ phổ biến của nó.
Tuy nhiên, khi nhắc đến các thương hiệu, tất cả Chatbot AI đều ưu tiên các thương hiệu phổ biến và luôn xếp hạng chúng theo cùng một thứ tự.
- Có mối liên hệ rõ ràng giữa các danh mục câu hỏi của người dùng (sức khỏe tâm thần, chăm sóc da, giảm cân, rụng tóc, rối loạn cương dương) và thương hiệu.
- Dữ liệu ban đầu cho thấy các thương hiệu dễ nhận thấy nhất là thương hiệu số hóa trước và đầu tư mạnh vào sự hiện diện trực tuyến của họ bằng nội dung, SEO, đánh giá, phương tiện truyền thông xã hội và quảng cáo kỹ thuật số.
Điểm mấu chốt: Mức độ phổ biến là tiêu chí quan trọng nhất quyết định một thương hiệu có được nhắc đến trong Chatbot AI hay không. Cách người tiêu dùng kết nối thương hiệu với danh mục sản phẩm cũng rất quan trọng. Việc so sánh lượng tìm kiếm thương hiệu và sự hiện diện của danh mục sản phẩm với đối thủ cạnh tranh sẽ giúp bạn đánh giá chính xác nhất mức độ cạnh tranh của mình trên Chatbots & Co.
Ví dụ: Tất cả các mô hình trong phân tích của tôi đều trích dẫn Healthline thường xuyên nhất. Không có tên miền nào khác nằm trong top 10 trích dẫn cho cả 4 mô hình, cho thấy sở thích khác biệt rõ rệt của họ và tầm quan trọng của việc theo dõi nhiều mô hình thay vì chỉ theo dõi Chat GPT – nếu những mô hình đó cũng mang lại lưu lượng truy cập cho bạn.
Domain | ChatGPT 4o | Domain | Perplexity |
www.healthline.com | 297 | www.healthline.com | 605 |
www.verywellmind.com | 219 | www.onlinedoctor.com | 403 |
nypost.com | 208 | blocked.goodrx.com | 249 |
www.gq.com | 125 | www.reddit.com | 232 |
www.onlinedoctor.com | 69 | www.byrdie.com | 231 |
www.medicalnewstoday.com | 60 | www.cosmopolitan.com | 181 |
www.eatingwell.com | 56 | www.lemonaidhealth.com | 173 |
www.mymallbox.com | 50 | www.verywellmind.com | 168 |
en.wikipedia.org | 48 | www.hims.com | 166 |
www.instyle.com | 42 | www.medicalnewstoday.com | 161 |
Domain | Google AI Overviews | Domain | Microsoft Copilot |
www.healthline.com | 431 | www.healthline.com | 1830 |
www.everydayhealth.com | 415 | www.forbes.com | 914 |
www.onlinedoctor.com | 292 | www.byrdie.com | 680 |
www.verywellmind.com | 246 | www.medicalnewstoday.com | 555 |
www.today.com | 164 | www.clinicadvisor.com | 457 |
www.byrdie.com | 161 | health.usnews.com | 347 |
www.cnet.com | 147 | www.cnet.com | 325 |
www.ncoa.org | 142 | www.sitejabber.com | 301 |
www.innerbody.com | 141 | www.ncoa.org | 286 |
builtin.com | 125 | psychcentral.com | 269 |
Ví dụ các trang thường được trích dẫn nhất trong lĩnh vực sức khỏe:
- verywellmind.com
- onlinedoctor.com
- medicalnewstoday.com
- byrdie.com
- cnet.com
- ncoa.org
Bối cảnh: Không phải tất cả các chatbot AI đều đề cập đến các thương hiệu với tần suất như nhau. Mặc dù Chat GPT có tỷ lệ sử dụng cao nhất và gửi lưu lượng truy cập giới thiệu đến các nguồn nhiều nhất, Perplexity lại đề cập đến nhiều thương hiệu nhất theo trung bình trong các câu trả lời.
Cấu trúc prompt ảnh hưởng đến đề cập thương hiệu
- Từ “tốt nhất” là yếu tố kích hoạt mạnh mẽ cho việc đề cập đến thương hiệu trong 69,71% lời nhắc
- Các từ như “đáng tin cậy” (5,77%), “nguồn” (2,88%), “khuyến nghị” (0,96%) và “đáng tin cậy” (0,96%) cũng có liên quan đến khả năng đề cập đến thương hiệu cao hơn
- Các lời nhắc bao gồm “khuyến nghị” thường đề cập đến các tổ chức công cộng như FDA, đặc biệt là khi lời nhắc bao gồm các từ như “đáng tin cậy” hoặc “hàng đầu”
- Google AIO cho thấy sự đa dạng thương hiệu cao nhất, tiếp theo là Perplexity, sau đó là Chat GPT
Bài học rút ra: Cách promt có tác động đáng kể đến các thương hiệu xuất hiện trong câu trả lời. Tuy nhiên, chúng ta vẫn chưa thể thực sự biết người dùng sử dụng gợi ý nào. Điều quan trọng cần lưu ý: tất cả gợi ý chúng ta xem xét và theo dõi chỉ là đại diện cho những gì người dùng có thể đang làm.
Lỗi kỹ thuật có thể cản trở khả năng hiển thị trong Chatbot AI
Bối cảnh: Trong quá trình nghiên cứu, tôi đã phát hiện ra một số cách các thương hiệu vô tình làm giảm khả năng hiển thị của Chatbot AI. Tôi nêu ra những cách này ở đây vì điều kiện tiên quyết để được hiển thị trong LLM, tất nhiên, là khả năng thu thập dữ liệu trang web của họ, dù là trực tiếp hay thông qua dữ liệu đào tạo.
Ví dụ, Copilot không trích dẫn onlinedoctor.com vì nó không được lập chỉ mục trên Bing. Tôi không tìm thấy dấu hiệu nào cho thấy việc này là cố ý, nên tôi cho rằng đây chỉ là sự cố ngoài ý muốn và có thể nhanh chóng khắc phục và được thưởng bằng lưu lượng truy cập giới thiệu.
Mặt khác, Chat GPT 4o không trích dẫn cnet.com và Perplexity không trích dẫn everydayhealth.com vì cả hai trang web đều cố tình chặn Chatbot AI tương ứng trong robots.txt của họ.
Nhưng cũng có những trường hợp Chatbot AI tham chiếu đến các trang web mặc dù về mặt kỹ thuật, chúng không nên làm vậy. Tên miền được trích dẫn nhiều nhất trên Perplexity trong tập dữ liệu của tôi là blocked.goodrx.com. GoodRX chặn người dùng từ các quốc gia ngoài Hoa Kỳ, và có vẻ như họ đã vô tình hoặc cố ý chặn Perplexity.
Điều quan trọng cần lưu ý ở đây là Google AI Overview: Không có tùy chọn từ chối nào cho AIO, nghĩa là nếu bạn muốn nhận lưu lượng truy cập tự nhiên từ Google, bạn cần cho phép Google thu thập dữ liệu trang web của bạn, có thể sử dụng nội dung của bạn để huấn luyện các mô hình của Google và hiển thị nội dung đó trong Tổng quan về AI.
Lưu ý: Hãy theo dõi trang web của bạn, đặc biệt nếu tất cả các URL mong muốn đều được lập chỉ mục, trong Google Search Console và Bing Webmaster Tools. Hãy kiểm tra xem bạn có vô tình chặn trình thu thập dữ liệuChatbot AItrong tệp robots.txt hoặc thông qua CDN hay không. Nếu bạn cố tình chặn trình thu thập dữ liệu LLM, hãy kiểm tra xem bạn có xuất hiện trong kết quả của chúng không, chỉ cần hỏi chúng xem chúng biết gì về tên miền của bạn.
Tóm tắt: điểm qua 6 kết luận chính
- Các số liệu SEO truyền thống không ảnh hưởng nhiều đến trích dẫn của AI Chatbot
- Độ sâu nội dung (số lượng từ và câu cao hơn) và khả năng đọc (Điểm Flesch tốt) quan trọng hơn
- Các chatbot AI khác nhau có ưu tiên cho việc trích dẫn khác nhau – việc theo dõi nhiều nền tảng là rất quan trọng
- Mức độ phổ biến của thương hiệu (được đo bằng khối lượng tìm kiếm) là yếu tố dự báo mạnh nhất về việc đề cập đến thương hiệu trong AI Chatbots, đặc biệt là trong Chat GPT
- Cấu trúc prompt ảnh hưởng đến khả năng hiển thị thương hiệu và chúng ta vẫn chưa biết người dùng thực sự đặt prompt như thế nào
- Vấn đề kỹ thuật có thể cản trở khả năng hiển thị AI – đảm bảo trang của bạn không vô tình chặn crawler LLM qua robots.txt hoặc cài đặt CDN