Một nghiên cứu về các đề cập và trích dẫn trong Chatbot & AI

Trong thời qua, tôi đã lấp đầy những khoảng trống đáng kể trong hiểu biết của mình về các Chatbot AI.

Contents

Yếu tố quyết định lượt trích dẫn: Nội dung chuyên sâu Yếu tố quyết định lượt đề cập thương hiệu: Độ phổ biến Lỗi kỹ thuật có thể cản trở khả năng hiển thị trong Chatbot AI Tóm tắt: điểm qua 6 kết luận chính

Trong thời gian qua, tôi cũng đã có một số nghiên cứu để có được một sự hiểu về mình về các công cụ Chatbot AI như Chat GPT, Gemini, Perplexity, Google AIO.

Phải thừa nhận rằng:

Việc sử dụng Chat AI đã trở thành công cụ thiết yếu.
Chatbot AI gửi nhiều lượt giới thiệu (referral traffic) hơn đến các trang web theo thời gian.
Lưu lượng truy cập giới thiệu từ AI Chatbots có chất lượng cao hơn từ Google

Bạn có thể đọc tất cả về nó trong bài viết về AI Chatbots và SEO .

Nhưng không có nhiều nội dung về các ví dụ và yếu tố thành công của nội dung thúc đẩy trích dẫn và đề cập trong AI Chatbots.

Để có được câu trả lời, tôi đã phân tích hơn 7.000 trích dẫn trên 1.600 URL đến các trang web có nhiều nội dung trong AI Chatbots (Chat GPT, Perplexity, AI Overviews)

Mục tiêu của tôi là tìm ra:

Tại sao một số trang được trích dẫn nhiều hơn những trang khác để chúng ta có thể tối ưu hóa nội dung cho AI Chatbots
Liệu các yếu tố SEO truyền thống có quan trọng đối với khả năng hiển thị của AI Chatbot hay không, để chúng ta có thể ưu tiên
Những sai lầm cần tránh để chúng ta không phải học lại nhiều lần
Nếu các yếu tố khác nhau ảnh hưởng đến việc đề cập và trích dẫn, chúng ta có thể nhắm mục tiêu tốt hơn trong các nỗ lực của mình

Sau đây là những phát hiện của tôi:

Yếu tố quyết định lượt trích dẫn: Nội dung chuyên sâu

Factor	Chat GPT	AI Overviews	Perplexity	AVG
Word Count	0.047	0.153	0.191	0.130
Sentence Count	0.046	0.105	0.155	0.102
Domain Rating	0.161	0.034	0.074	0.090
Flesch Score	0.115	-0.037	0.113	0.064
URL Rating	0.066	-0.001	0.024	0.030
Response Time	0.048	-0.021	-0.006	0.007
Domains	-0.037	-0.032	0.005	-0.021
Total Backlinks	-0.030	-0.021	-0.024	-0.025
Total Keywords	-0.046	-0.044	0.002	-0.030
Total Traffic	-0.026	-0.041	-0.023	-0.030

Bối cảnh: Chúng ta biết rằng Chatbot AI sử dụng RAG (Retrieval Augmented Generation – Tạo sinh dựa trên truy xuất tăng cường) để so sánh câu trả lời với kết quả từ Google và Bing. Tuy nhiên, liệu điều đó có nghĩa là các yếu tố xếp hạng SEO truyền thống cũng được chuyển thành trích dẫn của Chatbot AI không? Không.

Phân tích tương quan của tôi cho thấy không có chỉ số SEO truyền thống nào có mối quan hệ chặt chẽ với trích dẫn. Các mô hình ngôn ngữ lớn (LLMs) có sự ưu tiên khác nhau:

Perplexity và AI Overviews ưu tiên số lượng từ và câu nhiều hơn.
ChatGPT thiên về chỉ số độ mạnh tên miền (domain rating) và độ dễ đọc (Flesch Score).
AI Overviews ưu tiên thẩm quyền và uy tín tên miền kết hợp với trích dẫn từ báo chí.

Bài học rút ra: Các chỉ số SEO truyền thống gần như không quan trọng đối với các lượt đề cập và trích dẫn của Chatbot AI. Điều tốt nhất bạn có thể làm để tối ưu hóa nội dung là hướng đến chiều sâu, tính toàn diện và khả năng đọc hiểu (mức độ dễ hiểu của văn bản).

Phân tích tương quan chung không đưa ra đủ thông tin và để lại quá nhiều câu hỏi bỏ ngỏ. Vì vậy, tôi đã xem xét những gì mà nội dung được trích dẫn nhiều nhất làm khác so với phần còn lại. Cách tiếp cận đó cho thấy các mẫu rõ ràng hơn nhiều.

Sự khác biệy giữa 10% nội dung được trích dẫn nhiều nhất và 90% còn lại theo từng yếu tố

Vì phân tích tương quan thống kê không mang lại nhiều giá trị, tôi muốn xem nhóm 10% nội dung được trích dẫn nhiều nhất so với 90% còn lại như thế nào. Hiệu số càng lớn thì yếu tố đó càng quan trọng với nhóm 10% hàng đầu. Nói cách khác, hệ số nhân (trục x trên biểu đồ) cho thấy những yếu tố mà Chatbot thưởng bằng lượt trích dẫn.

Kết quả:

Hai yếu tố nổi bật là số lượng câu và số từ , tiếp theo là Điểm Flesch . Các số liệu liên quan đến backlink và lưu lượng truy cập dường như có tác động tiêu cực, điều này không có nghĩa là Chatbot AI đánh giá thấp chúng mà chỉ đơn giản là chúng không quan trọng đối với lượt đề cập hoặc trích dẫn.
10 % trang được trích dẫn nhiều nhất trên cả 3Chatbot AIđều có lưu lượng truy cập thấp hơn nhiều, xếp hạng cho ít từ khóa hơn và nhận được ít backlink hơn . Điều này có lý không? Dường như việc mạnh về các chỉ số SEO truyền thống lại không tốt cho khả năng hiển thị của Chatbot AI.

Nhân tiện, Copilot (không được đưa vào biểu đồ) có sự chênh lệch rõ nhất. Nhóm 10% hàng đầu có nhiều hơn 17,6 lượt trích dẫn so với 90% còn lại. Tuy nhiên, nhóm 10% cũng xếp hạng nhiều hơn 1,7 lần về từ khóa trong tìm kiếm tự nhiên. Vì vậy, Copilot có vẻ ưu tiên rõ ràng hơn so với các chatbot AI khác.

Việc phân chia dữ liệu theo AI Chatbot sẽ cho bạn thấy yếu tố được riêng của chúng:

Bài học rút ra: Độ sâu nội dung (số lượng từ và câu) và khả năng đọc hiểu (Điểm Flesch) có tác động lớn nhất đến số lần trích dẫn trong Chatbot AI . Điều quan trọng cần hiểu là: Nội dung dài hơn không tốt hơn vì nó dài hơn, mà vì nó có khả năng trả lời câu hỏi cụ thể được đưa ra trong Chatbot AI cao hơn.

Yếu tố quyết định lượt đề cập thương hiệu: Độ phổ biến

Bối cảnh: Chúng ta vẫn chưa biết rõ giá trị của việc một thương hiệu được nhắc đến bởi Chatbot AI. Nghiên cứu ban đầu cho thấy giá trị này rất cao, đặc biệt là khi lời nhắc cho thấy ý định mua hàng. Tuy nhiên, tôi muốn đi sâu hơn một chút bằng cách tìm hiểu điều gì dẫn đến việc nhắc đến thương hiệu trong Chatbot AI ngay từ đầu.

Sau khi so sánh nhiều chỉ số với khả năng hiển thị của AI Chatbot, tôi tìm thấy một yếu tố nổi bật hơn bất kỳ yếu tố nào khác: Lượng tìm kiếm thương hiệu. Số lần đề cập đến AI Chatbot và lượng tìm kiếm thương hiệu có mối tương quan là .334 – khá tốt trong lĩnh vực này. Nói cách khác, mức độ phổ biến của một thương hiệu quyết định phần lớn mức độ hiển thị của thương hiệu đó trong AI Chatbot .

Mức độ phổ biến là yếu tố dự báo quan trọng nhất cho Chat GPT, cũng là yếu tố gửi lưu lượng truy cập nhiều nhất và có mức sử dụng cao nhất trong tất cả các Chatbot AI. Khi phân tích theo Chatbot AI, tôi thấy Chat GPT có hệ số tương quan cao nhất với .542 (mạnh), nhưng Perplexity (.196) và Google AIO (.254) có hệ số tương quan thấp hơn.

Nói rõ hơn, có rất nhiều sắc thái ở cấp độ lời nhắc và danh mục. Nhưng nhìn chung, mức độ hiển thị của một thương hiệu dường như bị ảnh hưởng nghiêm trọng bởi mức độ phổ biến của nó.

Tuy nhiên, khi nhắc đến các thương hiệu, tất cả Chatbot AI đều ưu tiên các thương hiệu phổ biến và luôn xếp hạng chúng theo cùng một thứ tự.

Có mối liên hệ rõ ràng giữa các danh mục câu hỏi của người dùng (sức khỏe tâm thần, chăm sóc da, giảm cân, rụng tóc, rối loạn cương dương) và thương hiệu.
Dữ liệu ban đầu cho thấy các thương hiệu dễ nhận thấy nhất là thương hiệu số hóa trước và đầu tư mạnh vào sự hiện diện trực tuyến của họ bằng nội dung, SEO, đánh giá, phương tiện truyền thông xã hội và quảng cáo kỹ thuật số.

Điểm mấu chốt: Mức độ phổ biến là tiêu chí quan trọng nhất quyết định một thương hiệu có được nhắc đến trong Chatbot AI hay không. Cách người tiêu dùng kết nối thương hiệu với danh mục sản phẩm cũng rất quan trọng. Việc so sánh lượng tìm kiếm thương hiệu và sự hiện diện của danh mục sản phẩm với đối thủ cạnh tranh sẽ giúp bạn đánh giá chính xác nhất mức độ cạnh tranh của mình trên Chatbots & Co.

Ví dụ: Tất cả các mô hình trong phân tích của tôi đều trích dẫn Healthline thường xuyên nhất. Không có tên miền nào khác nằm trong top 10 trích dẫn cho cả 4 mô hình, cho thấy sở thích khác biệt rõ rệt của họ và tầm quan trọng của việc theo dõi nhiều mô hình thay vì chỉ theo dõi Chat GPT – nếu những mô hình đó cũng mang lại lưu lượng truy cập cho bạn.

Domain	ChatGPT 4o	Domain	Perplexity
www.healthline.com	297	www.healthline.com	605
www.verywellmind.com	219	www.onlinedoctor.com	403
nypost.com	208	blocked.goodrx.com	249
www.gq.com	125	www.reddit.com	232
www.onlinedoctor.com	69	www.byrdie.com	231
www.medicalnewstoday.com	60	www.cosmopolitan.com	181
www.eatingwell.com	56	www.lemonaidhealth.com	173
www.mymallbox.com	50	www.verywellmind.com	168
en.wikipedia.org	48	www.hims.com	166
www.instyle.com	42	www.medicalnewstoday.com	161
Domain	Google AI Overviews	Domain	Microsoft Copilot
www.healthline.com	431	www.healthline.com	1830
www.everydayhealth.com	415	www.forbes.com	914
www.onlinedoctor.com	292	www.byrdie.com	680
www.verywellmind.com	246	www.medicalnewstoday.com	555
www.today.com	164	www.clinicadvisor.com	457
www.byrdie.com	161	health.usnews.com	347
www.cnet.com	147	www.cnet.com	325
www.ncoa.org	142	www.sitejabber.com	301
www.innerbody.com	141	www.ncoa.org	286
builtin.com	125	psychcentral.com	269

Ví dụ các trang thường được trích dẫn nhất trong lĩnh vực sức khỏe:

verywellmind.com
onlinedoctor.com
medicalnewstoday.com
byrdie.com
cnet.com
ncoa.org

Bối cảnh: Không phải tất cả các chatbot AI đều đề cập đến các thương hiệu với tần suất như nhau. Mặc dù Chat GPT có tỷ lệ sử dụng cao nhất và gửi lưu lượng truy cập giới thiệu đến các nguồn nhiều nhất, Perplexity lại đề cập đến nhiều thương hiệu nhất theo trung bình trong các câu trả lời.

Cấu trúc prompt ảnh hưởng đến đề cập thương hiệu

Từ “tốt nhất” là yếu tố kích hoạt mạnh mẽ cho việc đề cập đến thương hiệu trong 69,71% lời nhắc
Các từ như “đáng tin cậy” (5,77%), “nguồn” (2,88%), “khuyến nghị” (0,96%) và “đáng tin cậy” (0,96%) cũng có liên quan đến khả năng đề cập đến thương hiệu cao hơn
Các lời nhắc bao gồm “khuyến nghị” thường đề cập đến các tổ chức công cộng như FDA, đặc biệt là khi lời nhắc bao gồm các từ như “đáng tin cậy” hoặc “hàng đầu”
Google AIO cho thấy sự đa dạng thương hiệu cao nhất, tiếp theo là Perplexity, sau đó là Chat GPT

Bài học rút ra: Cách promt có tác động đáng kể đến các thương hiệu xuất hiện trong câu trả lời. Tuy nhiên, chúng ta vẫn chưa thể thực sự biết người dùng sử dụng gợi ý nào. Điều quan trọng cần lưu ý: tất cả gợi ý chúng ta xem xét và theo dõi chỉ là đại diện cho những gì người dùng có thể đang làm.

Lỗi kỹ thuật có thể cản trở khả năng hiển thị trong Chatbot AI

Bối cảnh: Trong quá trình nghiên cứu, tôi đã phát hiện ra một số cách các thương hiệu vô tình làm giảm khả năng hiển thị của Chatbot AI. Tôi nêu ra những cách này ở đây vì điều kiện tiên quyết để được hiển thị trong LLM, tất nhiên, là khả năng thu thập dữ liệu trang web của họ, dù là trực tiếp hay thông qua dữ liệu đào tạo.

Ví dụ, Copilot không trích dẫn onlinedoctor.com vì nó không được lập chỉ mục trên Bing. Tôi không tìm thấy dấu hiệu nào cho thấy việc này là cố ý, nên tôi cho rằng đây chỉ là sự cố ngoài ý muốn và có thể nhanh chóng khắc phục và được thưởng bằng lưu lượng truy cập giới thiệu.

Mặt khác, Chat GPT 4o không trích dẫn cnet.com và Perplexity không trích dẫn everydayhealth.com vì cả hai trang web đều cố tình chặn Chatbot AI tương ứng trong robots.txt của họ.

Nhưng cũng có những trường hợp Chatbot AI tham chiếu đến các trang web mặc dù về mặt kỹ thuật, chúng không nên làm vậy. Tên miền được trích dẫn nhiều nhất trên Perplexity trong tập dữ liệu của tôi là blocked.goodrx.com. GoodRX chặn người dùng từ các quốc gia ngoài Hoa Kỳ, và có vẻ như họ đã vô tình hoặc cố ý chặn Perplexity.

Điều quan trọng cần lưu ý ở đây là Google AI Overview: Không có tùy chọn từ chối nào cho AIO, nghĩa là nếu bạn muốn nhận lưu lượng truy cập tự nhiên từ Google, bạn cần cho phép Google thu thập dữ liệu trang web của bạn, có thể sử dụng nội dung của bạn để huấn luyện các mô hình của Google và hiển thị nội dung đó trong Tổng quan về AI.

Lưu ý: Hãy theo dõi trang web của bạn, đặc biệt nếu tất cả các URL mong muốn đều được lập chỉ mục, trong Google Search Console và Bing Webmaster Tools. Hãy kiểm tra xem bạn có vô tình chặn trình thu thập dữ liệuChatbot AItrong tệp robots.txt hoặc thông qua CDN hay không. Nếu bạn cố tình chặn trình thu thập dữ liệu LLM, hãy kiểm tra xem bạn có xuất hiện trong kết quả của chúng không, chỉ cần hỏi chúng xem chúng biết gì về tên miền của bạn.

Tóm tắt: điểm qua 6 kết luận chính

Các số liệu SEO truyền thống không ảnh hưởng nhiều đến trích dẫn của AI Chatbot
Độ sâu nội dung (số lượng từ và câu cao hơn) và khả năng đọc (Điểm Flesch tốt) quan trọng hơn
Các chatbot AI khác nhau có ưu tiên cho việc trích dẫn khác nhau – việc theo dõi nhiều nền tảng là rất quan trọng
Mức độ phổ biến của thương hiệu (được đo bằng khối lượng tìm kiếm) là yếu tố dự báo mạnh nhất về việc đề cập đến thương hiệu trong AI Chatbots, đặc biệt là trong Chat GPT
Cấu trúc prompt ảnh hưởng đến khả năng hiển thị thương hiệu và chúng ta vẫn chưa biết người dùng thực sự đặt prompt như thế nào
Vấn đề kỹ thuật có thể cản trở khả năng hiển thị AI – đảm bảo trang của bạn không vô tình chặn crawler LLM qua robots.txt hoặc cài đặt CDN

Một nghiên cứu về các đề cập và trích dẫn trong Chatbot & AI

Yếu tố quyết định lượt trích dẫn: Nội dung chuyên sâu

Yếu tố quyết định lượt đề cập thương hiệu: Độ phổ biến

Lỗi kỹ thuật có thể cản trở khả năng hiển thị trong Chatbot AI

Tóm tắt: điểm qua 6 kết luận chính

Editor's Pick

Nghiên cứu về hành vi sử dụng AI Mode của người dùng

Góc nhìn 360 độ về cách AI thay đổi tìm kiếm

Brand Authority là gì? Chiến lược xây dựng Brand Authority

Top Writers

Oponion

Góc nhìn 360 độ về cách AI thay đổi tìm kiếm

Bản tin AI Marketing #7

Bản tin AI Marketing #6

Nghệ Thuật Đánh Thức Giác Quan: Sống Trọn Vẹn Từng Khoảnh Khắc Tại Namia

SEO đã chết? Đây là câu hỏi cần phải định nghĩa lại

You Might Also Like

Content-Market Fit là gì? Làm thế nào để tìm ra Content-Market Fit?

AI Overviews | phần 1 |

Giá trị của nội dung AI là … thấp

Platform Confluence

Community

Network

Policy

About

Nhận báo giá quảng cáo

Nhận báo giá