
Theo một số nguồn tin, Microsoft đang có kế hoạch tích hợp Chat GPT vào Bing và thậm chí cả các ứng dụng văn phòng như Word, PowerPoint, và Excel trước cuối tháng 3 năm nay [nguồn].
Thông tin này xuất hiện cùng lúc với những tiếng nói ồn ào trên mạng xã hội cho rằng Google đang gặp nguy hiểm vì AI sẽ trở thành công cụ trả lời câu hỏi trong tương lai. Nhiều người đã gọi Chat GPT là “kẻ hủy diệt Google”.
Tôi khá hoài nghi về việc AI tạo sinh như Chat GPT đã sẵn sàng để tích hợp vào công cụ tìm kiếm và tự hỏi liệu việc tích hợp AI vào MS Office có đơn thuần là tạo ra các bản tóm tắt tài liệu, giống như cách mà Google đã lên kế hoạch cho Google Docs hay không. Tuy nhiên, vào tuần trước, các đối thủ của Google như Neeva và You đã bổ sung các tính năng AI tương tự như Chat GPT trong phiên bản beta của họ. Mặc dù chỉ mới ở giai đoạn thử nghiệm sản phẩm tối thiểu (MVP), những tính năng này có thể cho chúng ta một cái nhìn rõ hơn về tương lai của AI trong Tìm kiếm.
Từ nhiều kết quả tới một câu trả lời duy nhất
Khi tìm kiếm câu hỏi trên Neeva, hiện nay đã có tính năng mới là “AI Answer”, hiển thị một kết quả duy nhất trích dẫn từ nhiều nguồn. Nó giống như một “trích đoạn nổi bật được tổng hợp” (stitched-together featured snippet). Bên dưới kết quả AI này, các kết quả tìm kiếm tự nhiên vẫn xuất hiện theo định dạng thông thường mà chúng ta đã quen thuộc.
Tương tự, You Chat cũng có một tính năng như vậy (tôi không chắc ai đã triển khai trước), mặc dù không phải tất cả các kết quả đều có trích dẫn nguồn.
Một nỗi lo lớn của các nhà tiếp thị và doanh nghiệp là việc một công cụ tìm kiếm giống như Chat GPT sẽ không dẫn người dùng tới các trang web nữa. Tuy nhiên, thực tế trong các phiên bản MVP ban đầu, người dùng vẫn nhận được một câu trả lời duy nhất nhưng có thể truy cập sâu hơn vào các nguồn trích dẫn. Bên cạnh những vấn đề pháp lý tiềm tàng nếu không trích dẫn nguồn, một trải nghiệm tìm kiếm tốt vẫn phải cho phép người dùng tự tìm hiểu và so sánh thông tin khi đưa ra các quyết định quan trọng hoặc mua sắm sản phẩm đắt tiền. Vì vậy, một câu trả lời duy nhất mà không có thêm kết quả khác có thể mang lại trải nghiệm kém, trừ khi đó là những thông tin đơn giản, nhanh gọn.
Một sự kết hợp khác giữa chatbot và công cụ tìm kiếm là Perplexity AI, tích hợp mô hình ngôn ngữ lớn (LLM) từ OpenAI với kết quả tìm kiếm của Bing. Khác với Neeva hay You Chat, Perplexity AI cho phép người dùng chọn giữa câu trả lời ngắn gọn và chi tiết.
Nếu mô hình “một câu trả lời cùng với trích dẫn” trở nên phổ biến, điều này sẽ chuyển đổi trải nghiệm Tìm kiếm từ việc cung cấp nhiều kết quả từ nhiều trang web sang chỉ một kết quả duy nhất được tổng hợp từ nhiều nguồn. Chúng ta cần thêm nhiều dữ liệu để đưa ra quyết định, nhưng việc trích dẫn kết quả từ AI có thể gây ra tình trạng sụt giảm lưu lượng truy cập từ công cụ tìm kiếm nghiêm trọng hơn so với các tính năng SERP hiện tại. Nó cũng đưa Google trở về với nguồn gốc của mình khi ý tưởng PageRank được xây dựng dựa trên khái niệm về trích dẫn.
Mô hình AI trả lời kèm trích dẫn này cũng có thể được áp dụng cho kết quả Tin tức và Video. Ví dụ, Google News có thể tóm tắt tin tức trong ngày trong vài đoạn văn ngắn và trích dẫn các nguồn. AI tạo sinh có thể tóm tắt những khoảnh khắc quan trọng nhất trong video, giống như một bản tin hay đoạn reel cho bất kỳ câu hỏi nào. Chẳng hạn, khi bạn tìm kiếm “Quốc hội Hoa Kỳ”, bạn có thể nhận được một đoạn video ngắn 1 phút cắt ghép từ nhiều video khác với những khoảnh khắc then chốt. Google hiện đã hiển thị các khoảnh khắc quan trọng trong tìm kiếm và YouTube cũng cho thấy những thời điểm tương tác cao trong video.
Khi được hỏi liệu AI có được kết nối với web hay không, Sridhar Ramaswamy (Nhà sáng lập và CEO của Neeva) cho biết, “[…] đúng vậy, đây là một sự tích hợp sâu của các mô hình ngôn ngữ lớn (LLM) ở mọi giai đoạn tìm kiếm: viết lại truy vấn, truy xuất, xếp hạng và tạo ra kết quả!”
Phục vụ các truy vấn có khả năng sinh lợi bằng AI
Một yếu tố thú vị khác của những tích hợp AI tạo sinh ban đầu là khả năng phục vụ các truy vấn có khả năng sinh lợi. Chat GPT không trả về kết quả về sản phẩm hoặc dịch vụ vì nó không được huấn luyện trên web. Tuy nhiên, Neeva AI, You Chat và Perplexity AI lại được huấn luyện trên các kết quả web và có thể hiển thị thông tin về sản phẩm và dịch vụ.
Các truy vấn có mức độ sinh lợi khác nhau. Không phải mọi tìm kiếm đều có thể kiếm tiền bằng quảng cáo vì không phải mọi tìm kiếm đều cho thấy người dùng có nhu cầu mua sắm. Ví dụ, khi tìm kiếm “thời tiết ngày mai”, người dùng chỉ muốn biết thời tiết, họ không có ý định mua ô dù, ngay cả khi kết quả là “trời mưa”.
Nhưng khi tìm kiếm “giày bốt mùa đông nam”, đây là tín hiệu rõ ràng rằng người dùng đang có nhu cầu mua. Từ quan điểm của công cụ tìm kiếm, truy vấn thứ hai dễ kiếm tiền hơn vì các nhà quảng cáo đang nhắm mục tiêu vào những người mua sắm. Truy vấn càng có ý định mua cao, khả năng kiếm tiền càng tốt vì a) ý định rõ ràng hơn, b) tăng khả năng các nhà quảng cáo hài lòng, và c) cạnh tranh cao hơn, khiến các nhà quảng cáo đấu thầu giá cao hơn.
Do đó, câu trả lời bằng AI có trích dẫn có thể hiển thị một gợi ý duy nhất cho sản phẩm hoặc dịch vụ trong tương lai, nhưng cũng hiển thị thêm kết quả nếu người dùng muốn so sánh. Trong trải nghiệm tìm kiếm này, các nhà quảng cáo có thể không đấu thầu cho câu trả lời duy nhất, nhưng vẫn có thể đấu thầu cho các kết quả sau đó. Tôi không nghĩ Tìm kiếm Mua sắm sẽ chỉ hiển thị một câu trả lời duy nhất mà không có tùy chọn quảng cáo.
Mối nguy thực sự đối với Google
Vì các quảng cáo có khả năng vẫn tồn tại trong tương lai của câu trả lời AI, tôi không cho rằng mô hình kinh doanh của Google gặp rủi ro nghiêm trọng từ AI tạo sinh. Rủi ro cao hơn chỉ với các câu hỏi vốn đã khó kiếm tiền từ trước. Nguy cơ lớn hơn đối với Google là một công ty như Open AI cung cấp trải nghiệm tìm kiếm tốt hơn cho các câu hỏi đơn giản và sử dụng sự chú ý đó để xây dựng một mô hình tìm kiếm dựa trên quảng cáo.
Một rủi ro khác đến từ việc các mô hình ngôn ngữ lớn (LLM) được tinh chỉnh cho các ngành dọc cụ thể. Google đã mất thị phần đáng kể trong lĩnh vực tìm kiếm mua sắm cho Amazon. Tìm kiếm được chia thành nhiều ngành dọc như việc làm, bất động sản, công thức nấu ăn, sức khỏe, v.v., nhưng mua sắm là một trong những lĩnh vực sinh lợi nhất. Một trong những liên hệ của tôi cho biết Google có các đội chuyên biệt theo từng ngành dọc trong nhiều năm qua. Điều này là do sở thích tìm kiếm khác nhau theo từng lĩnh vực (vì vậy có thể các tín hiệu xếp hạng cũng được cân nhắc khác nhau cho từng lĩnh vực).
Ví dụ, người dùng có thể thích các kết quả trực quan hơn khi mua sắm sản phẩm, trong khi các tìm kiếm liên quan đến sức khỏe cần được tạo ra bởi các chuyên gia trong lĩnh vực đó. Các mô hình ngôn ngữ lớn (LLM) có thể được tinh chỉnh cho các ngành dọc cụ thể và cung cấp kết quả tốt hơn, nhanh hơn, điều này có thể khiến Google, vốn là một công cụ tìm kiếm tổng hợp, bị ảnh hưởng lớn.
Một cách mà Google có thể phá vỡ mô hình kinh doanh hiện tại của chính mình là cấp phép cho các mô hình LLM cho các nhà phát triển. Tương tự như cách Amazon AWS cung cấp dịch vụ lưu trữ đám mây cho các công ty khởi nghiệp công nghệ, các doanh nghiệp mới có thể được xây dựng dựa trên nền tảng LLM của Google. AWS hiện được định giá khoảng một nghìn tỷ USD, và giá trị thị trường của Google hiện tại cũng chỉ nhỉnh hơn con số đó một chút. Nếu Google cung cấp nền tảng LLM qua dịch vụ Google Cloud, họ có thể không cần quá lo lắng về việc tìm kiếm nữa.
Tuy nhiên, không nên vội vàng đánh giá thấp Google, bởi họ đã phát triển khái niệm transformers, vốn là nền tảng của AI tạo sinh. Chúng ta vẫn chưa thực sự thấy sức mạnh của LaMDA và các LLM khác của Google. Với việc bổ sung chữ “E” (Experience – Trải nghiệm) vào nguyên tắc chất lượng E-A-T (Chuyên môn, Thẩm quyền, Độ tin cậy), Google đang chuẩn bị để đưa ra nhiều kết quả tìm kiếm mà AI không thể tạo ra.
Bên cạnh đó, kết quả từ AI tạo sinh hiện tại vẫn còn nhiều vấn đề như thiếu chính xác, thiên vị và có thể sai lầm. Việc duy trì các LLM cũng tốn kém (Chat GPT tiêu tốn khoảng 100.000 USD mỗi ngày để duy trì cho một triệu người dùng), cập nhật chậm và đôi khi chạy không mượt mà. Chúng ta còn chưa đề cập đến các vấn đề pháp lý liên quan đến việc huấn luyện mô hình trên dữ liệu công khai từ web. Ít nhất, chúng ta đã có một cái nhìn sơ bộ về việc tìm kiếm tích hợp AI có thể trông như thế nào trong tương lai.