
Bản cập nhật “Nội dung hữu ích” (Helpful Content Update – HCU) của Google đã làm sống lại cuộc tranh luận về nội dung do AI tạo ra. Tuy nhiên, các lập luận thường khá cực đoan, chỉ đơn giản là “tốt” hoặc “xấu”. Tôi muốn đưa ra một góc nhìn thứ ba để làm rõ vấn đề này hơn: Tất cả phụ thuộc vào mục đích sử dụng. Kể từ khi các công cụ nội dung AI trở nên dễ tiếp cận và sử dụng hơn, tôi đã chứng kiến nhiều trường hợp chúng mang lại hiệu quả tốt và hữu ích cho người tìm kiếm.
Rõ ràng, HCU nhắm đến nội dung có chất lượng thấp (xem phần dịch của tôi). Tài liệu chính thức không hề đề cập đến từ “AI” hay “nội dung do máy tạo ra” mà chỉ nhắc đến “tự động hóa rộng rãi” (theo tôi, điều này có vẻ giống với việc tạo ra nội dung tự động kiểu “content spinning”). Nó dường như liên quan nhiều hơn đến thuật toán Panda và đánh giá chất lượng nội dung nói chung.
Tuy nhiên, có một đoạn trong tài liệu ám chỉ rằng nội dung nên được tạo ra bởi con người (tôi nhấn mạnh):
“Chúng tôi đang triển khai cái gọi là ‘bản cập nhật nội dung hữu ích’ như một phần của nỗ lực lớn hơn nhằm đảm bảo mọi người sẽ thấy nhiều nội dung gốc, hữu ích do con người tạo ra, vì con người, xuất hiện trên kết quả tìm kiếm.”
Trước đây, các đại diện của Google đã tuyên bố rằng nội dung AI vi phạm nguyên tắc của họ. Và tất nhiên, nguyên tắc này cũng được ghi rõ trong chính sách của Google, cấm nội dung được tạo ra tự động.
Nhưng tại sao lại cấm?
Chất lượng quan trọng hơn nguồn gốc
Tại sao lại quan trọng việc nội dung được tạo ra bởi con người hay máy móc? Điều duy nhất cần quan tâm là chất lượng và sự hữu ích của nội dung đó. Trải qua lịch sử, con người đã không ngừng sử dụng công nghệ tiên tiến để tự động hóa các quy trình, từ máy giặt đến ô tô và lò vi sóng. Việc tạo ra nội dung cũng không nên là ngoại lệ, ít nhất là đối với một số loại nội dung nhất định.
Nội dung không chỉ là “nội dung”. Nó có thể đóng vai trò khác nhau, như:
- Giải thích
- Giáo dục
- Mô tả
- Truyền cảm hứng
- Trả lời
- Cung cấp bối cảnh
- Đưa ra ý kiến
- Tóm tắt
Máy móc có thể thực hiện một số chức năng trên, nhưng không phải tất cả. Quan điểm cho rằng nội dung cần được “con người tạo ra” ngụ ý rằng con người có khả năng làm một số việc tốt hơn máy móc. Con người là một loại bộ lọc chất lượng.
Nhưng đối với các trường hợp sử dụng khác, chúng ta hoàn toàn nên sử dụng nội dung do máy tạo ra. Thậm chí, Google còn khuyến nghị tự động hóa phần mô tả meta cho các trang web lớn.
Một vài trường hợp sử dụng nội dung AI hợp lý bao gồm:
- Mô tả meta
- Mô tả sản phẩm/danh mục
- Tóm tắt
- Định nghĩa
- Chuyển đổi giọng nói thành văn bản (transcriptions)
Có thể còn nhiều trường hợp khác, nhưng tại sao không sử dụng máy móc để tạo ra những nội dung có mức độ phức tạp thấp? Đây là loại nội dung không thu hút sự quan tâm của con người khi viết và máy móc có thể làm tốt hơn.
Tôi chia nội dung tìm kiếm thành 3 loại: nội dung ngữ cảnh (contextual), nội dung chuyên sâu (deep) và nội dung kể chuyện (narrative). Nội dung ngữ cảnh cung cấp bối cảnh cho từng bước nhỏ trong hành trình của người dùng, như chọn đoạn trích phù hợp, hiểu rõ trang web cung cấp gì, chọn sản phẩm hoặc đăng ký. Các dạng nội dung ngữ cảnh bao gồm: thuật ngữ, dữ liệu meta, bài viết “cái gì là gì” hoặc mô tả sản phẩm.
Nội dung chuyên sâu có tính phân tích và độc đáo. Mục đích chính là giải thích các chủ đề phức tạp hoặc giúp người tìm kiếm đưa ra quyết định khó khăn. Nội dung này dẫn đến những nhận thức quan trọng trong hành trình của người dùng.
Nội dung kể chuyện không nhằm mục đích cải thiện thứ hạng tìm kiếm mà giúp thương hiệu kể câu chuyện của mình. Nó có thể thu hút các liên kết ngược (backlink) nếu câu chuyện đủ hấp dẫn, hoặc ít nhất giúp công ty thu hút sự chú ý của đối tượng mục tiêu. Nội dung dạng này bao gồm những bài viết thể hiện tư duy lãnh đạo và các câu chuyện dựa trên dữ liệu.
Google đã và đang sử dụng AI để tạo nội dung ngữ cảnh cho chính họ, như:
- Cung cấp tóm tắt dựa trên máy học trong Google Docs
- Tạo mô tả thành phố bằng AI
- Phụ đề video trên YouTube
Nếu Google có thể làm điều này, tại sao các trang web khác lại không?
Sự phát triển của nội dung
Trong 20 năm qua, nội dung đã trải qua nhiều giai đoạn phát triển:
- Các công ty (chủ yếu là nhà xuất bản) tạo và chia sẻ nội dung theo một chiều với người tiêu dùng.
- Người tiêu dùng chia sẻ nội dung với nhau thông qua mạng xã hội.
- Người tiêu dùng tạo và chia sẻ nội dung với nhau thông qua các mạng xã hội và nền tảng.
- Người dùng hoặc sử dụng AI để tạo nội dung và chia sẻ với nhau, hoặc tạo nội dung và AI sẽ chia sẻ với người dùng khác.
Hiện chúng ta đang bước vào giai đoạn thứ 4 của quá trình phát triển này, nhờ vào các nền tảng video phổ biến. TikTok rất hấp dẫn vì nó hiểu con người muốn gì hơn bất kỳ ai khác. Thuật toán dựa trên máy học của TikTok đo lường từng tương tác nhỏ nhất, kể cả những lần nhấn phím trên trình duyệt.
Google đã sử dụng một thuật toán tiên tiến để chiếm lĩnh thị trường của mình. Hệ sinh thái của họ được xây dựng trên việc kết nối các truy vấn tìm kiếm với các trang web và nhà quảng cáo. Google sử dụng thuật toán PageRank để xác định các trang web có thẩm quyền nhất và cung cấp kết quả phù hợp nhất. Thuật toán này đã phát triển, hiện tính đến cả nội dung, trải nghiệm người dùng và hành vi người dùng.
TikTok đang dẫn đầu trong bước tiến thứ 4 vì nó không dựa vào các trang, kiến thức hoặc đồ thị người theo dõi. Nó xây dựng hồ sơ người dùng dựa trên hành vi và kết hợp với nội dung mà họ có khả năng quan tâm nhất. Đánh giá tất cả những tín hiệu này sẽ không thể thực hiện được nếu không có học máy (machine learning). Tương tự như Google, thuật toán là lợi thế cạnh tranh của họ.
Điều này có thể là một mối đe dọa lớn đối với bất kỳ công ty nào vẫn còn mắc kẹt ở các bước 1-3 của sự phát triển nội dung và có thể là lý do Google chống lại nội dung AI.
Vấn đề của Google với nội dung AI
Một vài lý do khiến Google cấm nội dung AI có thể bao gồm:
- Nội dung AI thường có chất lượng thấp đến mức giống như spam.
- Lý do đạo đức.
- Google không muốn các trang web lợi dụng AI để xây dựng lượng người đọc riêng thông qua Google.
- Lo ngại về việc tràn ngập nội dung phổ thông.
- Sẽ khó cho công cụ tìm kiếm nếu nội dung có thể nhanh chóng được tạo ra và tối ưu hóa bằng AI.
- Google muốn tự mình trả lời các câu hỏi cấp cao bằng AI.
Dù lý do là gì, hiện tại có hai sự thật tồn tại:
- Nội dung do AI tạo ra có thể hoạt động tốt trên kết quả tìm kiếm nếu chất lượng cao. Một lần nữa, điều này phụ thuộc vào loại nội dung. Những gì đang hoạt động tốt hiện nay chủ yếu là nội dung chức năng.
- Nội dung AI vẫn chưa dễ để mở rộng quy mô. Kỹ thuật soạn thảo (prompt engineering), tức là cách yêu cầu một công cụ AI như GPT-3 hay DALL-E tạo ra nội dung, vẫn còn phức tạp. AI vẫn cần nhiều sự hướng dẫn và kiểm duyệt. Chưa ai dám tin tưởng hoàn toàn vào nội dung AI mà không qua kiểm tra trước khi xuất bản.
Một thách thức khác là nội dung AI có xu hướng lặp lại khi bài viết càng dài, làm giảm giá trị cho người dùng và dễ bị Google phát hiện. Mọi người lo sợ rằng chúng ta sắp đạt đến thời kỳ mà chỉ cần bấm một nút là có ngay một bài viết 3.000 từ, nhưng thực tế chúng ta chưa đến mức đó.
Tuy nhiên, khi nội dung AI trở nên tốt hơn, nó sẽ được nhiều người sử dụng hơn, bao gồm cả Google. Tôi dự đoán sẽ có một giai đoạn ngắn mà các công ty có khả năng mở rộng quy mô nội dung AI nhanh nhất sẽ chiếm ưu thế, và sau đó công nghệ này sẽ trở nên phổ biến cho tất cả mọi người. Yếu tố khác biệt lớn nhất sẽ nằm ở nguồn dữ liệu đầu vào mà các công ty có thể sử dụng để tạo ra nội dung.
Kết luận
Cuộc tranh luận về nội dung AI đang được làm nóng lại bởi bản cập nhật “Nội dung hữu ích” của Google, nhưng cách tiếp cận chỉ dựa vào khái niệm “nội dung AI là tốt hoặc xấu” là không hợp lý. Thay vào đó, cần phải xem xét kỹ mục đích và loại nội dung mà AI sẽ tạo ra.
Có một số loại nội dung mà con người thực sự vượt trội hơn máy móc, như nội dung mang tính kể chuyện hoặc đòi hỏi sự sáng tạo. Nhưng với những nội dung đơn giản, như mô tả sản phẩm hay định nghĩa thuật ngữ, AI có thể hoàn toàn đảm nhận và thậm chí làm tốt hơn.
Việc sử dụng AI trong nội dung không phải là điều mà Google hoàn toàn phản đối, vì chính họ cũng sử dụng AI để tạo ra nội dung ngữ cảnh cho nhiều sản phẩm của mình. Do đó, chúng ta nên cởi mở hơn trong việc tiếp nhận sự hỗ trợ từ công nghệ, thay vì cố chấp cho rằng chỉ có con người mới có thể tạo ra nội dung hữu ích.
Tương lai của nội dung vẫn đang không ngừng phát triển, và việc kết hợp giữa con người và AI có thể sẽ mang lại những giá trị cao nhất cho người dùng. Điều quan trọng là không nên nhìn nhận vấn đề một cách cực đoan, mà hãy tìm ra những cách sử dụng AI phù hợp để tối ưu hóa hiệu quả và chất lượng nội dung.