
Những tiến bộ gần đây trong lĩnh vực học máy (machine learning) đã đặt ra nhiều thách thức mới cho các công cụ tìm kiếm và cả internet nói chung.
Cách AI thay đổi bức tranh nội dung trực tuyến
Khi internet lần đầu tiên phổ biến, nó chủ yếu được sử dụng để chơi game trực tuyến với bạn bè. Khi đó, tôi chưa thể tưởng tượng rằng một ngày nào đó sẽ có những công ty thu thập toàn bộ thông tin trên mạng hoặc kết nối tất cả bạn bè của tôi một cách dễ dàng. Các nhà cung cấp dịch vụ như Google hay Facebook đã xây dựng một kho dữ liệu khổng lồ (Google là về các trang web, còn Facebook là về con người) và biến nó thành thứ dễ tìm kiếm và tương tác. Hiệu ứng mạng lưới (network effect) của internet khiến điều này trở nên khả thi: cả thế giới có thể truy cập cùng một mạng lưới và đáp ứng các nhu cầu chung.
Giai đoạn tiếp theo của internet là khả năng tạo ra bất kỳ nội dung nào một cách dễ dàng. Thay vì phải tìm kiếm thông tin trên mạng để viết bài cho bản tin của mình, tôi sẽ chỉ cần đưa một vài đầu vào cho công nghệ học máy và nó sẽ tự động viết bài cho tôi.
Hiện tại, chúng ta có thể làm điều tương tự với hình ảnh. Vào tháng 1/2021, OpenAI đã ra mắt DALL-E, một công nghệ học máy dựa trên GPT có khả năng tạo ra bất kỳ hình ảnh nào chỉ từ mô tả bằng văn bản. Gần đây, OpenAI đã trình diễn khả năng của DALL-E. Bạn muốn một “GPU hình quả bơ”? DALL-E sẽ tạo ra nó ngay lập tức.
Tương lai của sáng tạo nội dung với DALL-E
OpenAI sử dụng công nghệ Transformer tương tự như Google dùng cho MUM và GPT-3. Vì thế, DALL-E hiểu rất rõ ngữ cảnh ngầm của các đầu vào. Ví dụ, nó phân biệt được giữa “ly rượu trên bàn” và “rượu trên bàn kính” và sẽ trả về hai hình ảnh hoàn toàn khác nhau. DALL-E cũng hiểu được ngữ cảnh về ngôn ngữ và thời gian. Nhờ vậy, nó có thể tạo ra bất kỳ hình ảnh nào cho mọi ứng dụng.
GPT-3 có thể tạo ra văn bản dựa trên một vài đầu vào. Bạn yêu cầu nó viết về “chiến lược của Napoleon trong cuộc xâm lược nước Nga” và nó sẽ soạn thảo một bài tiểu luận hoàn chỉnh về cuộc chiến năm 1812. Tương tự, DALL-E là sự kết hợp giữa nhân vật Wall-E trong phim của Pixar và nghệ sĩ Salvador Dali, cho phép chuyển đổi từ văn bản thành hình ảnh một cách sáng tạo.
Các chuyên gia SEO giàu trí tưởng tượng có thể hình dung ra một tương lai nơi DALL-E tự động tạo hình ảnh cho các bài viết trên blog. Bạn chỉ cần viết văn bản, nói DALL-E muốn bao nhiêu hình ảnh và theo phong cách nào, nó sẽ tạo ra chúng dựa trên ngữ cảnh mà nó tìm thấy trong nội dung của bạn. Hoặc nó có thể tạo ra các hình ảnh sáng tạo cho trang đích (landing page). Thậm chí, DALL-E có thể đặt logo hoặc sản phẩm của bạn vào một ngữ cảnh hoàn toàn khác và làm cho chúng trông thật như đời.
Có ai đó có thể xây dựng một dịch vụ cho phép tạo bất kỳ hình ảnh nào bạn muốn dựa trên mô tả văn bản hoặc giọng nói, thay thế hoặc cải thiện các trang như Unsplash, Pexels hay Shutterstock. Bạn sẽ không cần tìm kiếm hình ảnh miễn phí bản quyền cho bài thuyết trình của mình nữa. Google hoặc Microsoft có thể cung cấp dịch vụ này miễn phí ngay trong phần mềm của họ. Chỉ cần nói: “Chèn hình ảnh doanh nhân mỉm cười trong bộ vest” là bạn đã có ngay hình ảnh mình cần.
Thật phù hợp khi Google và Microsoft là hai nhà đầu tư lớn nhất trong lĩnh vực nghiên cứu AI. Trên thực tế, Microsoft đã chi hàng tỷ đô la để có quyền truy cập độc quyền vào mã nguồn của GPT-3, trong khi tất cả mọi người khác chỉ có thể sử dụng qua API. Lợi thế cạnh tranh của việc sở hữu công nghệ như GPT-3 hay DALL-E sẽ rất khó để đánh bại.
Nhưng điều này không đến một cách miễn phí. Chỉ một lần huấn luyện mô hình GPT-3 đã tiêu tốn của OpenAI 12 triệu USD và chi phí tính toán tăng gấp 300 lần. Việc huấn luyện liên tục AI rất tốn kém, chưa kể đến chi phí sức mạnh tính toán để vận hành nó. Ngưỡng để gia nhập lĩnh vực này là rất cao.
Google có thể nhận diện nội dung AI như thế nào?
Gần đây, John Mueller của Google đã đề cập rằng Google có thể coi nội dung do AI tạo ra là nội dung spam. Nếu đội ngũ chống spam của Google phát hiện nội dung AI, họ có thể áp dụng hình phạt thủ công lên trang đó. Mueller lập luận rằng nội dung do AI tạo ra tương tự như việc “spin content” – một phương pháp cũ kỹ dùng để tạo ra các phiên bản khác nhau của cùng một nội dung bằng cách thay đổi cấu trúc câu và từ ngữ.
Điều này dẫn đến hai câu hỏi cơ bản: Thứ nhất, chúng ta nên sử dụng AI để tạo nội dung như thế nào? Và thứ hai, làm thế nào để Google phát hiện ra nội dung AI?
Với câu hỏi đầu tiên, điều quan trọng là mức độ sử dụng AI trong việc tạo nội dung. Có sự khác biệt giữa việc hoàn toàn dựa vào AI để tạo ra nội dung và việc sử dụng AI để hỗ trợ tạo nội dung, ví dụ như giúp lập dàn bài hoặc đề xuất chủ đề. Hiện tại, các công cụ chỉnh sửa SEO và nội dung hiện đại có thể đưa ra dàn bài và đề xuất cho nội dung, nhưng chúng chưa thể hoàn toàn tự viết văn bản. Tuy nhiên, nếu công nghệ tiếp tục phát triển với tốc độ như hiện nay, điều này sẽ sớm trở thành hiện thực trong vài năm tới.
Với câu hỏi thứ hai, việc phát hiện nội dung do AI tạo ra phức tạp hơn nhiều. Các phiên bản cũ của mô hình NLG (Natural Language Generation) như GPT hoặc GPT-2 có thể bị phát hiện. Nhưng với những mô hình tiên tiến hơn như GPT-3, việc nhận diện trở nên khó khăn vì chúng mô phỏng rất tốt phong cách viết của con người.
Có một cách Google có thể áp dụng là xử lý nội dung AI tương tự như cách họ xử lý backlink. Theo nguyên tắc, việc mua bán hoặc trao đổi liên kết là vi phạm hướng dẫn của Google. Nhưng trên thực tế, Google không phải lúc nào cũng phân biệt được liệu một liên kết được đặt một cách tự nhiên hay là một phần của giao dịch. Chỉ khi các mẫu hình trở nên rõ ràng (ví dụ như liên kết không liên quan đến nội dung), Google mới có thể hành động. Điều này cũng có thể áp dụng cho nội dung AI: Google có thể không phân biệt được nếu nội dung vẫn đảm bảo chất lượng cao và có phong cách nhất quán.
Một giải pháp khác có thể là sử dụng công nghệ Blockchain. Google có thể xác thực và theo dõi nội dung do con người tạo ra thông qua một sổ cái, tương tự như cách họ đã dùng đánh dấu quyền tác giả (authorship markup) trước đây. Nội dung được viết bởi con người có thể được gắn thẻ trong kết quả tìm kiếm và thậm chí có thể được xếp hạng cao hơn tùy theo trường hợp sử dụng. Blockchain có thể là liều thuốc giải cho vấn đề tin giả và rất có thể trở thành con đường hướng tới kết quả tìm kiếm đáng tin cậy.
Từ việc tổng hợp đến tạo ra nội dung
Khi nghĩ đến AI, nội dung và SEO, tôi thường tự đặt câu hỏi: “Điều gì sẽ tạo ra sự khác biệt cho các trang web khi tất cả đều có cùng một loại nội dung?” và “Liệu các trang web có còn cần thiết trong giai đoạn đó không?”
Google đánh giá nội dung dựa trên nhiều yếu tố khác nhau nhưng đã từng nói rằng nội dung là một trong những tín hiệu xếp hạng mạnh mẽ nhất. Nếu ai cũng có thể tạo ra văn bản ở quy mô lớn với chi phí thấp, Google có thể phải quay về đánh giá các tín hiệu khác. Trong thương mại điện tử, đó có thể là tình trạng hàng hóa hoặc thời gian vận chuyển. Trong SaaS, đó có thể là tính năng sản phẩm. Còn gì khác nữa?
Điều quan trọng là không ngừng theo dõi những xu hướng mới để không bỏ lỡ cơ hội từ các chuyển động lớn của Google và các công nghệ tiên tiến.