
Tư duy Bayes là việc liên tục cập nhật niềm tin của chúng ta dựa trên dữ liệu trước đó và là cách tốt nhất để lý luận hướng tới sự thật.
Có hai kiểu người làm marketing tăng trưởng: một bên thì nhìn nhận các thí nghiệm theo kiểu “trắng – đen” rõ ràng, còn một bên thì biết rằng mọi thứ phức tạp hơn thế. Nếu được thực hiện đúng cách, các thí nghiệm chỉ là những điểm dữ liệu giúp chúng ta tiến gần hơn đến sự thật. Đôi khi, chúng là những điểm dữ liệu lớn và cho thấy mối quan hệ nhân – quả. Nhưng cũng có lúc, chúng chỉ ra những điều lớn lao hơn và cho thấy mối tương quan.
Mỗi một mối quan hệ nhân – quả đều sẽ có một mối tương quan nhất định. Câu hỏi đặt ra là: làm sao để chúng ta có thể đi từ mối tương quan đến mối quan hệ nhân – quả? Câu trả lời chính là Định lý Bayes.
Định lý Bayes là gì?
Ý tưởng chính đằng sau Định lý Bayes là nhìn nhận các sự kiện như thí nghiệm hoặc xác suất trong bối cảnh, chứ không phải tách rời. Đây là nền tảng cho nhiều ứng dụng khác nhau, từ chuỗi Markov cho đến mô hình Naive Bayes – một mô hình xác suất đơn giản thường được sử dụng trong machine learning.
Bayes định nghĩa định lý của mình là: “tỷ lệ giữa giá trị mà kỳ vọng phụ thuộc vào sự kiện xảy ra nên được tính toán, và giá trị của thứ được mong đợi khi sự kiện đó xảy ra.” Điều thú vị là ông không tự công bố định lý của mình. Định lý Bayes chỉ được khám phá và phổ biến sau khi ông qua đời bởi Richard Price vào năm 1763.
Công thức của Định lý Bayes:
P(B∣A)=P(A∣B)×P(B)P(A)P(B|A) = \frac{P(A|B) \times P(B)}{P(A)}P(B∣A)=P(A)P(A∣B)×P(B)
Trong đó, P(A|B) là xác suất của A (thí nghiệm) dựa trên B (dự đoán). Nó là tích số của P(A|B) và P(B) (xác suất của B), rồi chia cho P(A) (xác suất của A).
Định lý Bayes và tính ứng dụng
Điểm mạnh nhất của định lý này nằm ở khả năng kết hợp dự đoán trong phương trình – đây chính là phần mà bối cảnh và kinh nghiệm đóng vai trò quan trọng. Khác với cách tiếp cận của chủ nghĩa Tần suất (Frequentist), chỉ nhìn nhận bằng chứng theo cách biệt lập, tư duy Bayes cho phép ta xem bằng chứng mới là một bản cập nhật của niềm tin sẵn có.
Sự khác biệt giữa Tư Duy Bayes và Tư Duy Tần Suất
Các nhà thống kê và nhà khoa học dữ liệu đã tranh luận trong một thời gian dài về tư duy Bayes và tư duy Tần Suất. Kết luận chung là cả hai đều có giá trị và đa số các cuộc tranh cãi chỉ mang tính kỹ thuật. Với tôi, việc kết hợp xác suất dựa trên những sự kiện trước đó có vẻ hợp lý hơn so với việc chỉ nhìn xác suất trong sự cô lập, đặc biệt là trong bối cảnh Tăng Trưởng.
Tư duy Bayes chính là việc cập nhật niềm tin dựa trên dữ liệu mới và không nhìn nhận các thí nghiệm một cách tách biệt. Bằng chứng nên cập nhật niềm tin của bạn, chứ không nên định nghĩa niềm tin đó.
Trong bài viết “Hiểu biết hiện đại về SEO“, tôi đã giải thích rằng chúng ta cần xây dựng một hệ thống thí nghiệm. Nghe theo lời đồn đại trên mạng là chưa đủ, cũng như việc dựa 100% vào kinh nghiệm cá nhân hoặc một thí nghiệm duy nhất của người khác cũng vậy.
Trong bài “Phát triển trong mờ hồ“, tôi có đề cập rằng “chúng ta có một ý tưởng sơ lược về điều gì có hiệu quả, nhưng cần suy nghĩ theo xác suất thay vì tuyệt đối.” Khi chúng ta suy nghĩ về sự mơ hồ theo các nguyên tắc của Bayes, ta sẽ tiến gần hơn đến sự thật khi liên tục cập nhật xác suất dựa trên thông tin mới. Những nhà ra quyết định giỏi nhất không thay đổi ý kiến của mình một cách đột ngột, mà là dần dần, từng chút một.
Chúng ta cần thu thập tất cả các điểm dữ liệu có sẵn và sử dụng chúng như bàn đạp để thực hiện thí nghiệm của riêng mình. Cũng giống như các nhà khoa học không đặt quá nhiều niềm tin vào một nghiên cứu duy nhất, các SEOer và những người làm marketing tăng trưởng cũng phải xây dựng cho mình một hệ thống thí nghiệm đủ lớn để hồi quy về trung bình và tiệm cận sự thật. Có sự khác biệt rất lớn giữa việc bác bỏ kết quả của một thí nghiệm và cập nhật niềm tin của mình.