Như đã nói trong bài trước, phương trình machine learning chỉ là:
F(x) = (w * x + b > 0)
Giả sử robot này được gọi là "Markbot" (vì do Mark viết ra). Vậy Markbot và nhà đầu tư con người ai sẽ thông minh hơn? Tức là, ai đưa ra nhiều quyết định đúng hơn và giúp sinh lời nhiều hơn?
Markbot: Duy lý trí, chỉ có ĐÚNG hay SAI tức 1 hay 0 (nhị phân)
Con người: Có cảm tính, dùng THANG XÁM, ví dụ từ 0 tới 10 (rất xấu tới rất tốt)
Hình minh họa:
Máy tính: Trắng hay Đen = Đúng hay Sai
Con người: Thang xám (dải giá trị cảm tính)
Ví dụ thế này: Đối với vector "hoàn cảnh" x = (x1, x2, ..., xn) và vector trọng số w = (w1, w2, ..., wn) (ví dụ được tính toán ra từ kinh nghiệm quá khứ) với kỳ vọng bitcoin tăng 3% thì hàm F(x) cho giá trị TRUE, tức là nên mua bitcoin vào.
Giả sử việc mua là đúng, và bitcoin tăng giá tới 30%, tức là gấp 10 lần kỳ vọng. Như vậy, đối với nhà đầu tư con người thì đây không phải là quyết định đúng nữa, mà là quyết định "quá đúng".
Markbot: MỘT quyết định đúng
Con người: Quyết định QUÁ ĐÚNG, TUYỆT VỜI
Đây chính là khác biệt lớn nhất giữa robot và human. Robot là duy lý trí và con người là cảm tính.
Điều quan trọng là: Đây chính là chỗ robot sẽ vượt qua con người, chỉ là vấn đề thời gian.
Khả năng học một biết mười
Về cơ bản mà nói, càng cảm tính sẽ càng kém thông minh. Trong sự việc trên (giá bitcoin tăng 30% gấp 10 lần kỳ vọng), markbot chỉ tính là một quyết định đúng, còn con người tính là một quyết định tuyệt vời, nên cần phát huy nhiều trong tương lai.Nói cách khác, con người sùng bái vector trọng số w, coi nó là đúng gấp 10 lần. Liệu Markbot cũng nên "học tập" tư duy con người theo cách này? Ví dụ thay vì coi đó là 01 quyết định đúng thì coi là 10 quyết định đúng và "đăng ký" trọng số w 10 lần để năng cao "uy tín" cho trọng số w?
Điều đó là cảm tính và không đúng đắn. Cho dù bitcoin tăng 30% hay 300% đi chăng nữa, nó vẫn chỉ là quyết định "đúng" mà thôi.
Bởi vì vector trọng số w' (w phẩy) khác một chút so với w cũng sẽ cho ra quyết định đúng y như w. Hoặc vector w'' (hai phẩy) cho quyết định sai. Như thế, w' cũng phải đúng 10 lần, và w'' phải sai 10 lần. Rốt cuộc thì nếu chỉ sùng bái w sẽ dẫn tới nhận định sai.
Đây chính là sai lầm lớn nhất của con người: Ra quyết định dựa trên cảm xúc.
Vì thế, họ thường sẽ kết thúc bằng việc đánh bạc.
Vậy thì Markbot học tập thế nào để học một biết mười?
Nếu bitcoin tăng giá 30% (một sự thật = FACT), chắc chắn sẽ có rất nhiều vector trọng số đúng, và Markbot sẽ ghi tất cả là "cho ra kết quả đúng". Ngược lại sẽ có rất nhiều vector trọng số bị ghi là sai.
Bằng cách này, Markbot sẽ "học một biết mười" chỉ qua một sự kiện riêng lẻ. Đó là lý do sẽ tới lúc khả năng ra quyết định của robot sẽ vượt qua con người.
Và đây chưa phải là A.I. (trí tuệ nhân tạo). Đây mới chỉ là robot do con người lập trình ra.
Mark
No comments:
Post a Comment