Nghiên cứu tiên tiến cho thấy ngôn ngữ không giống với trí tuệ. Toàn bộ bong bóng AI được xây dựng trên việc bỏ qua điều này.
"Việc phát triển siêu trí tuệ hiện đã trong tầm mắt," Mark Zuckerberg tuyên bố, báo hiệu "sự sáng tạo và khám phá những điều không thể tưởng tượng được ngày hôm nay." AI mạnh mẽ "có thể xuất hiện sớm nhất vào năm 2026 [và sẽ] thông minh hơn người đoạt giải Nobel trong hầu hết các lĩnh vực liên quan," Dario Amodei nói, hứa hẹn việc tăng gấp đôi tuổi thọ con người hoặc thậm chí "thoát khỏi cái chết". "Chúng tôi hiện tin tưởng rằng mình biết cách xây dựng AGI," Sam Altman nói, ám chỉ tới "chén thánh" của ngành - trí tuệ nhân tạo tổng quát - và sớm AI siêu thông minh "có thể đẩy nhanh đáng kể việc khám phá và đổi mới khoa học vượt xa khả năng của chúng ta."
Chúng ta có nên tin họ không? Không nếu chúng ta tin vào khoa học về trí tuệ con người, và đơn giản nhìn vào các hệ thống AI mà những công ty này đã tạo ra cho đến nay.
Đặc điểm chung xuyên suốt các chatbot như ChatGPT của OpenAI, Claude của Anthropic, Gemini của Google, và bất cứ sản phẩm AI nào mà Meta đang gọi tuần này là tất cả đều chủ yếu là "mô hình ngôn ngữ lớn". Về cơ bản, chúng dựa trên việc thu thập một lượng dữ liệu ngôn ngữ khổng lồ (phần lớn được mã hóa trên internet), tìm mối tương quan giữa các từ (chính xác hơn là các từ con gọi là "token"), và sau đó dự đoán đầu ra nào nên theo sau một lời nhắc cụ thể làm đầu vào. Dù AI sinh tạo được cho là phức tạp, nhưng về cốt lõi chúng thực sự chỉ là mô hình của ngôn ngữ.
Vấn đề là theo khoa học thần kinh hiện tại, tư duy con người phần lớn độc lập với ngôn ngữ con người - và chúng ta có ít lý do để tin rằng việc mô hình hóa ngôn ngữ ngày càng tinh vi sẽ tạo ra một dạng trí tuệ đáp ứng hoặc vượt qua trí tuệ của chúng ta. Con người sử dụng ngôn ngữ để truyền đạt kết quả của khả năng lý luận, hình thành trừu tượng và tổng quát hóa, hay những gì chúng ta có thể gọi là trí tuệ. Chúng ta sử dụng ngôn ngữ để suy nghĩ, nhưng điều đó không làm cho ngôn ngữ giống với tư duy. Hiểu được sự khác biệt này là chìa khóa để tách biệt sự thật khoa học khỏi khoa học viễn tưởng đầy suy đoán của các CEO phấn khích về AI.
Cỗ máy thổi phồng AI không ngừng quảng bá ý tưởng rằng chúng ta đang trên bờ vực tạo ra thứ gì đó thông minh như con người, hoặc thậm chí "siêu trí tuệ" sẽ làm lu mờ khả năng nhận thức của chúng ta. Nếu chúng ta thu thập hàng tấn dữ liệu về thế giới, và kết hợp với sức mạnh tính toán ngày càng mạnh mẽ (đọc: chip Nvidia) để cải thiện mối tương quan thống kê, thì voilà, chúng ta sẽ có AGI. Mở rộng quy mô là tất cả những gì chúng ta cần.
Nhưng lý thuyết này có khiếm khuyết khoa học nghiêm trọng. LLM chỉ đơn giản là công cụ mô phỏng chức năng giao tiếp của ngôn ngữ, không phải quá trình nhận thức riêng biệt và khác biệt của tư duy và lý luận, bất kể chúng ta xây dựng bao nhiêu trung tâm dữ liệu.
Chúng ta sử dụng ngôn ngữ để suy nghĩ, nhưng điều đó không làm cho ngôn ngữ giống với tư duy
Năm ngoái, ba nhà khoa học đã xuất bản một bài bình luận trên tạp chí Nature với tiêu đề rõ ràng đáng ngưỡng mộ: "Ngôn ngữ chủ yếu là công cụ giao tiếp hơn là tư duy." Đồng tác giả bởi Evelina Fedorenko (MIT), Steven T. Piantadosi (UC Berkeley) và Edward A.F. Gibson (MIT), bài viết là bản tóm tắt xuất sắc về hàng thập kỷ nghiên cứu khoa học về mối quan hệ giữa ngôn ngữ và tư duy, và có hai mục đích: một, phá bỏ quan niệm rằng ngôn ngữ sinh ra khả năng suy nghĩ và lý luận của chúng ta, và hai, xây dựng ý tưởng rằng ngôn ngữ tiến hóa như một công cụ văn hóa chúng ta sử dụng để chia sẻ suy nghĩ với nhau.
Hãy xem xét từng khẳng định này.
Khi chúng ta suy ngẫm về tư duy của mình, thường cảm thấy như thể chúng ta đang suy nghĩ bằng một ngôn ngữ cụ thể, và do đó vì ngôn ngữ của chúng ta. Nhưng nếu đúng là ngôn ngữ thiết yếu cho tư duy, thì việc lấy đi ngôn ngữ cũng sẽ lấy đi khả năng suy nghĩ của chúng ta. Điều này không xảy ra. Tôi nhắc lại: Lấy đi ngôn ngữ không lấy đi khả năng suy nghĩ của chúng ta. Và chúng ta biết điều này vì một vài lý do thực nghiệm.
Thứ nhất, sử dụng chụp cộng hưởng từ chức năng tiên tiến (fMRI), chúng ta có thể thấy các phần khác nhau của não người kích hoạt khi chúng ta tham gia vào các hoạt động tinh thần khác nhau. Hóa ra, khi chúng ta tham gia vào các hoạt động nhận thức khác nhau - giải một bài toán chẳng hạn, hoặc cố hiểu điều gì đang xảy ra trong tâm trí của người khác - các phần khác nhau của não chúng ta "sáng lên" như một phần của các mạng lưới khác biệt với khả năng ngôn ngữ của chúng ta.

Thứ hai, các nghiên cứu về những người đã mất khả năng ngôn ngữ do tổn thương não hoặc các rối loạn khác chứng minh một cách thuyết phục rằng sự mất mát này không làm suy giảm cơ bản khả năng suy nghĩ tổng quát. "Bằng chứng là không thể chối cãi," Fedorenko và cộng sự tuyên bố, rằng "có nhiều trường hợp cá nhân bị suy giảm ngôn ngữ nghiêm trọng... nhưng vẫn thể hiện khả năng nguyên vẹn để tham gia vào nhiều hình thức tư duy." Những người này có thể giải các bài toán, làm theo hướng dẫn phi ngôn ngữ, hiểu động cơ của người khác, và tham gia lý luận - bao gồm lý luận logic hình thức và lý luận nhân quả về thế giới.
Nếu bạn muốn tự mình điều tra độc lập điều này, đây là một cách đơn giản: Tìm một em bé và quan sát chúng (khi chúng không ngủ). Điều bạn chắc chắn sẽ quan sát thấy là một con người nhỏ tò mò khám phá thế giới xung quanh, chơi với đồ vật, tạo ra tiếng động, bắt chước khuôn mặt, và học hỏi từ tương tác và trải nghiệm. "Các nghiên cứu cho thấy trẻ em học về thế giới theo cách giống như các nhà khoa học - bằng cách tiến hành thí nghiệm, phân tích thống kê, và hình thành các lý thuyết trực quan về các lĩnh vực vật lý, sinh học và tâm lý," nhà khoa học nhận thức Alison Gopnik lưu ý, tất cả trước khi học cách nói chuyện. Trẻ sơ sinh có thể chưa thể sử dụng ngôn ngữ, nhưng tất nhiên chúng đang suy nghĩ! Và mọi bậc cha mẹ đều biết niềm vui khi xem nhận thức của con mình nổi lên theo thời gian, ít nhất là cho đến tuổi teen.
Vậy, về mặt khoa học, ngôn ngữ chỉ là một khía cạnh của tư duy con người, và phần lớn trí tuệ của chúng ta liên quan đến khả năng phi ngôn ngữ. Tại sao nhiều người trong chúng ta lại cảm thấy trực quan ngược lại?
Điều này đưa chúng ta đến khẳng định chính thứ hai trong bài viết Nature của Fedorenko và cộng sự, rằng ngôn ngữ chủ yếu là công cụ chúng ta sử dụng để chia sẻ suy nghĩ với nhau - một "mã giao tiếp hiệu quả," theo lời họ. Điều này được chứng minh bởi thực tế rằng, qua sự đa dạng rộng lớn của các ngôn ngữ con người, chúng chia sẻ những đặc điểm chung nhất định khiến chúng "dễ tạo ra, dễ học và hiểu, súc tích và hiệu quả để sử dụng, và mạnh mẽ trước nhiễu."
Thậm chí các bộ phận trong ngành AI cũng đang ngày càng chỉ trích LLMs
Không đi quá sâu vào chi tiết ngôn ngữ học ở đây, kết quả là con người, như một loài, hưởng lợi rất nhiều từ việc sử dụng ngôn ngữ để chia sẻ kiến thức, cả trong hiện tại và qua các thế hệ. Hiểu theo cách này, ngôn ngữ là thứ mà nhà khoa học nhận thức Cecilia Heyes gọi là "thiết bị nhận thức" "cho phép con người học hỏi từ người khác với hiệu quả, độ trung thực và độ chính xác phi thường."
Nhận thức của chúng ta cải thiện nhờ ngôn ngữ - nhưng nó không được tạo ra hoặc định nghĩa bởi ngôn ngữ.
Lấy đi khả năng nói của chúng ta, và chúng ta vẫn có thể suy nghĩ, lý luận, hình thành niềm tin, yêu, và di chuyển trong thế giới; phạm vi những gì chúng ta có thể trải nghiệm và suy nghĩ vẫn rộng lớn.
Nhưng lấy đi ngôn ngữ khỏi một mô hình ngôn ngữ lớn, và bạn không còn lại gì cả.
Một người đam mê AI có thể tranh luận rằng trí tuệ cấp độ con người không nhất thiết phải hoạt động theo cách giống như nhận thức con người. Các mô hình AI đã vượt qua hiệu suất con người trong các hoạt động như cờ vua sử dụng các quy trình khác với những gì chúng ta làm, vậy có lẽ chúng có thể trở nên siêu thông minh thông qua một phương pháp độc đáo dựa trên việc rút ra mối tương quan từ dữ liệu huấn luyện.
Có thể! Nhưng không có lý do rõ ràng nào để nghĩ rằng chúng ta có thể đạt được trí tuệ tổng quát - không cải thiện các nhiệm vụ được định nghĩa hẹp - thông qua huấn luyện dựa trên văn bản. Sau cả, con người sở hữu đủ loại kiến thức không dễ dàng được gói gọn trong dữ liệu ngôn ngữ - và nếu bạn nghi ngờ điều này, hãy nghĩ về cách bạn biết cách đi xe đạp.
Thực tế, trong cộng đồng nghiên cứu AI có nhận thức ngày càng tăng rằng LLM, tự chúng, là những mô hình không đủ về trí tuệ con người. Ví dụ, Yann LeCun, người đoạt giải Turing cho nghiên cứu AI và là người hoài nghi nổi bật về LLM, đã rời vị trí tại Meta tuần trước để thành lập một startup AI phát triển cái được gọi là mô hình thế giới: "hệ thống hiểu thế giới vật lý, có bộ nhớ bền vững, có thể lý luận, và có thể lập kế hoạch chuỗi hành động phức tạp." Và gần đây, một nhóm các nhà khoa học AI và "nhà lãnh đạo tư tưởng" nổi bật - bao gồm Yoshua Bengio (người đoạt giải Turing khác), cựu CEO Google Eric Schmidt, và Gary Marcus người hoài nghi AI nổi tiếng - đã tập hợp xung quanh định nghĩa làm việc về AGI là "AI có thể đáp ứng hoặc vượt qua tính linh hoạt và thành thạo nhận thức của một người lớn được giáo dục tốt" (nhấn mạnh thêm). Thay vì coi trí tuệ như một "khả năng đơn khối," họ đề xuất thay vào đó chúng ta chấp nhận một mô hình về cả nhận thức con người và nhân tạo phản ánh "một kiến trúc phức tạp bao gồm nhiều khả năng riêng biệt."
Họ tranh luận trí tuệ trông giống như thế này:

Đây có phải là tiến bộ? Có lẽ, trong chừng mực điều này đưa chúng ta vượt qua cuộc tìm kiếm ngớ ngẩn về nhiều dữ liệu huấn luyện hơn để đưa vào các giá máy chủ. Nhưng vẫn còn một số vấn đề. Chúng ta có thể thực sự tổng hợp các khả năng nhận thức cá nhân và coi tổng kết quả là trí tuệ tổng quát không? Chúng ta định nghĩa trọng số mà chúng nên được đưa ra như thế nào, và những khả năng nào để bao gồm và loại trừ? Chúng ta có ý gì chính xác khi nói "kiến thức" hoặc "tốc độ," và trong những bối cảnh nào? Và trong khi những chuyên gia này đồng ý rằng việc đơn giản mở rộng quy mô mô hình ngôn ngữ sẽ không đưa chúng ta đến đó, các con đường tiến về phía trước được đề xuất của họ lại rất khác nhau - họ đang đưa ra một cột mốc tốt hơn, không phải lộ trình để đạt được nó.
Dù phương pháp nào, hãy giả sử rằng trong tương lai không xa, chúng ta thành công trong việc xây dựng một hệ thống AI hoạt động đáng ngưỡng mộ trên phạm vi rộng các nhiệm vụ thách thức nhận thức được phản ánh trong biểu đồ hình mạng nhện này. Liệu chúng ta sẽ đạt được việc xây dựng một hệ thống AI sở hữu loại trí tuệ sẽ dẫn đến các khám phá khoa học biến đổi, như các CEO Big Tech đang hứa hẹn? Không nhất thiết. Bởi vì có một rào cản cuối cùng: Thậm chí việc sao chép cách con người hiện đang suy nghĩ không đảm bảo các hệ thống AI có thể tạo ra những bước nhảy nhận thức mà nhân loại đạt được.
Chúng ta có thể ghi nhận Thomas Kuhn và cuốn sách "Cấu trúc của các cuộc cách mạng khoa học" cho khái niệm "mô hình khoa học" của chúng ta, những khung cơ bản về cách chúng ta hiểu thế giới tại bất kỳ thời điểm nào. Ông tranh luận những mô hình này "chuyển đổi" không phải là kết quả của thí nghiệm lặp đi lặp lại, mà khi những câu hỏi và ý tưởng mới xuất hiện không còn phù hợp trong các mô tả khoa học hiện có của chúng ta về thế giới. Einstein, ví dụ, đã hình thành thuyết tương đối trước khi có bằng chứng thực nghiệm nào xác nhận nó. Dựa trên khái niệm này, triết gia Richard Rorty cho rằng chính khi các nhà khoa học và nghệ sĩ trở nên không hài lòng với các mô hình hiện có (hoặc từ vựng, như ông gọi) thì họ tạo ra những ẩn dụ mới sinh ra những mô tả mới về thế giới - và nếu những ý tưởng mới này hữu ích, chúng sau đó trở thành hiểu biết chung của chúng ta về điều gì là đúng. Do đó, ông tranh luận, "thường thức là tập hợp những ẩn dụ đã chết."
Như hiện được hình thành, một hệ thống AI trải dài nhiều lĩnh vực nhận thức có thể, giả sử, dự đoán và sao chép những gì một con người thông minh tổng quát sẽ làm hoặc nói để phản hồi một lời nhắc nhất định. Những dự đoán này sẽ được thực hiện dựa trên việc tổng hợp và mô hình hóa điện tử bất cứ dữ liệu hiện có nào chúng đã được cung cấp. Chúng thậm chí có thể kết hợp các mô hình mới vào mô hình của mình theo cách xuất hiện giống con người. Nhưng chúng không có lý do rõ ràng nào để trở nên không hài lòng với dữ liệu chúng đang được cung cấp - và do mở rộng, để tạo ra những bước nhảy khoa học và sáng tạo vĩ đại.
Thay vào đó, kết quả rõ ràng nhất không gì khác hơn là một kho lưu trữ thường thức. Vâng, một hệ thống AI có thể remix và tái chế kiến thức của chúng ta theo những cách thú vị. Nhưng đó là tất cả những gì nó có thể làm. Nó sẽ mãi mãi bị mắc kẹt trong từ vựng chúng ta đã mã hóa trong dữ liệu và huấn luyện nó - một cỗ máy ẩn dụ chết. Và con người thực sự - suy nghĩ và lý luận và sử dụng ngôn ngữ để truyền đạt suy nghĩ của chúng ta cho nhau - sẽ vẫn đi đầu trong việc biến đổi hiểu biết của chúng ta về thế giới.







