Rodney Brooks cho rằng robot humanoid tiềm ẩn những thách thức an toàn ẩn giấu và sẽ không học được khéo léo chỉ từ video.
Khi một người tiên phong robotics đã dành hàng thập kỷ xây dựng máy humanoid khuyên bạn nên đứng cách ít nhất 2,7 mét từ bất kỳ robot đi bộ cỡ lớn nào, có lẽ bạn nên lắng nghe.
"Lời khuyên của tôi dành cho mọi người là không được đến gần hơn 3 mét với robot đi bộ cỡ lớn," Rodney Brooks viết trong một bài luận kỹ thuật có tiêu đề "Tại Sao Robot Humanoid Ngày Nay Sẽ Không Học Được Khéo Léo" được xuất bản trên blog của ông tuần trước. "Cho đến khi ai đó đưa ra phiên bản tốt hơn của robot đi bộ hai chân an toàn hơn nhiều khi ở gần, và thậm chí khi tiếp xúc, chúng ta sẽ không thấy robot humanoid được chứng nhận để triển khai trong các khu vực cũng có người."
Brooks, giáo sư danh dự MIT đồng sáng lập iRobot (nổi tiếng với Roomba) và Rethink Robotics, tin rằng các công ty đổ hàng tỷ đô la vào phát triển humanoid đang theo đuổi một ảo tưởng đắt đỏ. Trong số những vấn đề khác chưa được giải quyết, ông cảnh báo rằng các robot humanoid hai chân ngày nay về cơ bản không an toàn cho con người ở gần khi chúng đi bộ do năng lượng động học khổng lồ mà chúng tạo ra khi duy trì thăng bằng. Năng lượng dự trữ đó có thể gây thương tích nghiêm trọng nếu robot ngã hoặc các chi của nó va vào ai đó.

Ngoài lo ngại về trục trặc, Brooks phản bác niềm tin phổ biến rằng robot humanoid sẽ sớm thay thế công nhân con người bằng cách học khéo léo thông qua việc xem video người thực hiện các nhiệm vụ. Đó là một kỹ thuật huấn luyện AI robotics phổ biến mà chúng tôi đã đề cập trước đây. Ông không nghĩ những robot như vậy là không thể, nhưng chúng có thể xa hơn so với những gì hầu hết mọi người nghĩ.
Trong một số góc của thế giới công nghệ, sự cường điệu về robot đã đạt đến mức sốt cao do những tiến bộ nhanh chóng trong AI. CEO Tesla Elon Musk đã tuyên bố rằng robot Optimus của công ty có thể tạo ra 30 nghìn tỷ đô la doanh thu, trong khi CEO Figure Brett Adcock hình dung humanoid phục vụ hàng triệu nhiệm vụ trong lực lượng lao động.
Tuy nhiên, phần cứng khó hơn nhiều so với phần mềm. Không giống như phần mềm chạy trong thế giới ảo, các định luật vật lý là không thể tha thứ và bất biến, và tương tác với thế giới vật lý một cách an toàn đòi hỏi rất nhiều đầu vào cảm giác. Brooks, người đã làm việc về thao tác robot từ những năm 1970, lập luận rằng những công ty này đang bỏ lỡ thành phần cơ bản cho thao tác khéo léo: giác quan xúc giác.
Trọng tâm của lập luận Brooks tập trung vào cách các công ty như Tesla và Figure đang huấn luyện robot của họ. Cả hai đều đã tuyên bố công khai rằng họ đang sử dụng phương pháp chỉ dựa trên thị giác, yêu cầu công nhân đeo thiết bị camera để ghi lại các nhiệm vụ như gấp áo sơ mi hoặc nhặt đồ vật. Dữ liệu sau đó được đưa vào các mô hình AI, có thể bắt chước các hoán vị của chuyển động trong bối cảnh mới. Tesla gần đây đã chuyển từ bộ đồ bắt chuyển động và điều khiển từ xa để thu thập dữ liệu sang phương pháp dựa trên video, với công nhân đeo mũ bảo hiểm và ba lô được trang bị năm camera. Sáng kiến "Project Go-Big" của Figure tương tự dựa vào việc chuyển giao kiến thức trực tiếp từ những gì họ gọi là "video con người hàng ngày."
(Ngoài việc quay video từ con người thực thực hiện nhiệm vụ, một số mô hình AI robotics sử dụng mô phỏng không gian vật lý để huấn luyện, có những hạn chế tương tự.)
Những phương pháp này, Brooks lập luận, bỏ qua hàng thập kỷ nghiên cứu cho thấy rằng sự khéo léo của con người phụ thuộc vào một hệ thống cảm nhận xúc giác cực kỳ phức tạp. Ông trích dẫn công việc từ phòng thí nghiệm của Roland Johansson tại Đại học Umea cho thấy rằng khi đầu ngón tay của một người được gây tê, một nhiệm vụ 7 giây nhặt và thắp que diêm kéo dài đến gần 30 giây loay hoay. Bàn tay con người chứa khoảng 17.000 thụ thể cơ học, với 1.000 tập trung chỉ trong mỗi đầu ngón tay. Nghiên cứu gần đây từ phòng thí nghiệm của David Ginty tại Harvard đã xác định 15 họ tế bào thần kinh liên quan đến cảm nhận xúc giác, phát hiện mọi thứ từ lõm nhẹ đến rung động đến căng da. Đó là rất nhiều thông tin cảm giác mà các hệ thống robot hiện tại chưa thể nắm bắt hoặc mô phỏng.
Vật Lý Của Robot Ngã
Ngoài vấn đề khéo léo còn có một mối quan tâm an toàn ngay lập tức hơn. Các robot humanoid hiện tại sử dụng động cơ điện mạnh mẽ và một thuật toán hàng thập kỷ tuổi được gọi là điểm moment không để duy trì thăng bằng bằng cách bơm một lượng lớn năng lượng vào hệ thống của chúng khi phát hiện sự mất ổn định. Phương pháp này hoạt động đủ tốt để giữ chúng thẳng đứng hầu hết thời gian, nhưng nó tạo ra những gì Brooks mô tả là sự không tương thích cơ bản với sự gần gũi của con người.
Các định luật tỷ lệ của vật lý làm cho humanoid cỡ lớn nguy hiểm hơn theo cấp số nhân so với các đối tác nhỏ hơn của chúng. Khi bạn tăng gấp đôi kích thước của robot, Brooks nói, khối lượng của nó tăng lên gấp tám lần. Điều đó có nghĩa là một humanoid cỡ lớn ngã có năng lượng động học gấp tám lần so với phiên bản nửa kích thước. Nếu chiếc chân kim loại tăng tốc nhanh đó gặp bất cứ thứ gì trên đường đi trong khi ngã, tác động có thể gây thương tích nghiêm trọng.
Trong bài đăng của mình, Brooks kể lại việc "quá gần" với robot humanoid Digit của Agility Robotics khi nó ngã vài năm trước. Ông đã không dám tiếp cận một con khi đi bộ kể từ đó. Ngay cả trong các video quảng cáo từ các công ty humanoid, Brooks lưu ý, con người không bao giờ được hiển thị gần robot humanoid đang di chuyển trừ khi được ngăn cách bởi đồ nội thất, và ngay cả khi đó, robot chỉ di chuyển tối thiểu.
Vấn đề an toàn này mở rộng ra ngoài những cú ngã tình cờ. Để humanoid hoàn thành vai trò được hứa hẹn trong chăm sóc sức khỏe và cài đặt nhà máy, chúng cần chứng nhận để hoạt động trong các khu vực được chia sẻ với con người. Các cơ chế đi bộ hiện tại làm cho việc chứng nhận như vậy hầu như không thể dưới các tiêu chuẩn an toàn hiện có ở hầu hết các nơi trên thế giới.

Brooks dự đoán rằng trong vòng 15 năm, thực sự sẽ có nhiều robot được gọi là "humanoid" thực hiện các nhiệm vụ khác nhau. Nhưng trớ trêu thay, chúng sẽ không giống gì với các máy hai chân ngày nay. Chúng sẽ có bánh xe thay vì chân, số lượng cánh tay khác nhau và các cảm biến chuyên dụng không giống gì với mắt người. Một số sẽ có camera trong tay hoặc nhìn xuống từ phần giữa cơ thể. Định nghĩa về "humanoid" sẽ thay đổi, giống như "ô tô bay" bây giờ có nghĩa là trực thăng điện thay vì máy bay có khả năng đi đường, và "ô tô tự lái" có nghĩa là xe có người giám sát từ xa thay vì hệ thống thực sự tự động.
Hàng tỷ đô la hiện đang được đầu tư vào việc buộc các humanoid cứng nhắc, chỉ dựa trên thị giác ngày nay học khéo léo sẽ phần lớn biến mất, Brooks lập luận. Các nhà nghiên cứu học thuật đang đạt được nhiều tiến bộ hơn với các hệ thống kết hợp phản hồi xúc giác, như phương pháp của MIT sử dụng găng tay truyền cảm giác giữa người vận hành và tay robot. Nhưng ngay cả những tiến bộ này vẫn còn xa so với cảm nhận xúc giác toàn diện cho phép sự khéo léo của con người.
Ngày nay, ít người dành ngày của họ gần robot humanoid, nhưng quy tắc ba mét của Brooks đứng như một cảnh báo thực tế về những thách thức phía trước từ ai đó đã dành hàng thập kỷ xây dựng những máy này. Khoảng cách giữa video quảng cáo và thực tế có thể triển khai vẫn còn lớn, được đo không chỉ bằng năm mà bằng những vấn đề cơ bản chưa được giải quyết về vật lý, cảm nhận và an toàn.







