Meta đã thực hiện một số bước đi khá lớn trong AI tuần này, và một số trong đó cực kỳ đắt đỏ. Theo Bloomberg, Meta đã chi một khoản tiền khổng lồ 200 triệu đô la để cố gắng mời chào chỉ một người từ Apple (Ruoming Pang, cựu trưởng nhóm phụ trách phát triển các mô hình ngôn ngữ lớn đằng sau Apple Intelligence), và đó chỉ là một người mà họ đã thu hút trong cơn sốt tuyển dụng nhân tài AI—có một số người khác từ OpenAI cũng đã nhảy tàu chỉ trong tuần này.
Điều này có thể được mong đợi theo một cách nào đó. AI đang là xu hướng hiện nay, và có vẻ như mọi công ty có đủ tiềm lực tài chính đều đang đổ tiền thừa vào việc trở thành điều lớn tiếp theo trong chatbot hoặc AI slop. Nhưng đối với Meta nói riêng, những động thái đó có thể tương đương với nhiều hơn chỉ là chi tiêu bình thường để đưa AI vào đúng hướng. Nó thực sự có thể là một lợi thế lớn cho một trong những danh mục thiết bị thú vị nhất—tôi đang nói về kính thông minh.
AI rõ ràng đang được áp dụng cho rất nhiều thứ hiện nay—phim ảnh, trò chơi, tìm kiếm web—và nó không phải lúc nào cũng lý tưởng cho tất cả các nhiệm vụ mà nó đang được áp dụng, nhưng có một điều tôi biết nó có thể (và đã bắt đầu) thực sự có tác động lớn, đó là kính thông minh. Mặc dù kính thông minh như Ray-Ban của Meta đã thú vị trong giai đoạn đầu, chúng cũng cảm thấy cực kỳ hạn chế và, trong trường hợp xấu nhất, thực sự gây khó chịu. Rất nhiều những nhược điểm đó liên quan đến giao diện người dùng. Không giống như một thiết bị có màn hình, kính thông minh chỉ có một lựa chọn thực sự cho đầu vào gốc, và đó là trợ lý giọng nói. Vấn đề với điều đó là rất nhiều trợ lý giọng nói tệ hại. Chúng ổn cho các nhiệm vụ cơ bản, nhưng hãy hỏi bất cứ điều gì vượt quá "phát nhạc", và mọi thứ có xu hướng trở nên lộn xộn thực sự nhanh.
Tuy nhiên, những tiến bộ trong các mô hình ngôn ngữ lớn như mô hình cung cấp năng lượng cho ChatGPT có thể thay đổi tất cả điều đó. Các mô hình ngôn ngữ lớn vốn dĩ giỏi về các lệnh ngôn ngữ tự nhiên, điều này làm cho chúng thành thạo hơn trong các lệnh nâng cao và nhiều bước. Nếu có một cách để làm cho một cặp kính thông minh cảm thấy tiên tiến hơn ngay bây giờ, cải thiện trợ lý giọng nói sẽ là điều đó. Không chỉ vậy, mà nó cũng cảm thấy như một trong những cách duy nhất để làm điều đó tại thời điểm hiện tại. Mặc dù giao diện phức tạp như Vision Pro của Apple thật tuyệt vời—nó sử dụng một hỗn hợp khá tuyệt vời của theo dõi mắt và tay—thu nhỏ tất cả phần cứng cần thiết để làm cho giao diện đó hoạt động xuống thành một hình dạng có thể được coi là bất cứ thứ gì thậm chí từ xa "kính" vẫn là một khả năng xa vời.
Để chứng minh vấn đề đó, hãy nhìn không đâu xa hơn khái niệm Orion của Meta, vẫn yêu cầu một compute puck khá lớn để giảm bớt phần kính khỏi việc phải chịu trọng lượng (trọng lượng theo nghĩa đen trong trường hợp này) của việc là một máy tính. Hiện tại, vấn đề thu nhỏ kính thông minh trong khi cũng nâng cao khả năng của chúng vẫn chưa được giải quyết, và kết quả là, các công ty phần cứng sẽ phải sáng tạo với cách họ tiếp cận câu đố đó. Trong trường hợp này, cách tiếp cận đó có thể là tất cả về AI, và Meta, với hàng triệu đô la đã chi tuần này, có thể chỉ có một lợi thế.