Gemini 3 có kỹ năng lập luận, tạo video và viết code. Giữa những cuộc thảo luận về bong bóng AI, Google lưu ý mô hình mới có thể giúp tăng doanh thu tìm kiếm.
Google đã giới thiệu Gemini 3, mô hình trí tuệ nhân tạo thông minh nhất từ trước đến nay, với khả năng lập luận, đa phương tiện và lập trình tiên tiến. Khi những cuộc thảo luận về bong bóng AI ngày càng tăng, công ty muốn nhấn mạnh rằng sản phẩm mới nhất của họ không chỉ là một mô hình thông minh và chatbot - mà còn là cách cải thiện các sản phẩm hiện có của Google, bao gồm cả hoạt động kinh doanh tìm kiếm sinh lời, bắt đầu từ hôm nay.
"Chúng tôi là phòng máy của Google, và giờ đây chúng tôi đang tích hợp AI vào mọi nơi," Demis Hassabis, CEO của Google DeepMind, một công ty con tập trung vào AI của Alphabet - công ty mẹ của Google, nói với WIRED trong một cuộc phỏng vấn trước thông báo.
Hassabis thừa nhận rằng thị trường AI có vẻ bị thổi phồng, với một số startup chưa được chứng minh nhận được định giá hàng tỷ đô la.
Google và các công ty AI khác cũng đang đầu tư hàng tỷ đô la để xây dựng các trung tâm dữ liệu mới để huấn luyện và vận hành các mô hình AI, làm dấy lên lo ngại về một cuộc sụp đổ tiềm tàng.
Nhưng ngay cả khi bong bóng AI vỡ, Hassabis nghĩ Google vẫn được bảo vệ. Công ty đã sử dụng AI để nâng cao các sản phẩm như Google Maps, Gmail và Search. "Trong kịch bản xấu, chúng tôi sẽ dựa vào điều đó nhiều hơn," Hassabis nói. "Trong kịch bản tốt, tôi nghĩ chúng tôi có danh mục đầu tư rộng nhất và nghiên cứu tiên phong nhất."
Google cũng đang sử dụng AI để xây dựng các công cụ mới phổ biến như NotebookLM, có thể tự động tạo podcast từ tài liệu viết, và AI Studio có thể tạo nguyên mẫu ứng dụng với AI. Công ty thậm chí còn khám phá việc nhúng công nghệ vào các lĩnh vực như game và robot, mà Hassabis nói có thể mang lại lợi nhuận khổng lồ trong những năm tới, bất kể điều gì xảy ra trên thị trường rộng lớn hơn.
Google đang cung cấp Gemini 3 từ hôm nay thông qua ứng dụng Gemini và trong AI Overviews, một tính năng của Google Search tổng hợp thông tin cùng với kết quả tìm kiếm thông thường. Trong các buổi demo, công ty cho thấy một số truy vấn Google, như yêu cầu thông tin về bài toán ba vật thể trong vật lý, sẽ khiến Gemini 3 tự động tạo ra một hình ảnh tương tác tùy chỉnh ngay lập tức.
Robby Stein, phó chủ tịch sản phẩm của Google Search, cho biết tại một cuộc họp báo trước khi ra mắt rằng công ty đã thấy sự gia tăng "hai chữ số" trong các truy vấn được diễn đạt bằng ngôn ngữ tự nhiên, có khả năng nhắm vào AI Overviews, so với cùng kỳ năm trước. Công ty cũng thấy sự tăng vọt 70% trong tìm kiếm hình ảnh, dựa vào khả năng phân tích ảnh của Gemini.
Mặc dù đầu tư mạnh vào AI và đạt được những đột phá quan trọng, bao gồm việc phát minh ra mô hình transformer cung cấp năng lượng cho hầu hết các mô hình ngôn ngữ lớn, Google đã bị rung chuyển bởi sự trỗi dậy đột ngột của ChatGPT vào năm 2022. Chatbot này không chỉ đưa OpenAI lên vị trí trung tâm khi nói đến nghiên cứu AI; nó còn thách thức hoạt động kinh doanh cốt lõi của Google bằng cách cung cấp một cách mới và có khả năng dễ dàng hơn để tìm kiếm web.
Những lo ngại rằng AI có thể nhanh chóng thay thế tìm kiếm thông thường dường như đang phai nhạt khi Google đuổi kịp OpenAI. Công ty đang gần đạt được thỏa thuận với Apple để sử dụng Gemini cho trợ lý ảo Siri của nhà sản xuất iPhone, theo Bloomberg. Nano Banana, một công cụ AI có khả năng tạo và chỉnh sửa hình ảnh, được báo cáo là đã thành công với người dùng. Quan trọng nhất, AI tạo sinh dường như chưa ăn vào hoạt động kinh doanh tìm kiếm sinh lời của Google. Alphabet cho biết trong báo cáo thu nhập quý vào tháng 7 rằng AI Overviews đã thúc đẩy sự gia tăng 10% trong các truy vấn tìm kiếm.
Trong khi đó, mô hình tiên phong mới nhất của OpenAI, GPT-5, hơi thất vọng khi ra mắt vào tháng 8. Một số chuyên gia gọi nó là không ấn tượng, và người dùng phжалуются về việc chuyển sang một tính cách trang trọng hơn.
Google cho biết Gemini 3 vượt trội hơn GPT-5 và các mô hình khác trên một số bảng xếp hạng quan trọng, bao gồm LMArena, một trang web phổ biến cho phép người dùng chấm điểm các mô hình. Công ty nói mô hình này tốt hơn trong việc thực hiện lập luận mô phỏng liên quan đến việc chia nhỏ vấn đề thành các phần và lập kế hoạch trong thời gian dài hơn, có thể cải thiện chức năng của các agent sử dụng công cụ và web.
"Đây là mô hình thông minh nhất của chúng tôi," Koray Kavukcuoglu, CTO của Google DeepMind, nói trong cuộc họp báo trước khi ra mắt.
"Đây là mô hình tốt nhất thế giới cho hiểu biết đa phương tiện."
Kavukcuoglu thêm rằng cơ sở người dùng khổng lồ của Google đang giúp công ty cải thiện các mô hình của mình. Ứng dụng Gemini có 650 triệu người dùng hàng tháng, có 13 triệu nhà phát triển làm việc với các mô hình của Google, và 2 tỷ người sử dụng AI Overviews mỗi tháng. Khi người dùng tương tác với chatbot hoặc ứng dụng AI, phản hồi của họ có thể được sử dụng làm dữ liệu huấn luyện - ví dụ, cho thấy khi nào một mô hình cần cải thiện chuyên môn trong một lĩnh vực cụ thể. Kavukcuoglu thêm rằng khả năng thiết kế silicon và vận hành trung tâm dữ liệu của Google cũng mang lại cho họ lợi thế. "Chúng tôi có cách tiếp cận full-stack rất khác biệt," ông nói.
Google cho biết Gemini 3 sẽ được triển khai cho các thuê bao Google AI Plus và Google AI Pro, những người trả 19,99 đô la và 249,99 đô la mỗi tháng, tương ứng, trong những tuần tới. Công ty cũng đang ra mắt một công cụ lập trình AI mới có tên Antigravity được cung cấp năng lượng bởi Gemini 3.
Bong bóng hay không, Hassabis nói rằng Gemini 3 sẽ là một nền tảng để xây dựng AI có khả năng hơn trong tương lai. "Tôi vẫn nghĩ chúng ta còn cách 5 đến 10 năm nữa mới có thể có được những gì tôi gọi là AGI đầy đủ thực sự," ông nói. "Và điều đó có thể yêu cầu một hoặc hai đột phá trên các mô hình đang ngày càng tốt hơn."







