Microsoft vừa giới thiệu MAI-Image-1, bộ tạo ảnh từ văn bản đầu tiên được phát triển nội bộ. Bằng việc xây dựng mô hình trong nhà, Microsoft đang đặt cược mới, cạnh tranh không chỉ với những ông lớn trong ngành như Google's Nano Banana và Midjourney, mà còn với đối tác rất thân thiết của mình - dòng mô hình AI tạo ảnh của OpenAI.
MAI-Image-1 đã lọt vào top 10 trên bảng xếp hạng LMArena, một nền tảng đánh giá công khai và hiện tại là nơi duy nhất có thể truy cập mô hình này. Tuy nhiên, điều đó sẽ sớm thay đổi khi Microsoft cho biết mô hình sẽ được tích hợp vào Copilot và Bing Image Creator.
Microsoft đặc biệt tự hào về chất lượng sản xuất siêu thực của MAI-Image-1 cũng như khả năng kiểm soát ánh sáng và kết cấu. Ý tưởng của công ty là cung cấp những hình ảnh AI không giống với những hình ảnh được tạo bởi các mô hình khác, tách biệt khỏi thẩm mỹ phổ biến mà bất kỳ ai đã xem nhiều hình ảnh AI đều quen thuộc, đặc biệt là dạng "slop" (nội dung kém chất lượng) tràn lan trên mạng xã hội. Chìa khóa là tuyển chọn dữ liệu huấn luyện và làm việc với các chuyên gia sáng tạo để tinh chỉnh mô hình, thử nghiệm so với cách người dùng bình thường sử dụng. Microsoft hy vọng MAI sẽ khiến các mô hình Midjourney hoặc Stable Diffusion trở nên bất ổn và chậm chạp hơn khi so sánh.
Hình Ảnh AI Riêng Của Microsoft
Microsoft đã đầu tư mạnh mẽ vào việc nhúng AI vào mọi thứ họ tạo ra, nhưng điều đó chủ yếu có nghĩa là các công cụ OpenAI.
Tuy nhiên, điều đó đang thay đổi từ bây giờ. MAI-Image-1 giờ đây gia nhập cùng các mô hình ngôn ngữ và giọng nói tự phát triển MAI-1 và MAI-Voice-1. MAI-Image-1 là mảnh ghép tiếp theo.
Tất nhiên, người dùng bình thường sẽ không nhận ra điều đó. Họ sẽ chỉ thích hoặc khó chịu với bất kỳ hình ảnh nào mà AI của Microsoft PowerPoint tạo ra khi họ đang xây dựng bài thuyết trình. Công ty cho biết việc tập trung vào tính thực tế và hữu ích có nghĩa là mọi người sẽ khá hài lòng. Sẽ có ít những khối mơ hồ như trong mơ hơn và nhiều hình ảnh thực sự hoạt động trong tài liệu, quảng cáo và bài thuyết trình. Bởi vì câu hỏi không phải là "ai có mô hình hình ảnh?" Mà là "ai có mô hình hữu ích mà mọi người thực sự sẽ sử dụng trong các công cụ thực tế?" Đó là nơi Microsoft đang đặt cược rằng MAI-Image-1 sẽ tỏa sáng.

Đối với các chuyên gia sáng tạo, điều này có thể có nghĩa là con đường nhanh hơn từ lời nhắc đến khái niệm hoàn thiện. Đối với người dùng hàng ngày, nó có nghĩa là ít khoảng cách bực bội hơn giữa ý tưởng và thực hiện. Và đối với Microsoft, nếu người dùng yêu thích mô hình này, nó sẽ làm cho toàn bộ hệ sinh thái AI Copilot trở nên hấp dẫn hơn. Nếu nó thất bại, có thể họ cần quay trở lại OpenAI để được giúp đỡ.
Tuy nhiên, hiện tại, có vẻ như kỷ nguyên phụ thuộc vào OpenAI của Microsoft đã kết thúc. Tương lai của các công cụ AI sẽ là về việc ai xây dựng chúng và chúng xuất hiện ở đâu cũng như những gì chúng thực sự có thể làm và những vấn đề chúng giải quyết. Với MAI-Image-1, Microsoft đang nói rằng họ muốn tự mình trả lời tất cả những câu hỏi đó.








