Các thiết bị Android đã cung cấp tính năng đọc màn hình tích hợp có tên TalkBack trong nhiều năm. Nó giúp những người có vấn đề về thị lực hiểu được những gì xuất hiện trên màn hình điện thoại của họ và cho phép họ điều khiển bằng giọng nói. Năm 2024, Google đã thêm AI Gemini vào để cung cấp cho người dùng mô tả chi tiết hơn về hình ảnh.
Google hiện đang tăng cường nó với một lớp tiện ích tương tác hoàn toàn mới cho người dùng. Cho đến nay, Gemini chỉ mô tả hình ảnh. Bây giờ, khi người dùng xem hình ảnh, họ thậm chí có thể hỏi các câu hỏi tiếp theo về chúng và có cuộc trò chuyện chi tiết hơn.
Nó giúp người dùng gặp khó khăn về thị lực như thế nào?
"Lần tới khi một người bạn nhắn tin cho bạn hình ảnh cây guitar mới của họ, bạn có thể nhận được mô tả và hỏi các câu hỏi tiếp theo về thương hiệu và màu sắc, hoặc thậm chí những gì khác có trong hình ảnh," Google nói. Điều này xây dựng dựa trên nâng cấp khả năng tiếp cận đã tích hợp Gemini trong hệ thống Talkback cuối năm ngoái.
Menu Talkback trên Android hiện hiển thị tính năng Describe Screen chuyên dụng đặt Gemini vào ghế lái. Vì vậy, ví dụ, nếu người dùng đang duyệt danh mục quần áo, Gemini không chỉ mô tả những gì xuất hiện trên màn hình, mà còn trả lời các câu hỏi có liên quan.
Ví dụ, người dùng có thể hỏi các câu hỏi như "Chiếc váy nào sẽ tốt nhất cho một buổi tối ra ngoài trong mùa đông lạnh giá?" hoặc "Loại sốt nào sẽ phù hợp nhất với sandwich?" Gemini cũng sẽ có thể phân tích toàn bộ màn hình và thông báo cho người dùng về chi tiết sản phẩm chi tiết, hoặc nếu có bất kỳ giảm giá nào.
Làm cho phụ đề biểu cảm và cải thiện thu phóng văn bản
Trong trình duyệt Chrome, Google đang nâng cấp nhẹ các phụ đề tự động tạo cho video. Giả sử bạn đang xem một trận bóng đá. Phụ đề sẽ không chỉ theo dõi lời của bình luận viên, mà còn phù hợp với cảm xúc và biểu cảm của họ.
Ví dụ, thay vì "goal," người dùng có vấn đề về thính giác sẽ thấy một "goooaaal" vang dội để thêm chút nhấn mạnh cảm xúc. Google gọi chúng là Expressive Captions.
Ngoài lời nói của con người, giờ chúng cũng sẽ bao gồm các âm thanh quan trọng như tiếng còi, tiếng cổ vũ, hoặc thậm chí người nói chỉ đang khá họng. Expressive captions sẽ có sẵn trên tất cả thiết bị chạy Android 15 hoặc phiên bản mới hơn, tại Mỹ, Anh, Canada và Australia.
Một thay đổi có ý nghĩa khác sắp đến với trình duyệt Chrome là thu phóng văn bản thích ứng, về cơ bản là một bản cập nhật cho hệ thống Page Zoom có sẵn trên điện thoại Android. Bây giờ, khi người dùng tăng kích thước văn bản, nó sẽ không ảnh hưởng đến bố cục của phần còn lại của trang web.
Bên cạnh đó, "Bạn có thể tùy chỉnh mức độ bạn muốn thu phóng và dễ dàng áp dụng tùy chọn cho tất cả các trang bạn truy cập hoặc chỉ những trang cụ thể," Google nói. Người dùng sẽ có thể thực hiện điều chỉnh phạm vi thu phóng bằng thanh trượt ở dưới cùng trang.
Kết luận:
Google Gemini đã mang đến những cải tiến đáng kể trong việc hỗ trợ người khuyết tật truy cập công nghệ. Với khả năng tương tác nâng cao trong TalkBack, tính năng Expressive Captions thể hiện cảm xúc và Adaptive Text Zoom thông minh, Google đang chứng minh cam kết tạo ra môi trường kỹ thuật số bao trùm hơn. Những tính năng này không chỉ cải thiện trải nghiệm cho người khiếm thị và khiếm thính mà còn thể hiện tiềm năng to lớn của AI trong việc phá bỏ rào cản số.