AI tạo video, AI nói chuyện với người, nhìn và hiểu thế giới thật, phát hiện lừa đảo

8334885 Google IO24 Tinhte 05
Đáp lại yêu cầu của các nhà phát triển, Google đã nâng cấp model Gemma phiên bản mới với 27 tỷ tham số so với hiện tại. Model mới sẽ được chính thức phát hành vào tháng 6 sắp tới. Google cho biết model sẽ được tối ưu hóa bởi NVIDIA để chạy trên các GPU thế hệ mới của công ty, đồng thời có thể chạy hiệu quả trên host 1 TPU và vertex AI.


Google IO24 Tinhte -07.jpg


Tích hợp sâu AI trong lõi Android mới


Google cho biết từ giờ, các thế hệ Android mới sẽ được tích hợp sẵn AI từ tầng lõi của OS, cho phép các tính năng sử dụng trí thông minh nhân tạo, đặc biệt là on device được hoạt động hiệu quả và mạnh mẽ hơn. Một thí dụ được họ đưa ra là với AI, chúng ta sẽ có thể tìm kiếm những hình ảnh nằm trong Google Photos theo một cách hoàn toàn mới.


8334735-Screenshot-2024-05-15-000707.webp


Thay vì search và sử dụng việc nhận diện vật thể trong hình ảnh để trả về kết quả như trước đây, bây giờ chúng ta có thể dùng ngôn ngữ tự nhiên để hỏi thông tin trong hình, thí dụ như search bản số xe của tôi,… Tương tự, chỉ cần người dùng gõ “quá trình tập bơi của con tôi”, Google Photos sẽ trả về toàn bộ các hình ảnh trong quá trình tập bơi mà người dùng đã từng chụp lại, sắp xếp theo thứ tự luôn.


Google IO24 Tinhte -03.jpg


Một tính năng khác là cảnh báo ngay khi người dùng đang nghe một cuộc gọi lừa đảo. Không chặn hẳn số, nhưng trong cuộc điện thoại mà kẻ xấu gọi với mục đích lừa đảo, Android sẽ nhận diện và hiện cảnh báo ngay trong cuộc gọi để người dùng nhận biết, thí dụ như “Ngân hàng không bao giờ yêu cầu bạn chuyển tiền để giữ nó an toàn,….”. Tính năng này hoạt động đựa trên Gemini Nano – model gen AI nhỏ nhất của AI, chạy hoàn toàn trên máy không cần mạng và có khả năng nhận diện dấu hiệu lừa đảo trong nội dung cuộc hội thoại theo thời gian thực.

Thêm một tính năng khác, Gemini sẽ dần thay thế Google Assistant, sớm hỗ trợ thêm các tính năng tương tác sâu hơn với từng nhu cầu của người dùng. Thí dụ như người dùng có thể kéo thả các hình ảnh tạo bằng AI vào Gmail, Message hoặc các app khác, đồng thời, Gemini sẽ có thể “đọc” ngữ cảnh mà người dùng đang xài trên màn hình thí dụ như đang coi video, người dùng chỉ cần đặt câu hỏi tự nhiên, hệ thống sẽ tự biết người dùng đang muốn hỏi nội dung trong video, AI lúc này sẽ tự mò vào đó và lấy thông tin ra,…

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Contact Me on Zalo
Tư Vấn Miễn Phí