在人工智慧(AI)领域的激烈竞逐中,Google 持续展现其领先地位。近日,Google 宣布 Gemini 推出两项由「Project Astra」支援的全新功能:萤幕阅读和即时影像解读,为使用者带来更智慧、更直觉的互动体验。这两项功能不仅提升了 Gemini 的实用性,更预示着 AI 助理正朝向更个人化、更具情境感知能力的时代迈进。

Gemini 新功能:资讯无障碍与生活智慧的双重提升

Gemini 的萤幕阅读功能,让 AI 助理能够读取萤幕上的内容,并提供相关资讯或协助。这项功能对于视障人士或需要更便利资讯获取方式的使用者来说,无疑是一大福音。想像一下,当你在浏览外文网页时,Gemini 可以即时翻译萤幕上的文字,省去複制贴上的麻烦;当你在使用複杂的应用程式时,Gemini 可以提供操作指引,让你轻鬆上手。这项功能不仅提升了资讯的可及性,更让 AI 助理成为真正的个人化辅助工具。

另一项令人期待的功能是即时影像解读。这项功能让 Gemini live能够分析智慧型手机相机所拍摄的画面,并回答使用者的相关问题。Google 在示範影片中展示了这项功能的应用场景:使用者可以透过 Gemini 寻求建议,例如为新上釉的陶器选择合适的颜料。这项功能不仅能提供即时的资讯,还能作为生活中的 AI 顾问,协助使用者解决各种问题。无论是辨识植物种类、翻译路标文字,或是提供购物建议,Gemini 都能成为你生活中的得力助手。

目前仅有国外少部分用户表示已经在它们手机的App中可以看到这个功能,因此可能这功能正陆续推动开放中。

AI 助理时代的竞争与变革

随着 AI 技术的快速发展,AI 助理已成为科技巨头们争夺的焦点。除了 Google 的 Gemini 之外,Amazon 正在準备推出 Alexa Plus 升级版的有限早期试用,而 Apple 则延后了其升级版 Siri 的发布。微软则是专注在推动他们自家的Copilot。这些产品的功能预计将与 Gemini 现在开始启用的功能类似。儘管三星仍然拥有 Bixby,但 Gemini 仍然是其手机上的预设助理。这场 AI 助理竞赛,将为使用者带来更多创新和便利。

然而,AI 助理的发展并不仅仅是功能的堆叠,更重要的是如何将 AI 融入使用者的生活,意味着 AI 能够理解使用者的意图,主动提供协助,并与使用者协同完成任务。

为了实现 Copilot 的愿景,科技巨头们正在积极开发各种新技术。例如,Google 的 Project Astra 旨在打造一个能够理解使用者意图、并与使用者进行自然对话的多模态虚拟助理。Amazon 也在积极开发能够理解人类情感的 AI 助理,让 AI 助理能够更好地与使用者互动。Apple 则在努力提升 Siri 的自然语言处理能力,让 Siri 能够更準确地理解使用者的指令。

然而,AI 助理的发展也面临着一些挑战。例如,如何保护使用者的隐私、如何避免 AI 助理产生偏见、如何确保 AI 助理的安全可靠等等。这些问题需要科技巨头们共同努力解决,才能让 AI 助理真正成为人类的 Copilot,为人类带来福祉。