谷歌:Android 手机,听我的,AI 要这么做

190次阅读
没有评论

共计 1981 个字符,预计需要花费 5 分钟才能阅读完成。

除了这些集成体验外,谷歌还正式上线了 Gemini Live,这一功能可以说是谷歌对 OpenAI 推出的 GPT-4o 高级语音模式的回应。该功能此前在谷歌 2024 年的 I/O 开发者大会上曝光过,今天开始正式推出。

用户可以用手机与谷歌的生成式 AI 聊天机器人 Gemini 进行语音对话,可以中途打断,提出跟进的问题,对话可以随时暂停和恢复。一些具体用途例子包括,让 Gemini Live 陪你准备工作面试、练习演讲,随便聊聊关心的话题等。

谷歌:Android 手机,听我的,AI 要这么做

Gemini Live明显要对标 GPT-4o 的语音交互|图片来源:谷歌

那么,Gemini Live 相较于 ChatGPT 的语音模式有优势吗?

据称,支持 Live 的生成式 AI 模型架构——Gemini 1.5 Pro 和 Gemini 1.5 Flash,拥有比平均水平更长的「上下文窗口」,这意味着它们可以在生成响应之前处理和推理大量数据,理论上可以进行长达数小时的对话。

Gemini Live 还可免提使用,用户可以在应用后台或手机锁定时继续进行语音对话,有 10 种新声音可以选择。

但值得注意的是,Gemini Live 目前还未上线「多模态输入」功能,据称将于「今年晚些时候」推出。

几个月前,谷歌曾经发布了预录视频,展示了 Gemini Live 如何通过手机摄像头捕捉的照片和视频识别用户周围环境,并做出响应,比如指出损坏自行车的某个部件,或解释计算机屏幕上一段代码的功能,这些都未得到现场的真实演示。

而且,Gemini Live 在 Android 手机上的 Gemini Advanced 订阅用户中推出,并不是免费的。目前它仅提供英文版本,谷歌称「未来几周」将扩展到更多语言,还要通过应用程序扩展到 iOS。

谷歌:Android 手机,听我的,AI 要这么做

谷歌高管直播演示 Gemini Live|图片来源:谷歌

谷歌 Gemini 体验与谷歌助手方面的高管称「谷歌正处于探索 AI 驱动助手各种有用方式的早期阶段——就像 Pixel 手机一样,Gemini 将会越来越好。」

另外,在隐私问题方面,谷歌 Android 生态系统方面的高管称,Gemini 支持来自几十个设备制造商的数百款手机型号,在处理用户数据时,数据不会离开手机。

「Gemini 可以基于你私人教练的邮件帮助创建每日锻炼计划,或利用你 Google Drive 中的简历撰写工作简介。只有 Gemini 能够通过这种安全的、一体化的方法做到这一切,而不需要将数据交给你可能不认识或信任的第三方 AI 提供商。」谷歌 Android 生态系统总裁 Sameer Samat 称。

「由于 Android 是首个拥有大型设备内多模态 AI 模型的移动操作系统——名为 Gemini Nano——在处理一些最敏感的用例时,你的数据不会离开你的手机。」

AI进一步融合进Android

谷歌推广 AI 手机的最大优势无疑是自家的多种应用工具,以及 Android 生态,谷歌现在有数十亿 Android 用户,能发挥的空间,显然比一个聊天机器人应用程序更多。

去年,作为首款以 AI 为核心的智能手机,谷歌的 Pixel 8 系列带来了各种 AI 功能。例如,用户可以移除、移动或编辑照片中的单个元素,可以在照片之间移动表情以获得最佳的合成照片,可以基于截图或屏幕上的某个「圈选部分」进行搜索等。

所有这些功能都首次出现在 Pixel 8 系列上,随后在整个 Android 生态系统中得到一定推广。

像谷歌的「圈选搜索」功能,实际上首次出现在三星的 Galaxy AI 手机上,作为谷歌的 Android 生态合作伙伴,三星的手机还添加了许多类似的 AI 功能。前述 AI 助手 Gemini 也出现在三星的 Galaxy Z Fold6、摩托罗拉 Razr+等手机里。

与此同时,其他制造商也宣布要推出自己的手机 AI,过去几个月最受关注的莫过于苹果,相同的一个方向和理念是融合自家的应用程序生态。

在这差不多一年时间里,「AI 手机」可以说已经成了市场看待手机的核心视角,不仅仅是谷歌手机。如何再用 AI 让人眼前一亮,对谷歌来说是个挑战。目前来看,与推出第一代 AI 手机 Pixel 8 时类似,谷歌输出最多的还是各种 AI 功能小工具。

在今年的 Made By Google 活动上,谷歌重点推出的 AI 新功能包括:

「Add Me」,即使是拍照的人也能把自己拍进合照里;

「Pixel Studio」,一款 AI 图像生成器,与苹果即将推出的 Image Playground 应用非常相似;

「Pixel Screenshots」,它可以扫描用户图库中的截图,将它们转变为一个易于搜索的数据库;

「Call Notes」,可以保存通话记录中的信息摘要,激活该功能后通话中的每个人都会收到通知。

其中,如果想实现「Add Me」的功能,摄影师首先拍摄一张没有自己的照片,然后由另一个人当摄影师,再拍一张照片。Pixel 会将两张照片合并,确保每个人都在一张照片里,无需找陌生人帮忙拍照。

谷歌:Android 手机,听我的,AI 要这么做

文章来源:https://www.geekpark.net/news/339238

正文完
 
yangyang
版权声明:本站原创文章,由 yangyang 2024-08-14发表,共计1981字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)