一夜之间,谷歌版GPT-4o和AI手机全上市了

2024-08-15 10:48:00
admin
原创
142
Gemini Live 对标 GPT-4o,谷歌 AI 手机全家桶上线。


在 GPT-4o 进 iPhone 之前,谷歌 Gemini 抢先了一步完成了手机版的落地。


周三凌晨,在人们期待 OpenAI 「草莓大模型」的时候,谷歌在 Made by Google 活动上正式发布了 Gemini Live,以及一系列 Pixel 硬件产品。


图片


今天的活动,谷歌充满信心地进行了 100% 现场演示,虽然出现了一些小问题。


两次让手机识图(不过用的是三星),都失败了。


不过正如谷歌所说的,我们已经进入了「Gemini 的时代」。


在 Pixel 9 系列之后,今天发布的一系列 Gemini AI 功能也将随安卓 15 出现在各种 Android 手机上。


Gemini Live:对标 GPT-4o,即刻上线


Gemini Live 是谷歌针对 OpenAI 高级语音模式推出的一款产品,该功能与 ChatGPT 几乎完全相同,之前一直处于 alpha 测试阶段。


图片


Gemini Live 提供了一种移动对话体验,可以让用户和 Gemini 展开自由流畅的对话,甚至可以像在普通电话中一样打断或改变话题,而无需打字。


谷歌在博客中这样描述:你可以与 Gemini Live (通过 Gemini app)交谈,并从 10 种新的自然声音中选择一种来回应,(而 OpenAI 仅提供 3 种声音)。你甚至可以按照自己的节奏说话,或者在回答过程中打断它并提出其他问题,就像在平时对话中一样。


,时长 01:24


Gemini Live 是可以直接唤醒的,你可以在应用程序在后台运行或手机锁屏时继续与 Gemini 对话,且对话可以随时暂停和恢复。


Gemini Live 还将与多种安卓应用的功能(如 Keep)集成,从而提高 Gemini 的可用性。


图片


今日起,谷歌开始在 Android 手机的 Gemini Advanced 用户推出该功能,仅限英语,并将在未来几周内扩展到 iOS 和更多语言版本。


图片


不过,在现场演示中,当现场人员问到演唱会海报的相关信息时,Gemini Live 失败了两次,需要演示者更换手机才能正常工作。虽然演示过程中遇到了一些问题,但最终成功了,Gemini Live 最终从图片中提取相关信息并连接日历,为用户提供了准确结果。


,时长 01:43


值得注意的是,据产品经理 Leland Rechis 介绍,谷歌不允许 Gemini Live 模仿这 10 种声音以外的任何声音。谷歌这样做可能是为了避免与版权法发生冲突。此前,OpenAI 就因为使用了 寡姐的声音而被后者告到法庭。


总体而言,该功能似乎是一种比使用简单的 Google 搜索更自然地深入研究主题的好方法。谷歌指出,Gemini Live 是 Project Astra 迈出的一步,Project Astra 是该公司在 Google I/O 期间首次亮相的多模态 AI 模型。目前,Gemini Live 仅支持语音对话,谷歌希望在未来增加实时视频理解功能。


发表评论
评论通过审核后显示。
文章分类
联系我们
联系人: 羊毛君
Email: soft850207@gmail.com