Google I/O 2024:一切公布

Google I/O 刚刚结束,它挤满了 AI 公告。正如预期的那样,该活动主要集中在谷歌的Gemini AI模型上,以及它们被集成到Workspace和Chrome等应用程序中的方式。

如果您没有现场收看该活动,您可以在下面的综述中了解 Google 的所有最新消息。

Google 智能镜头现在允许您通过录制视频进行搜索

Google Lens 已经允许您根据图像搜索内容,但现在 Google 更进一步,能够使用视频进行搜索。这意味着你可以拍摄你想搜索的东西的视频,在视频中提出一个问题,谷歌的人工智能将尝试从网络上提取相关的答案。

Gemini 将回答有关您的照片库的问题

Google I/O 2024 主题演讲图片。
图片:谷歌

谷歌将在今年夏天推出一项新功能,对于任何有数年甚至十多年照片需要筛选的人来说,这可能是一个福音。“询问照片”让 Gemini 可以仔细查看您的 Google 相册库以回答您的问题,该功能不仅仅是调出狗和猫的照片。首席执行官桑达尔·皮查伊(Sundar Pichai)通过询问双子座的车牌号来证明这一点。回答是数字本身,然后是它的照片,这样他就可以确保它是正确的。

谷歌的旗舰双子座机型变得更快、更强大

Gemini 1.5 Flash 图形的屏幕截图。
截图:YouTube

谷歌在其阵容中引入了一种新的 AI 模型:Gemini 1.5 Flash。新的多模态模型与Gemini 1.5 Pro一样强大,但它针对“狭窄,高频,低延迟的任务”进行了优化。这使得它能够更好地产生快速响应。谷歌还对 Gemini 1.5 进行了一些更改,据称这将提高其翻译、推理和编码的能力。此外,谷歌表示,它已经将 Gemini 1.5 Pro 的上下文窗口(它可以接收多少信息)从 100 万个代币增加到 200 万个代币。

Gemini 加入 Workspace 中的用户

显示 Gemini 总结会议录音的屏幕截图。
Gemini 总结了 Google Meet 录制的内容。 截图:YouTube

谷歌正在将其最新的主流语言模型 Gemini 1.5 Pro 整合到文档、表格、幻灯片、云端硬盘和 Gmail 的侧边栏中。当它在下个月向付费订阅者推出时,它将变成 Workspace 中的通用助手,无论您身在何处,都可以从云端硬盘中的任何和所有内容中获取信息。它还将能够为您做一些事情,例如编写包含您当前正在查看的文档中的信息的电子邮件,或者稍后提醒您回复您正在阅读的电子邮件。一些早期测试人员已经可以使用这些功能,但谷歌表示将在下个月向所有付费 Gemini 订阅者推出这些功能。

Project Astra 是谷歌的《星际迷航》人工智能未来

谷歌的Project Astra是一款多模态人工智能助手,该公司希望它能成为一个无所不能的虚拟助手,可以观察和理解它通过设备的摄像头看到的东西,记住你的东西在哪里,并为你做事。它为今年 I/O 中许多最令人印象深刻的演示提供了动力,该公司的目标是成为一个诚实至善的 AI 代理,不仅可以与您交谈,还可以代表您做事。

Veo 为创作者带来 Sora 风格的视频生成
一个简短的GIF,显示一个牛仔在日落时骑马。

Veo的输出示例。 图片:谷歌

谷歌对 OpenAI 的 Sora 的回应是一种新的生成式 AI 模型,可以根据文本、图像和基于视频的提示输出 1080p 视频。视频可以以多种风格制作,例如航拍或延时摄影,并且可以使用更多提示进行调整。该公司已经向一些创作者提供Veo,用于YouTube视频,但也在向好莱坞推销用于电影。

Gems 为 Gemini 带来自定义聊天机器人创建

谷歌正在推出一个名为 Gems 的自定义聊天机器人创建器。就像 OpenAI 的 GPT 一样,Gems 允许用户向 Gemini 发出指令,以自定义它的响应方式和专长。如果你想让它成为一个积极而坚持的跑步教练,每天有动力和跑步计划——也就是我最糟糕的噩梦——你很快就能做到(如果你是 Gemini Advanced 的订阅者)。

双子座成为更好的对话伙伴

blank

新的 Gemini Live 功能旨在让与 Gemini 的语音聊天感觉更自然。聊天机器人的声音将更新一些额外的个性,用户将能够在句子中途打断它,或者要求它通过智能手机摄像头观看,并实时提供有关它所看到的信息。Gemini 还获得了新的集成,允许它使用多模式功能(例如将传单中的详细信息添加到您的个人日历中)更新或从 Google Calendar、Tasks 和 Keep 中提取信息。

Circle to Search 现在可以帮助解决数学问题

blank
图片:谷歌

如果您使用的是 Android 手机或平板电脑,您现在可以在屏幕上圈出一个数学问题并获得解决它的帮助。谷歌的人工智能不会为你解决问题——所以它不会帮助学生在家庭作业上作弊——但它会把它分解成更容易完成的步骤。

谷歌搜索对人工智能进行了全面改革

显示周年纪念餐厅的 Google 搜索结果截图。
图片:谷歌

谷歌本周将向美国所有人推出“AI Overviews”——以前称为“搜索生成体验”,口口如瓶。现在,一个“专业”的双子座模型将用来自网络的汇总答案来设计和填充结果页面(类似于你在 Perplexity 或 Arc Search 等 AI 搜索工具中看到的)。

Android 获得 AI 驱动的诈骗检测

谷歌表示,使用设备上的Gemini Nano AI智能,Android手机将能够通过寻找危险信号(例如常见的诈骗者对话模式)来帮助您避免诈骗电话,然后弹出上述实时警告。该公司承诺在今年晚些时候提供有关该功能的更多细节。

Android 设备即将获得更智能的 AI

双子座新功能的屏幕截图。
图片:谷歌。

谷歌表示,Gemini 很快将能够让用户在屏幕上询问有关视频的问题,并且它将根据自动字幕回答。对于付费的 Gemini Advanced 用户,它还可以摄取 PDF 并提供信息。这些以及 Android 上 Gemini 的其他多模式更新将在未来几个月内推出。

谷歌浏览器正在获得一个人工智能助手

Screenshot showing Gemini offering to help in Chrome.
截图:YouTube

谷歌宣布将 Gemini Nano 添加到桌面版的 Chrome 中,这是其 Gemini 型号的轻量级版本。内置助手将使用设备上的 AI 帮助您直接在 Google Chrome 中为社交媒体帖子、产品评论等生成文本。

谷歌升级其 SynthID AI 水印

屏幕截图显示“SynthID”字样下的四张图片
截图:YouTube

谷歌表示,它正在扩展 SynthID 的功能——该公司表示,它将在其新的 Veo 视频生成器创建的内容中嵌入水印,并且现在还可以检测 AI 生成的视频。

© 版权声明
文章全是未果本果写的,尽量别直接复制粘贴
暂无评论

发送评论 编辑评论

上一篇
下一篇