Google I/O 2024：一切公布

Google I/O 刚刚结束，它挤满了 AI 公告。正如预期的那样，该活动主要集中在谷歌的Gemini AI模型上，以及它们被集成到Workspace和Chrome等应用程序中的方式。

如果您没有现场收看该活动，您可以在下面的综述中了解 Google 的所有最新消息。

Google 智能镜头现在允许您通过录制视频进行搜索

Google Lens 已经允许您根据图像搜索内容，但现在 Google 更进一步，能够使用视频进行搜索。这意味着你可以拍摄你想搜索的东西的视频，在视频中提出一个问题，谷歌的人工智能将尝试从网络上提取相关的答案。

Gemini 将回答有关您的照片库的问题

图片：谷歌

谷歌将在今年夏天推出一项新功能，对于任何有数年甚至十多年照片需要筛选的人来说，这可能是一个福音。“询问照片”让 Gemini 可以仔细查看您的 Google 相册库以回答您的问题，该功能不仅仅是调出狗和猫的照片。首席执行官桑达尔·皮查伊（Sundar Pichai）通过询问双子座的车牌号来证明这一点。回答是数字本身，然后是它的照片，这样他就可以确保它是正确的。

谷歌的旗舰双子座机型变得更快、更强大

截图：YouTube

谷歌在其阵容中引入了一种新的 AI 模型：Gemini 1.5 Flash。新的多模态模型与Gemini 1.5 Pro一样强大，但它针对“狭窄，高频，低延迟的任务”进行了优化。这使得它能够更好地产生快速响应。谷歌还对 Gemini 1.5 进行了一些更改，据称这将提高其翻译、推理和编码的能力。此外，谷歌表示，它已经将 Gemini 1.5 Pro 的上下文窗口（它可以接收多少信息）从 100 万个代币增加到 200 万个代币。

Gemini 加入 Workspace 中的用户

Gemini 总结了 Google Meet 录制的内容。 截图：YouTube

谷歌正在将其最新的主流语言模型 Gemini 1.5 Pro 整合到文档、表格、幻灯片、云端硬盘和 Gmail 的侧边栏中。当它在下个月向付费订阅者推出时，它将变成 Workspace 中的通用助手，无论您身在何处，都可以从云端硬盘中的任何和所有内容中获取信息。它还将能够为您做一些事情，例如编写包含您当前正在查看的文档中的信息的电子邮件，或者稍后提醒您回复您正在阅读的电子邮件。一些早期测试人员已经可以使用这些功能，但谷歌表示将在下个月向所有付费 Gemini 订阅者推出这些功能。

Project Astra 是谷歌的《星际迷航》人工智能未来

谷歌的Project Astra是一款多模态人工智能助手，该公司希望它能成为一个无所不能的虚拟助手，可以观察和理解它通过设备的摄像头看到的东西，记住你的东西在哪里，并为你做事。它为今年 I/O 中许多最令人印象深刻的演示提供了动力，该公司的目标是成为一个诚实至善的 AI 代理，不仅可以与您交谈，还可以代表您做事。

Veo 为创作者带来 Sora 风格的视频生成

Veo的输出示例。 图片：谷歌

谷歌对 OpenAI 的 Sora 的回应是一种新的生成式 AI 模型，可以根据文本、图像和基于视频的提示输出 1080p 视频。视频可以以多种风格制作，例如航拍或延时摄影，并且可以使用更多提示进行调整。该公司已经向一些创作者提供Veo，用于YouTube视频，但也在向好莱坞推销用于电影。

Gems 为 Gemini 带来自定义聊天机器人创建

无论你需要一个瑜伽闺蜜还是微积分导师，在接下来的几个月里，你都可以定制双子座，当你一次又一次地以特定的方式与双子座互动时，可以节省时间。我们称这些为宝石。#GoogleIO pic.twitter.com/YQOHsUbMWE

— 谷歌（@Google） May 14， 2024

谷歌正在推出一个名为 Gems 的自定义聊天机器人创建器。就像 OpenAI 的 GPT 一样，Gems 允许用户向 Gemini 发出指令，以自定义它的响应方式和专长。如果你想让它成为一个积极而坚持的跑步教练，每天有动力和跑步计划——也就是我最糟糕的噩梦——你很快就能做到（如果你是 Gemini Advanced 的订阅者）。

双子座成为更好的对话伙伴

新的 Gemini Live 功能旨在让与 Gemini 的语音聊天感觉更自然。聊天机器人的声音将更新一些额外的个性，用户将能够在句子中途打断它，或者要求它通过智能手机摄像头观看，并实时提供有关它所看到的信息。Gemini 还获得了新的集成，允许它使用多模式功能（例如将传单中的详细信息添加到您的个人日历中）更新或从 Google Calendar、Tasks 和 Keep 中提取信息。

Circle to Search 现在可以帮助解决数学问题

图片：谷歌

如果您使用的是 Android 手机或平板电脑，您现在可以在屏幕上圈出一个数学问题并获得解决它的帮助。谷歌的人工智能不会为你解决问题——所以它不会帮助学生在家庭作业上作弊——但它会把它分解成更容易完成的步骤。

谷歌搜索对人工智能进行了全面改革

图片：谷歌

谷歌本周将向美国所有人推出“AI Overviews”——以前称为“搜索生成体验”，口口如瓶。现在，一个“专业”的双子座模型将用来自网络的汇总答案来设计和填充结果页面（类似于你在 Perplexity 或 Arc Search 等 AI 搜索工具中看到的）。

Android 获得 AI 驱动的诈骗检测

谷歌表示，使用设备上的Gemini Nano AI智能，Android手机将能够通过寻找危险信号（例如常见的诈骗者对话模式）来帮助您避免诈骗电话，然后弹出上述实时警告。该公司承诺在今年晚些时候提供有关该功能的更多细节。

Android 设备即将获得更智能的 AI

图片：谷歌。

谷歌表示，Gemini 很快将能够让用户在屏幕上询问有关视频的问题，并且它将根据自动字幕回答。对于付费的 Gemini Advanced 用户，它还可以摄取 PDF 并提供信息。这些以及 Android 上 Gemini 的其他多模式更新将在未来几个月内推出。

谷歌浏览器正在获得一个人工智能助手

截图：YouTube

谷歌宣布将 Gemini Nano 添加到桌面版的 Chrome 中，这是其 Gemini 型号的轻量级版本。内置助手将使用设备上的 AI 帮助您直接在 Google Chrome 中为社交媒体帖子、产品评论等生成文本。

谷歌升级其 SynthID AI 水印

截图：YouTube

谷歌表示，它正在扩展 SynthID 的功能——该公司表示，它将在其新的 Veo 视频生成器创建的内容中嵌入水印，并且现在还可以检测 AI 生成的视频。

Google 智能镜头现在允许您通过录制视频进行搜索

Gemini 将回答有关您的照片库的问题

谷歌的旗舰双子座机型变得更快、更强大

Gemini 加入 Workspace 中的用户

Project Astra 是谷歌的《星际迷航》人工智能未来

Veo 为创作者带来 Sora 风格的视频生成

Gems 为 Gemini 带来自定义聊天机器人创建

双子座成为更好的对话伙伴

Circle to Search 现在可以帮助解决数学问题

谷歌搜索对人工智能进行了全面改革

Android 获得 AI 驱动的诈骗检测

Android 设备即将获得更智能的 AI

谷歌浏览器正在获得一个人工智能助手

谷歌升级其 SynthID AI 水印

发送评论 编辑评论

推荐文章

发送评论编辑评论