快捷导航
科技信息

比OpenAI本心多了,一文总结Google发布会的11个亮点

就在X上一群人被草莓哥乱发OpenAI预报,疯狂搞心态的时间。Google带着MadeByGoogle24发布会来了。OpenAI乃至为了偷袭Google,在人发布会开始几分钟后,发了一个Blog,就这么个破Blog,还让他们的AI草莓哥当谜语人预

就在X上一群人被草莓哥乱发OpenAI预报,疯狂搞心态的时间。

Google带着MadeByGoogle24发布会来了。

OpenAI乃至为了偷袭Google,在人发布会开始几分钟后,发了一个Blog,就这么个破Blog,还让他们的AI草莓哥当谜语人预报了两天。

如今的OpenAI,真的跟狼来了一样,我对他已经没有任多么待和信托可言了。每次就差那两个脏话骂出来了,XXX,XX!

而Google在没有任何的预期下,照旧有一些额外的惊喜的。

我总结了11个亮点,你看完了这篇文章,也算是看完发布会了。

1. Google要根据Gemini重构Android。

他们界说了一个词,叫AI OS,Google想把AI OS带给全部人。

如今它们已经支持200多个国家和地区的45种语言,它可以在数十个装备制造商的数百个手机型号上使用,环球数十亿台装备上得到支持。

2. 手机上Gemini的图像辨认翻车了。

他们第一个演示的是Gemini的图像辨认本领。

作为多模态AI,图像拍摄辨认似乎被卷成必须有的功能了。最能磨练照片辨认本领的,就是拍摄阐明书、日程表这类信息麋集的内容——既要辨认图像,还得看得懂文本内容给出答案。

演示的小哥拍摄了一张纸质音乐会海报,上面巡演的日程安排。演示者让Gemini检察自己的操持,选择可以去看Sabrina Carpenter演出的时间。

然而,现场演示肯定会出现的失误,它来了。

Gemini前两次照相都很不给面子地现场演示失败,隔着太平洋我都感觉现场尬住了,照旧两次。。。= =

这个演示还特意提了一下,用的是三星Galaxy S24 Ultra手机,岂非是三星发力了?

现场紧急换了一部装备重新尝试,幸亏第三次顺遂辨认出了图片内容。

Gemini直接给出了很详细的日期:Sabrina会在2024年11月9日到达旧金山,而且这一天演示者没有其他安排,可以去看演出。

现场的掌声终于响起,哥们儿肉眼可看法松了一口气啊。

3. 跨软件交互很方便。

Gemini如今可以或许在手机上直接明确并分析视频内容。

你可以一边观看视频,一边呼唤出Gemini为你总结重点,大概复兴你关于视频内容的标题。

比如晚上观看油管上美食视频后,都不消你挨个识图,自动天生视频中出现的食品清单,并添加到用户的个人"待尝试"列表中。

吃货福音。

而且可以为油管上的一些旅行视频创建景点清单或行程发起。

作为一个连散步都须要出场bgm的,

你也可以要求gemini制作一个“得当在首尔散步的韩国盛行音乐播放列表”,它能根据用户形貌的场景、情绪或活动范例保举符合的音乐。

使探求音乐变得更加直观和个性化。

4. 写文速率很快结果也不错。

Gemini还可以辅助在手机端用仅数秒的时间完成邮件写作。

小哥演示了两个场景:第一个是给房东写封不失规矩的敦促信,关照她来维修家里的供电模块。

第二个是给传授写一封抱病缺勤的致歉信(看来这种事小哥之前没少干)。

别的Gemini另有方便用户润色文本和发送邮件的交互计划。

看到Gemini没几秒就完成致歉信,小哥都快憋不住笑了。

5.Gemini Live实时对话结果还不错,但只是低延迟的TTS。

Google推出了雷同于GPT4o的可以随时打断的实时对话功能,他们称为Gemini Live。

内里有10中音色可以选择。

演示的小姐姐跟Gemini Live聊了半天,音色结果不错,延迟也足够低,但是实在看着就是一个低延迟的TTS,而不是GPT4o那种原生的多模态大模型。

因为没有任何情绪明确和表达的演示,按照Google的尿性,真要是有他们肯定会疯狂展示的,别的在一些长一点的复兴上,照旧能显着的感觉到延时。

所以实在就是个低延时的TTS对话。

如今得Gemini Advanced订阅用户才气用,一个月20美刀,立刻上线。

6.Pixel 9 是首款搭载多模态 Gemini Nano 的手机。

这是迄今为止在手机上发布的功能最强大的装备端 AI 模型,比之前在 Pixel 8 Pro 上用的 AI 强大了三倍。

Pixel 9 的处理处罚器(TPU 和 Tensor G4)可以在一秒内天生多达 45 个单词,比之前的速率快了两倍。

平常版的 Pixel 9 有 12GB 的内存,而 Pro 版本的内存更大,到达了 16GB。而且他们最骚的是,终于也上了卫星通话的功能。。。

这里只能说一句,遥遥领先!

这次发布的产物包罗三款直板手机和一款折叠手机。通例系列包罗一款配备 6.3 英寸表现屏的底子版 Pixel 9,一款配备 6.8 英寸屏幕的 Pixel 9 Pro XL,以及一款新的更小巧的 6.3 英寸 Pixel 9 Pro。

说实话,我以为,有点丑。。。

另有个新款的折叠屏Pixel 9 Pro Fold。

更丑了。。。

7.Call Notes在电话过程中可以帮你记录下关键信息。

如今,Pixel的“通话助手”变得更强大了,增长了“Call Notes”功能。

在你打完电话后,它会为你提供一个完全私密的通话总结。如许纵然你在通话时没有纸笔,也能轻松获取电话号码、时间、细节和其他你不想忘记的信息。

而且这个过程全部是当地跑的,根本没有隐私标题。

小哥举了个例子,他最近思量换个发型,但他的剃头师做不了他想要的发型,所以他保举我去另一家剃头店。

但是标题是,他忘了记下那家店的电话号码。有了Call Notes后,就可以轻松回溯。

7.雷同于Recall的屏幕截图功能有点屌。

有个各人都认识的场景:你在手机上看到一些想记着的东西,大概你会在脑海中记下来,大概截图生存。

但通常,你要么忘记了要记的东西,要么在须要的时间找不到。

然后他们就做了一个新的产物。

可以用AI快速搜索所生存的全部图片。比如你手机里有几十张自行车的图,你搜一下自行车,就都出来了。

你还能问一下更复杂的,比如T恤价格,你可以看到Pixel截图不仅找到了原始图像,而且还根据图像中的信息用天然语言为我提供了答案。

8.一个普平常通的当地AI绘图Pixel Studio。

每部Pixel 9手机都配备了新的Pixel Studio,他们手机上的首款图像天生器。

结果我以为,就是普平常通,属于能用。

比如日落时的海滩篝火坑,就感觉结果,非常的平常。

9.AI相机拍合照非常的棒。

Pixel相机,说是第一个AI相机。

大多数参数我不懂,但是这个合照的场景非常的风趣。

许多时间各人没法拍合照,总有一个朋友要当拍照师。

它会用一个简单的屏幕界面来引导你照相,比如让你把相机交给别人,如许你们可以交换位置。然后,你可以根据第一张照片中人物的表面,把他们在新照片中对齐,再拍一张。终极天生的图片会把两张照片合成在一起,看起来就像各人同时出如今同一张照片里一样。

非常的牛逼,办理了合照的一大痛点。

10.新的手表和耳机。

发了一个Pixel Watch 3。

一个耳机Pixelbuds Pro 2。

耳机可以随时唤醒Gemini跟他对话。

11.对标GPT4o的Project Aster。

Project Aster在几个月前的Google发布会上就表态过了,直接对标GPT4o的原生多模态大模型。

如今,在Gemin Live中,你未来也可以用到Aster了。

比如,你可以在与Gemini对话时共享你的相机,如许你可以直接展示自己在微积分作业中碰到的标题,大概寻求下一步家具组装的帮助。

而且,还把最常用的应用步伐也集成到Gemini Live中,如许它可以在对话和消息中帮助你采取举措,并从像Google日历如许的应用步伐中提取信息。

所以你可以直接在Gemini Live中给邻人发短信,分享关于某个商家的详细信息,并同时检察你的日历,完全不须要打开其他应用步伐。

有点屌,GPT4o+苹果的集合体。

就是可惜,照旧个饼。

在AI方面,跟硬件的联合,照旧蛮故意思的,Gemini Live至少不是期货,本日就可以用。

比谁人只会画饼的OpenAI,照旧强了许多。

盼望Google越来越好,锤死OpenAI。

以上,既然看到这里了,如果以为不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标~谢谢你看我的文章,我们,下次再见。

>/ 作者:卡兹克、稳稳、小瑞、Dawn_E

收藏 邀请
上一篇:拼多多将向报名参与站内资源位运动的商家,推出技能服务费可退权益下一篇:谷歌赶在苹果之前发布了四款AI手机
我有任务需求要发布
专业服务商主动承接
快速解决你的需求

专注IT众包服务

平台只专注IT众包,服务数 十万用户,快速解决需求

资金安全

交易资金托管平台,保障资 金安全,确认完成再付款

实力商家

优秀软件人才汇集,实力服务商入驻,高效解决需求

全程监管

交易过程中产生纠纷,官方100%介入受理,交易无忧

  • 微信访问
  • 手机APP