有没有可能,让计算机理解我们,而不是我们去理解计算机?
在信息不断增加的世界里,计算机能否根据这些信息帮助我们更有效地推理、计划并采取行动?
当地时间5月21日(周二)上午举行的微软Build年度开发者大会上,微软首席执行官萨蒂亚·纳德拉 (Satya Nadella) 提出了上述两个问题。他说这是微软几十年来的两个梦想,而当下的人工智能浪潮为这两个梦想提供了答案。
大会前一日,微软首先发布了史上最强大的AI PC产品,其中包括多个令人惊艳的新功能。在媒体采访中,纳德拉毫不掩饰对苹果的“敌意”。他骄傲地宣布,诞生于上个世纪的微软PC与苹果Mac的大战,正重新回到聚光灯下:“我们现在想让真正的竞争重新回到 Windows 与 Mac 之间。”
和此前媒体透露的信息不同,微软并没有发布自研大模型与OpenAI抗衡。相反,上周OpenAI刚刚发布的GPT-4o模型得到了纳德拉的高度肯定。同时,OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)也在OpenAI近期陷入一片争议声中的前提下,亲自来到西雅图为Build大会站台,巩固了微软与OpenAI的联系。
但从网友表态来看,让主流市场接受拥有了GPT-4o加持的Copilot,恐怕还需要一段时间。许多人看不到购买新电脑或者抛弃Mac的理由,还有人认为“电脑充分理解自己”是十分恐怖的事情。
不过微软的确在首次发布Copilot一年后的Build大会上,又一次真切地铺开了AI PC时代的画卷。另外,也正像纳德拉所说,PC不PC的也不是那么重要:“我相信 Copilot 未来会无处不在。”
1.让电脑预测你的意图
微软在5月20日发布的Copilot+PC,令人印象最深刻的当属Recall功能。
之前用户可能在电脑里存了无数张图片和笔记,然而却忘了放在哪个文件夹里。通过Recall功能,Windows 将不断捕获屏幕上的内容,并通过设备中的生成式AI模型处理并搜索所有内容。比如你可以搜索“带有鱼的那张PPT”——哪怕PPT中并没有“鱼”这个字,Recall也可以准确识别图像信息并找到它。
“它能记住我忘记的事情,”微软 Surface 电脑营销主管马特·巴洛 (Matt Barlow) 强烈推荐道。
然而,把用户在屏幕上的所有举动截图这件事,很容易引起大家的恐慌。微软方面目前保证,这些截图不会离开所在的电脑,不会发送到微软的服务器或用于训练未来的AI系统。而且用户可以限制 Recall 截取某些应用或网站的截图,或者完全关闭该功能。
其他新功能还包括44种语言的实时翻译——也包括视频通话和App试用期间;与AI共同创作图像的CoCreator功能等。
在一段5月20日公布过的演示中,有人在玩沙盒游戏“我的世界”时,Copilot已经明显可以看到屏幕上的游戏内容,并为玩家提供相应的游戏建议。
在Build大会上,纳德拉还给出一个全新的演示视频:一名男子把一只鞋子举到电脑前,询问Copilot这双鞋是否适合露营或徒步旅行。
Copilot用语音回应称不太好。然后该男子便让Copilot把适合露营的鞋子加到购物车里,Copilot也瞬间完成这项更加主动的“行为”。随后男子突然开始说西班牙语,Copilot也切换为西班牙语回应。