OpenAI 和Google正在推出强大的人工智能助手。以下是您可以尝试的方法

OpenAI 和Google正在推出强大的人工智能助手。以下是您可以尝试的方法

他们承诺将超越 Siri 或 Alexa 等工具。

本周,谷歌和 OpenAI 都宣布他们已经构建了强大的人工智能助手:这些工具可以与你实时对话,并在你打断它们时恢复,通过实时视频分析你的周围环境,并即时翻译对话。 

OpenAI 在周一首次亮相,推出了新的旗舰型号 GPT-4o。现场演示显示,它可以阅读睡前故事并帮助解决数学问题,所有这一切的声音听起来都怪异地像电影《她》中华金·菲尼克斯 (Joaquin Phoenix) 的人工智能女友(CEO 萨姆·奥尔特曼 (Sam Altman)也有这种特质)。 

周二,谷歌宣布了自己的新工具,其中包括名为 Gemini Live 的对话助手,它可以做许多相同的事情。它还透露,它正在构建一种“无所不能”的人工智能代理,目前正在开发中,但要到今年晚些时候才会发布。

很快你就可以自己探索,衡量你是否会像它们的制造者希望的那样在日常生活中使用这些工具,或者它们是否更像是最终失去魅力的科幻派对技巧。以下是您应该了解的有关如何访问这些新工具、它们的用途以及费用的信息。 

OpenAI 的 GPT-4o

它的功能:该模型可以与你实时对话,响应延迟约为 320 毫秒,OpenAI 表示这与人类自然对话相当。你可以要求模型解释你将智能手机摄像头指向的任何东西,它可以为编码或翻译文本等任务提供帮助。它还可以汇总信息,并生成图像、字体和 3D 渲染。 

如何访问: OpenAI 表示将开始在Web 界面以及 GPT 应用程序中推出 GPT-4o 的文本和视觉功能,但尚未确定日期。该公司表示将在未来几周内添加语音功能,但尚未确定具体日期。开发人员现在可以访问 API 中的文本和视觉功能,但语音模式最初只会向“一小群”开发人员推出。

费用: GPT-4o 的使用是免费的,但 OpenAI 会在您需要升级到付费计划之前设置模型的使用上限。那些加入 OpenAI 付费计划(每月 20 美元起)的人将拥有五倍的 GPT-4o 容量。 

谷歌的双子座直播 

什么是双子座直播?这是最能与 GPT-4o 相媲美的 Google 产品——该公司人工智能模型的一个版本,您可以与它进行实时对话。谷歌表示,“今年晚些时候”你还可以使用该工具通过实时视频进行交流。该公司承诺,它将成为一个有用的对话助手,可以帮助你准备工作面试或排练演讲。

如何访问: Gemini Live 将在“未来几个月”通过 Google 的高级人工智能计划 Gemini Advanced 推出。 

费用是多少: Gemini Advanced 提供两个月的免费试用期,此后每月收费 20 美元。 

但是等等,阿斯特拉计划是什么? Astra 是一个构建万能人工智能代理的项目,该项目已在 Google 的 I/O 大会上进行了演示,但要到今年晚些时候才会发布。

谷歌 DeepMind 研究副总裁 Oriol Vinyals 告诉《麻省理工科技评论》,人们将能够通过智能手机甚至台式电脑使用 Astra,但该公司也在探索其他选择,例如将其嵌入智能眼镜或其他设备中。。

哪个更好?

如果我们自己没有接触过这些模型的完整版本,就很难判断。谷歌通过一段精美的视频展示了 Project Astra,而 OpenAI 选择通过看似更真实的现场演示来首次展示 GPT-4o,但在这两种情况下,模型都被要求做设计师可能已经练习过的事情。当它们向数百万具有独特需求的用户推出时,真正的考验才会到来。  

也就是说,如果将 OpenAI 发布的视频 与 Google 的视频进行比较,这两个领先的工具看起来非常相似,至少在易用性方面如此。总而言之,GPT-4o 在音频方面似乎稍微领先,展示了逼真的声音、对话流程,甚至唱歌,而 Project Astra 则展示了更先进的视觉功能,比如能够“记住”你把眼镜放在哪里。 OpenAI 决定更快地推出新功能,这可能意味着其产品首先会比谷歌的产品得到更多使用,而谷歌的产品要到今年晚些时候才会完全可用。现在判断哪种模型“幻觉”错误信息的频率较低或创建更有用的响应还为时过早。

他们安全吗?

OpenAI 和谷歌都表示他们的模型经过了充分的测试:OpenAI 表示 GPT-4o 经过了错误信息和社会心理学等领域的 70 多名专家的评估,谷歌表示 Gemini“拥有所有谷歌 AI 模型中最全面的安全评估日期,包括偏见和毒性。” 

但这些公司正在构建一个未来,人工智能模型可以搜索、审查和评估世界信息,为我们的问题提供简洁的答案。比简单的聊天机器人更重要的是,对它们告诉你的内容保持怀疑是明智的。