草根影响力新视野(琪拉编译)

OpenAI 推出了支持其人工智能聊天机器人 ChatGPT 的最新版本技术。它被称为 GPT-4o,并且会向 ChatGPT 的所有用户推出,包括非订阅者。它比早期的模型反应更快,并且被回应过程所用的字句听起来很健谈,有时甚至是轻浮的。

这个新的版本可以阅读和讨论图像、翻译语言以及从视觉表达中识别情感。还有储存过去搜寻的功能,因此它可以回忆以前的提示。它可以中途被打断,并且再度唤回记忆,而且对话节奏更轻松,使用者提问和得到答案之间没有任何延迟。

在使用 GPT-4o 语音版本的现场演示中,它为如何解决写在纸上的简单方程序提供了有用的建议,而不是简单地求解它。它可以分析了一些电脑程序代码,并在在意大利语和英语之间进行翻译,并解释了一个微笑的男人的自拍照中的情绪。它也可以的美国女声向提示者打招呼,询问他们事情做得怎么样。当受到称赞时,它回答说:“别说了,你让我脸红了!”。

不过,它并不完美。有一次它把微笑的人误认为木质表面,并开始求解一个尚未显示的方程序。这些都在无意中表明,在解决导致聊天机器人不可靠和潜在不安全的故障和幻觉之前,还有很长的路要走。

聊 屏幕 概念 技术 业务 数字 因特网 在线 网站 软件 情报 公司 标志 对话 设备 发育 谈话 智能手机 虚拟 通讯 人造的 信息 服务 模煳 现代 网络 智能 助理 信息 革新 图标 机器人 高科技
图片取自:(示意图123rf)

但它确实向我们展示了 OpenAI 的发展方向, GPT-4o 打算成为下一代 AI 。项项房间里有一头大象,伴随著镜头外热情的观众欢呼和鼓掌,那就是这项技术的价格标签。我们知道,人工智能比传统运算任务更耗电,而且它变得越复杂,需要的运算能力就越多。 

我们已经看到像 Elon Musk 的 Grok 和 DeepMind 联合创始人 Mustafa Suleyman 的 Pi 这样的聊天机器人优先考虑其产品的“个性”,但 GPT-4o 无缝处理文本、音频和图像组合并实时响应的方式看来OpenAI 在竞争中处于领先地位。当然,目前我们只有该公司的说法,由他们精心策划和管理。

关于 OpenAI 和 Apple 之间的合作关系一直有传言,虽然这一消息尚未得到证实,但在OpenAI演示过程中可以看出,自始至终都使用了 Apple 产品。另一个引人注目的问题是这次活动的时间安排,距离其竞争对手谷歌在其年度大会 Google IO 上展示其最新的人工智能进展还有 24 小时。

资料来源:https://www.bbc.com