亚马逊进军AI,万亿巨头发布Nova Act。


亚马逊声称,其Nova Act在多项基准测试中超越了OpenAI与Anthropic的竞争对手。举例来说,在评估AI代理与屏幕文本交互能力的ScreenSpot Web Text测试中,Nova Act取得了94%的分数,这一成绩超过了OpenAI的CUA模型(88%)以及Anthropic的Claude 3.7 Sonnet(90%)。
鉴于AI智能体仍处于其发展的初级阶段,这些基准测试结果仅可作为产品实际效用的一个参考。同时,亚马逊并未公布Nova Act在更广泛使用的代理评估标准(例如WebVoyager)中的测试表现。
对于拥有全球数亿用户的电商巨头亚马逊而言,涉足智能体领域本身就具有重大意义。根据对OpenAI、谷歌等产品的过往测试,当前的AI智能体仍面临反应迟缓、难以长时间自主运行、常犯低级错误等严重影响用户体验的问题。
作为互联网行业的领军企业,亚马逊进入AI领域的时间相对较晚。去年6月,亚马逊与AI初创企业Adept达成了一项类似收购的协议,据此亚马逊获得了技术授权,同时Adept的联合创始人、前OpenAI工程副总裁David Luan及其团队加入了亚马逊。
去年12月,公司宣布成立旧金山AGI研发实验室,该实验室由David Luan与加利福尼亚大学伯克利分校AI和机器人领域的教授Pieter Abbeel共同领导。同月,亚马逊发布了Nova系列大模型,全面参与到AI竞争中,而Nova Act正是旧金山实验室首个公开面世的产品。
针对“为何AGI实验室要开发AI智能体”的疑问,David Luan回应道,他认为智能体是构建超级智能系统的关键一环。他还将AGI定义为“能够协助人类完成计算机上所有操作的AI系统”。
David Luan进一步表示,旧金山团队设计的Nova Act SDK旨在稳定处理简单、短小的任务,并为开发者提供工具,以便精确界定在智能体工作流程中何时需要人工介入,从而打造出更加可靠的智能体应用。
烟台三明网络专注软件开发10年+,具备烟台APP开发、烟台小程序定制、烟台公众号定制、烟台网站建设、烟台商城开发、烟台分销系统开发、烟台康复系统开发,致力烟台互联网+行业的系统定制开发与运营,为企业发展提供助力。