新 AI 超级代理来了!詹斯帕克”真AI助手”亮相

Photo of author

By Global Team

Genspark发布的“超级代理”从根本上改变了现有人工智能助手的框架。从仅执行给定命令的AI转变为理解用户目标、计划任务并独立执行复杂流程的通用代理。其特点是在实现单一模型中心之外,采用AI协作结构的“MoA(混合代理)”系统,吸引了业界的广泛关注。

Genspark超级代理首页
Genspark超级代理首页(图片来源于Genspark官网截图)

Genspark超级代理不仅限于简单的问答,还可以接收用户的要求,自动处理复杂任务。例如,当输入旅行计划请求时,它会收集相关信息,比较交通工具和住宿信息,并实际进行电话预约以完成日程安排。5小时的视频内容被提炼为10张幻灯片,研究全球行业动态之后自动生成可视化分析报告。

内容制作功能也得到了扩展。基于最新新闻制作1分钟的动画,利用分步烹饪指南生成社交媒体视频,甚至在特定预算范围内自动推荐购物清单。这些广泛的应用由理解用户需求并忠实反映其结果的能力所推动。

代用户拨打餐馆电话的超级代理
代用户拨打餐馆电话的超级代理。凭借自然对话处理预约请求并回应座位偏好(来源:YouTube @Genspark截图)

超级代理的功能多种多样。实际上,在公开的演示视频中,AI代替用户拨打餐馆电话预约,压缩长视频内容为10张总结幻灯片,并编写包含数据可视化的全球市场报告。另外,有基于新闻内容制作“南方公园”风格的1分钟小插曲、Instagram Reels视频、营销海报,甚至3D数学公式可视化等展示。无论是内容创作者、市场营销人员、研究人员还是个人用户,都可以利用这一通用AI。

Genspark超级代理的三大核心组成
Genspark超级代理的三大核心组成:LLM模型、自有工具集和高级数据集的整合结构(资料提供:MainFunc)

超级代理的核心是Genspark率先引入的MoA(混合代理)系统。这是一种将GPT-4o、Claude、Gemini等多个AI模型分配到不同任务中使用的方式。通过利用每个模型的优势和交叉验证,减少错误可能性,最终提供更加准确可靠的结果。

MoA系统就像公司内为了单个项目而联合多职能专家协同工作一样。当请求音乐行业分析时,一个模型扮演数据研究员角色,另一个模型负责创建视觉材料,最后一个模型则整理总结内容,作为内容策划者。这种分工使得AI们协同合作,总控系统协调这一过程并将其整合为高质量的成果。

Genspark GAIA基准性能图
Genspark GAIA基准性能图(资料提供:MainFunc)

Genspark超级代理在客观性能上也超越了现有模型。在全球公认的AI性能评估标准GAIA基准测试中,一级至三级的所有阶段均领先竞争模型,取得了最高的准确率。一级记录了87.8%,二级为72.7%,三级达到58.8%,在OpenAI、manus.ai等著名研究机构中取得了优势。

该评价不仅仅是简单的正确率,而是基于对实际用户对话流程的多次自动化情境进行的,证明了其实际应用可能性。除了性能之外,在响应速度、稳定性和错误预防方面也取得了显著成果。

Genspark通过iOS应用发布了超级代理,并正在准备安卓版本。此次发布同时获得了1亿美元的A轮融资,标志着AI基础超级应用生态系统的全面建设开始。

超级代理不仅是技术进步,还预示着AI的日常化。它可以委托重复性工作,使人们更专注于创造性工作,并将高级AI技术的使用变得更加简便。

现在,AI不再仅仅是助手,而是作为可以‘生产、思考和行动’的存在,代替人类进化。

Leave a Comment