GenAI广受瞩目,然而今天咱们来谈谈另一种类型的Agent。这种Agent以目标为导向,能够完成整个工作流程,这确实是一项非常酷炫的技能,让人不禁想要深入了解。在智谱公司,这方面已经取得了不少新突破,为AI的发展带来了新的亮点。
智谱Agent的目标驱动特性
智谱的智能代理以任务为焦点,宛若一位专为执行任务而设的得力助手。它能适应不同环境,不断学习和更新。在企业实际工作中,它能与系统及人类并肩协作。例如在项目开发阶段,它能从海量数据中挑选出关键信息,为人类提供精确的参考,与传统的通用人工智能有显著差异。这种以目标为导向的特性,让它在各行各业都有广阔的应用前景,可以说开创了人工智能应用的新模式。它并非仅仅回答问题,而是致力于达成特定目标,在现实场景中,这种特性显得尤为宝贵。
智谱CEO张鹏指出,Agent可以视为大型模型通用操作系统LLM-OS的早期形态。由此可知,Agent在人工智能体系中扮演着关键角色,对AI发展框架的构建具有重大影响。
智谱Agent在活动中的多项进展展示
在最新的「Agent」活动中,智谱展现了诸多卓越功能。它将基础对话升级为高度自主的操作系统,这一变革非同小可。就像从只能简单回应的机器变成了具备自主思考和规划能力的智能伙伴。目前,它能够独立执行超过50个步骤的复杂任务,这一数据令人印象深刻。比如,在处理大型文件整理工作时,它能够有序地进行分类、标注、分析等多个环节。此外,它还能在不同应用程序间协作完成任务。例如,它能在办公软件和图像处理软件等不同软件间交换信息,以完成一个整体任务,无需人工干预即可在多个平台上自如操作。
智谱的升级亮点之一在任务执行上,它能够完成那些复杂且步骤众多的任务,满足不同应用场景的需求。这就像连接起众多独立王国的使者一样。
实际场景中的任务完成示例
智谱Agent的表现十分出色。比如在选购火锅食材时,它能独立完成54个步骤,速度甚至超过了人工。想想看,从寻找供应商、比价、核实质量,到最终下单,整个过程一气呵成。再比如点咖啡,用户只需说一声“点咖啡”,它就能自动完成从选咖啡到购买的全部流程,极大地简化了操作。对忙碌的现代人来说,这无疑是一种非常便捷的智能服务。
PC任务处理表现同样出色,GLM-PC能应对繁复任务,还能自主学习并执行为人类量身定制的应用。它在多个平台上都展现出了出色的适应性和操作技能,堪比一位全能的PC助手。
智能体面临的集成挑战
智能体虽有许多长处,但在处理繁复的业务流程时,却遇到了一些困扰。执行任务时,它往往需要调用众多数据和多种应用程序。现在,许多网站和APP的API缺乏统一标准,导致企业在整合智能体时面临诸多挑战。例如,当企业试图将智能体融入自身业务系统时,由于API的不规范,它们不知道如何顺畅对接,这是一个实实在在的问题。一些企业可能需要投入大量精力调整现有系统以适应智能体,但这会带来高昂的成本。
智谱的应对方案
刘潇,智谱技术的负责人,提出了一种巧妙的方案,即采用图形化用户交互界面。这种方法并非依赖传统的API调用。相较于传统API,它更不易因应用更新而失效。只要图形化界面保持用户易懂且操作简便,智能体就能顺畅运作。这就像为智能体与各应用程序间搭建了一条新通道,无论应用程序如何更新,只要界面保持易于人类操作,智能体就能在其上正常发挥功能,有效规避了API标准不统一所造成的难题。
距离全面替代人工办公的差距
尽管GLM-PC功能强大,但在处理PC任务方面,目前还不能完全替代人工。这是因为PC任务较为复杂,需要用户输入精确指令。在日常工作环境中,某些复杂业务逻辑和特定需求仍需人工介入和思考来完成。比如编制财务报表,数据分析中涉及众多隐秘信息和特殊规则,这是智能体目前无法独立解决的。我们都想知道,智能体何时能在复杂PC任务中完全取代人工?期待大家在评论区交流探讨,也欢迎点赞和转发这篇文章。这种现象也揭示了当前AI技术的局限性,即从理解到行动的转变仍需进步,从文本交互到更广泛的实际操作还有很长的路要走。
智谱的这些成就充分展现了当前人工智能发展的核心。要想增强大型模型从理解到执行的能力,这是人工智能实现更广泛实际应用的关键途径。