人工智能行业正快速进步,GLM模型系列的新进展引人关注。这一话题引人入胜,不仅关联技术革新,还紧密联系商业运作和用户感受。

GLM模型能力收束

GLM模型家族目前正经历一种“聚焦”过程。这就像筛选后的精华汇集。这种“聚焦”在具体应用中展现出了多种形式。比如,模型在计算量上有了新的思考,有用信息与计算量紧密相连。预训练速度的降低以及后训练曲线效果的显现等,都是这种转变的反映。模型能力的聚焦并非是退步,而是为了更精准、更有效地提升自身能力。目前来看,这种聚焦趋势与行业需求相契合。许多模型在发展到一定阶段后,都需要重新审视自身能力范围和发展方向,GLM模型在这方面也在积极探索。

商业角度下的能力聚焦,更有助于打造基础生态体系。这为其他参与者提供了一个基础平台,对大家都是有益的。比如,在与大型厂商的应用生态接轨时,这种聚焦有助于合作更加顺畅和精确。

迈向AI智能操作系统

探索AI智能操作系统领域是一项勇敢的举措。在这一探索过程中,我们面临诸多挑战与机遇。从技术角度看,这就像是在一片未知的土地上开拓。在人与应用之间增设执行调度层,这将大大转变人机交互模式。这种模式的转变意义重大,比如用户可以更自然地完成操作。这不禁让人遐想,未来人与电子设备的交流是否将不再依赖繁杂的接口,只需语言就能完成所有操作。

长远来看,LLM-OS的潜力逐渐显现。这得益于大模型智能水平的持续提升。它有望实现真正的人机交互。从L1到L4,甚至更高级别的能力发展,将为操作系统带来颠覆性的改变。就好比给机器装上越来越聪明的“大脑”,使其能够自主理解和处理更多任务。

人在交互中的角色关键

各个领域的人对操作和使用的需求各不相同。在刘潇的观点中,模型应作为枢纽,满足人们的需求。人的意愿影响着工具如何运用自然语言实现功能组合。人们期望在复杂的硬件、应用和服务中找到捷径。比如,对于那些不熟悉复杂设备操作的人,如果模型能按其意愿连接各种设备,这将极大地提升他们的生活效率。

技术要求是需更精确地洞察人们的意愿。人们表述有时含糊不清,特别是在使用自然语言进行交流时。因此,模型需持续进步,以应对人们多变且不够精确的表达。与封闭平台开发不同,当前针对用户需求的开发需具备更高的开放性和接纳度。

技术困难重重

当然,要实现理想中的人机交互智能操作系统,技术挑战不少。在现有生态系统中,开发过程受到诸多限制。比如,只能在封闭平台上进行开发,获取数据的机会也受限。数据是衡量模型智能程度的关键因素。这就像学生没有资料来源,很难学到丰富的知识一样。因此,在这样的条件下开发出的模型能力受限,不够智能,也就难以有效整合各方资源。

技术栈的层级较高,需要解决的问题不少。比如,在预训练的Law模型中,就已经显现出数据上的限制。尽管普通用户对技术的接受度有所提高,似乎让发展变得容易些,但在企业层面,困难依然不少。这些困难仿佛一道道难以逾越的高墙,横亘在理想与现实之间。

多模态与Agent的潜力

多模态技术和Agent领域蕴藏着巨大潜能。在现有发布的内容中,多模态和Agent已探索众多新兴领域。以APP功能为例,这实质上是模型能力的展现。多模态技术能够提供更加丰富的交互感受,将视觉、听觉等多种信息融合到交互过程中。

Agent有多种用途,虽然目前与提高生产力的应用还有一定距离,但其发展潜力不容小觑。一旦未来应用范围扩大,比如覆盖到50%、80%的设备使用场景,其影响力将显著增强。此外,对Agent的开发也十分关键,比如后训练效果挖掘等技术,这些都有助于提升Agent在各种环境下的适应性。

新硬件与开放平台

这个变化的关键趋势之一可能是新硬件的形态。像AIPin这样的AI设备,可能预示着智能硬件的未来。依照技术进步的规律,新软件通常需要与之相匹配的新硬件来达到最佳性能。这就像手机硬件的进步推动了手机软件从单一功能向多功能整合的转变。

在此过程中,开放平台至关重要。我们应以开放的心态吸纳各种资源和创意。这将为新硬件与软件的进步拓展无限可能。封闭只会导致技术发展缓慢或应用场景受限。

AutoGLM:迈向AI智能操作系统的新阶段,改变人机交互范式  第1张

最后,我想请教大家,在GLM模型向AI智能操作系统转变的过程中,哪一点可能最为棘手?期待大家的点赞、转发,并在评论区分享你们的见解。

AutoGLM:迈向AI智能操作系统的新阶段,改变人机交互范式  第2张