四家国产大模型明星公司罕见同台 通往AGI之路仍存分歧|大模界星空体育下载
发布时间:2024-06-15 23:31:26

  ◎月之暗面CEO杨植麟认为,AGI的定义是重要的,但它不一定需要在现在被非常精确地、量化地定义,它可能是一个定性的、感性的东西。

  ◎面壁智能CEO李大海看来,大模型一定是通往AGI方向上,当前所有技术里能走得最远的,它能不能够直接到达,现在还有很多未知的因素。

  6月14日,“2024北京智源大会”在中关村展示中心启幕,在这次大会上,国内几家大模型明星公司的创始人们罕见同台。

  圆桌活动中,在北京智源人工智能研究院院长王仲远的主持下,月之暗面CEO杨植麟、百川智能CEO王小川、智谱AI CEO张鹏、面壁智能CEO李大海共同展开了一场通往通用人工智能(AGI)之路的尖峰对话。

  对话中,四位掌舵者对于通往“AGI”的未来之路尚未形成共识,而在分歧之下,四家明星公司不同的发展路径或也可窥见一斑。

  在全球范围内,对于AGI的定义一直缺乏统一的共识,不同的人、不同的视角都会有不同的答案。

  杨植麟认为,AGI的定义是重要的,但它不一定需要在现在被非常精确地、量化地定义,它可能是一个定性的、感性的东西。“它最重要的作用,是能让社会,或者说所有人,能够对于接下来要发生什么事情有个准备,因为也许这个技术的节奏会非常快。”

  另一方面,杨植麟提出,AGI一定程度上在短期内可能需要一些量化,因为如果完全没有量化,可能无法衡量AGI的开发进度,所以从短期的角度而言,evaluation(评估)本身也会是一个很难的问题,而且可能也是个很大的挑战。

  张鹏则认为,与其说AGI有很严格的规范、定义,他更愿意相信AGI是一种信念、符号,它的内涵、外延是在不断地变化的。“其实没有人能够把这些说清楚,反过头来讲是一件好事,这个事情还有很多未知的空间等待我们去探索。”

  张鹏举例道,在早期如何确认一个系统是否为人工智能?答案是图灵测试。然而,随着技术的不断进步和对事物认知的深化,大家认为图灵测试已经过时。同样的,AGI三个字母所代表的含义实则在动态变化中。因此,如果将某一事物过于量化、明确化,“那这件事情也就那样了,估计天花板在哪儿大家都能看得到了”。

  张鹏进一步表示,可以把AGI定义成一个目标,当前是以人为参照,让机器像人一样去思考是第一步。而机器的能力远不止人的水平,我们期待它能实现对人类能力的超越。下一步是能否产生超过人类智能水平的能力,行业则将不断对AGI的内涵和外延进行更新与迭代。

  王小川倾向于用一个可以评测的指标来看能造医生,就是AGI。他表示,过去在讨论AGI时,往往将其视为一种工具。然而,这次的第一个变化是,它开始具备思考、学习、沟通、共情的能力,甚至包括多模态图像处理的能力。从其学习范式的要求来看,我们反而是像看人一样看AGI。

  从当前共识的评价指标和学习范式来看,人工智能就是在向人类学习,其数据来源于人类社会产生的数据,因此在评价过程中,我们将其与人类职业进行比较。在所有职业中,医生行业的智力密度是相对最高的,既需要具备多模态能力,还要减少幻觉、有效记忆、阅读70万字的病例,具备推理能力和查阅文献能力等。在将医生与AGI进行比较时,有人认为,医生所涉及的领域仅仅是垂直细分市场,相对较低层次,但试图制造医生的难度却极大,其中涉及诸多幻觉问题、推理能力问题。如果将医生视为低于AGI,那么连医生都无法制造,何谈AGI的实现。

  李大海则表示,从经济学的角度去定义,如果执行任何一个任务,它的边际成本都为零,这就是理想中的AGI。“为什么我认为大模型能够走得最远?就是我相信大模型能够把这个边际成本一直往下降,可能会逼近于零。”然而,在此过程中,需要各行各业的数据产生“飞轮效应”,逐步使模型持续训练星空体育下载、持续学习,从而降低整体成本。实际上,去年在行业里大模型落地的过程中,许多场景仍需进行微调,边际成本较高。

  大模型的热潮让AGI的实现更加接近,但大模型是否是实现通用人工智能的“基石”?

  杨植麟坚定相信大模型的第一性原理,即Scaling Law(规模定律),他认为,规模定律确实本质上是“压缩”,但也确实可以产生智能,然后随着不断地去规模化模型,不断地做更好地压缩,它能产生越来越多的智能。

  与此同时,在过程中也一定会有很多挑战,杨植麟认为,最大的挑战或许在于某些领域数据的稀缺性。在数据量有限的领域解决数据稀缺的难题成为关键。或者如果要构建超越人类的AI,可能根本不存在相应的数据,因为目前的所有数据都由人类产生,因此解决不存在的数据难题成为关键。但是,规模定律或者大模型本身,没有太本质的问题。

  王小川则认为,说大模型是通向AGI的“基石”是没有问题的,但是“它只是在逼近AGI,但是光靠Scaling Law我理解(认为)是不够的”。

  王小川表示,在Scaling Law之外,还有一件事情被大家忽略,那就是将语言纳入大模型体系,使语言转化为数学。除了规模之外,符号与连接的融合,也是中间的一个环节。未来,还会有更多的东西,必须产生范式变革。例如,大模型是数据驱动的学习系统,而类似于AlphaGo这样的自我思考型系统,同样有作用。

  张鹏则认为,大模型是基石,但是不是“之一”则是另一个问题,所以这个问题其实也涉及怎么来定义AGI,“能不能真的像我们每个人心中定义的AGI那个路径上帮我们推进一步?大模型到目前为止还是很有效地在推进这件事情”。

  张鹏表示,目前,Scaling Law依旧有效,还在往前进,“但它是不是能帮助我们推到那个顶峰上去,我们现在也找不到很确切的答案,但至少我们相信它在这个阶段还是有效的,所以我认为它肯定是基石”。

  而在李大海看来,大模型一定是通往AGI方向上,当前所有技术里能走得最远的,它能不能够直接到达,现在还有很多未知的因素。

  他补充道,当前的大型模型主要作为知识压缩工具,处理人脑的系统1,即慢思考。而系统2,即快速推理,在搜索空间中进行搜索和组合,以完成任务的能力,未来大型模型可能需要通过Agent(智能代理)技术进行外部化,或将其内化为自身能力,这是行业内需要探索的方向。

  如需转载请与《每日经济新闻》报社联系。未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。

  特别提醒:如果我们使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。

  AGI,距离现实仅五年?阿尔特曼等科技领袖大胆预测,DeepMind提出6大原则

  Meta确认开源大模型LLaMA 3下个月登场,年底还将建成等同于60万个H100 GPU的“超级算力库” 大模界

  “百模大战”周年考国内大模型盘点:305个大模型发布,备案率约四成,如何寻找变现、破局之路

  “百模大战”周年考国内大模型盘点:305个大模型发布,备案率约四成,如何寻找变现、破局之路

  成都市跨境电子商务协会秘书长吴悦:成都跨境电商正从卖货物转向卖品牌和技术

  沙滩、瀑布、摩天轮......世园会主会场推出一系列“端午限定”版主题活动

  17岁中专女生姜萍,闯进全球数学竞赛12强!为什么没有读高中,老师解答!能否破格录取,浙大回应

  “00后”女生成为上市公司总裁,身家上亿!她毕业于哥伦比亚大学,26岁哥哥是董事长

  每经记者探访多地银行取款要求:大额取现多需提前预约,但资金来源正常、用途合理的取款不受影响星空体育手机版星空体育手机版星空体育手机版

TOP