模型大小怎么区分_大模型是什么_da模型

【摘要】知识图谱大模型本质上都是知识库,那么两者各有何优劣势,未来关系将如何发展?

【作者】郑金辉

大好的周末时光,刚要下班回家,接了一个客户的电话,咨询有关行业AI平台的相关问题,其中有一个关于“知识图谱与大模型关系”的问题,个人觉得比较有代表性,在这里做一个简要的梳理。

一、从认知智能的两种路径说起

我们都知道,人工智能的发展分为三个阶段:计算智能、感知智能、认知智能。计算智能大模型是什么,即快速计算和记忆存储能力。感知智能,即视觉、听觉、触觉等感知能力。认知智能,即理解、思考、推理等认知能力。我们现在已经迈进了认知智能的阶段,目前以多模态为主。

多模态认知智能,一般来说有两种实现路径。一是,多模态大模型;二是多模态知识工程。

多模态大模型,是典型的连接主义和经验主义的思想,从海量预训练数据中学习概率关联,是简单而鲁棒的,它属于统计学习范畴,具备端到端、干预少和“数”尽其用的优势,其劣势在于难以学习到从因到果、从主到次、从整体到部分、从概括到具体、从现象到本质、从具体到一般等逻辑关系。

另一种实现路径是多模态知识工程,其代表了符号主义的思想,从精选数据和专家知识中学习符号关联,是精细而脆弱的,它往往通过专家系统和知识图谱实现,具备易推理、可控、可干预、可解释的优点,但是它的劣势主要在于将数据转换成符号知识的过程往往伴随着巨大的信息损失,而其中隐性知识等难以表达的知识往往是信息损失的主体。多模态知识图谱是多模态知识工程的主要形式。

二、知识图谱与大模型的优劣势分析

两者本质上都是一种知识库。在实时性和时效性上面临的挑战一致,都需要面对事实性错误、时效性以及知识更新的问题。

知识图谱是知识的结构化表达,通过三元组与图网络建立起知识体系,结构清晰,查询简单,便于理解。大模型是利用海量语料,经过神经网络和深度学习大规模训练后,形成的巨量参数的语言模型大模型是什么,上下文感知能力、深层语义表示能力较强,主打通用性。

大模型的优点是:

而其不足之处在于:

而与之对应的,多模态知识图谱的优点是:

而多模态知识图谱的缺点在于:

由上分析可见,大模型的优点常常是多模态知识图谱的不足,而多模态大模型的不足又往往是多模态知识图谱的优势。因此,当前阶段,大模型与知识图谱仍应继续保持竞合关系,互相帮助,互为补充。

三、知识图谱与大模型的关系会如何发展?

1、知识图谱在一定时期内,不会被大模型替代

一是知识图谱是在现阶段有意义的,因为神经网络目前无法解决或者非常难以解决事实性准确的问题。目前因为 GPT4 这种胡编乱造的情况还是很严重的,远远达不到完美解决的阶段。它会一本正经的解释,贾宝玉为什么要葬花。

二是通用大模型的工业化落地,需要行业知识。真正落地到很多行业应用的时候,也是需要有专业领域知识的支撑,大模型训练语料里最为致命的一点是专业知识在大语料里边它占比非常少的,很难在训练里面把专业知识给学习出来,所以在一个具体的应用领域的它还是需要知识,至少短期内还是需要的。概率空间网络(不管是原来深度学习还是现在大模型)跟知识库或者知识图谱的结合是后续我们在行业实践的关键点。

2、相互促进,你中有我,我中有你

首先作为新生事物的大模型可以服务于传统知识谱图的构建。大模型可以帮助完成数据标注和数据增强,加速知识图谱的落地。无论是文本知识还是多模态知识都可以利用大模型,大幅提升知识抽取的效率,使得零样本、少样本、开放知识抽取成为可能。大模型在部分领域上拥有领域常识,可以辅助完成的半自动化设计,为知识融合扫清障碍,进一步协助更好完成知识更新。

然后反过来说,利用知识图谱中的知识构建测试集,可对大模型的生成能力进行各方面评估,降低事实性错误的发生概率,尽量别再出现“宝玉葬花”、“金莲倒拔垂杨柳”的笑话。再有,可以由知识图谱在大模型中引入指定约束,适度控制内容生成,提高大模型在行业场景中的适应能力。

总之,人工智能从通用走向行业,从实验室走向生产,需要大模型和知识图谱进一步携手,必将走出一条融合之路。

原题:浅谈知识图谱与大模型的关系

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注