大模型的定位:智能决策还是辅助工具?

2024-07-08 14:15:58 | 作者: 来源:互联网

【编者按】7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议在上海开幕,深圳计算科学研究院首席科学家樊文飞院士应邀出席,在中信集团承办...

7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议在上海开幕,深圳计算科学研究院首席科学家樊文飞院士应邀出席,在中信集团承办的投融资主题论坛发表了“AI=机器学习+逻辑推理”的主旨演讲,和与会嘉宾分享了AI领域前沿趋势和在垂直领域应用的重大机遇

大模型——挑战与机遇并存

樊文飞院士指出,通用大模型推动了行业的变革,引起社会的广泛关注,但也存在局限性。做为辅助工具,大模型表现优异;但在智能制造的应用前景还有待观察。当下的大语言模型是基于统计类的机器学习模型,无法满足结果的可解释,且无法同时满足模型的“准确性”“公平性”“鲁棒性”要求,逻辑推理能力不强,训练成本高(算力、数据、能耗),而且经常产生“幻觉” (hallucination)。可否应用大模型在生产关键环节做出实时“决策”,解决行业痛点,提高生产效率?如何确保大模型在智能制造决策中的准确性和可靠性?如何减少它们所产生的幻觉?能否增强机器学习的逻辑推理能力?所以要讨论大模型的远景,首先要确定大模型的定位,不能企望大模型做到其所不能。

如何在工业界发挥人工智能的效能,解决行业痛点,是业界需要关注和解决的一项重大机遇和挑战。在解决行业痛点问题时,大模型是否最优解?能否找到成本低、高精度、易解释的方法,为行业痛点提供实时解决方案?

以“AI+”的自动化、高精度、可解释、低成本赋能工业界

在人工智能技术的发展大潮中,中国应发挥在制造业规模大、垂直领域数据积累多等优势。樊文飞院士提出:以“机器学习+逻辑推理”的“AI+”发展思路,在提高模型结果准确度的同时赋予结果可解释性;与此同时,通过逻辑规则融入行业(小)模型预测,大幅降低模型的落地成本。深算院通过独创的机器学习模型与业务逻辑规则的高效结合,研发填补国际空白的钓鱼城数据分析系统,并衍生出生产工艺、配方优化、网络安全、新药研发、金融风控、精准推荐等行业的AI应用创新,均已上线应用。如在动力电池制造行业,助力头部企业在保证误差率0.06%-0.01%的同时,缩短80%化成分容生产周期,降低50%能耗,单条产线节省上千万设备成本,每GWh产能年节省上百万元电费,并可扩展优化更多工艺环节。钓鱼城系统已证明可以实现实时决策、精准解释、自动适配,并在算力不足、训练样本少的情况下,得到远超大模型的精度,解决许多行业痛点。

语料准备与算力同等重要

文飞院士表示,目前社会广泛聚焦的是大模型以及与其相关的算力,忽视了大模型训练必需的语料准备这一关键环节。大模型的精度和可用性取决于所训练的语料数据,如果致力于打造一个具备产线实时应用的大模型决策系统,那么语料清洗的重要性和算力同等重要。基于“大数据质量保证模型与方法”原创理论,深算院研发的采石矶数据质量系统,为上海数据交易所的数据评估和数据交易流程提供底层能力支撑,落地国内首创的大数据精准量化质量评估,实现了自动化的数据质量评估和数据质量增强,真正打通数据要素进入流通的关键节点。下一步将继续为大模型的训练提供优质的语料数据和行业调优数据,以提升行业大模型的准确性。

走出国产基础软件的“寒冬

重要性不亚于大模型的是标准化基础软件的研发。目前芯片受制于人。如果开源软件被禁用,中国的大模型发展将何去何从?所以坚持自主源头创新和自研根技术,才能推动中国软件行业真正走出受制于人的困境。例如,深算院以有界计算、跨模计算等创新理论,研发出全自研满足AI场景需求的崖山数据库系统,实现与国际主流数据库在高端场景提供1:1的平替能力,在中国人民银行数字货币场景,通过反复数十万次的故障和高可用测试,故障恢复和数据一致性得到强保证,在兼容、功能、故障、运维、备份、安全、性能等维度,满足数字货币场景对数据库的业务诉求。

 

更多

快讯

三言智创(北京)咨询有限公司企业文化