大模型的定位：智能决策还是辅助工具？

2024-07-08 14:15:58 | 作者：来源：互联网

【编者按】7月4日，2024世界人工智能大会暨人工智能全球治理高级别会议在上海开幕，深圳计算科学研究院首席科学家樊文飞院士应邀出席，在中信集团承办...

7月4日，2024世界人工智能大会暨人工智能全球治理高级别会议在上海开幕，深圳计算科学研究院首席科学家樊文飞院士应邀出席，在中信集团承办的投融资主题论坛发表了“AI=机器学习+逻辑推理”的主旨演讲，和与会嘉宾分享了AI领域前沿趋势和在垂直领域应用的重大机遇。

大模型——挑战与机遇并存

樊文飞院士指出，通用大模型推动了行业的变革，引起社会的广泛关注，但也存在局限性。做为辅助工具，大模型表现优异；但在智能制造的应用前景还有待观察。当下的大语言模型是基于统计类的机器学习模型，无法满足结果的可解释，且无法同时满足模型的“准确性”“公平性”和“鲁棒性”要求，逻辑推理能力不强，训练成本高（算力、数据、能耗），而且经常产生“幻觉” (hallucination)。可否应用大模型在生产关键环节做出实时“决策”，解决行业痛点，提高生产效率？如何确保大模型在智能制造决策中的准确性和可靠性？如何减少它们所产生的幻觉？能否增强机器学习的逻辑推理能力？所以要讨论大模型的远景，首先要确定大模型的定位，不能企望大模型做到其所不能。

如何在工业界发挥人工智能的效能，解决行业痛点，是业界需要关注和解决的一项重大机遇和挑战。在解决行业痛点问题时，大模型是否最优解？能否找到成本低、高精度、易解释的方法，为行业痛点提供实时解决方案？

以“AI+”的自动化、高精度、可解释、低成本赋能工业界

在人工智能技术的发展大潮中，中国应发挥在制造业规模大、垂直领域数据积累多等优势。樊文飞院士提出：以“机器学习+逻辑推理”的“AI+”发展思路，在提高模型结果准确度的同时赋予结果可解释性；与此同时，通过逻辑规则融入行业（小）模型预测，大幅降低模型的落地成本。深算院通过独创的机器学习模型与业务逻辑规则的高效结合，研发填补国际空白的钓鱼城数据分析系统，并衍生出生产工艺、配方优化、网络安全、新药研发、金融风控、精准推荐等行业的AI应用创新，均已上线应用。如在动力电池制造行业，助力头部企业在保证误差率0.06%-0.01%的同时，缩短80%化成分容生产周期，降低50%能耗，单条产线节省上千万设备成本，每GWh产能年节省上百万元电费，并可扩展优化更多工艺环节。钓鱼城系统已证明可以实现实时决策、精准解释、自动适配，并在算力不足、训练样本较少的情况下，得到远超大模型的精度，解决许多行业痛点。

语料准备与算力同等重要

樊文飞院士表示，目前社会广泛聚焦的是大模型以及与其相关的算力，忽视了大模型训练必需的语料准备这一关键环节。大模型的精度和可用性取决于所训练的语料数据，如果致力于打造一个具备产线实时应用的大模型决策系统，那么语料清洗的重要性和算力同等重要。基于“大数据质量保证模型与方法”原创理论，深算院研发的采石矶数据质量系统，为上海数据交易所的数据评估和数据交易流程提供底层能力支撑，落地国内首创的大数据精准量化质量评估，实现了自动化的数据质量评估和数据质量增强，真正打通数据要素进入流通的关键节点。下一步将继续为大模型的训练提供优质的语料数据和行业调优数据，以提升行业大模型的准确性。

走出国产基础软件的“寒冬”

重要性不亚于大模型的是标准化基础软件的研发。目前芯片受制于人。如果开源软件被禁用，中国的大模型发展将何去何从？所以坚持自主源头创新和自研根技术，才能推动中国软件行业真正走出受制于人的困境。例如，深算院以有界计算、跨模计算等创新理论，研发出全自研满足AI场景需求的崖山数据库系统，实现与国际主流数据库在高端场景提供1：1的平替能力，在中国人民银行数字货币场景，通过反复数十万次的故障和高可用测试，故障恢复和数据一致性得到强保证，在兼容、功能、故障、运维、备份、安全、性能等维度，满足数字货币场景对数据库的业务诉求。

: 三言智创(北京)咨询有限公司企业文化

深度专题

企业文化的精髓

阅读详细

大模型的定位：智能决策还是辅助工具？

快讯

三言智创(北京)咨询有限公司企业文化

深度专题

免责声明