摘 要 伴随数据增列为第五生产要素与生成式人工智能 (artificial intelligence ,AI)技术的跨越式突破,数据和AI进入融合共生的剧烈变革期,“数据+AI”深度交叉融合成为各行业的研究焦点。针对二者协同机制的解析不足,探讨其双向赋能的机制与实践路径,旨在为AI快速迭代升级、数据要素价值加速释放及行业智能服务发展落地提供理论支撑与实证支持。从数据赋能AI和AI赋能数据维度阐释其双向协同机制,二者关系从单向依赖转为双向深度协同发展,形成良性互动循环,进入由应用驱动的融合发展阶段。在实践层面,以国家农业图书馆为例,提出“数据+AI”基础设施布局与建设响应策略,规划出高质量知识底座-全链条智能引擎-多元场景服务为核心的实践路径,最终形成“数据-模型-应用”的智慧飞轮效应。基于以数据为中心的AI开发范式,强调高质量大数据和小数据互补性建设,协同进化大模型通用能力和小模型专用能力,深化双向赋能一体化机制,助力智能化应用场景高效落地。
关键词 生成式AI; 数据要素; 赋能机制; 以数据为中心; 数智融合;农知大模型
2023年被称作生成式预训练对话模型(chat generative pre-trained transformer,ChatGPT)元年。以ChatGPT为代表的生成式人工智能 (artificial intelligence,AI)大模型的涌现标志着AI进入了认知智能阶段,智能范式从依赖专用小模型的手工作坊时代转向通用大模型为核心的工业化时代。这一转型背后是模型架构、参数规模、训练数据及训练方法等多方面的实质性突破。2024年,政府工作报告中提出,开展“人工智能+(AI+)”行动,旨在打造具有国际竞争力的数字产业集群。“AI+X”融合服务新模式通过融合AI技术与多元应用场景,已在智能对话、信息检索、医疗健康、智能驾驶、内容生成和教育赋能等关键领域呈现爆发式增长态势,成为各行业数字化智能化转型升级的核心驱动力。 支撑这一转型的底层逻辑正是“大算力+大数据+大模型”架构模式的成熟。当前,算力与算法的演进逐渐收敛,AI能力突破的本质在于从数据中学习获取并应用知识能力的大幅提升,由量变积累实现质的飞跃。越来越多的研究和实践开始转向“以数据为中心”的方法,强调通过系统化优化数据质量、数量和多样性来提升AI系统的整体表现。尤其是在GPT(generative pre-trained transformer)模式下,专业正版数据或垂直行业私域数据与大模型通用能力的结合至关重要。数据作为继土地、劳动力、技术和资本后的第五大生产要素,正通过“数据要素×”行动在不同场景中释放乘数效应,同时AI技术也反向赋能数据质量与供给能力提升,助力数据“供得出、流得动、用得好”,进而催生新产业、新业态、新模式、新应用、新治理,形成数据要素与AI的双向赋能闭环。


