来源:中国信息通信研究院
日前,在“2022可信AI峰会”上,中国信息通信研究院云计算与大数据研究所所长何宝宏正式发布并解读了“2022 人工智能十大关键词”。
关键词一:大模型
大模型技术创新和工程落地齐头并进,掀起行业大模型落地热潮。大模型的更新迭代速度不断加快,开始从“可用”的基础大模型转向为“好用”的行业大模型。
在技术创新方面,大模型的网络构建、模型训练、算法调优等技术趋于成熟,持续提升其通用性和泛化性,已初步具备通用智能雏形。例如,近期开源的NLLB可支持200种语言的相互翻译。
在工程落地方面,已初步形成大模型As a Service的应用模式,加速向互联网、ICT、金融、政务等垂直行业渗透。为支撑应用方更便捷地开发和部署大模型,多家头部企业发布了行业大模型及开发工具。
关键词二:生成式AI
生成式AI开辟AI创作能力,加速AI与数据要素深度融合。近几年生成式AI的技术能力越来越成熟,可生成逼真且富有创意的多模态数据,形成自动写作、代码生成、数字人等典型的应用形态,已连续两年入选《人工智能技术成熟度曲线报告》。
在技术方面,生成式AI借助生成对抗学习等技术,能够生成更加真实、更有创意、更有趣味的内容。例如,2017至2022年,在图片生成权威榜单上,真实度和趣味度综合评分提升了近5倍。
在应用方面,生成式AI既是生产要素,也是生产工具。除了图像生成以外,在写作和编程等方面也取得进展。
关键词三:AI4S(AI for Science)
AI for Science在多个传统科学领域取得重大突破。随着人工智能技术的快速发展和大规模应用,AI在逐渐成为科学研究新的生产工具,AI4S将进一步释放科学研究的生产力,促进人工智能的工程落地。
一方面,AI与传统科学领域的深度融合,极大拓展该领域解决问题的能力,目前AI在生物、数学、材料、物理、基因、化学等基础科学领域都取得了诸多成果和突破,并对科学研究范式产生了深刻的影响,例如,目前人工智能已经能够预测几乎所有的生物蛋白质的可能结构,被誉为人类在21世纪取得的最重要的科学突破之一,可能开启“数字生物学”的新时代。
另一方面,传统科学领域的进步和对AI技术的需求加速了AI本身的发展。当前产学研共同发力人工智能与科学的融合,产业界聚焦工具创新,开源工具和基于开源工具产生的创新成果呈爆发趋势,AI4S的研究范围也扩展到了更多基础问题领域。高校和研究院聚焦算法和应用,用AI算法更好地将科学计算和物理模型相连接,进而指导科学与产业创新。
关键词四:知识驱动AI
知识驱动助力人工智能认知能力的提升,满足人工智能深入各个行业不同应用场景的需求。随着深度学习与知识图谱等多重技术的深度融合,综合利用大量知识数据中的因果和逻辑关系,可以助力人工智能认知能力的提升,来解决人工智能深入各个行业时场景复杂、可解释性较低等问题。
在技术方面,知识和数据双轮驱动的人工智能技术路线展现了强劲的发展潜力,知识的融合应用有效地提升了智能问答、智能推荐、大规模预训练模型等人工智能技术中的效果。文心大模型、孟子大模型等均尝试利用知识增强技术路线提升效果。
在应用方面,知识与人工智能的融合拓展了人工智能的应用范围,促进形成知识凝练、知识流转、知识赋能闭环,推动数字化发展下行业与企业各类知识的沉淀、流转,显著提升实际场景的智能应用水平。
关键词五:超级自动化
超级自动化已经成为企业即开即用、敏捷配置的数字化转型工具箱。经过一年多的发展,超级自动化有了很多新的价值。在概念深化方面,中国信息通信研究院在今年发布的《超级自动化技术与应用研究报告(2022)》中首次对其主要概念进行了深入剖析和理解,认为“超级自动化是多种技术能力与软件工具组合,覆盖了自动化从需求发现到应用实践的全流程”;在技术发展方面,机器人流程自动化、智能流程管理、低代码应用平台、流程挖掘等工具和平台,衔接起了企业级各类复杂业务场景,其综合应用、交互使能是超级自动化发挥效能的重要手段。
人工智能、大数据、云计算等技术作为底座,为超级自动化发展注入了源源不断的强大动力;在应用拓展方面,政府和企业使用超级自动化技术开始呈现出全面爆发的状态。例如,日本全面引入RPA实现政务的数字化转型,据统计各级政府的引入率已经超过90%。同时,产业创新层面,领先的RPA企业都不再局限于RPA或流程挖掘等单点能力的输出,而是围绕信通院提出的超级自动化技术与工具体系,开始由点及面的建立起立体服务架构。
关键词六:人工智能中台
人工智能中台重塑企业智能化转型的能力底座。随着企业从重视人工智能的“研发”,到“研发-运营”并重,AI开发平台也逐渐向AI中台演进。
理念层面,AI中台更加重视管理和运营,技术层面,AI中台高度集约了AI能力,具有规模化、标准化、可扩展等特点。其中,规模化是指整合了丰富的人工智能开发、部署、测试、运维等能力,标准化是指将异构的软硬件环境封装为标准化的界面,可扩展是指可以不断适配新的技术和工具,保证AI技术的动态演进。
通过与数据中台、云平台、业务中台、运营平台的打通,AI中台正在加速融入企业的技术平台体系中。当前阶段,大型的行业企业正在积极构建AI中台体系,通过高效的组织管理实践,推动全场景全领域的AI赋能。
关键词七:MLOps
MLOps落地开花,AI资产沉淀和治理成为实践新风向。随着业界对人工智能研发效率、团队协作、安全保障等需求进一步提升,整个MLOps产业实践呈现出“内涵很明确、落地很困难”的现状。
从技术内涵来看, MLOps的核心和要求已明确,即围绕“一个基础、两个关键、三个提升”,逐步建设从需求、开发、交付到模型运营的全生命周期运营管理机制。一个基础是指持续交付,通过搭建工厂流水线式的模型生产方式,提高规模化生产效率。许多头部企业都已开始实践模式的持续交付,部分企业模型研发效率提升超过40%。两个关键是指持续训练和持续监控,通过持续训练和持续监控搭建高效闭环的运营管理体系,提高机器学习可观察性,保证模型质量,增加赋能效果。
三个提升是指数据管理、特征管理、模型管理能力的提升。对数据、特征和模型等AI资产加以沉淀、安全管控和风险治理,提升企业级AI治理能力,已成为MLOps新风向。
从落地现状来看,持续交付、持续训练、持续监控和模型治理难度依次提升,产业界当前尚处在提升持续交付和持续监控能力过程中,模型治理等仅有少量探索,未来仍然是AI工程化的重点方向。
此外,MLOps的工具市场持续火热,端到端的MLOps一体化工具和细分场景的专项工具都非常火热,端到端工具追求大而全的功能集,专项工具在局部或某些场景下功能和性能较好,例如流水线编排、模型监控、特征存储、可观测等工具,未来MLOps相关工具可能会成为AI软件市场的重要赛道。
关键词八:人工智能新基建
AI软件设施加速新基建的赋能效应。自2018年新基建的概念提出以来,政产学研用多方主体发力建设人工智能基础设施,AI新基建的内涵也在这个过程中逐步明晰。
AI新基建主要包括数据基础设施、算力基础设施和AI软件设施。数据和算力基础设施非常重要,但是如果没有软件设施作为连接枢纽,则难以充分发挥人工智能的赋能效应,支撑起丰富的AI应用和服务。
因此,AI软件设施在近两年成为产业焦点,AI开源框架生态、预训练大模型体系、AI软件平台生态等内容都得到了长足的发展。
AI新基建的愿景是让AI像水、电一样成为触手可得的普惠资源:政策层面,国家以及各行业的“十四五”规划相继对人工智能新基建提出指导意见,不断推动新基建的落地应用;产业层面,头部科技企业联合地方政府,积极建设运营区域性基础设施,不断加速AI生态的培育。
关键词九:企业智能
企业智能化建设手段与方法实现全新变革,逐渐向全场景、全流程、全层级深度融合应用转变。随着智能化技术的不断发展和应用深入,企业智能建设从部分场景、外部维护、单点优化逐渐向系统化、全面化转变,通过智能基础设施和智能应用双驱重塑企业智能化发展势能。
一方面,企业建设完善人工智能中台、知识中台、大模型等智能基础设施,筑牢了企业智能的底座、打造了企业的知识大脑、拓宽了企业的全新赛道,整体上夯实了企业智能化发展的根基。例如国有六大银行、电力、石油等大型央企都已经建设了各类智能基础设施,并依托该设施为企业的智能转型提供支持。
另一方面,智能文档处理、智能会议、知识管理、智能客服等各类企业智能应用不断发展,全面赋能企业办公、管理、决策、风控、营销、服务等各个环节,促进业务的数据化与知识化、工作流程的信息化与智能化。智能基础设施和智能应用相辅相成,智能基础设施促进智能应用的敏捷高效,智能应用助推智能基础设施底座的升级优化,共同推动企业智能化的加速发展。
关键词十:可信落地
可信AI由理论研究迈向工程化落地。随着人工智能技术的快速发展,社会各界对可信AI研究已经从理论探索逐步走向工程化落地实践。政府与研究机构相关政策和规范从宏观指导,开始向可操作、可落地的规范演进。在法律监管层面,各政府部门的法规政策愈发重视实施和操作。例如新加坡于5月出台世界首个AI治理测试框架及工具包;英国6月宣布首个人工智能伦理和监管的重大研究计划。
在行业可信实践层面,各国研究机构纷纷开展可信AI技术研究及标准制定工作,为业界提供评估准则并聚焦准入落地。如英国BSI与艾伦图灵实验室合作开发技术标准改善人工智能治理,美国NIST发布《人工智能偏差识别和管理标准》和《AI风险管理框架(草案)》,为企业和机构的AI风险管理提供了大量可参考的要求和指导。
在企业可信实践层面,产业界从企业战略管理和技术工具研发创新双线并进,加速了可信AI在企业的落地实践。如头部科技企业先后发布了AI治理战略和治理体系,成立了相关委员会和工作组,聚焦企业层面的AI治理和风险管理体系。同时可信AI技术和保障工具也在蓬勃发展,各大企业积极研发可信产品应用,也开源了一批聚焦隐私性、鲁棒性、安全性、可解释性、公平性等可信能力的测试工具。