CopyRight 2009-2020 © All Rights Reserved.版权所有: 中国海关未经授权禁止复制或建立镜像
构建人工智能应用能力 助力海关高质量发展
作者:刘宏志
文 / 刘宏志
数字化浪潮奔涌而来,以人工智能为代表的新技术正在颠覆我们的生产生活。面对数字新时代,如何重塑产业竞争优势,抢抓新一轮科技革命带来的发展新机遇,是各行各业的共同命题。在此背景下,海关领域积极采用高新技术设备应用和创新思维,推动海关智慧治理、边境协同治理、全球合作治理。
以“智能”之匙,开启新世界的大门
回顾我国海关的现代化建设历程,自20世纪80年代末开始,历经单项应用、系统化应用、跨地区联网应用、跨部委综合应用等发展阶段,海关信息化从无到有,基本建立了覆盖海关总署和各直属海关单位的办公网络,并通过数字化、自动化、智能化等试点建设积累了大量数据和经验,海关事业实现了跨越式发展,各项工作均取得了长足进步。
同时我们也清醒地看到,海关的现代化建设当前仍存在诸多挑战,如何加快搭建智慧海关建设的“四梁八柱”、如何用好改革和科技“双轮驱动”的新引擎、如何以科技创新驱动管理创新是我们所面对的关键问题。《“十四五”海关发展规划》明确提出,要以推动高质量发展为主题,以社会主义现代化海关建设为战略牵引,全面提升海关制度创新和治理能力建设水平,加快构建“全国海关一盘棋”的垂直管理优势和完善的海关监管体制机制,建成更高水平的智慧海关。近期海关总署在“三智”理念的指导下,加快推进智慧海关建设和“智关强国”行动,找准解决问题推动工作的关键点、结合点。
在众多要推进和解决的条线工作中,打造人工智能应用能力或将成为海关现代化建设能力跃升的关键抓手之一,AI大模型在海关领域的应用,契合智慧海关建设构建协同高效的现代化海关治理体系,强化数字赋能的现代化海关治理能力,推动海关高质量发展等方面要求,通过推进管理要素数据化,大力开展人工智能等算法模型研发,构建智能模型库等手段,可实现以大数据赋能风险防控、通关监管、税收征管、检验检疫等海关主要业务领域。
比如,外来物种识别、货物标签识别、检疫证书识别、危化品标识识别等海关常见场景均可在AI技术的支撑下进行智能辅助查验,但传统的AI模型仅针对固定的外来物种进行精准识别,当有新增时,模型需进行重新训练开发。借助泛化性强的AI大模型,则极大缩减了这种重复开发的工作,提升了平均精度和开发效率,并降低了使用门槛,进一步助力海关现代化建设迈上新台阶。再比如,随着国际经济格局的持续演变,全球治理体系正在进行深刻重塑,各类传统安全与非传统安全风险交织叠加,维护国门安全的形势更加严峻。作为全球第一大货物贸易国,我国海关以数字化转型为契机,以AI大模型为抓手,加快智慧海关建设,是顺应数字时代发展趋势,科学精准防范风险的必然路径。
科技赋能创新发展,构筑海关人工智能应用能力
相对传统的AI开发而言,大模型由于其模型结构复杂,参数量和数据量巨大,且需要持续迭代,从基础的硬件到算法、开发工具、调试、调优、部署等,每一步都存在大量的工程技术挑战,大模型开发到应用落地是极其复杂的系统工程。海关想要部署AI大模型,打开变革新局面,也需要解决平台建设、模型开发和推理部署三大挑战:其一,大模型无法在单卡或单机上执行训练,平台构建需要综合考虑计算、网络、存储、调度等系统的设计与优化;其二,在模型开发阶段,面临着模型结构如何设计、并行的策略如何制定、训练问题如何定位解决、稳定性如何保障等各种挑战;其三,在推理应用阶段,需要进行模型小型化,同时还要保障模型精度。目前,国内AI大模型市场百花齐放,已有近百种产品涌现,其中,昇腾AI是以昇腾AI基础软硬件平台为基础构建的人工智能计算产业,昇腾AI基础软硬件平台包括Atlas系列硬件、异构计算架构CANN、全场景AI框架昇思MindSpore、昇腾应用使能MindX以及“一站式”开发平台ModelArts等,帮助伙伴和开发者高效使用AI能力,创新场景化AI应用。面对AI大模型建设所需的大量高质量数据、强大算力、复杂算法、工程化方法和工具等,昇腾AI基于持续创新的根技术,可从集群硬件、基础软件等层面提供技术支撑,从训练开发到推理部署提供全流程平台原生力,并不断沉淀自身的大模型经验,将大模型的开发、微调和部署能力固化成系列套件。
一起“昇腾”,共促人工智能产业加速发展
在集群硬件上,昇腾AI结合华为“算、网、存、云、管”跨域协同经验,构筑全栈协同平台,支持参数面无阻塞RoCE组网,万亿参数无损交互。同时,昇腾AI集群采用全液冷方式散热,可实现大规模工程化部署,PUE≤1.15。面向大模型训练场景,通过多级可靠机制,可实现月级长稳训练,10倍级提升集群系统稳定性。在近期举办的昇腾人工智能产业高峰论坛上,昇腾AI集群全面升级,集群规模从最初的4000卡集群扩展至16000卡,是业界首个万卡AI集群,目前该集群已支撑了全国25个人工智能计算中心建设。
在基础软件上,昇腾AI提供了多维度的混合并行、多层级的存储优化、更敏捷的断点续训、更高效的推理引擎等能力,加速了大模型的高效开发和部署,可支持2000亿参数的大模型20天以上的稳定训练。据今年5月发布的《中国大模型地图研究报告》介绍,中国10亿参数以上的大模型,有30多个是基于昇腾AI原生开发及适配,包括GPT、GLM、LLAMA、讯飞星火等,覆盖NLP、多模态、语音等多个领域,昇腾AI支撑了近一半的中国大模型原生创新。昇腾AI秉持“硬件开放、软件开源、使能伙伴、发展人才”的理念,已联合30多家硬件伙伴、1200多家软件伙伴,孵化了2500多个AI解决方案。在技术生态上,已有300多家高校院所与昇腾AI合作,每年培养超过10万名专业AI人才,开发者已突破了180万人,昇腾AI的产业生态正在持续做强、做大。
面向未来,人工智能应用能力将成为海关现代化建设强有力的新引擎,助力智慧海关建设迈上新高度。
(作者单位:北京大学软件与微电子学院)