CopyRight 2009-2020 © All Rights Reserved.版权所有: 中国海关未经授权禁止复制或建立镜像
深度学习背景下海关动植物检疫风险源智能识别优化研究
作者:娄宸钦
文 / 娄宸钦
国门生物安全不仅是海关要务,更是社会要事、国之大事,关系亿万人民的生命健康安全。濒危野生动植物保护以及守护国门安全(尤其是防范生物入侵)是海关的重要使命。我国海关一直致力于行邮物品查验的优化升级,已基本实现动植物及其产品从“人工判图”到“智能判图”的转变,部分关区已初步实现了智能审图系统深度学习下的算法优化。2022年,由美国OpenAI公司研发的、基于神经网络架构的ChatGPT火遍全球,预示着未来各应用领域的人工智能潮的到来。
因此,开展深度学习背景下海关动植物检疫风险源智能识别优化研究,尤其是基于ChatGPT模式的思考和感悟,为我国海关的行邮渠道动植物检疫风险查验环节总结经验并提出相应的建议,具有与时代共振的重要意义。
国内外海关智能识别发展与现状研究
外国海关智能识别——以美国为例
海关领域首先应用人工智能技术的国家是美国,美国海关和边境保护局(以下简称“CBP”)早在20世纪90年代就开始研究和开发人工智能技术。
如今,美国海关已经建成一个完整的智能体系,例如CBP已经部署了一种名为自动化商业环境(Automated Commercial Environment,ACE)的自动化系统,该系统可以使用机器学习算法来自动检测和识别高风险货物。近年来,CBP还引入了机器学习算法和计算机视觉技术对Beagle Brigade项目进行升级,通过自动化图像识别技术和机器学习算法来加速识别和分类。CBP还开发了一些在线工具,如进口执法数据挖掘(Import Enforcement Data Mining System,IPEDS),用于自动化处理和分析进口数据和文件,帮助检疫员快速准确地评估进口货物的风险,并及时采取相应的措施。
我国海关智能识别
我国人工智能技术发展乃至在海关领域的应用虽然相较于欧美等发达国家略晚,但发展十分迅速,现已基本处于国际领先水平。海关总署与清华大学联合攻关的重要科技成果——“智能审图”系统,结合双能X射线CT技术和螺旋CT扫描技术,成为动植物检疫专用的智能查验系统,着重解决了与动植物检疫相匹配的关键技术问题。
海关智能审图率先将人工智能技术引入海关监管领域。以广州海关为例,2022年以来新增有效识别商品198种,“智能审图”可识别商品的覆盖面已由2021年应用之初的6.35%扩展到目前的86.65%,这意味着大部分进出口货物都可由“智能审图”系统进行辅助识别判定。
基于深度学习技术运用现状的问题分析
深度学习技术在海关领域的运用优势
首先,深度学习技术可以用于动植物产品的图像分类和识别。通过训练深度神经网络模型,可以将海关检疫行邮渠道中的动植物产品进行自动识别和分类,进而有效区分出受监管的植物和动物物种,帮助海关关员快速鉴别潜在的风险。
其次,深度学习技术可以用于识别病虫害。植物病虫害严重威胁农业生产,且往往通过行邮等渠道传播。利用深度学习技术,可以对动植物产品进行病虫害的自动识别。通过分析图像中的异常模式和病害特征,深度学习模型可以帮助海关关员及时发现携带病虫害的物品,减少病虫害的传播风险。
此外,深度学习技术还可以用于行邮物品的风险评估和筛查。通过深度学习模型对大量数据进行分析和建模,可以建立起行风险评估模型。该模型可以根据物种的属性、来源、历史数据等进行风险预测,并自动识别高风险物品。这有助于海关关员节省查验时间,提高查验效率。
海关运用的实地考察
在针对某海关行邮查验的实地调查分析中,我们考察了海关查验点,并与海关关员进行了面对面的交谈,了解到深度学习技术在海关行邮查验中的应用呈现出许多积极的迹象,但也存在需进一步完善的问题。
首先,高分辨率相机和非侵入式X光扫描仪已用于获取和处理行邮物品的图像和数据,以支持后续的检疫工作。这些设备可以使海关人员更准确地识别和检测携带动植物产品的包裹,并及时采取相应措施。
其次,海关在行邮查验过程中已应用到深度学习技术。通过应用深度学习算法和模型,海关能够对行邮物品进行分类和识别,尤其对涉及动植物产品和病虫害的物品进行识别和风险评估。这种技术的应用极大地提高了查验效率和准确性,但目前仍不太完善。
此外,目前存在的主要问题是数据的质量和标注的准确性有待提高。由于海关查验涉及大量不同类型的动植物品种,收集和构建高质量的数据集是一项巨大的挑战。与此同时,部分物种的外观相似度较高,识别和分类的准确性也需要进一步提升。
问题分析
首先,人工查验流程存在瓶颈。当非侵入式查验发现可疑物品时或是短时间内需要查验的物品超过机检上限时,就需要人工开封查验,而高峰时段查验关员不足以及在这个阶段中设备只是提示异常而判断主导权在人,会导致快速通关和准确判断无法兼顾。
其次,数据记录信息的共享障碍。各个海关查验点的数据记录和信息共享存在不便,在部分海关查验环节深度学习模型中新增的可疑点或删去的判断标准无法第一时间和其他海关共享,不同地区海关行邮查验标准不同,存在潜在的风险点。
再次,对关员相关能力的复杂要求与现状的冲突。调查发现,对可疑或抽检的行邮物品进行查验时,由于部分关员对最新的动植物种类和病虫害信息了解不足,会导致误判和错判。
最后,风险点过分集中在查验环节。由于行邮物品尤其是行李物品有很多零散小件分布,目前很难做到像货物查验那样的“前推后移”,将风险分摊。非侵入式查验和深度学习技术结合虽然可以达到很好的预警效果,但无法做到百分百精确判断。
优化建议
灵活数据集建设与共享
海关可以与农业、生态环境等相关部门合作,建立共享的动植物和病虫害数据库,将这些数据集整合,形成一个丰富和多样化的训练集,以支持深度学习模型的训练和优化。
对重点风险人员标记和事后追踪
运用大数据处理技术和深度学习技术,对曾经在海关查验环节有前科的个人或邮件收发人进行分类和标记,分级存档,下次通关时重点监控,实现一定程度的风险“后移”。
强化风险预警系统
风控之要,唯在预防。结合深度学习技术和大数据分析,建立海关动植物查验风险预警系统。该系统可以自动分析和处理各类数据,如行邮记录、物流信息和关键词匹配等,在查验前发现标记高风险物品和潜在问题,提供针对性的查验措施,实现一定程度的风险“前推”。
优化检疫设备和技术
对于大规模的动植物查验工作,引入先进的图像采集设备和自动化技术。例如,使用高分辨率相机和三维成像技术,结合深度学习模型,实现对动植物的精确识别。
专业培训与知识共享
加强海关关员的专业培训,提高对深度学习技术的理解和运用能力。同时,建立知识共享和经验交流平台,促进海关与相关科研机构之间的沟通和合作,共同推动动植物查验领域的研究和发展。
深度学习模型的本地化
针对本地动植物的特点和国内监管标准,优先选择或开发相应的深度学习模型,提高模型的适应性和准确性,提升与查验实践的契合度。在中国海关行邮查验领域,深度学习模型的本地化通常包括以下几个方面:
1. 数据本地化。包括当地常见的进出口物种、可能的违禁品、海关规定等信息。
2. 模型调整。包括调整模型的架构、超参数、训练集等。
3. 语言本地化。包括模型的界面语言、输出结果的语言等。
4. 算法本地化。考虑到中国海关场景可能存在的特殊情况,如人口密集的口岸、高速流量的物品检查等,需要对算法进行相应的优化和调整,其框图如左所示:
搭建“海关ChatGPT”
ChatGPT模式在优化海关行邮查验领域具有一定的潜力,尤其是可以与深度学习技术结合进行风险“前推后移”的优化,具体方面包括:
1. 自动识别问题和建议解决方案:可以创建一个智能问答系统,用于回答海关关员的问题,帮助他们更快地解决特殊情况或难以分类的物种,提供关于如何处理潜在风险的建议。
2. 培训与知识传递:用于开发培训和知识传递工具,为海关关员提供查验和风险评估方面的基础知识,确保关员具备必要的知识和技能,并能高效地执行任务。
3. 多语言支持:用于协助关员与来自不同国家和地区的人员进行交流,提高信息传递和沟通的效率。
4. 自动化和智能化决策:与深度学习模型集成,用于自动化决策。通过分析扫描的物种图像和相关数据,自动识别可能的风险,减少人工干预的需求,并确保一致性和准确性。
5. 实时风险评估:用于开发实时风险评估工具,允许海关关员快速评估包裹的潜在风险。
6. 改善客户服务: 用于提供更高效的客户服务,如回答常见问题、处理投诉并提供及时的信息。
(本论文受上海海关学院大学生创新创业训练计划项目经费支持)
(作者单位:上海海关学院)
① 输入数据(Input Data)
涵盖了从各海关行邮查验中收集的各种数据,例如X光扫描图像、包裹上的标签信息、货物描述
② 数据预处理(Data Preprocessing)
对输入数据进行本地化预处理,包括中文字符的编码处理、数据清洗、图像增强等,以确保数据适应于后续处理步骤
③ 本地化特征提取(Localized Feature Extraction)
根据我国海关行邮查验的实际情况,提取本地化特征。包括针对进出口物品的特点,提取更具代表性的特征,例如特定形状的物体、特定的包装方式
④ 本地化深度学习架构(Localized Deep Learning Architecture)
针对我国海关行邮查验的需求和特点,设计本地化的深度学习架构。包括对现有的深度学习模型进行改进,以适应实际需求,例如增加适应性学习机制、引入多任务学习
⑤本地化和创新(Localization and Innovation)
对我国海关行邮查验领域的特定问题进行本地化处理,并引入创新的方法和技术。例如,针对可能面临的特殊场景和难点,引入适应性算法优化、基于知识图谱的数据增强等创新方法
⑥ 海关查验输出(Output for Customs Inspection)
模型的最终输出,包括检测到的物品类别、风险评估结果、可能的违禁品提示等信息,便于海关关员进行查验