CopyRight 2009-2020 © All Rights Reserved.版权所有: 中国海关未经授权禁止复制或建立镜像
大数据背景下构建先期机检历史图像库的设想
作者:张逸雷 陆林 王超 孟凯
文 / 张逸雷 陆林 王超 孟凯
先期机检是海关基于“提高口岸检查覆盖面与减轻人力资源成本负荷”这一矛盾推出的新型口岸监管模式,在扩大监管覆盖面、筑牢国门安全屏障的同时,先期机检也成为海关有效积累数据资源的手段,以年均20万张的机检图像与相关的舱单、报关单信息相结合,围绕机检图像“海量、真实、标准、多样”的特点,构建先期机检历史图像库可以有效提升风险防控精准度和智能审图准确性。
青岛海关是最早开展先期机检模式研究的海关,目前关区内共有13台H986接入先期机检系统,先期机检不仅是对安全准入风险的初筛,而且已经成为海关收集影像数据的重要手段。在大数据对数字治理的支撑作用日益凸显的背景下,如何利用好先期机检积累的图像资源,更好地发挥数据价值?构建先期机检历史图像库势在必行。
先期机检成效及特点
海运口岸先期机检是指在口岸关键物流通道上部署H986设备,集装箱货物抵港通过物流通道时顺势进行机检的监管方式,它消除了传统查验在通关时效、物流成本及查验场地、人力配置等制约因素的影响,有效提升海关监管覆盖范围。仅2022年第一季度,青岛海关先期机检就移交布控线索51条,有效查获情事15起,其中查获固体废物199.4吨。
先期机检凭借低成本和广覆盖的优势,已成为海关收集影像数据的主要手段。在不到3年的时间里,青岛海关共积累先期机检图像50余万幅,这些图像积量成势,将成为海关宝贵的数据资产和监管资源。
先期机检历史图像应用优势
先期机检历史图像够“海量”
2020年,青岛关区先期机检共检查集装箱23万箱,2021年达到26.1万箱,个别口岸可以做到进口重箱量的50%,甚至100%,同期传统货运机检布控的过机量约为先期机检的1/4。海量图像资源是后期分析利用的基础条件。
先期机检历史图像够“真实”
H986图像的“真实”体现在两个方面,一是它直接反映了集装箱内货物的真实情况,与实货紧密相连;二是作为海关自产数据,数据来源可靠,较企业申报数据有更高可信度。
先期机检历史图像够“标准”
机检图像与查管单兵中拍摄的照片信息不同,不会受拍摄角度、光线、对焦点的影响,即便H986设备的生产商不同,生成的图像都具有相当的“标准”度,这有利于人工智能对图像数据的提取和分析。
先期机检历史图像够“多样”
先期机检历史图像的另一显著优势是具有大数据应用所必须的多样性,特别是对口岸进出口货物高比率覆盖后,可以形成种类齐全的商品、企业资料库供后期利用。
先期机检历史图像库的应用场景
提升海关风险判别能力
H986应用的集装箱货运渠道和CT应用的快件渠道相比,具有进出口企业相对稳定的优势,特别是生产型企业进口原材料和出口成品具备一定延续性。如果将即时机检图像和该企业的历史机检图像进行比对,可以提高风险判别的准确度。
如某企业在一段时间内进口同一种商品,留下一定数量的图像,特别是有一票“机检+人工”查验后,人工查验人员对货物品名等进行了实货确认,则一旦新的过机图像与历史图像高度相似就可以避免重复布控或以非侵入的方式快速放行,海关监管就可以从“查得出”和“放得快”两个方面共同发力。
图像信息和舱单、报关单关联后,也有助于风险部门开展对特定企业的风险筛查,形成特定企业直观的“视觉档案”。如在口岸检查中人工核实异常后,可以根据历史图像进行倒查,加强海关后续监管。同时,也有助于厘清舱单中体现的贸易商和报关单中体现的进口商之间的贸易关联,排除其中蕴含的伪瞒报风险。
推动智能审图算法学习评估
构建历史图像库后,多样的商品种类可以供智能审图进行标图学习。特别是增加企业维度后,可以实现针对特定企业、特定商品的小规模算法学习,有利于以企业的有限性弥补商品的无限性,进一步提高智能审图有效性。
构建先期机检历史图像库,还有助于开展智能审图算法评估。使用历史图像资源构建科学完备的智能审图图像评估池,实际就是搭建了智能审图算法评估的实验室环境,在现场监管的评估中相对不容易实现的漏报率等评估,可以利用该实验室环境进行基础验证,得到的评估结论将减少人为因素干扰且效率更高。
先期机检图像应用面临的困境
数据整理、清洗不规范
先期机检审核图像时,相关报关单信息可能尚未申报,尚不能达到大数据应用的要求。建立标准、规范的先期机检历史图像库,需要将图像、舱单和后期申报的报关单匹配,并根据审核结论对捆绑错误的图像清洗,然后形成干净、清洁、完备的历史图像库,目前在后期数据关联、无效数据清洗配套机制、技术支持方面尚待完善。
数据存储、应用缺乏路径支撑
先期机检尚未实现全国范围的互联互通,数据利用率还不高,本地存储体积较大。构建先期机检历史图像库应着眼未来,从技术层面设计数据库、图像存储的空间关系,利用“云技术”、分布式存储等构建全国性存储调用体系,满足安全、易用、好用的总要求。
构建先期机检历史图像库的几个设想
业务方面构建“采集、验核、应用”同向发力的格局
加强图像采集:一是继续扩大先期机检试点,拓展常规图像采集渠道;二是增加特定图像的采集深度,应加强风险部门对数据库构建的驱动力,对特定商品、特定企业开展针对性过机,在不增加企业成本的情况下满足海关数据需要,使数据库更完备、更科学;三是汇总其他图像资源,将联网集中审像与先期机检图像互通并联,推进先期机检与货运机检图像库整合。
加强图像准确度验核:一是加强智能审图和人工审图对审像任务的验核,完成对图像准确度的初筛;二是对图像无法明确的信息,可由风险部门下达人工查验指令,通过人工查验确认图像与实货的真实关系;三是开拓先期机检智能审图标图渠道,通过标图提升图像数据准确度。
加强历史图像库应用:一是完善数据授权,强化数据安全管理;二是建设历史图像库基础查询功能,可根据企业、商品、HS编码、原产国等检索项对数据库进行检索并提取相应信息;三是支持风险部门与智能审图研发部门扩大数据应用场景。
技术方面搭建“前端、中台、算法”协同推进的体系
前端应用方面,加快先期机检系统优化和总署版系统部署,进一步完善先期机检选箱系统,在高覆盖率随机布控之外,提高定向选箱能力,提升查管系统、风控系统与历史图像库的有机互联,满足关员第一时间的查询调取需求。推动先期机检系统与码头生产系统开展高水平交互,满足企业快速过机需求。
数据中台方面,打通图像库、舱单库、报关单库等系统的连接障碍和直属海关间先期机检数据的传输障碍,利用分布式数据库、云存储等技术提升海关机检图像结构化管理水平,不断提高先期机检历史图像库的可追溯性、可持续性、完整性和真实性。
算法构建方面,提升智能审图算法、风险模型的底层支持,提升中国海关数据应用的核心竞争力。加快智能审图算法研发,在禁限类商品、可识别商品之外继续增加算法层数,在与报关单信息结合增加智能审图精确度之外,探索针对图像本身的复杂度算法、图像秤算法和RM算法。利用先期机检图像继续增强风险模型研究,有效提取高风险单证和高风险企业,完善监管全链条。
(作者单位:青岛海关)
栏目编辑:王国秀 34655075@qq.com