随着“智慧公安”建设的推进,各地公安机关依托“大数据”“云计算”“物联网”等新技术,积极推动警务模式从传统“粗放型”向“精准型”转变。在此过程中,以数据建模和分析为核心的智能分析研判无疑占有突出重要的位子。以XX公安机关为例,目前XX公安机关已开发了七百多个数据模型并投入到公安实战应用中,但是在模型的建设和应用过程中仍有一些问题和薄弱环节。
一、当前数据模型建设过程中存在的主要问题
(一)数据质量不高
如果说蛋白质、淀粉、维生素是人体不可或缺的养料,那么数据就是“智慧公安”的生命之源。数据建模作为一种应用数据进行的警务生产活动,数据质量的高低直接决定了数据建模的成败。正所谓正确的数据不一定能得到正确的结果, 但错误的数据一定会得到错误的结果。
1.数据标准不统一。在“智慧公安”的建设推进过程中很多公安机关采用“众筹”理念,包括建设众筹和技术众筹。建设众筹,即采用相关地方政府部门和社会力量参与建设,实现多方共建共享。在社会面智能安防方面采用这一模式比较多,由政府引导,安防企业出资建设扩展服务,居民仅承担安装费。虽然这一模式解决了资金和运维问题,但不同地区的政府机关引进的安防企业各不相同,各家企业采用的前端感知设备比如门磁、烟感、窨井盖、车牌识别、人脸识别也没有统一标准和规范数据结构,对后续全市的数据汇集整合带来了不小的难度。
2.数据更新不及时。公安机关一直都很重视数据的采集和使用,也较早的出台了数据汇集和共享方面的考核政策。但在过去较长的一段时间内,只注重大数据4V中的Volume(数据量大),片面地追求数据量多,导致的结果就是公安数据汇集库中积淀了大量的数据,但数据种类少、数据更新也不及时。
3.数据共享有限。过往公安系统内部存在着较多数据壁垒和数据烟囱现象,各个业务警种对数据共享多持有“索取多,共享少”的态度。随着智慧公安的建设,打破数据壁垒,实现数据融合共享,充分发挥大数据的威力已经成为了共识。但是,有一些重要的数据由于法律法规和历史原因,往往掌握在少数业务部门中,仍未实现实时、全面共享。特别是在数据建模应用比较多的数据共享程度很低,直接影响了模型的分析质量。
(二)数据模型层级比较低
1.数据使用水平不高。目前公安数据模型对数据的使用还处在依据民警过往公安业务经验将数据进行关联、比对、碰撞和查询阶段,只是将传统需要手工完成的公安业务自动化,距离结合机器学习算法与多源异构数据的大数据分析和智能预测还有较大的差距。
2.使用的数据结构形式单一。随着智慧公安建设的全面开展,各类感知神经元安装到位,公安大脑中的数据呈现“多源异构”化特征:既有传统公安数据库中获取的文字、数字类的结构化数据,还有从前端感知设备获取的图像、视频等非结构化数据。目前公安数据建模中还是在应用结构化数据为主,文本、图像、视频等非结构化数据目前还不能很好地处理和应用。
3.公安数据模型数量少。阿里巴巴公司有320万个数据模型,而目前XX市公安只有七百个数据模型,差距十分悬殊。模型开发和业务需求联系紧密,有限的模型数量严重影响了“智慧公安”在实战中的作用发挥。
二、相关对策和建议
(一)强化数据治理,健全数据共享机制
1.加强数据采集的标准化建设工作,统一数据格式标准。相关部门应当抓紧制定前端采感知设备采集数据的标准,明确所需的字段和数据标准格式,统一数据传输协议。确保不同厂家生产的同类型感知设备采集的数据能够顺利汇集到警务上并进行数据融合。
2.加大数据治理力度,开展数据融合。一是打破数据壁垒,将分散在各个业务警种手中的公安内部数据统一纳入公安警务云,实现数据物理层面的互联互通。二是将不同来源 的同一数据开展整合治理工作,在统一字段、数据标准并去除脏数据后进行合表,不再让数据建模人员为选择哪一张数据表而发愁。三是开展数据融合,将不同维度的数据表整合成各类主题表。比如根据身份信息构建数据主题库,将关于个人的有关信息(如衣食住行等)整合到一张数据表中。数据建模时如需对某一个违法犯罪人员进行人物画像时,直接调用这一人员的人员数据档案表就可以了,无需再从底层数据关联工作开始。
3.健全数据共享机制,让数据共享成为常态,不共享成为例外。一是建立数据资产编目系统,厘清数据资产,让民警能够根据编目轻松找到自己所需的数据表。二是建立数据分类分级制度,将警务云上的数据根据分级制度确定数据密级,不再让笼统的“涉密”两字成为不共享的万能理由。三是进一步完善数据共享审批流程,根据数据密级开发不同的共享审批流程。如低密级的数据可以走快速审批流程,没有特殊理由不得拒绝共享。而高密级的数据必须一事一申请,逐级审批,做到谁使用谁负责,谁审批谁监督,确保数据的安全。
(二)完善数据模型开发流程,规范数据模型应用和数据反馈,推动数据流和业务流的融合
1.根据一线业务需求开发数据模型,坚持模型服务实战的理念,完善模型开发流程。应当坚持数据模型的开发需求由一线实战业务部门提出,模型建设部门配合建设的理念,建立和规范公安内部模型建设需求征集流程,坚决杜绝模型开发由少数部门“拍脑袋”而产生的脱离实际、自娱自乐甚至“科技疲警”的现象。让数据模型能够真正急一线之所急,想一线之所想,把一线民警从简单、不确定、重复劳动中解放出来。
2.模型的生命在于迭代升级,没有了实战应用和数据反馈的模型也就失去了其存在的意义和价值。首先,完善对模型建设单位的考核方式,在对其绩效考核的时候不仅要计算模型建设的数量,更要统计其模型产生的战果和推送结果的准确性。这样在模型结果推送的时候,模型开发单位不仅要考虑推送结果的数量,更要确保模型结果的准确性和可操作性,避免让基层一线部门疲于奔命。其次,加大对基层模型应用的奖惩机制,对通过数据模型完成的警务工作在原有考核分之上再给予一定的奖励分数,同时对无反馈的部门进行扣分,增加各单位的积极性。
推动警务流程再造,实现数据流和业务流的融合。建立和完善扁平化的指挥体系,将指挥体系从原本以行政审批流程为核心的“千层饼”模式升级为以大数据分析研判为核心的“中台”模式,减少指挥层和处置层中间的环节,提升处置反应速度。其次,整合原本分散的街面处置力量,所有一线处置力量由“中台”进行科学统一的安排,避免“各管一段,互相扯皮”的现象,提升处置的效率。将数据流和业务流在“中台” 融合,实现公安指挥和处置体系的“秒级”响应。