近日,每日互动(个推)CTO叶新江受邀出席WAIC世界人工智能大会,并于“大数据关联下的图数据库技术与应用”主题论坛上发表演讲,同与会专家、观众共同探讨“万亿级图下的数据智能”。

 

叶新江介绍,每日互动成立于2010年,以提供APP消息推送服务起家。十多年来,每日互动参与和见证了移动互联网行业的飞速发展,更依托自身海量数据资源和大数据、人工智能技术优势,构建了完整的数据智能服务生态,提供专业的大数据解决方案,推动移动互联网、品牌营销、金融、智慧城市等细分领域的数智化升级。

 

目前,每日互动已成长为将互联网、大数据、人工智能、云计算等新兴领域特点有机融合于一身的新经济综合体,并着力打造数据中台产品——“每日治数平台”,输出治数能力,为垂直行业的数字化创新增能提效。

 

数据智能的新发展:解决现实中不确定性大的问题

 

每日互动将“数据让产业更智能”作为自己的使命和愿景,对数据智能有着自己独到的理解。叶新江讲到,在信息化时代,我们主要通过数据来描述客观现实。比如,我们通过可视化的监控大屏描述道路状况,用不同的颜色代表道路的拥堵程度。后来,我们越来越多地使用数据进行诊断和因果分析,比如对道路拥堵进行归因。近年来,数据持续呈爆炸式增长,机器学习、图挖掘等前沿技术得到更广泛的应用,数据智能随之发展到一个全新的阶段。当下,人们对数据的应用已经不仅仅停留在描述和诊断的阶段,人们希望通过数据智能,解决现实中不确定性大的问题,并对未来进行预测,从而掌握态势,掌握动向,掌握主动。

 

数据智能的应用阶段

 

正确的解题方式:本体建模和检索

 

叶新江提到,现实中不确定性大的问题,往往是开放环境下的问题,受到众多因素影响。为了解决这类问题,传统的基于神经网络的深度学习方法,需要大量的参数对环境建模,如最近流行的GPT-3模型包含了千亿级别的参数,一次训练所需的成本达到千万美元。即便如此,这种形式下的人工智能也很难达到人类的智能水平。

 

因此,我们判断人工智能的最终形态应该是 “人脑+电脑”人机共生的方式。如何实现“人机共生”,来解决这些不确定性大的问题呢?基于知识图谱的数据智能是一个具有前景的方向,一方面通过本体建模将已有的知识进行数据化,让电脑具有了人脑的思维方式;另一方面通过在知识图谱上进行检索和推理,让人脑可以利用电脑的计算能力。为了实现这个目标,底层基础设施需要符合建模架构要求,并具有快速检索和全局推导的能力。而综合了图查询系统和图计算系统的综合图数据库系统,能够满足这些特性和功能要求。

 

万亿级图下的数据智能实践:大数据抗疫

 

那么,如何基于综合图数据库系统开展数据智能应用,以解决现实中不确定性大的问题呢?叶新江以每日互动参与大数据抗疫为例,分享了每日互动在万亿级图下的数据智能实践。

 

2020年新冠肺炎疫情发生后,每日互动火速成立大数据抗疫团队——“个医”,并与李兰娟院士团队共同合作,投入到这场与新型冠状病毒的战斗中,在疫情态势研判、传播路径分析等方面进行深入研究,全面助力疫情精准防控。

 

为了帮助地方政府实现高效防疫,公司联合李兰娟院士团队提出“无意识密切接触者”概念,基于人时空大数据,帮助相关部门找到工作重点区域、重点人群和重点场景,实现智能防控。同时,为了方便地方政府综合了解疫情态势,我们通过大数据来反映和量化当前区域内的疫情风险,为高效开展疫情防控提供有力数据支撑。为了助力地方政府有序推进复工复产,我们还参与了健康码赋码引擎的开发,通过综合“空间、时间、人间”三个维度的信息来计算密接风险,再结合当前的防控策略,助力完成最终发码。

 

实际上,以上这些应用,都依赖于综合图数据库对人群在“空间、时间、人间”三个维度上的关系进行高效的建模、检索和推理,而三个维度的叠加形成了最终的万亿级图,拓展了数据智能在社会治理、智慧医疗等方面的应用场景。

 

总结

 

如今,经济发展呈现一种新的范式,数据成为一种新型生产要素,对未来发展起着重要的驱动作用。图数据库作为数据智能时代的一项重要基础设施,为我们在全域范围内,针对时间、空间等多维度进行动态检索、统计、关系推导等复杂计算创造了充分条件。

 

未来,每日互动还将基于图数据库、知识图谱等技术持续展开实践,通过挖掘数据潜能,释放数据互联的力量,推动解决现实中不确定性大的问题,为产业发展和社会进步贡献更大的力量。