特征之间还能做交叉,如此下去,特征越多,效果提升反而越慢,而且计算成本、存储成本越来越高。这是传统方法面临的难题,也是图计算可以解决的问题。
图计算所带来的,是从个体的特征工程到全局的网络工程的转变。这种新视界,摆脱了此前的基于特征的传统分析模式,能够更快速、更准确的识别欺诈行为。
图计算是研究事物之间关系的学问:药物之间的关系,消费行为之间的关系,欺诈模式之间的关系。由此不难理解,图相关技术也会在我们的社交媒体中得到广泛应用。在社交网络数据上构建图模型后,可以深入挖掘个体之间的联系,比如发现潜在的黑客、挖掘社区、根据爱好更精准推荐好友等等。
图计算的未来,不可限量
图计算可以应用于相当多的主流行业。除了我们提到的金融、社交、制造,其在能源行业、制造业甚至脑科学中同样有用武之地。以电网为例,如今电网规模之大、不同设备、区域之间关联关系之复杂,已经超出了一般模型的分析能力。图计算可以帮助电网进行实时、高效的管理,提升输电、配电效率。著名咨询公司 Gartner 在《2021 年十大数据和分析技术趋势》报告中预测,到 2025 年图计算技术将应用于 80% 的数据和分析创新。
中国工程院院士、清华大学计算机科学与技术系教授郑纬民强调:“现在布局高性能图计算恰逢其时,就相当于抓住了未来大数据、人工智能和高性能计算产业发展的牛鼻子,其影响不可估量。”
清华大学计算机系教授、蚂蚁集团图计算技术负责人陈文光,也曾表示,“图计算不仅仅只是一个技术,更是一种理解世界新的方式”。
图计算应用前景广阔,原因在于其就像“万金油”一般,可以和很多当今前沿的新兴技术发生化学反应。
如图技术与机器学习结合而出现的图机器学习,前者体现的是“连接主义”,后者则是“人工智能符号主义”。传统的机器学习具有可解释性低下、缺乏非欧空间数据结构处理能力等问题,图结构数据有可能成为解决方案之一。融合了图结构数据和机器学习技术的图神经网络(GNN),可以将人类认知以图的形式和计算机建立的神经网络相结合,探索人工智能更强大的潜力。
在图计算上的突破,只是“朱雀”团队众多科研创新成果的一部分。
获得本次 OGB 冠军的团队之江智能图计算平台负责人陈红阳告诉 DeepTech,除了图计算在制药领域的研究进展,目前团队也在积极探索图+其他领域的融合。比如在国产芯片领域,如何将图计算应用于存算一体的芯片,期望未来三年能看到成果。
目前,该团队既有来自全球知名高校的学者,也有来自头部科技公司的行业专家。近年来在智能计算、数据挖掘和深度学习等领域取得了重大进展。此次 OGB 夺冠是团队多年深耕基础科学研究的必然回报。
▲图|之江实验室“朱雀”团队合照
在谈到科研细节时,之江实验室图计算研究中心高级研究专员吕劲松博士介绍,这次能够开发出识别准确率高达 92% 的模型有一些运气,更多的是因为坚持。在攻关之处,尝试了多种方式,期望在上一年冠军模型基础上进行优化,最终结果反而更差了。在思考节点与节点关系上,研究人员举了这样一个例子,“这就好比判断全球任意两个人之间是不是潜在的朋友关系,这是很难穷举的。但后来有人提出能否通过第三者、中间人的存在去判断,由此打开了思路”。但这种猜想很可能是错的,抱着试一试的态度,团队成员沿着这条路线走了下去,最终获得成功。
“大胆假设,小心求证”不仅是做学问的原则,也是科研的原则。只有秉承这样的精神,加之持之以恒的品质,中国的实验室将有望在全球更多基础科学领域获得更大的成就。