交叉学科
Interdisciplinary
2023年10月13日,复旦大学计算机科学技术学院陈阳博士团队在Cell Press细胞出版社旗下Patterns期刊发表了题为“EasyGraph: A multifunctional, cross-platform, and effective library for interdisciplinary network analysis”的论文。陈阳团队基于在复杂网络结构分析方面的持续积累,设计实现了开源的网络结构分析工具箱EasyGraph,支持一系列重要的跨学科网络结构分析功能。EasyGraph为研究人员和从业者提供了一个探索不同类型网络的各种结构属性并支撑相应研究工作的工具箱。EasyGraph采用多进程、Python/C++混合编程等多种优化技术,显著提高了关键功能和算法的运行效率。研究结果表明EasyGraph在计算效率方面优于已有的代表性的网络结构分析工具箱(igraph和NetworkX),凸显了它在不同学科领域开展大规模网络结构分析的潜力。复旦大学计算机科学技术学院博士生高敏是该论文第一作者,陈阳博士为论文通讯作者。论文合作作者还包括复旦大学计算机科学技术学院王新教授、复旦大学智能复杂体系基础理论与关键技术实验室宫庆媛博士、香港浸会大学互动媒体系李钰鹏博士和北京化工大学信息科学与技术学院谷伟伟博士等。
▲长按图片识别二维码阅读原文
研究亮点
  1. 设计实现了一个能够支持多学科网络结构分析的开源工具箱;
  2. 利用多进程和Python/C++混合编程等技术实现出色的计算效率,能够有效处理大规模网络数据;
  3. 提供易于使用的Python语言接口,支持多种主流网络数据格式。
研究简介
网络是表征与建模个体之间的复杂关系和交互的强大工具。网络的概念为探索和理解多个学科的一系列重要科学问题提供了一个有价值的框架。网络结构分析是研究网络的统计特性、拓扑结构和演化模型的重要方法,涵盖多个学科领域包括社交网络、生物网络、交通网络、交易网络等。随着网络规模不断增大,高效分析大规模网络结构数据成为一项巨大挑战。为了满足各学科的需求,网络结构分析需要提供更为全面的功能。然而,现有的主流开源工具箱往往只支持有限的网络格式和覆盖有限的传统算法(如igraph),或者在处理大规模网络数据时计算效率较低(如NetworkX)。因此,研究人员经常需要从零开始自行实现网络结构分析功能,甚至无法有效处理大规模网络数据,从而难以验证其研究思路是否切实可行和有效。为有效解决这一难题,加速各个学科中研究人员对网络结构分析工具的全面性需求和对网络结构分析功能的高效性需求,设计实现一套更通用高效的网络分析工具箱是该研究领域亟需解决的重要问题。
图1 EasyGraph工具箱整体框架图
本研究中,陈阳团队提出的开源工具箱EasyGraph支持一系列重要的跨学科网络分析功能(EasyGraph整体框架见图1)。相比于现有的网络分析开源工具如igraph和NetworkX等,EasyGraph拥有多方面的优势。其主要特色如下:

  • 利用Python/C++混合编程和并行计算技术提高了运行效率,并针对多个重要网络结构分析功能模块进行了性能优化,可以有效处理大规模网络数据;
  • 基于社会学的结构洞理论,针对网络结构分析的具体需求,提供了多种结构洞挖掘方法;
  • 支持社团检测、中心度、连通子图、聚集系数等经典网络结构分析算法;
  • 支持DeepWalk、node2vec、LINE、SDNE等网络嵌入算法;
  • 支持网络可视化并内置多个经典网络数据集。
图2 EasyGraph和代表性网络分析工具箱(igraph和NetworkX)的性能对比
EasyGraph提供基于Python编程的接口,并使用C++编程语言作为后端以实现算法的高效计算,兼容Windows、Linux和macOS等主流操作系统。EasyGraph的目标是支撑不同学科领域中的大规模网络结构分析及应用研究,为多学科相关研究工作提供强大的助力。EasyGraph的出色性能得益于一系列优化技术的采用,包括多进程优化、Python/C++混合编程技术以及针对重要网络结构分析功能模块的有针对性的优化。图2可以看出,执行同样的最短路径长度计算功能,EasyGraph的速度要远远快于目前的主流软件如NetworkX和igraph,使其成为同类工具箱中的佼佼者。
截止2023年10月,EasyGraph已经获得了30余万次下载。快速增长的用户规模体现了相关领域科研人员对EasyGraph全面功能和出色性能的认可。在未来工作中,EasyGraph还将围绕高阶网络和GPU加速等角度开展深入研究,提供更强大的网络结构分析功能。
EasyGraph工具箱相关网址如下:
项目网站:https://easy-graph.github.io/
项目源代码:https://github.com/easy-graph/Easy-Graph
作者介绍
陈阳 
副教授
陈阳,复旦大学副教授、博士生导师。在清华大学获学士、博士学位,并先后在哥廷根大学和杜克大学从事博士后研究。主要研究领域包括智能互联网、社会计算、网络数据挖掘等。现为中国人工智能学会社会计算与社会智能专委会副秘书长、上海市计算机学会网络专委会副主任、上海开源信息技术协会大数据专委会主任。先后在SOSP、SIGCOMM、MobiSys、WWW等顶尖国际会议上担任组织委员会或程序委员会委员。任IEEE和清华大学出版社共同出版的国际期刊Journal of Social Computing副主编,JCR Q1期刊Computer Communications编委,CAAI第八届全国大数据与社会计算学术会议(BDSC 2023)程序委员会主席。先后获上海市计算机学会科学技术奖/教学成果奖(第一完成人)、美团科研合作探索奖、Microsoft Azure Research Award等。入选上海市浦江人才计划。
相关论文信息
论文原文刊载于Cell Press细胞出版社旗下期刊Patterns上,点击“阅读原文”或扫描下方二维码查看论文
论文标题:
EasyGraph: A multifunctional, cross-platform, and effective library for interdisciplinary network analysis
论文网址:
https://www.cell.com/patterns/fulltext/S2666-3899(23)00218-0
DOI:
https://doi.org/10.1016/j.patter.2023.100839
▲长按图片识别二维码阅读原文
1974年,我们出版了首本旗舰期刊《细胞》。如今,CellPress已发展为拥有50多本期刊的全科学领域国际前沿学术出版社。我们坚信,科学的力量将永远造福人类。
CellPress细胞出版社
推荐阅读
▲长按识别二维码关注细胞科学
继续阅读
阅读原文