自然界中存在大量的复杂系统都可以通过各种各样的网络来加以描述,一个典型的网络一般由若干个节点及节点之间的边相互连接构成。例如,社会关系网络可以看做是人类个体及个体之间的相互联系(可以是血缘关系、朋友关系、互通电话的关系等等)。随着以互联网为代表的网络技术及信息技术的迅速发展,人类的生产、生活已经越来越多地依赖于各种复杂网络系统。
复杂网络是一门典型的交叉学科,加入复杂网络研究的学者主要来自图论、统计物理学、计算机网络研究、生态学、社会学以及经济学等领域,研究所涉及的网络主要有:生命科学领域的各种网络(如细胞网络、蛋白质-蛋白质作用网络、蛋白质折叠网络、神经网络、生态网络)、Internet/WWW网络、社会网络,包括流行性疾病的传播网络、科学家合作网络、人类性关系网络、语言学网络,等等;同时,复杂网络也是一门有趣的学科,其研究内容涵盖了我们生活中的方方面面,如人际关系、交通出行、谣言传播、社会博弈等等。因此,跨入复杂网络的大门,既能够结合自己的专业知识体会各种不同学科的研究方法,又可以学以致用,发现身边某些常见现象背后的深刻原理进而提出改进。
对于同学们来说,复杂网络是一个门槛很低的课题,有一些计算机基础知识如编程语言、数据结构与算法,再加上基本的数理、图论知识,都可以很快找到某一个具体的方向并立即动手进行实验实践。例如,在Eclipse平台上,借助开源类库,很容易实现对网络数据的处理和某些特征的计算与分析,这对专业知识和技能的发展有很大帮助。如果希望进行更进一步,也有深刻的理论和方法值得研究,例如解决大规模网络计算的复杂度过高问题。
近年来,学界关于复杂网络的研究正方兴未艾。特别是,国际上有两项开创性工作掀起了一股不小的研究复杂网络的热潮。一是1998 年Watts 和Strogatz在Nature杂志上发表文章,引入了小世界(Small-World) 网络模型,以描述从完全规则网络到完全随机网络的转变。小世界网络既具有与规则网络类似的聚类特性, 又具有与随机网络类似的较小的平均路径长度。二是1999 年Barabasi 和Albert 在Science上发表文章指出,许多实际的复杂网络的连接度分布具有幂律形式。由于幂律分布没有明显的特征长度, 该类网络又被称为无标度(Scale-Free)网络。而后科学家们又研究了各种复杂网络的各种特性。国内学界也已经注意到了这种趋势,并且也开始展开研究。复杂网络的相关研究进入中国已经超过十年了,在过去的十年中,复杂网络的很多分支方向受到来自不同研究领域学者们的广泛关注,并极大地推动了复杂网络和复杂性科学的发展。
图 1,一个典型的无尺度网络,该图描绘了因特网中从某一测试站点到其他约10万个站点的最短连结路径,图中以相同的颜色来表示相类似的站点。
自2008年开始关注复杂网络以来,我们对该领域进行了较为深入的了解,并一直关注研究前沿。在互联网宏观拓扑分析、网络传播动力学、复杂系统建模、大规模计算方法方面的研究已取得若干成果。例如,我们利用上百种开源软件源代码进行实例经验分析,已经取得了一定的进展。如在软件网络关键结构识别方面,分别采用k-核和类继承树对软件网络进行层次分解,识别出关键结构,并以可视化方式分析了多层次特征和探讨了层级控制关系,相关工作发表在《International Journal of Software Engineering and KnowledgeEngineering》、《电子学报》等国内外重要期刊。在软件网络演化经验分析和建模方面,发现软件网络在新节点加入时依据对称连接概率、模块化添加机制与原有节点连接,并在此基础上建立一种更符合真实软件系统生长的演化模型。在已发表的研究成果中,既有针对互联网的宏观拓扑特征测量、大规模开源软件的复杂软件网络分析,也有面向复杂网络中共性问题的研究。研究内容涉及到静态拓扑特征分析,演化特征分析,模型建立,传播与免疫等。利用了数据处理、理论推导、建模、仿真等技术手段。在传播动力学方面,深入研究了节点度相关特征对网络病毒传播与免疫的影响。在分析工具及仿真平台方面,基于Eclipse平台开发了ComplexNetwork Analyzer(图2),软件网络基本度量分析及可视化分析平台(图3),并已经应用到我们的研究中。此外,实验室研究人在攻读博士学位期间所在的东北大学嵌入式技术实验室是国内最早开展复杂网络研究工作的科研机构,与国际互联网研究组织CAIDA(CooperativeAssociation for Internet Data Analysis)建立了长期合作关系,并建有CAIDA组织在中国的第一节点,在大规模网络建模和分析方面处于先进水平,申请人目前仍然与该实验室有紧密的科研合作。
图 2, Complex Network Analyzer
图 3,软件网络基本度量分析及可视化分析平台
目前,实验室关于复杂网络的研究主要集中在两个领域:
网络拓扑分析及传播动力学问题
基于网络的病毒传播是近年来人们在社会经济活动中最为密切关注的一个主题。病毒通过何种途径扩散?哪个人或哪个地区是某种新型疾病的发源地?哪些地区或国家具有更高的感染风险?这些问题都与我们的生活息息相关。2014年3月,埃博拉病毒蔓延暴发,到2014年12月中旬,病毒已在世界范围内感染逾1.7万人,据报道,此次历史上最严重的埃博拉疫情,始于几内亚一名两岁幼儿。找到了传播源头,科学家才得知疫情是什么时候、如何爆发的,这名“零号病人”所在的位置,成为此次疫情迅速扩散至西非三国的关键。随着现代人口生态的变化及科学技术的高速发展,以交通网络作为媒介的人类迁移使得病毒传播已经不再是一个区域性问题,而是全球性的问题。在网络拓扑分析及传播动力学问题中,前者主要内容包括如何用各种指标定量地分析网络特征,挖掘更多的网络特征并加以量化。对于网络中的传播问题,目前主要关注传播源定位、如何找到最有影响力的传播节点、结合节点行为对病毒传播进行免疫等等。当然,这两者实际上是相互依赖、相互影响的,这也是重要的研究内容。
图 4. 病毒通过航空网络快速扩散
软件测试与软件可信性研究
软件系统这种本质的复杂性使软件产品的结构和行为难以理解,进而影响到软件过程的管理和软件系统的维护与二次开发,极大地影响了软件产品的质量。因此,如何认知、度量乃至降低软件复杂性,以及以尽可能小的代价换取下一个版本尽可能高的质量,是软件工程面临的挑战性问题。软件系统的缺陷传播影响研究在近些年取得了很多进展,但是在目前软件系统大规模和高复杂性的背景下,目前的研究方法或多或少都存在一些缺陷和不足,因此更进一步的研究是十分必要而且迫切的。软件网络中节点的影响力(或重要性)度量往往只注重节点自身因素,但实际上来自邻居节点的间接影响力也不可忽略,因此设计一种考虑节点自身因素叠加邻居节点间接影响力的节点影响力度量方法是本项目重点解决的问题之一。软件网络中节点的影响范围应是有限的,找到节点影响范围的边界和找到大多数节点影响范围的共性规律是本项目的一个重要问题。
已发表的复杂网络相关论文:
Li, Hui ,Chen, Rong,Ge, Xin,Hao, Li-Ying,Zhao, Hai,Extraction and Analysis of Crucial Fraction in Software Networks,International Journal of Software Engineering and Knowledge Engineering,2014,24(4):617-634。EI,SCI
Li, Hui,Hao, Li-Ying ,Chen, Rong,Ge, Xin,Zhao, Hai,Symmetric Preferential Attachment for New Vertices Attaching to Software Networks,New Generation Computing,2014,32(3-4):271-296。EI,SCI
Hui Li ,Hai Zhao,Wei Cai,Jiu-Qiang Xu,Jun Ai,A modular attachment mechanism for software network evolution,Physica A: Statistical Mechanics and Its Applications,2013,392(9):2025-2037。EI,SCI
李辉 ,赵海,徐久强,李博,李鹏,王家亮,基于k-核的大规模软件宏观拓扑结构层次性研究,电子学报,2010,(11):2635-2643。EI
Ai Jun ,Zhao Hai,Carley, Kathleen M.,Su Zhan ,Li Hui,Evolution of IPv6 Internet topology with unusual sudden changes,Chinese Physics B,2013,22(7)。2,SCI
Ai, Jun ,Zhao, Hai,Carley, Kathleen M.,Su, Zhan,Li, Hui,Neighbor vector centrality of complex networks based on neighbors degree distribution,European Physical Journal
B,2013,86(4)。0,SCI
李辉 ,赵海,郝立颖,何滨,基于k-核的大规模软件核心框架结构抽取与度量,东北大学学报(自然科学版),2011,(07):939-943。EI
葛新, 赵海, 张君,网络度相关及其传播特征研究,计算机研究与发展. 第四期,2013. EI
Ge Xin, Wang H,Community overlays upon real-world complex networks,European Physical Journal B,85(1),pp1-10,2012. SCI
Van Mieghem P, Ge Xin, Schumm P, H.Wang, Spectral graph analysis of modularity and assortativity, Physical Review E,82(5),056113,2010. SCI
葛新, 赵海, 张君,可变相关系数网络上的病毒传播仿真研究,系统仿真学报,24(8),pp1723-1727,2012.
葛新, 赵海, 张君,基于熟人免疫的复杂网络免疫算法,计算机科学,38(11),pp83-86,2011
葛新,赵海,张君. 复杂网络无尺度特征及其演化机理研究,东北大学学报:自然科学版, 37(5),pp646-649,2011 EI
Ge Xin, Hai Z. Modelling community of Internet topology,2011 3rd International Coference on Computer Design and Application, May 27-29, 2011,pp521-526, Xi'an, ShanXi Province, China,2011.
Van Mieghem P, Wang H, Ge Xin, S. Tang F. A. Kuipers, Influence of assortativity and degree-preserving rewiring on the spectra of networks,The European Physical Journal B - Condensed Matter and Complex Systems,76(4), pp643-652,2010. SCI
入门书籍
复杂,梅拉妮·米歇尔 / 唐璐
网络、群体与市场,大卫·伊斯利(David Esley) / 乔恩·克莱因伯格(Jon Kleinberg)
复杂网络理论及其应用,汪小帆,李翔,陈关荣,2006
复杂系统与复杂网络,何大韧,刘宗华,汪秉宏
链路预测,吕琳瑗/周涛
网络科学原理与应用
Introduction to Complex Networks:Models,Structures and Dynamics,陈关荣,汪小帆,李翔
Jung开源框架,提供网络存储、特征分析等功能。
http://jung.sourceforge.net/
斯坦福大学提供的各种类型网络数据。
http://snap.stanford.edu/data/
图论百科。
http://mathworld.wolfram.com/topics/GraphTheory.html
如果对复杂网络感兴趣,欢迎与我们交流。