网络科学导论(三)

3.1 引言

复杂网络的具体问题在本章才开始进行介绍,包括网络的拓扑性质分析,网络的拓扑建模、网络的行为动力学分析与控制。书中指出,虽然网络科学看起来在基础部分和图论近乎完全一致,但是由于目前复杂网络的规模不是之前理论分析所能达到的,两者在研究方法和研究角度上都有着巨大的不同。较小规模的图可以通过图示的方法。出网络的性质,但对于大规模的网络的研究必须借助强大的计算能力和统计方法。现代网络科学更为关注网络拓扑结构的演变和网上动力学行为之间的关系。

网络规模尺度上的巨大差异使得图论和复杂网络在一些问题上的表述有所不同,经常如果去除某个点使得一个连通片分割为两个连通片那么称该点为割点,而在大规模网络中,去除单个的点和边往往难以对图的连通性产生什么影响,我们往往讨论去除多少比例的节点或边才能将网络分为不同的连通片,对网络的某个性质产生影响

近年来,人们在刻画复杂网络结构的统计特性上提出了许多概念和方法,并且利用了统计物理中的许多方法,包括相变和渗流理论、平均场理论、主方程方法等。

3.2 复杂网络的连通性

3.2.1 无向网络中的连通巨片

如果我们将地球上所有人的社会关系看作社交网络的话,那么凭直觉就可得出这个网络一定是不连通的,因为只要有一小群人(比如某个小岛上的野人)与世隔绝,那么就会形成一个小的连通片。从这个角度来看,大规模网络的连通问题通常是一个脆弱的问题,单个节点或者少数节点的行为都可能破坏整个网络的连通性问题。

但是从另外的角度来讲,社会网络存在大规模的连通片,也被称为连通巨片(Giant component),它包含了网络中相当比例的节点,在Facebook的社交网络连通片的分析中,虽然存在着多个连通片但是第一大的连通片包含了90%的节点。节点规模和此规模下的连通片数量大致是程幂律分布的

3.2.2 有向网络中的蝴蝶结结构

实际的大规模有向网往往既不是强连通的也不是弱连通的,但是许多有向网络往往有一个包含了网络中相当部分节点的很大的弱连通片,称为弱连通巨片(Giant weakly connected component,GWCC)。这一弱连通巨片又往往具有一种包含4个部分的蝴蝶结结构(Bow-tie structure)

(1)强连通核(Strongly connected core,SCC):也称为强联同巨片(Giant strongly connected component),它位于网络的中心。SCC任意两点都是强连通的,即存在从任一节点到另一节点的有向路径
(2)入部(IN):包含那些可以通过有向路径到达SCC,但不能从SCC到达的节点。也就是说,一定存在从IN中任一节点到SCC中任一节点的有向路径
(3)初部(OUT):包含那些从SCC中任一节点到OUT中任一节点的路径,反之则不行,从In中任一节点都有到达Out中任一节点的路径,该路径必通过SCC。
(4)卷须(Tendrils):包含哪些既无法到达SCC又无法从SCC到达的节点。对于挂在IN上的任一卷须节点,必至少存在一条从IN中某一节点到该节点的不需要经过SCC的路径;对于挂在Out上的任一卷须节点,必至少存在从该节点到OUT中某一结点的有向路径。

3.3 节点的度与网络稀疏性

3.3.1 度与平均度

度(Degree)是刻画单个节点属性最简单而又是最重要的概念之一。

无向网络中节点i的度$k_i$定义为与节点直接相连的边的数目。对于没有自环和重边的简单图,节点i的度$k_i$也是与节点i直接有边连接的其他节点的数目。网络中所有节点的度的平均值称为网络的平均度(Average Degree),记为<k>。

给定网络G的邻接矩阵$A=(a_{ij})_{N*N}$,我们有

$k_i={\sum^N_{j=1}}a_{ij}={\sum^N_{j=1}a_{ji}}$
$<k>=\frac{1}{N}\sum^N_{i=1}k_i=\frac{1}{N}\sum^N_{i,j=1}a_{ij}$

网络节点的度与网络边数M之间有如下关系:

$2M=N<k>=\sum^N_{i=1}k_i=\sum^{N}_{i,j=1}a_{ij}$

过于基础的部分不再进行介绍,属于图论中的基础知识。

网络的平均出度和平均入度是相同的

节点i的强度定义为$s_i=\sum^N_{j=i}w_{ij}$

如果G是有向加权网络,那么节点i的出强度(Out-strength)入强度(In-strength)分别定义为:

$s_i^{out}=\sum^N_{j=1}w_{ij},s^{in}_i=\sum^N_{j=1}w_{ji}$

3.3.3 网络稀疏性与稠密化

一个包含N个节点的网络的密度(Density)定义为网络中实际存在的边数和网络中的最大边数的比值

$\rho=\frac{M}{\frac{1}{2}N(N-1)}$

对于有向网络将分子上的$\frac12$q去除即可,实际上,大规模网络的一个实际特征就是稀疏性。在2011年FaceBook的活跃用户大约有7.21亿,但却只有687亿条边,网络平均度<k>$\approx190$,密度$\rho\approx0.3*10^{-7}$,意味着这是一个十分稀疏的网络 。

实际网络的规模一般也是随时间而变化的,而且许多网络的节点和边在很长一段时间里是呈增加趋势的。那么随着时间的变化,网络是愈发稠密还是愈发稀释呢?此时,平均度<k>是一个很好的刻画方式,平均度和网络密度间存在着如下简单的关系:

<k>$=\frac{2M}{N}=(N-1)\rho\approx{N}\rho$ (3-11)

将时刻t网络中的节点数和边数分别记为N(t)和M(t)。如果两者呈线性比例关系,即M(t)~N(t),那么由式(3-11)可见平均度为一常数,如果两者呈平方关系,即M(t)~N2(t),那么就意味着,平均而言,每个节点都会与网络中一定比例的其他节点直接相连,整个网络会演化成为一个非常稠密的网络。研究表明,许多网络的演化是介于两种情形之间的。即服从如下的超线性关系,也称为稠密化幂律(Densification power law)

$M(t){\sim}N^{\alpha}(t)$ 1<$\alpha$<2< center>

这意味着,一方面实际网络会随着时间的变化而越来越稠密,但实际网络永远是稀疏的。

lnM(t)$\approx$$\alpha(lnN(t))+C$,1<$\alpha$<2< center>

在双对数坐标下点的规模和边的规模呈线性相关

3.4 平均路径长度和直径

3.4.1 无权无向网络的情形

1.平均路径长度

网络中两个节点i,j之间的最短路径(Shortest Path)也称为测地路径(Geodesic Path),是指连接两个节点的边数最少的路径,节点i和j之间的距离$d_{ij}$定义为连接两个节点的最短路径上的边的数目,也称为两个节点之间的测地距离(Geodesic distance)跳跃距离(Hop distance)

网络的平均路径长度(Average distance)L,定义为任意两个节点之间的距离的平均值,即

$L=\frac1{\frac12N(N-1)}\sum_{i\geq{j}}d_{ij}$

其中N为网络节点数。网络的平均距离长度也称为网络的特征路径长度(Characteristic path length)平均距离(Average distance)

以FaceBook为例来看,目前存在的大多数复杂网络中,平均距离都在缩小,在2011年,fb中用户的平均距离仅为4.74。两点之间的最短路径可能不唯一,但最短路径长度是唯一的,要么是无穷大要么是一个确定的数。一个拥有N个节点和M条边网络的平均路径长度可以用时间量级为O(MN)的广度优先遍历算法来确定。

但是由于大型网络往往是不连通的,所以可能会导致距离为无穷大的情况,导致网络中的平均距离无法计算。此时可以采用两种方法进行处理,第一种是放弃此类节点的计算,适用于大多数节点都处于最大的连通片的情况;另一种方法是吧平均路径定义为网络中两点距离的简谐平均(Harmonic mean):

$L=\frac1{GE},GE=\frac1{\frac12N(N-1)}\sum_{i\geq{j}}\frac1{d_{ij}}$

按照上式计算,两点距离为无穷大对应距离的倒数为0,由此得到的平均路径长度总是有限值。如果我们认为两点之间的距离越短那么它们的传输效率就越高,那么GE就定量反映了网络之中节点之间发送信息的平均效率,因此GE也被称为全局效率(Global efficiency)

2.网络直径

网络中任意两个节点之间的距离的最大值称为网络的直径(Diameter),记为

$D=max_{ij}d_{ij}$

进一步讲,我们可能更为关心的是网络中绝大部分用户对之间的距离。为此,可以统计出距离为d的连通的节点对的数量占总数量的比例,记为f(d);并进而统计网络中距离不超过d的连通的节点对的数量占整个网络中连通的节点对数量的比例记为g(d)

一般的如果整数D满足

$g(D-1)<0.9,g(d)\geq0.9$< center>

那么就称D为网络的有效直径(Effective diameter)。换句话说D是使得90%的连通的节点对可以互相到达的最小的步数。我们可以通过插值的方法吧有效直径推广到非整数的情形。为此,对任一实数r,假设$d\leq{r}<d+1$,通过线性插值的方式定义g(r)如下:

g(r)=g(d)+(g(d+1)-g(d))(r-d)

如果实数D满足g(D)=0.9,那么就称D为网络的有效直径。有效直径通常是一个比直径更为鲁棒的量,因为去除几条边后可能会对网络的直径产生影响,但是对网络的有效直径并没有什么影响。

研究表明,许多实际网络的直径和有效直径都呈现越来越小的趋势,也称为直径收缩现象。

3.4.2 加权有向网络情形

该章节介绍了最短路径算法Dijstra算法,在此不做赘述,此外还提到了Bellman-Ford算法和一种由谷歌工程师发明的算法。

3.5 聚类系数

3.5.1无权无向网络的情形

通常使用聚类系数来定量刻画任意两个朋友间也互为朋友的概率:
假设网络中的节点i的度为ki,即它有ki个直接有边相连的邻居节点。如果节点i的ki个邻节点之间也互为邻居,那么,在这些邻节点之间就存在$k_i(k_i-1)/2$条边。在网络中,一个度为ki的节点i的聚类系数Ci的定义为

$C_i=\frac{E}{(k_i(k_i-1)/2)}=\frac{2E_i}{k_i(k_i-1)}$

其中$E_i$是邻居节点之间实际存在的边数。

我们还可以等价的给出节点i的聚类系数(几何形式)

$C_i=\frac{包含节点i的三角形的数目}{以节点i为中心的连通三元组的数目}$
给定网络的邻接矩阵$A=(a_{ij})_{N*N},那么包含节点i的三角形数目为$
$E_i=\frac12\sum_{j,k}a_{ij}a_{jk}a_{ki}=\sum_{k>j}a_{ij}a_{jk}a_{ki}$
因此节点i的聚类系数可如下计算:
$C_i=\frac{2E_i}{k_i(k_i-1)}=\frac1{k_i(k_i-1)}\sum^N_{j,k=1}{a_{ij}a_{jk}a_{ki}}$(3-22)
$C_i=\frac{包含节点i的三角形的数目}{以节点i为中心的连通三元组的数目}=\frac{\sum_{j\neq{i},k\neq{j},k\neq{i}}{a_{ij}a_{ik}a_{kj}}}{\sum_{j\neq{i},k\neq{j},k\neq{i}}a_{ij}a_{ik}}$
一个网络的聚类系数C定义为网络中所有节点聚类系数的平均值
$C=\frac{1}{N}\sum^N_{i=1}C_i$ (3-24)

三角形的社会学意义是你的两位朋友也互相为朋友,从而三个人之间形成一个三角形。因此社会学中利用网络中三角形的数量来刻画网络的聚类特性,也称横截性(Transitivity)。网络聚类系数的社会学定义如下:

$C=\frac{网络中的三角形数目}{\frac{网络中的连通三元组数目}3}=\frac{\sum^N_{i=1}\sum_{j\neq{i},k\neq{j},k\neq{i}}{a_{ij}a_{ik}a_{kj}}}{\sum^N_{i=1}\sum_{j\neq{i},k\neq{j},k\neq{i}}a_{ij}a_{ik}}$ (3-25)

网络聚类系数的两个定义3-243-25并不完全等价,定义3-24中的平均是对每个节点聚类系数给以相同的权,而定义3-25中的平均则是对于每个三角形给与相同的权。与度小的节点比,度大的节点可能被包含在更多的三角形中。然而,两种定义的差别并不会带来本质的影响,因为人们通常关心的是聚类系数的相对大小而不是绝对大小。例如,我们会关心与具有相同节点数和边数的一个完全随机化的网络相比,某个实际网络是否具有明显较高的聚类系数。

相对而言,聚类系数定义3-24易于计算,而3-25则更适合于解析研究。

在网络科学中有时会关注一类节点的整体行为或平均行为。在求得各节点聚类系数的基础上,我们可以得到度为k的节点的聚类系数的平均值,从而把聚类系数表示为节点度的函数:

$C(k)=\frac{\sum_iC_i\delta_{k_ik}}{\sum_i\delta_{k_ik}}$

这里$\delta_{k_ik}$为如下定义的Kronecker $\delta$函数:

$\delta_{k_ik}=$\begin{equation}\{ \begin{array}{**rcl**} 1, k_i=k& \\ 0,k_i\neq{k} \end{array}\end{equation}

3.5.2 加权网络

一些在无权网络中的概念可以很容易的推广到加权网络中,但并不总是如此,例如聚类系数,边的权值往往可以表示两点的亲密程度。

给定一个加权网络G及其临界矩阵A=(aij)和非负的权值矩阵W=(wij)。直观上来看,我们有无权的网络系欸但聚类系数定义的加权形式:

$\tilde{C_i}=\frac1{k_i(k_i-1)}\sum_{j,k}\omega_{ijk}a_{ij}a_{ik}a_{jk}$ (3-28)

现在的问题是如何根据非负权值矩阵来确定$w_{ijk}$:

1)当节点i、j、k不构成一个三角形时$\omega_{ijk}$可以取任何值(顾不妨取0)。这是因为$a_{ij}a_{jk}a_{ki}=1$当且仅当节点i,j,k构成一个三角形。
2)在无权网络的特殊情形,定义3-28应该退化为无权网络节点的聚类系数定义3-22。在此情形当节点i,j和k构成一个三角形时应有$\omega_{ijk}=1$
3)为了保证$\tilde{C_i}\in[0,1],应该有\omega_{ijk}\in[0,1]$。这就意味着不管权值如何选取,总有$\tilde{C_i}\leq{C_i}$。换句话说如果使用3-28来定义加权网络节点的聚类系数,那么权值的非均匀化可能会导致聚类系数的减小。
s
尽管有上述条件的限制,$\omega_{ijk}$的取法也是不唯一的。下面介绍两种取法。
(1)取法1:把$\omega_{ijk}$取为节点i与它的两个邻节点j和k之间的两条边的权值的归一化的平均值,即

$\omega_{ijk}=\frac{1}{<w_i>}\frac{w_{ij}+w_{ik}}{2}$ (3-29)
其中<$w_i$>是以节点i为一个端点的所有边的权值的平均值,即
$<w_i>=\frac1{k_i}\sum_jw_{ij}$ (3-30)
把式[3-29](#_3_29)代入式[3-28](#_3_28),即得到加权网络中节点i的聚类系数定义如下:
$\tilde{C}_i^{(1)}=\frac1{k_i(k_i-1)}\sum_{j,k}\frac{w_{ij}+w_{ik}}{2<w_i>}a_{ij}a_{ik}a_{jk}$ (3-31)
这一定义考虑了节点i与其邻节点之间的边的权值的影响,但是没有考虑节点i的两个邻节点之间的边(也称为外边)的权值的影响。对于无权网络,当节点i、j和k构成一个三角形时,有$\omega_{ijk}=1$,定义[3-31](#_3_31)即退化为无权网络的节点聚类系数定义[3-22](_3_22) 注意到节点i的强度$s_i$满足
$s_i=k_i(s_i/k_i)=k_i<w_i>$ (3-32)
式[3-31](#_3_31)也可以写为
$\tilde{C}_i^{(1)}=\frac{1}{s_i(k_i-1)}\sum_{(j,k)}\frac{w_{ij}+w_{ik}}2a_{ij}a_{ik}a_{kj}$ (3-33)

在此介绍另外一种取法

取法2)将$\omega_{ijk}$取为节点i与它的两个邻节点j和k组成的三角形的三条边的的归一化几何平均值,即:

$\omega_{ijk}=(\hat{w}_{ij}\hat{w}_{ik}\hat{w}_{jk})^{1/3} ( 3-34)$
其中$\hat{w}_{ij}\in[0,1]$为如下归一化定义
$\hat{w}_{ij}=\frac{w_{ij}}{max_{k,l}w_{kl}}$ (3-35)
把式[3-34](#_3_34)代入式[3-28](#_3_28),即得到加权网络中节点i的聚类系数的另一种定义:
$\tilde{C}_i^{(2)}=\frac1{k_i(k_1-1)}\sum_{j,k}(\hat{w}_{ij}\hat{w}_{ik}\hat{w}_{jk})^{1/3}a_{ij}a_{ik}a_{jk}$ (3-36)
如果把两个节点之间的没有边等价位定义两个节点之间的边的权值为0,那么式[3-36](#_3_36)可以等价地写为:
$\tilde{C}_i^{(2)}=\frac1{k_i(k_i-1)}\sum_{j,k}(\hat{w}_{ij}\hat{w}_{ik}\hat{w}_{jk})^{1/3}$ (3-37)
该式可进一步写为
$\tilde{C}_i^{(2)}=C_i\bar{I}_i$ (3-38)
其中Ci是把该网络看作无权网络节点时节点i的聚类系数,$\bar{I}_i$时包含节点i的三角形的归一化平均密度:
$\bar{I}_i=\frac1{2E_i}\sum_{j,k}(\hat{w}_{ij}\hat{w}_{ik}\hat{w}_{jk})^{1/3}$
这里Ei是包含节点i的三角形的数目,即
$E_i=\frac12\sum_{j,k}a_{ij}a_{jk}a_{ki}$

由无权网络中节点的聚类系数的定义(3-23)可以看出,在无权网络中,节点的聚类系数等于包含节点i的三角形数目Ei除以以节点i及其邻节点为顶点的三角形的数目的可能的上界。基于这一定义的推广可以得到加权网络节点聚类系数的第三种定义如下:

$\tilde{C}_{i}^{(3)}=\frac{\frac{1}{2}\sum_{j,k}{\hat{w}_{ij}\hat{w}_{ik}\hat{w}_{kj}}}{\frac{1}{2}(({\sum_k{\hat{w}_{ik}}})^2-\sum_{k}{\hat{w}^2_{ik}})}=\frac{\sum_{i,j}\hat{w}_{ij}\hat{w}_{ik}\hat{w}_{jk}}{(\sum_k{\hat{w}_{ik}})^2-\sum_k\hat{w}^2_{ik}}$ (3-41)

上式的分子即为包含节点i的三角形数目$E_i$的加权形式,而对应的分母则为分子的可能的上界,从而保证$\tilde{C}_i^{(3)}\in[0,1]$,式3-41也可以写为

$\tilde{C}_i^{(3)}=\frac{\sum_{j,k}{\hat{w}_{ij}\hat{w}_{ik}\hat{w}_{jk}}}{\sum_{j\neq{k}}\hat{w}_{ij}\hat{w}_{ik}} $ (3-42)

与无权网络的聚类系数定义相比,上述关于加权网络聚类系数的三种定义具有如下特性:
(1)当加权网络 退化为无权网络时,上述几种定义都是等价的。
(2)与无权网络中节点i的聚类系数$C_i$相同,它们的值域都为[0,1]
(3)与$C_i$相同,$\tilde{C}_{i}^{(l)}=0(l=1,2,3)$当且仅当不存在包含节点i的三角形。
(4)yu$C_i$相同,$\tilde{C}_i^{1}=1$的充要条件时节点i的任意两个邻节点都互为邻居,即节点i与它的任意两个邻节点都构成一个三角形。但是这一条件只是$\tilde{C}_{i}^{(2)}=\tilde{C}_i{(3)}=1$的必要条件,因为$\tilde{C}_i^{(2)}=1$还要求包含i的所有三角形的边的值权值都相同;$\tilde{C}_i^{(3)}=1$则要求三角形的外边的权值都相同且都为最大值,而与与节点i相连的边的权值无关。

关于有向网络 ,通常的方法仍是先将其看作无向网络。近些年来也有一些考虑到有向边的聚类系数的定义并用于有向网络的分类,其中的一个基本的难点是:无向网络的一个三角形对应于一个有向网络有7种可能性。

3.6 度分布

3.6.1 度分布概念

该章节主要介绍了网络中度分布的概念,度是指网络中从节点出发的边或到达节点的边的数目,分析网络中节点度的分布规律可以进一步得到网络中的一些性质,网络中节点的度分布定义为

$P(k)$ $P(k^{out})$ $P(k^{in})$

3.6.2 从钟形曲线到长尾分布

最常见,最重要的概率分布是正态分布,也称为高斯分布,记为$\xi{-}N(\mu,\sigma^2)$,其中$\mu$是均值,$\sigma$是标准差,均值决定了分布的中心,标准差决定了分布的形状。正态分布的均匀性体现在绝大部分的数据都落在均值附近,大约有68%、96%、99.7%的数据落在据平均值1个、2个、3个标准差的范围内。

正态分布是针对连续型随机变量而言的,但多数数据均为离散型的,取值为非负整数。常见的概率分布有超几何分布,二项分布和泊松分布,它们都可以看做是正态分布的离散形式,并且概率分布图都近似具有钟形形状。其中最重要的泊松分布满足

$P(k)=\frac{\lambda^ke^{-\lambda}}{k!}$ (3-43)

其中参数$\lambda{>}0$。泊松分布的均值和方差都是$\lambda$,且随着$\lambda$的增大,分布的形状迅速接近正态曲线
服从钟形分布的随机分布变量都具有一个明显的特征标度———钟形曲线的峰值(即随机变量的均值)。

现实世界中存在着另外一种常见的分布———-长尾分布,但与钟形分布不同的是,长尾分布并不具有特征标度,所谓特征标度是指大部分的值应该落在以特征标度为中心的一个相对较小的区间内

如果一个实际网络的度分布曲线近似具有钟形形状,其形状在远离峰值<k>处呈指数下降。这意味着我们可以肯定地认为网络中所有节点地度都与平均度<k>相差不大。此类网络被称为均匀网络(Homogeneous network)。但是大多数网络的节点地度分布呈现长尾特征。

幂律分布的分布函数具有长尾特征。在一定的数学意义下,幂律分布是唯一一种具有无标度特性的长尾分布。

3.7幂律分布

3.7.1 幂律分布及其检验

一篇在nature上的通讯指出,在万维网中,节点度的分布并不服从泊松分布,而是能更好的用幂律分布来表示

P(k)$\sim{k}^{-\gamma}$

其中$\gamma$大于等于0且通常在2到3之间

通过对万维网的采样数据发现,入度为k的网页的数量和k-2(实际比-2还要小一点)呈正比,这意味着随着度的增加,网页数量下降的速度比泊松分布要慢的多

3.7.2 幂律分布的性质

1.无标度特性

定理3-1 考虑一个概率分布函数f(x),假设f(1)f’(1)$\neq$0。如果给定常数a,存在常数b使得函数f(x)满足如下无标度条件:

f(ax)=bf(x)
那么必有$f(x)=f(1)x^{-\gamma},\gamma=-f'(1)/f(1)$ 也就是说,幂律分布函数是唯一满足无标度条件的概率分布函数(如果仅由结论猜测推导过程并不困难,在此略过证明过程) ### 2.归一化 幂函数$p_k=Ck^{-\gamma}$要成为概率分布必须要进行归一化操作,此外度k不能为0,所以我们假设度的概率分布函数在k>kmin>时才成立于是有
$\sum_{k=k_{min}}^{\infty}Ck^{-\gamma}=1$
从而得到
$C=\frac1{\zeta(\gamma,k_{min})}$
其中
$\zeta(\gamma,k_{min})\equiv{\sum_{k=k_{min}}^\infty{k}^{-\gamma}}$
称为广义$\zeta$函数,$\zeta{(\gamma,1)}\cong\zeta(\gamma)$称为标准黎曼函数。通过把求和利用积分近似可以得到幂律的度分布为
$p_k\sim{\frac{\gamma-1}{k_{min}}{(\frac{k}{k_{min}}})^{-\gamma}}$
相应的,累计度分布也可以写为
$P_k\sim(\frac{k}{k_{min}}^{-(\gamma-1)})$

3.矩的性质

度分布的m(m$\ge$1)阶矩为

$<k^m>=\sum_{k=0}^{\infty}k^mp_k$

其中当m=1时,一阶矩即为网络的平均度。如果网络的度分布在k$\ge$时度分布具有幂律形式那么可以得到

$<k^m>=\sum_{k=0}^{k_{min}-1 }k^mp_k+C\sum_{k=k_{min}}^{\infty}k^{m-\gamma}$

近似积分得

$<k^m>\simeq{\sum^{k_{min}-1}_{k=0}}k^mp_k+\frac{C}{m-\gamma+1}[k^{m-\gamma+1}]^\infty_{k_{min}}$

上式中最后一个和式的第一项总是有限值,取决于度k较小时的非幂律分布。如果$m-\gamma+1<0$那么第二项总是有限值,这意味着存在有限矩<km>;如果相反那么矩也发散,因此幂律分布存在m阶矩的充要条件为m-$\gamma+1$<0

实际网络中的规模总是有限的,任一节点的度也都是有限的,仅当网络的规模趋近于无限大时才有可能发散。