接下来, 我们将介绍一个这个领域非常根本的定理, 它列出了图可以具有的许多伪随机性质. 这些性质看上去两两不同 (有些看似很好验证, 有些看似很难) , 但这个定理却告诉我们, 这些性质全都等价.
令序列 {Gn} 是一个图的序列, 其中每个 Gn 都是 n 个点, (p+o(1))(2n) 个边的图 (固定一个常数 0<p<1) . 我们把 Gn 简写为 G. 以下的性质全部是等价的:
1. | DISC (“discrepancy”) : 对于任意 X,Y⊂V(G), ∣e(X,Y)−p∣X∣∣Y∣∣=o(n2). |
2. | DISC′ : 对于任意 X⊂V(G), ∣∣e(X)−p(2∣X∣)∣∣=o(n2). |
3. | COUNT : 对于任意的图 H, H 在 G 里 带标号 (也就是说 H 里不同的点看作是有区别的) 地出现了 (pe(H)+o(1))nv(H) 次. 其中低阶项 o(1) 只与 H 有关. |
4. | C4 : C4 在 G 里 带标号地出现了至多 (p4+o(1))n4 次. |
5. | CODEG (codegree) : 令 codeg(u,v) 表示 u 和 v 的公共邻居数, 那么 ∑u,v∈V(G)∣codeg(u,v)−p2n∣=o(n3). |
6. | EIG (eigenvalue) : 假设图 G 的邻接矩阵的特征值是 λ1≥λ2≥⋯≥λv(G), 那么 λ1=pn+o(n) 并且 maxi=1∣λi∣=o(n). |
特别的, 对于 d-正则图, 最大的特征值就是 d (对应的特征向量就是全 1 向量), EIG 在 d-正则图上相当于说 λ2=o(n).
我们可以等价地以 ϵ 语言来叙述这些性质, 比如说 DISC 可以写成这样: DISC(ϵ):∀X,Y⊂V(G),∣e(X,Y)−p∣X∣∣Y∣∣<ϵn2.
我们将会从定理 1.1 的证明中看到, 这些性质全部都在关于 ϵ 的多项式意义下等价, 也就是说, 对于任意两个性质 Prop1 与 Prop2, 都存在一个常数 c, 使得 Prop1(ϵ)⟹Prop2(ϵc).
在这个定理的证明中, 我们会多次用到 Cauchy–Schwarz 不等式, 所以我们不如从它的一个小练习开始.
如果 G 是一个 n 个点的图, 并且 e(G)≥pn2/2, 那么在 G 中 C4 带标号地出现了 ≥(p4−o(1))n4 次.
证明. 这里我们想要的是 S=Hom(C4,G) 的大小, 也就是从 C4 到 G 的图同态的个数. 这里 S 把不是单射的映射也包括在内, 也就是说 C4 里不同的点可以被映射到 G 中的同一个点. 但这不影响我们的结论, 因为反正这种映射最多也只有 O(n3) 个.
固定 C4 的对角线在 G 中的两个端点 u 和 v, 分别考虑对角线上下对称的两部分 (见图 ??) , 我们可以发现, ∣S∣=∑u,vcodeg(u,v)2. 我们应用两次 Cauchy–Schwarz 不等式就可以得到∣Hom(C4,G)∣=u,v∈V(G)∑codeg(u,v)2≥n21⎝⎛u,v∈V(G)∑codeg(u,v)⎠⎞2=n21⎝⎛x∈V(G)∑deg(x)2⎠⎞2≥n21⎝⎛n1⎝⎛x∈V(G)∑deg(x)⎠⎞2⎠⎞2=n21(n1(pn2)2)2=p4n4
其中第二行, 我们对长度为 2 的路径的条数用 “算两次” 的办法, 得到了 ∑u,v∈V(G)codeg(u,v)=∑x∈V(G)deg(x)2.
我们可以可视化的展示两次应用 Cauchy–Schwarz 的过程, 见图 ??. 我们可以发现 Cauchy–Schwarz 其实是利用了图的对称性. 1
(...) Cauchy–Schwarz 的可视化
接下来我们来证明定理 1.1.
证明. DISC⟹DISC′: 在 DISC 中, 令 Y=X.
DISC′⟹DISC: 我们把在 e(X,Y) 中的边分类, 应用容斥原理把它表示出来:
e(X,Y)=e(X∪Y)+e(X∩Y)−e(X∖Y)−e(Y∖X).
这样我们就可以用 DISC 得到: =p((∣X∪Y∣2)+(∣X∩Y∣2)+(∣X∖Y∣2)+(∣Y∖X∣2)+o(n2))p∣X∣∣Y∣+o(n2)
DISC⟹COUNT: 在图计数引理 (定理 5.0.3) 中, 令 Vi=G (i=1,…,v(H)), 就可以直接得到这个结论.
COUNT⟹C4: C4 只是 COUNT 的一个特殊情况.
C4⟹CODEG: 假设 C4 成立, 我们有u,v∈G∑codeg(u,v)=x∈G∑deg(x)2≥n(n2e(G))2=(p2+o(1))n3.
与此同时 ∑u,vcodeg(u,v)2 等于 C4 有标号地在 G 中出现的次数, 也就是: u,v∑codeg(u,v)2= Number of labeled copies of C4+o(n4)≤(p4+o(1))n4
从而我们可以用 Cauchy-Schwartz 来得到我们想要的: u,v∈G∑∣∣codeg(u,v)−p2n∣∣≤n⎝⎛u,v∈G∑(codeg(u,v)−p2n)2⎠⎞1/2=n⎝⎛u,v∈G∑codeg(u,v)2−2p2nu,v∈G∑codeg(u,v)+p4n4⎠⎞1/2≤n(p4n4−2p2n⋅p2n3+p4n4+o(n4))1/2=o(n3)
这个技巧类似于概率组合 (probabilistic combinatorics) 里的二阶矩方法: 我们希望证明 codeg(u,v) 的方差不会太大. 2
CODEG⟹DISC: 我们首先注意到u∈G∑∣deg(u)−pn∣≤n1/2(u∈G∑(deg(u)−pn)2)1/2=n1/2(u∈G∑(deg(u))2−2pnu∈G∑deg(u)+p2n3)1/2=n1/2⎝⎛u,v∈G∑codeg(u,v)−4pn⋅e(G)+p2n3⎠⎞1/2=n1/2(p2n3−2p2n3+p2n3+o(n3))1/2=o(n2).
从而有
∣e(X,Y)−p∣X∣∣Y∣∣=∣∣x∈X∑(deg(x,Y)−p∣Y∣)∣∣≤n1/2(x∈X∑(deg(x,Y)−p∣Y∣)2)1/2.
因为求和的每一项都是非负的, 我们可以把求和范围从 X 扩大到 V(G), 从而得到: ∣e(X,Y)−p∣X∣∣Y∣∣≤n1/2⎝⎛x∈V(G)∑deg(x,Y)2−2p∣Y∣x∈V(G)∑deg(x,Y)+p2n∣Y∣2⎠⎞1/2=n1/2⎝⎛y,y′∈Y∑codeg(y,y′)−2p∣Y∣y∈Y∑deg(y)+p2n∣Y∣2⎠⎞1/2=n1/2(∣Y∣2p2n−2p∣Y∣⋅∣Y∣pn+p2n∣Y∣2+o(n3))1/2=o(n2).
现在我们已经证明了这些定理间的一个 “C4”, DISC⟹COUNT⟹C4⟹CODEG⟹DISC, 我们最后证明 EIG 与 C4 的等价性.
EIG⟹C4: C4 在 G 中的带标号出现次数与长度为 4 的封闭路径的个数, 最多只相差 O(n3), 而长度为 4 的封闭路径个数等于 tr(AG4) (这里 AG 是图 G 的邻接矩阵) . 由线性代数我们知道, tr(AG4)=∑i=1nλi4. 其中最大的一项是 λi4, 而根据我们的假设, λ14=p4n4+o(n4). 那么接下来, 我们就是要证明其它 λi4 的和不会太大, 如果你把它们分开一个一个 bound, 你会得到一个 o(n5) 的误差项 (这太大了! ) . 所以我们放在一起 bound, 我们有i≥2∑λi4≤i=2max∣λi∣2i≥1∑λi2注意到 ∑i≥1λi2=tr(AG2)=2e(G), 从而i=1∑nλi4=p4n4+o(n4)+o(n2)n2=p4n4+o(n4).C4⟹EIG: 我们要用 Courant-Fischer 定理 (也叫极大极小定理) : 对于一个实对称矩阵 A, 最大的特征值是λ1=x=0supxTxxTAx.
令矩阵
AG 的特征值是
λ1≥λ2≥⋯≥λn, 然后令
\mathbbm1 是
RV(G) 中的全壹向量. 那么我们有
λ1≥\mathbbm1T\mathbbm1\mathbbm1TAG\mathbbm1=n2e(G)=(p+o(1))n.另一方面, 因为
C4 成立, 我们有
λ14≤i∑nλi4=trAG4≤p4n4+o(n4),这就意味着
λ1≤pn+o(n). 从而
λ1=pn+o(n). 余下就是,
i=1max∣λi∣4≤tr(AG4)−λ14≤p4n4−p4n4+o(n4)=o(n4)定理 1.1 最精彩的就是 C4 性质, 它看上去是所有性质中最弱的, 但是却能够推出其它所有性质.
我们说过这个定理是关于稠密图的 (也就是说 p 是个常数) , 当然也可以写出它在稀疏情形下的推广 (在这个情形下, 随着 n→∞, p=pn→0) . 比如说, 对 DISC 而言, 我们需要把 o(n2) 改成 o(pn2), 从而使其可以蕴含这样的事实: 一个拟随机图的边数应该接近于真随机图中的期望边数. 类似的, 在 COUNT 里, H 带标号地出现的次数应该是 (1+o(1))pe(H)nv(H). 但是对稀疏图来说, 这些性质并不等价. 具体来说, 稀疏图上计数引理不再成立了. 比如说, 下面这个图满足了 DISC 在稀疏情形下的推广, 但是它甚至不包含任何的 C3.
令 p=o(n−1/2), 那么我们期望中, C3 带标号出现的次数应该接近于 (3n)p3, 并且图中的边数应该是 (2n)p. 但是因为我们现在 p=o(n−1/2), 图中 C3 的出现次数要比边数低阶. 所以我们可以在在这个 G(n,p) 图里面, 每个三角形都删去一条边, 这样也只删了 o(n2p) 条边, 从而 DISC 的稀疏推广仍然成立, 但是现在这个图却没有三角形了. 这个图在 DISC 性质的意义下是伪随机的, 但是在三角形个数的意义上就不是伪随机的了.