在第 6.1 节中, 我们看到了 Roth 定理在有限域中 (特别是对于集合 F 3 n ) 的证明. 现在我们对它进行扩展来证明下面给出的上界, 即整数的 Roth 定理:
这个上界的原始证明由 Roth 本人给出. 回想一下, 有限域中 Roth 定理的证明有以下 3 个步骤:
1.
证明一个 3-AP-free 的集合允许一个大的 Fourier 系数.
2.
推导出一定存在一个密度增大的子空间.
3.
迭代密度增量, 得到 3-AP-free 集大小的上界.
关于整数 Roth 定理的证明将同样遵循以上 3 个步骤. 但是, 具体的执行将大不相同. 其中, 主要的区别在于第 2 步, [ N ] 子空间的概念在这里并不好找到.
之前我们在群 F 3 n 上定义了 Fourier 分析. 事实上, 在任何 Abel 群上均有 Fourier 分析理论, 它将群 G 与其对偶群 G 联系起来. 现在我们来考虑群 Z .
Z 的对偶群为 Z = R / Z . f : Z → C 的 Fourier 变换是如下函数 f : R / Z → C , 它满足f ( θ ) = x ∈ Z ∑ f ( x ) e ( − x θ ) 其中 e ( t ) = e 2 πi t . 这通常被称为 f 的 Fourier 级数.
和在 F 3 n 中一样, 以下恒等式在 Z 中也成立, 其证明也相同:
•
f ( 0 ) = ∑ x ∈ Z f ( x ) ;
•
(Parseval) ∑ x ∈ Z f ( x ) g ( x ) = ∫ 0 1 f ( θ ) g ( θ ) d θ ;
•
(反演) f ( x ) = ∫ 0 1 f ( θ ) e ( x θ ) d θ ;
•
定义 Λ ( f , g , h ) = ∑ x , y ∈ Z f ( x ) g ( x + y ) h ( x + 2 y ) , 则Λ ( f , g , h ) = ∫ 0 1 f ( θ ) g ( − 2 θ ) h ( θ ) d θ .
在有限域的版本中, 我们有一条计数引理, 用来表明如果两个函数具有相似的 Fourier 变换, 则它们具有相似数量的 3-AP. 同样的, 在 Z 中我们有类似的计数引理.
令 f , g : Z → C 满足 ∑ n ∈ Z ∣ f ( n ) ∣ 2 ≤ M , ∑ n ∈ Z ∣ g ( n ) ∣ 2 ≤ M . 定义 Λ 3 ( f ) = Λ ( f , f , f ) , 则有∣ Λ 3 ( f ) − Λ 3 ( g ) ∣ ≤ 3 M ∥ f − g ∥ ∞
证明. 注意到Λ 3 ( f ) − Λ 3 ( g ) = Λ ( f − g , f , f ) + Λ ( g , f − g , f ) + Λ ( g , g , f − g ) 我们考虑上式第一项的上界∣Λ ( f − g , f , f ) ∣ = ∣ ∣ ∫ 0 1 ( f − g ) ( θ ) f ( − 2 θ ) f ( θ ) d θ ∣ ∣ ≤ ∥ f − g ∥ ∞ ∣ ∣ ∫ 0 1 f ( − 2 θ ) f ( θ ) d θ ∣ ∣ ≤ ∥ f − g ∥ ∞ ( ∫ 0 1 ∣ f ^ ( − 2 θ ) ∣ 2 d θ ) 1/2 ( ∫ 0 1 ∣ f ( θ ) ∣ 2 d θ ) 1/2 (Cauchy-Schwarz) ≤ ∥ f − g ∥ ∞ ( x ∈ Z ∑ ∣ f ( x ) ∣ 2 ) (Parseval) ≤ M ∥ f − g ∥ ∞ 第二项、第三项的处理是完全相同的.
我们现在来证明 Roth 定理 (定理 2.1 ) . 我们的证明步骤与有限域版本的相同.
第 1 步: 如果集合是 3-AP-free 的, 则有一项大的 Fourier 系数.
令 A ⊂ [ N ] 是一个 3-AP-free 集, ∣ A ∣ = α N , N ≥ 5/ α 2 . 那么存在 θ ∈ R 使得∣ ∣ n = 1 ∑ N ( 1 A − α ) ( n ) e ( θ n ) ∣ ∣ ≥ 10 α 2 N
证明. 由于
A 无 3-AP, 因此
1 A ( x ) 1 A ( x + y ) 1 A ( x + 2 y ) 当且仅当
y = 0 时非零. 因此
Λ 3 ( 1 A ) = ∣ A ∣ = α N . 现在考虑
Λ 3 ( 1 [ N ] ) , 该式计算了
[ N ] 中 3-AP 的数量. 我们可以通过从
[ N ] 中选出两个相同奇偶的元素来构成 3-AP 中的第一项和第三项. 因此
Λ 3 ( 1 [ N ] ) = [ N /2 ] 2 + [ N /2 ] 2 ≥ N 2 /2 . 现在, 应用计数引理, 取
f = 1 A , g = α 1 [ N ] (我们使用记号
f ∧ = f ) ,
2 α 3 N 2 − α N ≤ 3 α N ∥ ∥ ( 1 A − α 1 [ N ] ) ∧ ∥ ∥ ∞ , 因此
∥ ∥ ( 1 A − α 1 [ N ] ) ∧ ∥ ∥ ∞ ≥ 3 α N 2 1 α 3 N 2 − α N = 6 1 α 2 N − 3 1 ≥ 10 1 α 2 N . 最后一个不等号成立时是因为
N ≥ 5/ α 2 . 因此存在
θ 使得
∣ ∣ n = 1 ∑ N ( 1 A − α ) ( n ) e ( θ n ) ∣ ∣ = ( 1 A − α 1 [ N ] ) ∧ ( θ ) ≥ 10 1 α 2 N . 整个证明的核心是关于结构与伪随机性, 我们在讨论图的正则性中也看到了这种想法. 如果 A 是 “伪随机的”, 那么我们希望证明 A 具有小的 Fourier 系数. 但这将表明 f 和 g 具有相似的 Fourier 系数, 这意味着 A 具有许多个 3-AP 从而矛盾. 因此 A 不能是伪随机的, 它必须具有某种结构.
第 2 步, 大的 Fourier 系数会产生密度增量.
在有限域版本中, 我们的 Fourier 系数对应于超平面, 然后我们能够证明在某个超平面陪集上密度很大. 然而, 现在 θ 是一个实数. [ N ] 中没有超平面的概念, 那么我们如何将 [ N ] 细分从而使用密度增量?
我们将 [ N ] 划分为子级数 (sub-progression) , 同时保证 x ↦ e ( x θ ) 在每个子级数上大致恒定.
举一个简单的例子, 假设 θ 是一个有理数 a / b , 其中 b 相当小. 那么 x ↦ e ( x θ ) 在具有公差 b 的算术级数上可近似为常数.
在正式写出这个想法之前, 我们需要介绍 Dirichlet 的经典引理.
令 θ ∈ R , 0 < δ < 1 , 则存在正整数 d ≤ 1/ δ 满足 ∥ d θ ∥ R / Z ≤ δ , 其中 ∥ ⋅ ∥ R / Z 是到最近整数的距离.
证明. 令
m = ⌊ δ 1 ⌋ . 考虑
m + 1 个数
0 , θ , ⋯ , m θ , 根据鸽巢原理, 存在
i , j 使得
i θ 和
j θ 的小数部分最多相差
δ . 令
d = ∣ i − j ∣ , 则有
∥ d θ ∥ R / Z ≤ δ .
下一个引理描述了我们之前将 [ N ] 划分为子级数的想法, 映射 x ↦ e ( x θ ) 在每个子级数上大致恒定.
令 0 < η < 1 , θ ∈ R . 假设 N > C η − 6 ( C 为某常数) . 可以将 [ N ] 划分为多个 sub-AP P i , 每个 sub-AP 的长度满足 N 1/3 ≤ ∣ P i ∣ ≤ 2 N 1/3 , 且 P i 满足对于任意的 i 有 sup x , y ∈ P i ∣ e ( x θ ) − e ( y θ ) ∣ < η .
证明. 根据引理
2.5 , 存在一个整数
d ≤ η 4 π N 1/3 使得
∥ d θ ∥ R / N ≤ 4 π N 1/3 η . 由于
N > C η − 6 , 取
C = ( 4 π ) 6 我们得到
d < N . 因此, 我们可以将
[ N ] 划分为多个具有公差
d 的 sub-AP, 并且保证每个 sub-AP 的长度在
N 1/3 和
2 N 1/3 之间. 然后, 在每个 sub-AP
P 中, 我们有
x , y ∈ P sup ∣ e ( x θ ) − e ( y θ ) ∣ ≤ ∣ P ∣ ∣ e ( d θ ) − 1 ∣ ≤ 2 N 1/3 ⋅ 2 π ∥ d θ ∥ R / Z ≤ η 不等式
∣ e ( d θ ) − 1∣ ≤ 2 π ∥ d θ ∥ R / Z 成立是因为弦长小于等于对应的弧长.
我们现在可以应用这个引理来得到密度增量.
令 A ⊂ [ N ] 是 3-AP-free 的, 且 ∣ A ∣ = α N , N > C α − 12 . 一定存在一个 sub-AP P ⊂ [ N ] , 其中 ∣ P ∣ ≥ N 1/3 且 ∣ A ∩ P ∣ ≥ ( α + α 2 /40 ) ∣ P ∣ .
证明. 根据引理
2.3 , 一定存在
θ 满足
∣ ∣ ∑ x = 1 N ( 1 A − α ) ( x ) e ( x θ ) ∣ ∣ ≥ α 2 N /10 . 然后, 使用引理
2.6 , 取
η = α 2 /20 我们得到
[ N ] 的一个划分
P 1 , … , P k , 该划分满足
N 1/3 ≤ ∣ P i ∣ ≤ 2 N 1/3 . 所以我们有
10 α 2 N ≤ ∣ ∣ x = 1 ∑ N ( 1 A − α ) ( x ) e ( x θ ) ∣ ∣ ≤ i = 1 ∑ k ∣ ∣ x ∈ P i ∑ ( 1 A − α ) ( x ) e ( x θ ) ∣ ∣ 对于
x , y ∈ P i ,
∣ e ( x θ ) − e ( y θ ) ∣ ≤ α 2 /20 . 因此
∣ ∣ x ∈ P i ∑ ( 1 A − α ) ( x ) e ( x θ ) ∣ ∣ ≤ ∣ ∣ x ∈ P i ∑ ( 1 A − α ) ( x ) e ( x 0 θ ) ∣ ∣ + 20 α 2 ∣ P i ∣ ≤ ∣ ∣ x ∈ P i ∑ ( 1 A − α ) ( x ) ∣ ∣ + 20 α 2 ∣ P i ∣ 其中,
x 0 是
P i 中任意一元素. 注意到
10 α 2 N ≤ i = 1 ∑ k ( ∣ ∣ x ∈ P i ∑ ( 1 A − α ) ( x ) ∣ ∣ + 20 α 2 ∣ P i ∣ ) = i = 1 ∑ k ∣ ∣ x ∈ P i ∑ ( 1 A − α ) ( x ) ∣ ∣ + 20 α 2 N 所以
20 α 2 N ≤ i = 1 ∑ k ∣ ∣ x ∈ P i ∑ ( 1 A − α ) ( x ) ∣ ∣ 因此
20 α 2 i = 1 ∑ k ∣ P i ∣ ≤ i = 1 ∑ k ∣ ∣ A ∩ P i ∣ − α ∣ P i ∣ ∣ 我们想证明存在
P i 使得
A 在限制在
P i 时具有密度增量. 我们使用以下技巧
20 α 2 i = 1 ∑ k ∣ P i ∣ ≤ i = 1 ∑ k ∣ ∣ A ∩ P i ∣ − α ∣ P i ∣ ∣ = i = 1 ∑ k ( ∣ ∣ A ∩ P i ∣ − α ∣ P i ∣ ∣ + ∣ A ∩ P i ∣ − α ∣ P i ∣ ) 所以存在
i 满足
20 α 2 ∣ P i ∣ ≤ ∣∣ A ∩ P i ∣ − α ∣ P i ∣∣ + ∣ A ∩ P i ∣ − α ∣ P i ∣ 当
∣ x ∣ + x 总是严格大于 0 时
x 一定大于等于零, 所以一定有
∣ A ∩ P i ∣ − α ∣ P i ∣ ≥ 0 , 因此我们有
20 α 2 ∣ P i ∣ ≤ 2 ( ∣ A ∩ P i ∣ − α ∣ P i ∣ ) 整理后得到
∣ A ∩ P i ∣ ≥ ( α + 40 α 2 ) ∣ P i ∣ 因此, 我们找到了具有密度增量的 sub-AP, 这是我们想要的.
第 3 步, 迭代密度增量.
第 3 步与有限域版本的非常相似. 设初始密度为 α 0 = α , 每次迭代后的密度为 α i . 我们有 α i + 1 ≥ α i + α i 2 /40 , 并且 α i ≤ 1 .
考虑从 α 0 开始到第一次翻倍的迭代次数 i 1 , α i 1 > 2 α 0 . 显然 i 1 ≤ α 40 . 接着我们考虑从 α i 1 到下一次翻倍的迭代次数 i 2 , α i 2 > 2 2 α 0 , 整理得到 i 2 ≤ α 20 . 依次类推, 第 k 次翻倍需要的迭代次数 i k ≤ α 2 k − 1 40 . 对于任意的 k , 有α 40 + α 20 + ⋯ + 2 k − 1 α 40 ≤ α 80 所以在 α 80 次迭代后一定终止. 所以总迭代次数必须是 O ( 1/ α ) .
引理 2.7 表明我们可以向下传递给 sub-AP , 并且 N i > C α − 12 时密度增加. 假设迭代过程在第 i 步终止, 我们必须有 N i ≤ C α i − 12 ≤ C α − 12 . 每次迭代我们的集合的大小都会减少为立方根, 所以N ≤ N i 3 i ≤ ( C α − 12 ) 3 O ( 1/ α ) = e e O ( 1/ α ) 两边取对数得到 α = O ( 1/ log log N ) , ∣ A ∣ = α N = O ( N / log log N ) , 这是我们想要的.
我们来比较 F 3 n 和 [ N ] 的证明策略. 我们看到 r 3 ( F 3 n ) = O ( N / log N ) . 然而, [ N ] 上的上界为 O ( N / log log N ) , 它相比于有限域的结果弱了一个对数因子. 这从何而来? 在 F 3 n 的密度增量步骤中, 我们能够向下传递到一个子集, 该子集的大小是原始子集的常数因子. 然而, 在 [ N ] 中, 每次迭代都会给我们一个子级数, 它的大小等于前一个子空间的立方根. 一个自然的问题是——是否有可能向下传递到一个看起来更像子空间的子级数? 事实证明, 这是可以做到的.
对于子集 S ⊂ F 3 n , 我们可以将其正交补写作U S = { x ∈ F 3 n : 对所有的 s ∈ S , x ⋅ s = 0 } 在 [ N ] 中, 类似的概念被称为 Bohr 集. 这是 Bourgain 在 1999 年提出的一个想法, 用于将有限域版本的证明转移到 Z 上. 这需要我们在 Z / N Z 上工作. 对于子集 S ⊂ Z / N Z , 我们可以将其 Bohr 集定义为Bohr ( S , ϵ ) = { x ∈ Z / N Z : 对所有的 s ∈ S , ∥ ∥ N s x ∥ ∥ ≤ ϵ } 这为子空间提供了更自然的类比, 并且是现代改进 Roth 定理上界的基础. 在第 7 章研究 Freiman 定理时我们还会遇到 Bohr 集.