Skip to content
Lokkue's Notes
Go back

第05讲 内积空间与Hilbert空间:找回失去的"直角"与正交分解的狂欢

Edit page

1. 动机先行:完美的 Banach 空间到底缺了什么?

我们在上一讲中将分析与代数联姻,登上了 Banach 空间(完备赋范线性空间) 的神坛。现在的我们看似无所不能:我们可以把函数像向量一样相加减(线性结构),可以丈量它们的长度误差(范数度量),并且完全不用担心迭代算法会掉进虚无的黑洞(完备性)。

但是,如果让一个几何学家来看 Banach 空间,他会感到极度的窒息。

我们遇到了什么麻烦?

在初等欧氏几何中,最伟大、最具威力的概念除了”长度”,还有一个平起平坐的王者:“角度”——尤其是 90 度的直角 / 正交

有了垂直,我们才能建立直角坐标系;有了坐标系,我们才能把一个复杂的受力分解为 XX 轴和 YY 轴的独立分量;有了分解,我们才能化繁为简、各个击破。

然而,在一般的 Banach 空间中,我们竟然无法判断两个函数是否”垂直”!只有表示长度的范数 x\|x\|,是绝对无法抠出夹角信息的。你能看出来 sinx\sin xcosx\cos x[0,2π][0, 2\pi] 上是否”垂直”吗?仅凭它们各自的范数(或它们差值的范数)绝对不可能。更致命的是,没有正交分解,我们在 Hilbert 空间中将失去以下所有瑰宝:

破局之道:重塑内积

为了找回在无垠的函数大海中丢失的”正交”概念,我们必须在范数的地基下面再打入一根更深的桩:内积(Inner Product)

范数告诉了我们一个向量”有多大”,但内积告诉了我们两个向量”有多对齐”。前者是长度的度量,后者是角度的度量。在范数的基础上引入内积,就如同在”尺子”之上再增加一个”量角器”——从此,泛函分析的几何面貌从一维(纯长度)跃升为二维(长度 + 角度)。

它的出现,将泛函分析推向了最华丽、最贴近物理现实的巅峰。


2. 内积与内积空间:重铸角度的基石

定义 5.1(内积 / Inner Product)

U\mathscr{U} 是数域 K\mathbb{K}R\mathbb{R}C\mathbb{C})上的线性空间。若映射 (,):U×UK(\cdot, \cdot): \mathscr{U} \times \mathscr{U} \to \mathbb{K} 满足以下三条公理,则称其为 U\mathscr{U} 上的一个内积

  1. 第一元线性性:对任意 a,bKa, b \in \mathbb{K}x1,x2,yUx_1, x_2, y \in \mathscr{U},有 (ax1+bx2,y)=a(x1,y)+b(x2,y)(a x_1 + b x_2, \, y) = a (x_1, y) + b (x_2, y)
  2. 共轭对称性(Hermite 对称)(x,y)=(y,x)(x, y) = \overline{(y, x)},其中上划线表示复共轭。
  3. 正定性(x,x)0(x, x) \ge 0,且 (x,x)=0    x=θ(x, x) = 0 \iff x = \theta

含义逐条解析

公理 1(第一元线性性):内积对待逗号左边的元素,就像普通的乘法一样可以拆括号、提系数。注意我们只规定了第一元的线性性;在复数域上,由公理 2 可推知第二元是共轭线性的:(x,ay)=aˉ(x,y)(x, ay) = \bar{a}(x, y)。在实数域上,两侧都是线性的,内积退化为完美的双线性型

公理 2(共轭对称性):在实数域上,这就是完美的对称 (x,y)=(y,x)(x,y) = (y,x)。但在量子力学常用的复数域中,交换位置必须取复共轭。这个看似”麻烦”的规定有一个至关重要的功能:确保 (x,x)=(x,x)(x,x) = \overline{(x,x)},从而 (x,x)(x,x) 永远是一个实数(而非复数),否则公理 3 的"0\ge 0"将毫无意义。物理学中,(x,x)(x,x) 就是概率幅的模平方或状态的能量期望值——必须是实数。

公理 3(正定性):没有任何非零向量与自己的内积是负数或零。这保证了内积诱导的”长度”是有意义的:长度必须是正数(除非是零向量)。

定义 5.2(内积空间 / Inner Product Space)

装备了内积 (,)(\cdot, \cdot) 的线性空间 U\mathscr{U},称为内积空间

2.1 从内积顺产范数:Cauchy-Schwarz 的降维压制

一旦有了内积,我们可以以一种极其自然、极其”物理”的方式定义长度(范数):

x=(x,x)\|x\| = \sqrt{(x, x)}

直觉震撼:这完完全全就是把初中物理课本上的矢量点乘 vv=v2\vec{v} \cdot \vec{v} = |\vec{v}|^2 直接抄到了无穷维的函数空间里!在 L2[a,b]L^2[a,b] 中,(f,f)=abf(t)2dt(f, f) = \int_a^b |f(t)|^2 dt,它的平方根正是信号 ff 的”均方根能量”(RMS energy)—— 电工学中的有效值概念的数学抽象。

但是,为了让 (x,x)\sqrt{(x,x)} 合法地成为一个范数(即必须满足三角不等式),我们需要泛函分析中最著名的镇海神针:

定理 5.1(Cauchy-Schwarz 不等式 / 柯西-施瓦茨不等式)

U\mathscr{U} 为内积空间,则对任意 x,yUx, y \in \mathscr{U},有: (x,y)xy|(x, y)| \le \|x\| \cdot \|y\| 等号成立当且仅当 xxyy 线性相关(即其中一个向量是另一个的标量倍数)。

前因后果与重要性:为什么这个不等式如此重要?因为在它成立的前提下,范数三角不等式的证明只需两行代数展开即可完成: x+y2=(x+y,x+y)=x2+(x,y)+(x,y)+y2x2+2xy+y2=(x+y)2\|x+y\|^2 = (x+y, x+y) = \|x\|^2 + (x,y) + \overline{(x,y)} + \|y\|^2 \le \|x\|^2 + 2\|x\|\|y\| + \|y\|^2 = (\|x\| + \|y\|)^2 证毕。如果没有 Cauchy-Schwarz,我们无法从 (x,y)|(x,y)| 过渡到 xy\|x\|\|y\|,整个内积空间的理论大厦将失去地基。

几何直觉:不等式 (x,y)xy|(x,y)| \le \|x\| \|y\| 等价于说”两个向量的内积的绝对值,永远不会超过它们各自长度的乘积”。在欧氏几何中,这等于说 xy=xycosθxy|\vec{x} \cdot \vec{y}| = \|x\|\|y\|\, |\cos\theta| \le \|x\|\|y\|,即 cosθ1|\cos\theta| \le 1——一个几何学中最基本的事实。Cauchy-Schwarz 不等式确保了在无穷维的函数空间中,我们的”角度”直觉——特别是 cosθ\cos\theta 的有界性——是完全成立的。

Cauchy-Schwarz 不等式的证明精要(在折叠区外给出核心思路):

考虑内积 (xλy,xλy)0(x - \lambda y, x - \lambda y) \ge 0 对任意标量 λ\lambda 成立。展开得 x2λˉ(x,y)λ(x,y)+λ2y20\|x\|^2 - \bar{\lambda}(x,y) - \lambda\overline{(x,y)} + |\lambda|^2\|y\|^2 \ge 0

y=θy = \theta,不等式显然成立。若 yθy \neq \theta,取 λ=(x,y)/y2\lambda = (x,y) / \|y\|^2(这正是 xxyy 方向上的”投影系数”),代入上述非负性展开式,化简即得 (x,y)2x2y2|(x,y)|^2 \le \|x\|^2\|y\|^2

思维旁白:这个证明的一个优雅之处在于,λ\lambda 的选取并非神来之笔,而是最佳投影系数的必然选择——取这个 λ\lambda 就是最小化 xλy\|x - \lambda y\|,几何上相当于从 xxyy 所在的直线作垂线。这个思路将在后续的正交分解定理中发扬光大。


3. Hilbert 空间:泛函分析皇冠上的明珠

定义 5.3(Hilbert 空间 / Hilbert Space)

如果一个内积空间,按照它自身诱导出的范数 x=(x,x)\|x\| = \sqrt{(x,x)} 来度量,是完备的(即每个 Cauchy 列都在空间中收敛),则称其为 Hilbert 空间(希尔伯特空间)。

史诗级定位:Hilbert 空间是无限维欧氏空间的完美终极形态。它是量子力学的原生宿主(量子态就是 Hilbert 空间中的单位向量),是信号处理的兵工厂(傅里叶分析在 L2L^2 中达到完整的理论统一),是偏微分方程论的主战场(Sobolev 空间通常构造为 Hilbert 空间)。在这个空间里,一切都异常平滑、极度和谐。

Hilbert 空间的核心案例

例 5.1(l2l^2 —— 离散霸主)

所有满足 i=1xi2<\sum_{i=1}^\infty |x_i|^2 < \infty 的复数数列构成的空间,内积定义为: (x,y)=i=1xiyi(x, y) = \sum_{i=1}^\infty x_i \overline{y_i} 诱导范数为 x=(xi2)1/2\|x\| = (\sum |x_i|^2)^{1/2}。它完备,因而是 Hilbert 空间。

例 5.2(L2(F)L^2(F) —— 连续霸主)

所有满足 Ff(t)2dt<\int_F |f(t)|^2 dt < \infty 的可测函数(模去几乎处处相等的等价类)构成的空间,内积定义为: (f,g)=Ff(t)g(t)dt(f, g) = \int_F f(t) \overline{g(t)} \, dt 诱导范数为 f2=(f2)1/2\|f\|_2 = (\int |f|^2)^{1/2}。同样完备,因而是 Hilbert 空间。

终极拷问:在五花八门的 LpL^plpl^p 空间家族中,为什么偏偏只有 p=2p=2 能够定义内积、加冕为 Hilbert 空间?这就引出了下文的深度辨析。

💡 深度辨析:如何验明正身?从 Banach 到 Hilbert 的门槛

给了你一个 Banach 空间和它的范数 x\|x\|,你如何一眼看穿它的底层其实隐藏着一个更为高贵的”内积”?

数学家给出了一个漂亮到令人窒息的几何判据——平行四边形法则(中线定理 / Parallelogram Law)

x+y2+xy2=2(x2+y2)\boxed{\|x+y\|^2 + \|x-y\|^2 = 2(\|x\|^2 + \|y\|^2)}

直觉解释:在平面几何中,平行四边形两条对角线长度的平方和,永远等于四条边长度的平方和。这是欧氏几何的内禀特征。

这个定理强悍到什么地步?在所有可能构造出来的范数中,只有且仅有由内积诱导出来的范数,才敢满足这条平行四边形法则! 它是内积空间的”验血报告”——通过了它的测试,你骨子里一定是内积空间;通不过,你就是一个”纯种的”Banach 空间(非 Hilbert)。

实战测试:把 LpL^p 空间的范数代入平行四边形法则。只在 p=2p=2 的那一瞬间,等式才轰然成立。对于 p2p \neq 2LpL^p 空间中的简单函数(如两个只在不相交区域非零的示性函数),左右两侧的计算结果天差地别。这就是 L2L^2 在自然界和工程界拥有超然地位的数学本质!

如果法则成立,一个逆操作可以直接从范数还原出隐藏的内积:

定理 5.2(极化恒等式 / Polarization Identity)

在实内积空间中: (x,y)=14(x+y2xy2)(x, y) = \frac{1}{4} \big( \|x+y\|^2 - \|x-y\|^2 \big)

在复内积空间中: (x,y)=14(x+y2xy2+ix+iy2ixiy2)(x, y) = \frac{1}{4} \big( \|x+y\|^2 - \|x-y\|^2 + i\|x+iy\|^2 - i\|x-iy\|^2 \big)


4. 正交与最佳逼近:在无穷维里切豆腐

终于,在 Hilbert 空间里,我们找回了期盼已久的直角。

定义 5.4(正交 / Orthogonal)

(x,y)=0(x, y) = 0,则称 xxyy 正交(或垂直),记作 xyx \perp y。 若 xx 与子集 MM 中的每一个元素都正交,则称 xMx \perp M。 记 M={xUxM}M^\perp = \{ x \in \mathscr{U} \mid x \perp M \},称为 MM正交补

一旦有了正交,勾股定理立刻”白嫖”到手: xy    x+y2=x2+y2x \perp y \implies \|x+y\|^2 = \|x\|^2 + \|y\|^2 这直接由内积展开 (x+y,x+y)=(x,x)+(x,y)+(y,x)+(y,y)=x2+0+0+y2(x+y, x+y) = (x,x) + (x,y) + (y,x) + (y,y) = \|x\|^2 + 0 + 0 + \|y\|^2 得到。

正交分解定理(投影定理):泛函分析最华彩的篇章

定理 5.3(正交分解定理 / Projection Theorem / 正交投影定理)

MM 是 Hilbert 空间 U\mathscr{U} 中的一个线性子空间(必须是闭的!),xUx \in \mathscr{U} 为任意向量。则:

  1. 最佳逼近的存在唯一性:在 MM 中存在唯一的 yMy \in M,使得 yyMM 中离 xx 最近的点: xy=infzMxz\|x - y\| = \inf_{z \in M} \|x - z\|
  2. 正交撕裂xx 可以被唯一地分解为: x=y+z,yM,zMx = y + z, \qquad y \in M,\quad z \in M^\perp 其中 yy 称为 xxMM 上的正交投影zz 称为正交残差
  3. 投影算子的性质:映射 P:UMP: \mathscr{U} \to MPx=yPx = y 是有界线性的(P=1\|P\| = 1 除非 M={θ}M = \{\theta\}),且满足 P2=PP^2 = P(幂等性)。

思维建模与物理直觉

想象你在一个三维房间里用手电筒,把一个点 xx 垂直投射到地板(闭子空间 MM)上。

  • 地板上的影子 yy 就是离 xx 最近的点(最佳逼近)——因为光走直线,垂足自然是距离最短的。
  • 光线走过的轨迹 z=xyz = x - y 垂直于整块地板(zMz \perp M)——手电筒的光束与地板正交。

Hilbert 空间保证了,即便在无穷维的恐怖空间中,这束”垂直光线”永远笔直、永远存在、永远唯一

yy 是离 xx 最近的点这一事实,有着极为深刻的物理意义:在所有只使用 MM 中元素去近似 xx 的方案中,正交投影 yy 的方案使得残差 z=xyz = x - y能量 z2\|z\|^2 达到绝对最小值。这就是最小二乘法的 Hilbert 空间表述——残差必须与被近似的子空间正交!

为什么要强调 MM 是”闭”的?

如果 MM 不闭,那么 infzMxz\inf_{z \in M} \|x - z\| 可能根本无法被 MM 中的任何点真正取到!就像在区间 (0,1)(0, 1) 中求最小值一样——下确界是 00 但没有点能够实现它。闭性保证了 MM 的”下确界可达性”——存在一个具体的点 yy 让它取到最小值。


5. 规范正交系与 Fourier 展开的终极升华

仅仅是切豆腐还不够爽,我们要把 Hilbert 空间铺满坐标系!

定义 5.5(规范正交系 / Orthonormal System)

U\mathscr{U} 中的一族向量 {eα}αΛ\{e_\alpha\}_{\alpha \in \Lambda}(指标集 Λ\Lambda 可以是有限的、可数的,甚至不可数的)称为规范正交系,若: (eα,eβ)=δαβ={1,α=β0,αβ(e_\alpha, e_\beta) = \delta_{\alpha\beta} = \begin{cases} 1, & \alpha = \beta \\ 0, & \alpha \neq \beta \end{cases}

有了规范正交系,我们可以像在三维空间分解出 (x,y,z)(x, y, z) 坐标一样,把任何向量 xx 往这些坐标轴上分别做正交投影。投影得到的坐标分量:

cα=(x,eα)c_\alpha = (x, e_\alpha)

被尊称为 xx 关于该规范正交系的 Fourier(傅里叶)系数

定理 5.4(Bessel 不等式 / 贝塞尔不等式)

{ek}k=1\{e_k\}_{k=1}^\inftyU\mathscr{U} 中的规范正交系,则对任意 xUx \in \mathscr{U}k=1(x,ek)2x2\sum_{k=1}^\infty |(x, e_k)|^2 \le \|x\|^2

降维打击直觉与物理意义:你的本尊总能量是 x2\|x\|^2。你往任意多个坐标轴上投下影子的部分能量之和,累死也绝对超不过你本尊的总能量。这是物理世界能量守恒的数学底线——信息不能无中生有,投影过程只会损失信息(丢弃与投影方向正交的分量),而不会凭空创造能量。

Bessel 不等式实际上是在说:Fourier 系数序列 {(x,ek)}\{(x, e_k)\} 必定属于 l2l^2,即 (x,ek)2<\sum |(x, e_k)|^2 < \infty。这给出了 Fourier 系数的衰减率约束——系数的平方必须是可和的,因此 (x,ek)|(x, e_k)| 必须随着 kk \to \infty 而趋于零(Riemann-Lebesgue 引理的离散版本)。

什么时候不等号变成等号?这就引出了泛函分析的巅峰定理之一:

定理 5.5(Parseval 等式 / 帕塞瓦尔等式)

{ek}k=1\{e_k\}_{k=1}^\infty 为 Hilbert 空间 U\mathscr{U} 中的规范正交系,则以下命题等价:

  1. k=1(x,ek)2=x2\sum_{k=1}^\infty |(x, e_k)|^2 = \|x\|^2 对所有 xUx \in \mathscr{U} 成立;
  2. 规范正交系 {ek}\{e_k\}完备的,即 span{ek}=U\overline{\operatorname{span}}\{e_k\} = \mathscr{U}(它们张成的闭线性包等于整个空间);
  3. 每个 xUx \in \mathscr{U} 都可以唯一地表示为 Fourier 级数 x=k=1(x,ek)ekx = \sum_{k=1}^\infty (x, e_k) e_k

高潮时刻:Parseval 等式是 Fourier 分析灵魂的最终数学表达。当你的坐标系 {ek}\{e_k\} 铺满了整个 Hilbert 空间的每一个角落时(换言之为完备规范正交系),所有的影子能量精确完美地拼凑出了本尊的完整能量。只要等式成立,就意味着: x=k=1(x,ek)ekx = \sum_{k=1}^\infty (x, e_k) e_k 这个级数在 U\mathscr{U} 的范数拓扑下精确地(而非近似地)还原了 xx。这就是大名鼎鼎的傅里叶级数展开的泛函分析根基!在这里,Fourier 级数的”逐点收敛”难题被更本质的”范数收敛(即能量收敛)“所稀释——我们不纠结于某一点的函数值是否对得上,我们只要求整体的均方误差趋于零。


6. Riesz-Fischer 定理:可分 Hilbert 空间的大一统

定理 5.6(Riesz-Fischer 定理 / 可分 Hilbert 空间的分类定理)

任何一个无穷维、可分的 Hilbert 空间 U\mathscr{U}(无论实或复),都等距同构于标准的数列空间 l2l^2

换言之,存在一个双射 U:Ul2U: \mathscr{U} \to l^2,它既是线性的(U(ax+by)=aUx+bUyU(ax+by) = aUx + bUy),又是保内积的((Ux,Uy)l2=(x,y)U(Ux, Uy)_{l^2} = (x, y)_{\mathscr{U}})。

大圆满感慨:这是泛函分析追求极致抽象后带来的终极美感。万法归宗——表象千变万化,但在 Hilbert 这面照妖镜前,一切无限维的复杂信号和量子态,最终都乖乖现出了原形:它们不过是 l2l^2 空间里,一串串平方可和的普普通通的数字坐标罢了。

一个看似完全不同的空间——比如 L2[0,1]L^2[0, 1](所有 [0,1][0,1] 上平方可积的函数)——在数学本质骨子里,竟然和由无穷数列构成的 l2l^2 一模一样(等距同构)。你在这个空间中的每一个函数 f(t)f(t),都对应着 l2l^2 中的某个唯一数列 (c1,c2,c3,)(c_1, c_2, c_3, \dots)——即它在某组完备规范正交系下的 Fourier 系数序列。两个空间的”距离感”经由这个对应关系完美互译。

这一定理是泛函分析”透过现象看本质”能力的极致展现:所有可分 Hilbert 空间,本质上只有 l2l^2 一个。


7. 交互式自测:大结局的试炼

灵魂问答 1:施密特正交化——从混乱中建立秩序

:理论听得很爽,但如果老板给我扔过来一堆歪七扭八、毫无垂直规律可言的普通向量集合 {x1,x2,}\{x_1, x_2, \dots\},我还能在里面硬生生地造出一套完美的”规范正交坐标系”吗?

做题思路与实战操作: 完全可以!只要这堆向量不是互相抄袭的(线性无关),我们就祭出线性代数中的无解大招:施密特(Gram-Schmidt)正交化过程

  1. 抓壮丁:先随便抓出 x1x_1,直接除以它的长度强行压缩成 1,得到第一根完美的坐标轴 e1=x1/x1e_1 = x_1 / \|x_1\|
  2. 扒皮抽筋:拿出 x2x_2。我们知道它里面肯定掺杂了 e1e_1 方向的成分。计算它在 e1e_1 上的投影 (x2,e1)e1(x_2, e_1) e_1,然后从 x2x_2 里无情地减去、扒掉这部分成分!剩下的残渣 h2=x2(x2,e1)e1h_2 = x_2 - (x_2, e_1) e_1,就是一个纯粹不含 e1e_1 血统、绝对垂直于 e1e_1 的新物种。把它长度归 1,得到第二根轴 e2e_2
  3. 无限剥削:拿出 x3x_3,把 e1e_1e2e_2 的成分全减掉,得到垂直于前两者的 e3e_3……依此类推: hk=xkj=1k1(xk,ej)ej,ek=hkhkh_k = x_k - \sum_{j=1}^{k-1} (x_k, e_j) e_j, \qquad e_k = \frac{h_k}{\|h_k\|}

这个精妙的榨取算法告诉我们:在 Hilbert 空间里,美好的正交坐标系不是天生的,而是只要你想要,就永远可以被完美且机械地人为构造出来。这就是为什么数学家敢在无底洞般的函数空间里昂首阔步的底气!

灵魂问答 2:为什么必须是”闭”子空间?

:正交分解定理的条件中,为什么强调 MM 是”闭”子空间?如果我忘记验证闭性就拿去用,会怎样?

手把手解惑:这不是吹毛求疵,而是血的教训。

考虑 Hilbert 空间 L2[0,1]L^2[0,1],取 MM[0,1][0,1] 上所有多项式构成的子空间。MM 显然是一个线性子空间,但它不是闭的!——由 Weierstrass 逼近定理,任意连续函数都可以被多项式列在 L2L^2 范数下逼近,因此 MM 的闭包 M=L2[0,1]\overline{M} = L^2[0,1]

现在取一个不在 MM 中的连续函数 x(t)=etL2[0,1]x(t) = e^t \in L^2[0,1]。由于 M=L2[0,1]\overline{M} = L^2[0,1],理论上存在多项式序列逼近 ete^t 到任意精度,infzMxz=0\inf_{z \in M} \|x - z\| = 0。但是——没有任何一个单个的多项式能够实现这个下确界 0!因为 ete^t 本身不是多项式,而多项式的极限是 ete^t 而非任何具体的多项式。

所以,如果不要求 MM 闭,你的”最佳逼近”可能根本不存在!


8. 本讲小结与系列终章

本讲我们完成了泛函分析从”距离空间”到”Hilbert 空间”的终极升维:

泛函分析的五大讲至此落下帷幕。我们从一把”尺子”出发,经历了距离空间、完备性、紧性、范数、内积的层层递进,最终在 Hilbert 空间的明珠上达成了分析、代数与几何的完美统一。

这只是一个起点。在后续的进阶学习中,这些基础将支撑起:线性算子的谱理论、紧算子的 Fredholm 理论、无界算子与量子力学、Sobolev 空间与偏微分方程的弱解理论……泛函分析的工具箱已然打开,道路在脚下延伸。


Edit page

Previous Post
第04讲 赋范线性空间与Banach空间:加上方向与向量结构的距离