有两种看待光的不同观点,一种将光视作粒子,另一种则是将光视为波,它们都包含着深刻的洞察力与价值。这两种不同的观点都各自启发了人们,不仅帮助我们加深了对自然世界的理解,还使相关新技术的开发和设计成为可能。然而值得注意的是,这两种观点中对光究竟是什么的概念似乎大相径庭。一方面,粒子模型将光视为一个固态的实体,具有能量,并沿着明确的轨迹移动;另一方面,波动模型将光描述为一个可扩散的实体,它穿过空间,与固态物体的运动无关。这两种观点怎么可能描述的是同一个概念?惠更斯及其同时代的人早就认识到了这种困境。作为对光本质的解释,这两种不同的观点针锋相对,一直持续到19世纪。

当麦克斯韦在发展他的电磁场理论时,他发现能够用此来解释光的波动性,正如我们在第3章中看到的那样。这一推理的胜利似乎证实了托马斯·杨(Thomas Young)和奥古斯丁·菲涅耳(Auguste Fresnel)分别做的两个实验(见第3章),在这两个实验中他们揭示了两个基本现象,干涉与衍射,它们都不适宜用粒子模型解释。然而,光作为粒子沿着轨迹运行的概念仍然非常强大,它可以用来分析和设计光学系统。因此,科学家们需要重新考虑一下,有没有方法使光的粒子说与光的波动说握手言和呢?

再次审视光的轨迹

17世纪上半叶,法国人皮埃尔·德·费马(Pierre de Fermat)就折射现象提出了一种巧妙的解释,与斯涅尔的解释截然不同。让我们回顾一下斯涅尔定律,它描述了光在两个透明介质之间的界面处发生折射,即光的传播方向发生变化。其中,光的传播方向由它的入射和它撞击到界面的位置决定,其传播方向的改变程度则与这两种透明材料的折射率之比成正比。因此,最重要的似乎只是光和界面的局部特性。斯涅尔定律适用于轨迹上的任意一个点,就好像光可以凭着自己的“感觉”,在遇到新界面时调整方向。

图21 费马认为光传播的路径是连接起始点(A)和终点(B)且传播时间最短的路径。光穿过两个光学介质之间的界面,且光在两种介质中的传播速度不同

费马的想法则完全不同。他认为应该根据起点和终点来定义光的轨迹,如图21所示。他认为最应该问的问题是:光穿过空间中两点之间的轨迹是怎样的?在他看来,这个路径应该是耗时最短的路线。基于这一想法,费马异曲同工地给出了与斯涅尔相同的答案。这一成果是非凡而深刻的,因为费马的“最少时间原理”表明了光并不仅是基于光和界面的局部属性,而是对整体情况加以考虑:入射方向、初始位置、最终位置以及处于两个位置之间的一切因素。这一理论与光的粒子模型(粒子对其直接接触的周围环境进行反应的局部模型)相比,差别不言而喻。

这个想法被德国自然哲学家戈特弗里德·威廉·冯·莱布尼茨(Gottfried Wilhelm von Leibniz)所接受,他是与牛顿同时代的科学家,也是牛顿的竞争对手。莱布尼茨对费马所描述的折射过程的整体图景,以及其中所隐含的“优化”概念印象深刻:光对整个空间进行探索,最终仅选择在指定起点和终点之间传输时间最小化的路径。于是他开发了数学工具来分析这个想法,通过计算变化的微积分,可以计算出运动轨迹的微小变化对传输时间产生的影响。莱布尼茨认识到了费马原理中所提出观点的重要性,即光通过从一点到另一点的运动定义了“最佳”轨迹。

事实上,莱布尼茨也被这种最优化的概念所吸引,他将它提升为一个目的论原则,即世界的方方面面都处在某一个起点和某一个终点之间的最佳轨道上。当把这一原则应用到科学领域之外时,这种立场便显现出了其固有的矛盾。伏尔泰在他的小说《赣第德》中便巧妙地讽刺了这一点,他将莱布尼茨的思想借潘葛洛斯博士之口说了出来。在书中,潘葛洛斯博士坚持认为任何发生的事情已经是穷尽所有可能性之后的最好安排,连自然灾害和人为灾难也皆是如此。

连接光波与光线

尽管如此,莱布尼茨的这一数学思想仍被证明是卓有成效的。19世纪著名的爱尔兰数学家威廉·卢云·哈密顿(William Rowan Hamilton)开始研究这些问题。他展示了如何将光的波动概念与粒子概念相结合。波可以通过波长、幅度和相位来定义(见图15);粒子由粒子的位置、移动方向(见图5)定义,而粒子的集合则由其密度(在给定位置的粒子数量)和方向范围来定义。光在介质之间传播时,介质的光学特征由它们的折射率决定,这可能因空间而异。例如,在图20所示的介质界面处,折射率存在一个阶跃变化。

哈密顿表明,光到底是表现出粒子性更多一些,还是波动性更多一些,主要取决于空间中折射率变化的速率与光的波长之间的关系。换句话说,如果折射率变化速度的数值非常接近入射光一个波长的大小,那么光的波动性特征将会非常明显;如果折射率的变化速度基本不变或者非常慢,那么光的粒子特性就会比较明显。

哈密顿展示了在某些常见情况下,较简单的射线图是如何从较复杂的波动图表现出来的。当光的波长与其传播介质的大小相当时,光会表现出明显的波动特性,从而出现如衍射或干涉的波动现象。因此,当光照射的物体直径仅为几微米或者具有非常锋利的边缘时,例如鸟羽或蝴蝶翅膀上的精细结构,你会看到衍射图样。在另一种情况下,例如相机的镜头,其透镜的折射率是均匀的,即折射率的变化速率为零,光会表现出明显的粒子性,因而可以用粒子的运动轨迹来解释。

图22 哈密顿把光线与波前的概念联系起来,从而结合了光的粒子性与波动性

此外,哈密顿还表明,费马提出的光的轨迹理论与一个波的特性直接相关,这个特性就是波前。当波在空间中传播时,将相位相同的位置连接起来就是波前。例如,一块石头被投入池塘中,你看到池塘表面的每一个涟漪,即圆形的图案就是波前。这些涟漪是池塘表面上的水波“达到峰值”(或低谷)时的波前。因此,哈密顿指出光线可以被认为是以直角与波前相交的线,如图22所示,从而将相邻的波前与一个定义明确的光的轨迹这两个概念连接了起来。

哈密顿的“光学类比”

这个显著的结果引申出了另一个深刻的类比,即哈密顿的“光学类比”。他注意到,在那些众所周知的力学公式中,固态物体的运动和位置均是基于轨迹的概念上的。那么,这样的轨迹是否像光的轨迹一样存在着某种“最佳”情况呢?18世纪的皮埃尔·路易·莫佩尔蒂(Pierre Louis Maupertuis)就曾对此展开过研究。

莫佩尔蒂制定了一种方法来评估“作用量”的最佳值,其中作用量指向物体的运动轨迹,是物体的速度、移动距离与质量的乘积。他认为,对于物体在两点之间运动的实际轨迹,作用量应该是最小的。莫佩尔蒂的“最小作用量原理”在概念上与费马的“最短时间原则”非常相似。事实上,18世纪的瑞士数学家莱昂哈德·欧拉(Leonhard Euler)利用莱布尼茨的微积分,从莫佩尔蒂的原理推导出了著名的牛顿运动方程。由此,欧拉将“粒子通过环境感知其运动轨迹”与“粒子的运动路径受指定起点和终点之间的整个空间影响”这两种理论连接了起来。

哈密顿推导出了可以根据运动物体所处环境来描述物体作用量变化的方程。并且,这个方程与哈密顿为描述光线轨迹所推导的方程有着非常相似的形式(只不过在这一情况下,运动物体所处环境指的就是折射率如何随介质中位置的变化而变化)。因此,在固态物体的轨迹和虚构的波前之间存在着一种潜在的类比:也许所有物体都可能具有类似粒子的轨迹和类似波动的特性?事实上,哈密顿方程式及其同名函数对于思考理解光的下一个重大课题——量子力学——来说非常重要。

未解之谜

除此之外,还有很多现象暗示着科学界仍然存在许多新机遇,等待着人们去揭开谜底。大约在19世纪末期,即便哈密顿已经将光的粒子性与波动性联系起来了,仍然有一些关于光的未解之谜,这些谜题用主流模型是无法解释的。其中最重要的两个未解之谜,一个是有关热物体(包括太阳)的颜色,另一个则是有关不同原子在火焰中的颜色。

当物体被加热而升温时,它的颜色会发生改变。拿一块金属为例,随着它越来越热,它首先会发出红色的光,然后是橙色的光,接着则是白色的光。这一现象背后的原理是什么呢?这个问题困扰着当时许多伟大的科学家,包括麦克斯韦本人。依据麦克斯韦的理论,随着温度的升高,物体发出光的颜色理应变得越来越蓝,并最终发出不处于人类视觉范围内的紫外线。显然,这与现实生活中观察到的现象大相径庭。

第二个未解之谜则集中在研究原子发出的光上。约翰·巴耳末(Johannes Balmer)在这一问题上作出了开创性的贡献,我们将在第5章中更详细地研究这种机制。光谱中的颜色分布是光的重要特征,从这个角度来说,原子发出的光与太阳光非常不同(太阳是热物体的一个很好的例子)。太阳光具有我们非常熟悉的“彩虹”光谱(见图23a),由从红色到紫色间的所有连续的颜色组成 。相比之下,一组原子发出的则是一组离散的颜色(见图23b),即一组特定波长的“光谱线”。这些光谱线与所涉及的特定原子的内部结构有关。

这两种现象要求我们彻底修改对光的理解,因为它们无法用波动或粒子的当代模型解释。

图23 a、b分别是太阳(一个“黑体”)和霓虹灯发出的谱图。前者有连续的色带,后者则显示出特定颜色的离散谱线,这些谱线是氖原子的“指纹”

19世纪后期在柏林洪堡大学工作的马克斯·普朗克(Max Planck)首先提出了一个想法,用来解释热物体发出的光谱,这种热物体也常被称为“黑体”。他推测,当光和物质相互作用时,它们只能通过交换离散的“小包裹”来实现,这种“小包裹”可以是量子或能量。普朗克认识到他的想法是非常具有颠覆性的,尽管这将极大地改变我们对光的看法,但他仍不愿意太多地从这个角度去推断有关光的本质。他的想法使光重新被看作一种粒子,一种离散的带有固定能量的物质,可以被原子吸收或发射。

科学家们对光的理解似乎发生了倒退。毕竟,光的波动模型已经解释了迄今为止观察到的所有现象。并且,从哈密顿的工作中可以清楚地看出,即使是光的粒子性表现得最明显的现象,如光沿着特定路径传播,也可以用光的波动模型来解释。所以,光由粒子构成的这种想法似乎没有必要进行讨论了。当然,把光重新看做粒子只是一个计算性的“修复”,来解释现有理论无法解释的现象,它最终会被一个更合理的理论所替代。然而,结合巴尔默的观察实验,这个猜想终将从根本上改变物理学。

在普朗克提出光和物质之间进行离散能量交换的想法之后的几年里,阿尔伯特·爱因斯坦(Albert Einstein)利用这一想法解释了另一个长期无解的物理现象——光电效应。光电效应发生在光照在金属上时,一些电荷(带电的电子)会从金属中喷射出来。电子射出的速度取决于光的波长。光必须足够“蓝”,即具有足够短的波长,才能够使电子喷射出来。随着它变得越来越蓝,电子以越来越高的能量射出,速度也越来越快。

爱因斯坦指出,电子至少需要具有某一特定的能量才能脱离金属的束缚。不仅如此,他认为光的粒子中具有离散的能量,且这样的能量与光的频率成比例(其比例常数被称为普朗克常数h)。因此,当光照射到金属表面时,如果光的频率足够高(波长足够短)时,光的粒子可以将能量传递给电子,为电子提供足够的能量从而逃离金属的束缚。爱因斯坦的模型表明,光与物质之间离散能量交换的起源来自光实际的离散特征。这标志着光的粒子模型的完全复兴。

这一想法与巴耳末对原子产生离散光谱线的观察结果非常吻合。但是,为了完整解释离散光谱线的现象,显然需要着重解释为什么原子会通过这种“小包裹”的能量去发射光。彼时在曼彻斯特工作的丹麦物理学家尼尔斯·玻尔(Niels Bohr)提出了解释这一问题的关键。他认为,光之所以作为离散能量的“小包裹”被发射,是因为原子本身只能以某种构型存在。他认为原子类似于微小的行星系统:电子在围绕中心核的轨道上运转。电子可以在两个稳定的轨道之间“跳跃”,同时发射或吸收光。究竟是发射还是吸收光,则取决于电子是跳跃到更低还是更高能量的轨道上去。这些轨道或量子态的特征取决于原子本身:该原子有多少电子,还有其原子核的大小。因此,电子在两个量子态之间移动并且发射或吸收能量,是由原子本身的特性所决定的。这就是说,当光子的能量与原子中电子的两个量子态的能量差相同时,光的吸收或发射就成为可能。玻尔的想法巧妙地解释了巴耳末的观测结果,并肯定了光束作为离散粒子集合的想法。

所有这些进展都有可能破坏麦克斯韦理论所强烈肯定的光的波动模型。它们甚至超越了哈密顿试图将光的波动性与粒子性相协调的努力,因为这一全新的想法,即光束是离散粒子的集合,似乎是光的基本特质,而不仅是拿物体的大小与光的波长进行比较的结果。因此,科学家们重新审视了关于光的本质问题。

1908年,在剑桥工作的杰弗里·泰勒(Geoffrey Taylor)用极其微弱的光进行了杨氏双缝实验。光非常微弱,以至于任何时刻同时通过两个狭缝的光子平均下来不到一个,但他仍然看到了干涉条纹。这个结果很奇怪。如果我们认为从光源到探测器有两条路径,第一条路径是通过第一个狭缝,第二条则是通过另一条狭缝,那么一个光子从光源到达探测器的路径也有两条。然而,在同一时间内通过双缝的光子数只有一个,那么,单个光子是怎样形成干涉条纹的呢?这让当时的科学家们陷入了两难的境地。玻尔解决了这一难题。玻尔指出,一方面,光子总是会选择这两种路径中的一种,而另一方面,它表现得好像它同时通过了这两种路径一样。因此,即使是单个粒子也可能表现出类似波的行为。

光的波粒二象性

正如你可能想象的那样,要摆脱这个难题,需要一个真正革命性的想法。20世纪20年代在剑桥工作的物理学家保罗·狄拉克(Paul Dirac)认为,光的基本属性在于它既是粒子又是波,两种特性同时存在。现在,这一想法对你来说可能只是诡辩,一种没有回答任何问题的逻辑游戏,但它背后隐藏着深刻的洞见。狄拉克发展了麦克斯韦电磁场理论的量子力学版本。利用这一理论,狄拉克能向你展示,如果你使用像杨氏双缝干涉仪这样的装置来测量这些“量子场”,你会看到干涉效应这种体现光的波动性的现象。然而,如果你只是测量光的强度,那么只用去数光束中的光子数就可以了。

这一理论非常深刻,它将量子场设定为构建宇宙的基本实体——它不是粒子也不是波,而是既是粒子又是波,具有完全的波粒二象性。它完美地解释了光所展现出的所有现象,并提供了理解所有光学效应的框架。这些光学效应不仅包括牛顿、麦克斯韦和哈密顿的经典世界,还包括了普朗克、爱因斯坦和玻尔的量子世界。但是,这一理论实在是令人费解,因为它包含有一个完全非直觉的实体——量子场。光只是量子场的一个例子。

光既是波又是粒子的这一跨时代的理论激发了一些重要的新思想。例如,路易斯·德布罗意(Louis de Broglie)提出,如果这种波粒二象性存在于光中,那肯定也应该存在于所有其他事物上。因此,那些我们通常认为的由粒子构成的物质实体也应该具有“波动”的特征。他的想法超越了哈密顿所考虑的范围,甚至找到了物质波动性波长的定义。这一波长现在被称为德布罗意波长λdB,它与粒子动量(质量与速度的乘积)成反比,比例常数为普朗克常数h。

λdB=h/mv

这个波长公式表明,如果想观察到这种波动现象,必须使用质量非常轻或温度非常低(意味着移动速度非常慢)的粒子。使用分子代替光通过双缝干涉仪,一样可以形成干涉图样,如图24所示。这个结果简直令人难以置信。如果你把一个分子当做是一个非常轻的粒子,那么你将无法解释这个干涉图样的出现,因为你认为这个粒子只能通过这两个缝隙中的一个。然而,一个具有质量的粒子竟然可以同时通过两个缝隙并发生干涉,这个想法是非常惊人的。

图24 一次只让一个分子通过一个微缩版的杨氏双缝装置所形成的干涉图样。这两个很小的狭缝之间的距离仅为十亿分之一米

光的强度是光的一个重要性质。如果将光看做是波,那么光的强度与其振幅的平方成正比。如果将光看做是粒子的集合,那么光的强度则与光束中的光子密度直接相关。类似地,波函数的平方与特定时间与空间中处于特定点的粒子的密度有关。但是,要想确定粒子在特定时刻的空间位置是不可能的。这种不确定性似乎是世界的基本属性,与“量子场是所有事物的核心”这一事实有着深刻的联系。

无即是有

认同这一事实的另一个结果就是,“什么也没有”实际上并不代表什么都不存在。换句话说,即使在一个完全没有物质(例如电子、原子)甚至光(光子)存在的空间里,仍然具有可测量的特性。这个空白的区域被称为“电磁量子真空”,是一种所有可提取的能量都被尽数去除的宇宙状态。与很多人的想象不同,它其实是一个容纳着很多活动的“大熔炉”,由波动的场组成却不包含任何光子。令人惊讶的是,量子真空中能够产生可以被观察到的现象。这不禁让我们发问,怎么能从“什么也没有”中产生出我们可以观测到的现象呢?

我们已经知道了,光可以被认为是电磁场的波动。请将这种波动所产生的场想象成海面上的涟漪。这些波动可以连续冲击海面上的任何船只,但是并不会将船上下移动或者将船推到某一条明确的波浪上。总的来说,船在这样的波动下并不会发生移动,仅仅是来回摇摆而已。现在将带电粒子(如电子)放在同样的想象场景中,这个带电粒子可以“感知”到电磁真空中的随机变化,并受到这些变化的连续冲击,就像海面上的涟漪一样。如果电子在原子中被束缚,那么这种冲击就是电子在其可能占据的量子态之间的能量的转变。由于原子吸收光子的频率取决于电子量子态间的能极差,因此,通过观察原子可能吸收的光的颜色变化,就可以知道电子在不同量子态间的能极差。这种变化微不足道,不到光的波长的十亿分之一。尽管非常微小,但是利用精确的频率测量技术,还是可以确定这种变化。20世纪50年代在纽约工作的威利斯·兰姆(Willis Lamb)是完成这一观测的第一人,并因此获得诺贝尔奖,他观测到的这种频率改变被称为“兰姆移位”。

对光双重身份的理解有许多层面。即使在前量子世界,光到底是波还是粒子的二元对立问题也需要解决。当时,通过了解光所体现的波动性质,以及与光相互作用的物体尺寸和性质,这一对立得到了解释。事实上,当物体的尺寸远大于光的波长且不具有锐利边缘时,物体的运动都可以解释成粒子沿着明确定义的路径做运动。而量子力学则提供了一种解释这种二元性的新观点。当光与物质相互作用时,光被视为一个或多或少带有能量的粒子,与此同时,它还保留了可以同时展现波动现象的能力。这个解决二元对立的方案引入了一个全新的概念:量子场。光粒子,即光子,是由量子场所激发,并且根据麦克斯韦量子版的光波方程进行传播。

量子场现在被认为是构成宇宙的基本实体,支撑着所有类型的物质和非物质,其中光可能是量子场最简单的一个例子。对此唯一的解释是,世界上的事物既不是粒子也不是波,而是兼而有之。这就是真实世界的本质。