李淼
第一章从弦论到M-理论
(第一节)
弦论的发现不同于过去任何物理理论的发现。一个物理理论形成的经典过程是从实验到理论,在爱因斯坦广义相对论之前的所有理论无不如此。一个系统的理论形成过程通常需要几十年甚至更长的时间,牛顿的万有引力理论起源于加利略的力学及第谷,开普勒的天文观测和经验公式。一个更为现代的例子是量子场论的建立。在量子力学建立(1925/26)之后仅仅两年就有人试图研究量子场论,量子场论的研究以狄拉克将辐射量子化及写下电子的相对论方程为开端,到费曼(Feynman),薛温格(Schwinger)和朝永振一郎(Tomonaga)的量子电动力学为高潮,而以威尔逊(K.Wilson)的量子场论重正化群及有效量子场论为终结,其间经过了四十余年,数十甚至数百人的努力。广义相对论的建立似乎是个例外,尽管爱因斯坦一开始已经知道水星近日点进动,他却以惯性质量等于引力质量这个等效原理为基础,逐步以相当逻辑的方式建立了广义相对论。如果爱因斯坦一开始对水星近日点进动反常一无所知,他对牛顿万有引力与狭义相对论不相容的深刻洞察也会促使他走向广义相对论。尽管同时有其他人如阿伯拉汗(MaxAbraham),米(GustavMie)试图改正牛顿万有引力,爱因斯坦的从原理出发的原则使得他得到正确的理论。弦论发现的过程又不同于广义相对论。弦论起源于一九六零年代的粒子物理,当时的强相互作用一连串实验表明存在无穷多个强子,质量与自旋越来越大越来越高。这些粒子绝大多数是不稳定粒子,所以叫做共振态。当无穷多的粒子参与相互作用时,粒子与粒子散射振幅满足一种奇怪的性质,叫做对偶性。1968年,一个在麻省理工学院工作的意大利物理学家威尼采亚诺(GabrieleVeneziano)翻了翻数学手册,发现一个简单的函数满足对偶性,这就是著名的威尼采亚诺公式。应当说当时还没有实验完全满足这个公式。很快人们发现这个简单的公式可以自然地解释为弦与弦的散射振幅。这样,弦理论起源于一个公式,而不是起源于一个或者一系列实验。伯克利大学的铃木(H.Suzuki)据说也同时发现了这个公式,遗憾的是他请教了一位资深教授并相信了他,所以从来没有发表这个公式。所有弦论笃信者都应为威尼亚采诺没有做同样的事感到庆幸,尽管他在当时同样年轻。
弦论又可以说是起源于一种不恰当的物理和实验。后来的发展表明,强相互作用不能
用弦论,至少不能用已知的简单的弦论来描述和解释。强相互作用的最好的理论还是场论,一种最完美的场论:量子色动力学。在后来的某一章内我们会发现,其实弦论与量子色动力学有一种非常微妙,甚至可以说是一种离奇的联系。作为一种强相互作用的理论,弦论的没落可以认为是弦论有可能后来被作为一种统一所有相互作用的理论运气,更可以说是加州理工学院史瓦兹(JohnSchwarz)的运气。想想吧,如果弦论顺理成章地成为强相互作用的理论,我们可能还在孜孜不倦地忙于将爱因斯坦的广义相对论量子化。不是说这种工作不能做,这种工作当然需要人做,正如现在还有相当多的人在做。如果弦论已经成为现实世界理论的一个部份,史瓦兹和他的合作者法国人舍尔克(JoelScherk)也不会灵机一动地将一种无质量,自旋为2的弦解释为引力子,将类似威尼采亚诺散射振幅中含引力子的部份解释爱因斯坦理论中的相应部份,从而使得弦论一变而为量子引力理论!正是因为弦论已失去作为强相互作用理论的可能,日本的米谷明民(TamiakiYoneya)的大脑同时做了同样的转换,建议将弦论作为量子引力理论来看待。他们同时还指出,弦论也含有自旋为1的粒子,弦的相互作用包括现在成为经典的规范相互作用,从而弦论可能是统一所有相互作用的理论。这种在技术上看似简单的转变,却需要足够的想象力和勇气,一个好的物理学家一辈子能做一件这样的工作就足够了。
我们说的史瓦兹的运气同时又是弦论的运气是因为史瓦兹本人的历史几乎可以看成弦的小历史。史瓦兹毫无疑问是现代弦论的创始人之一,自从在1972年离开普林斯顿大学助理教授位置到加州理工学院任资深博士后研究员。他“十年如一日”,将弦论从只有几个人知道的理论做成如今有数千人研究的学问。他也因此得以摆脱三年延长一次的位置,终于
成了加州理工学院的正教授。因为他早期与格林(MichaelGreen)的工作,他与现在已在剑桥大学的格林获得美国物理学会数学物理最高奖,2002年度的海因曼奖(Heinemanprize)。
按照流行的说法,弦本身经过两次“革命”。经过第一次“革命”,弦成为一种流行。一些弦论专家及一些亲和派走的很远,远在1985年即第一次“革命”后不久,他们认为终极理论就在眼前。有人说这就是一切事物的理论(TOE=TheoryofEverything),欧州核子中心理论部主任爱利斯(JohnEllis)是这一派的代表。显然,这些人在那时是过于乐观,或者是说对弦的理解还较浮于表面。为什么这么说呢?弦论在当时被理解成纯粹的弦的理论,即理论中基本对象是各种振动着的弦,又叫基本自由度。现在看来这种理解的确很肤浅,因为弦论中不可避免地含有其他自由度,如纯粹的点状粒子,两维的膜等等。15年前为数不多的人认识到弦论发展的过程是一个相当长的过程,著名的威顿(EdwardWitten)与他的老师格罗斯(DavidGross)相反,以他对弦的深刻理解,一直显得比较“悲观”。表明他的悲观是他的一句名言:“弦论是二十一世纪物理偶然落在了二十世纪”。(这使我们想到一些十九世纪的物理遗留到二十一世纪来完成,如湍流问题。)第一次“革命”后一些人的盲目乐观给反对弦论的人留下口实,遗患至今犹在。现在回过头来看,第一次“革命”解决的主要问
题是如何将粒子物理的标准理论在弦论中实现。这个问题并不象表面上看起来那么简单,我们在后面会回到这个问题上来。当然,另外一个基本问题至今还没有解决,这就是所谓宇宙学常数问题。15年前只有少数几个人包括威顿意识到这是阻碍弦论进一步发展的主要问题。
第二次“革命”远较第一次“革命”延伸得长(1994-1998),影响也更大更广。有意思的是,主导第二次“革命”主要思想,不同理论之间的对偶性(请注意这不是我们已提到的散射振幅的对偶性)已出现于第一次“革命”之前。英国人奥立弗(Olive)和芬兰人曼通宁(Montonen)已在1977年就猜测在一种特别的场论中存在电和磁的对称性。熟悉麦克斯维电磁理论的人知道,电和磁是互为因果的。如果世界上只存在电磁波,没有人能将电和磁
区别开来,所以此时电和磁完全对称。一旦有了电荷,电场由电荷产生,而磁场则由电流产生,因为不存在磁荷。而在奥立弗及曼通宁所考虑的场论中,存在多种电荷和多种磁荷。奥立弗-曼通宁猜想是,这个理论对于电和磁完全是对称的。这个猜想很难被直接证明,原因是虽然磁荷存在,它们却以一种极其隐蔽的方式存在:它们是场论中的所谓孤子解。在经典场论中证明这个猜想已经很难,要在量子理论中证明这个猜想是难上加难。尽管如此,人们在1994年前后已收集到很多这个猜想成立的证据。狄拉克早在1940年代就已证明,量子力学要求,电荷和磁荷的乘积是一个常数。如果电荷很小,则磁荷很大,反之亦然。在场论中,电荷决定了相互作用的强弱。如果电荷很小,那么场论是弱耦合的,这种理论通常容易研究。此时磁荷很大,也就是说磁理论的角度来看,场论是强偶合的。奥立弗-曼通宁猜想蕴涵着一个不可思议的结果,一个弱耦合的理论完全等价于一个强耦合的理论。这种对偶性通常叫做强弱对偶。
有许多人对发展强弱对偶作出了贡献。值得特别提出的是印度人森(AshokeSen)。1994年之前,当大多数人还忙于研究弦论的一种玩具模型,一种生活在两维时空中的弦,他已经在严肃地检验15年前奥立弗和曼通宁提出的猜测,并将其大胆地推广到弦论中来。这种尝试在当时无疑是太大胆了,只有很少的几个人觉得有点希望,史瓦兹是这几个人之一。要了解这种想法是如何地大胆,看看威顿的反应。一个在芝加哥大学做博士后研究员的人在一个会议上遇到威顿。威顿在作了自我介绍后问他–这是威顿通常作法–你在做什么研究,此人告诉他在做强弱对偶的研究,威顿思考一下之后说:“你在浪费时间”。
(第二节)
另外一个对对偶性做出很大贡献的人是洛特格斯大学(RutgersUniversity)新高能物理理论组的塞伯格(NathanSeiberg)。他也是1989-1992之间研究两维弦论又叫老的矩阵模型非常活跃的人物之一。然而他见机较早,回到矩阵模型发现以前第一次超弦革命后遗留问题之一,超对称及超对称如何破坏的问题。这里每一个专业名词都需要整整一章来解释,我们暂时存疑留下每一个重要词汇在将来适当的时候再略加解释。弦论中超对称无处不在,如何有效地破坏超对称是将弦论与粒子物理衔接起来的最为重要的问题。塞伯格在1993-1994之间的突破是,他非常有效地利用超对称来限制场论中的量子行为,在许多情形下获得了严格结果。这些结果从量子场论的角度来看几乎是不可能的。
科学史上最不可思议的事情之一是起先对某种想法反对最烈或怀疑最深的人后来反而成为对此想法的发展推动最大的人。威顿此时成为这样的人,这在他来说不是第一次也不是最后一次。所谓塞伯格-威顿理论将超对称和对偶性结合起来,一下子得到自有四维量子场论以来最为动人的结果。这件事发生在1994年夏天。塞伯格飞到当时正在亚斯本(Aspen)物理中心进行的超对称讲习班传播这些结果,而他本来并没有计划参加这个讲习班。纽约时报也不失时机地以几乎一个版面报导了这个消息。这是一个自第一次弦论革命以来近十年中的重大突破。这个突破的感染力慢慢扩散开来,大多数人的反应是从不相信到半信半疑,直至身不由己地卷入随之而来的量子场论和弦论长达4年的革命。很多人记得从94年夏到95年春,洛斯阿拉莫斯hep-th专门张贴高能物理理论文的电子“档案馆”多了很多推广和应用塞伯格-威顿理论的文章,平淡冷落的理论界开始复苏。塞伯格和威顿后来以此项工作获得1998年度美国物理学会的海因曼奖。
真正富于戏剧性的场面发生在次年的三月份。从八十年代末开始,弦的国际研究界每
年召开为期一个星期的会议。会议地点每年不尽相同,第一次会议在德克萨斯A&M大学召开。九三年的会议转到了南加州大学。威顿出人意料地报告了他的关于弦论对偶性的工作。在这个工作中他系统地研究了弦论中的各种对偶性,澄清过去的一些错误的猜测,也提出一些新的猜测。他的报告震动了参加会议的大多数人,在接着的塞伯格的报告中,塞伯格在一开始是这样评价威顿的工作的:“与威顿刚才报告的工作相比,我只配做一个卡车司机”。然而他报告的工作是关于不同超对称规范理论之间的对偶性,后来被称为塞伯格对偶,也是相当重要的工作。史瓦兹在接着的报告中说:“如果塞伯格只配做卡车司机,我应当去搞一辆三轮车来”。他则报告了与森的工作有关的新工作。
95年是令弦论界异常兴奋的一年。一个接一个令人大开眼界的发现接踵而来。施特劳明格(AndrewStrominger)在上半年发现塞伯格-威顿94年的结果可以用来解释超弦中具有不同拓扑的空间之间的相变,从而把看起来完全不同的“真空”态连结起来。他用到一种特别的孤子,这种孤子不是完全的点状粒子,而是三维的膜。威顿95年三月份的工作中,以及两个英国人胡耳(ChrisHull)和汤生(PaulTownsend)在94年夏的工作中,就已用到各种不同维数的膜来研究对偶性。这样,弦论中所包含的自由度远远不止弦本身。
在众多结果中,威顿最大胆的一个结果是10维的一种超弦在强耦合极限下成为一种11维的理论。汤生在95年一月份的一篇文章中做了类似的猜测,但他没有明确指出弦的耦合常数和第11维的关系。威顿和汤生同时指出,10维中的弦无非是其中1维绕在第11维上的膜。汤生甚至猜想最基本的理论应是膜论,当然这极有可能是错误的猜想。史瓦兹在随后的一篇文章中根据威顿的建议将这个11维理论叫成M-理论,M这个字母对史瓦兹来说代表母亲(Mother),后来证实所有的弦理论都能从这个母亲理论导出。这个字母对不同的人来说有不同的含义,对一些人来说它代表神秘(Mysterious),对于另外一些人来说代表膜论
(Membrane),对于相当多的人来说又代表矩阵(Matrix)。不同的选择表明了不同爱好和趣味,仁者乐山智者乐水,萝卜青菜各有所爱。总的说来,M-理论沿用至今而且还要用下去的主要原因是,我们只知道它是弦论的强耦合极限,而对它的动力学知之甚少,更不知道它的基本原理是什么。理论所的弦论专家朱传界说对于M-理论我们象瞎子摸象,每一次只摸到大象的一部份,所以M-理论应当叫做摸论。当然摸没有一个对应的以字母M打头的英文单词,如果我们想开M-理论的玩笑,我们不妨把它叫作按摩理论,因为按摩的英文是message。我们研究M-理论的办法很象做按摩,这里按一下,那里按一下。更有人不怀好意地说,M是威顿第一个字母的倒写。
1995年的所有的兴奋到10月份达到高潮。加州大学圣巴巴拉分校理论物理所的泡耳钦斯基(JosephPolchinski)发现弦论中很多膜状的孤子实际上就是他在6年前与他的两个学生发现的所谓D-膜。字母D的含义是Dirichlet,表示D-膜可以用一种满足狄雷克利边界条件开弦来描述。施特劳明格用到的三维膜就是一种D-膜。这个发现使得过去难以计算的东西可以用传统的弦论工具来做严格的计算。它的作用在其后的几年中发挥得淋漓尽致。又是威顿第一个系统地研究了D-膜理论,他的这篇重要文章的出现仅比泡耳钦斯基的文章迟了一个礼拜。威顿非常欣赏泡耳钦斯基的贡献,他在于哈佛大学所作的劳布(Leob)演讲中建议将D-膜称为泡耳钦斯基子,很可惜这个浪漫的名称没有流传下来。
讲到这里,我们已给读者一个关于M-理论的模糊印想。下面我们将从引力理论和弦论的基本东西谈起,这将是一个非常困难的工作。我们不得不假定读者已有了大学物理的基础,即便如此,一些概念也很难用大学已学到的东西来解释。我希望读者给我时间,也希望读者
直接在每个贴子后面提问题,如果一些东西我没有讲清楚。弦论或M-理论还在它发展的“初级阶段”,如果追根究底,有些问题还没有很好的回答。例如这么一个简单的问题:到底什么是弦论,什么是M-理论?如果能吸引那怕是一两个读者自己继续追问这个问题从而最终成为一个弦论专家,我已达到目的。
第二章经典的极致
(第一节)
如果说现代物理开始于量子物理,经典物理则终结于爱因斯坦的广义相对论。广义相对论的时空观无疑彻底改革了牛顿的时空观,但牛顿本人很清楚他的时空观的局限。爱因斯坦用相对论的因果律代替了牛顿的绝对时与空中的因果律,所以说爱因斯坦的时空概念与因果概念仍然是经典的,广义相对论是经典物理的极致。这个经典物理中的最高成就一直拒绝被量子物理所改造。所有相信弦论的人都认为引力已被成功地量子化,至少在微扰论的层次上。一些执著于几何是一切的人则认为还不存在一个成功的量子引力理论,他们在一定程度上承认弦论的成功,霍金(S.Hawking)以及特霍夫特(G.’tHooft)可以被看成这方面的代表,虽然前者较之后者更极积地支持弦论。我们希望在本章的结尾时看到,弦论家的观点和弦论同情者的观点都有一定道理。而第三派则采取鸵鸟政策,认为引力还是原来的引力,星星还是那颗星星,这样有助于他们继续发表各色各样的理论。
我们假定读者已学过狭义相对论,甚至一点广义相对论,这样我们就可以相对自由地从不同角度来看广义相对论。
广义相对论的基本原理是等效原理:在引力场中,在时空的任何一点都可以找到一个局部惯性系,物理定律在这个局部惯性系中与没有引力场时完全相同。爱因斯坦本人更喜欢将局域引力譬喻成局部加速所引起的结果。这样,局部惯性系类似于黎曼流形中一点的切向空间,加速则可以用一个二次的座标变换来消除。引力可以用黎曼几何中的度规来描述,在一个局域惯性系中,度规变成狭义相对论中的闵氏度规。爱因斯坦进一步说,如果引力效应可以用一般的座标变换来消除,则该引力场完全等价于无引力场。如此则一个非平庸的引力场必须具有曲率。爱因斯坦的引力理论是标准的场论,而他相信物理的基本要素就是场,这是他高度评价麦克斯韦工作的原因。
一个试验粒子在引力场中的运动轨迹是测地线,而运动方程可以由变分原理得到。这个变分原理说,连结时空两点的粒子轨迹使得总的粒子的固有时成为极大-粒子的固有时是欧氏空间中测地线长度在闵氏空间中的推广。这种几何变分原理早就用在光学中,光的轨道使光程取极小值,这是费马原理。当地球环绕太阳运动时,人们可以想象,太阳产生的引力场使得太阳周围的时空发生一点点弯曲,从而使得地球的测地线发生弯曲。在时空中,这个测地线并非是闭合的。一般说来,它在空间中的投影也不是闭合的,这样就有了水星近日点进动-这里,时空同时弯曲起了关健作用。同样,一个无质量的粒子如光子在引力场中的测地线也是弯曲的,尽管光的固有时总是为零,测地线的变分原理稍稍有点复杂。爱因斯坦在广义相对论完成之前就预言了光线在引力场中的弯曲,他仅用了等效原理,这等价于仅仅用了度规的时间分量,这样算出的弯曲角度是正确结果的一半。同样,要算出正确的结果,必须计及空间的弯曲。
决定时空曲率的是物质的能量和动量分布,这就是爱因斯坦著名的引力场方程。在方程的左边是一种特殊的曲率,现在叫做爱因斯坦张量。在方程的右边是能量-动量张量。爱因斯坦经过断断续续八年的努力,在1915年年尾才最终写下正确的场方程。(从1907到1911有三年半的时间,他发表了关于经典幅射理论的文章,关于狭义相对论,关于临界弥散,甚至尝试修改麦克斯韦方程以期得到光量子,就是没有发表关于广义相对论的文章。)1915年11月25日,爱因斯坦在普鲁士科学院物理-数学部(那时的科学没有今天专业化得利害,今天的一些物理学家往往以不能与数学家沟通为自豪)宣读了一篇题为《引力的场方程》文章。他说:“相对论的一般理论作为一个逻辑体系终于完成”。
1915年11月,爱因斯坦每一个礼拜完成一篇文章。11月4日,在一篇文章中他写下不完全正确的一种场方程,该方程线性化后成为牛顿-泊松方程。11月11日,他写下另一个场方程,方程的左边是里奇(Ricci)张量,方程的右边是能量-动量张量,他还要求度规的行列式等于一。11月18日,爱因斯坦仍然相信度规的行列式必须等于一。在这篇文章中他发现两个重要效应,爱因斯坦非常运气的是太阳的中心力场对应的度规的行列式的确等于一——史瓦兹希尔德于次年一月发现了严格解,五月即死于在俄罗斯前线得的一场病。爱因斯坦发现的第一个效应是水星近日点进动。勒维利埃(JeanJosephLeVerrier)1859年观察到的水星每百年45秒的进动完全可以用爱因斯坦的新的理论来解释。这个发现是如此令人激动,爱因斯坦此后一连几天不能平心静气地回到物理上来。第二个发现是,他以前计算的光线弯曲比正确的结果小一半,这时他计及了度规的空间部份。11月25日,爱因斯坦写下了一直沿用至今的引力场方程。爱因斯坦放弃了度规行列式等于一的物理要求,但将它作为对座标选取的一种条件。爱因斯坦当时还不知道场方程的左边满足比安基等式,从而方程右边自动满足能动量守恒定律。能动量守恒定律被爱因斯坦看成一个条件。
由于引力常数很小,引力往往在一个很大的系统中才有可观测效应。相互作用的大小通常可以用动能与势能之比来定,对于处于束缚态的系统,这个比例大约是1,所以我们常常说束缚态是非微扰的。不需要计算,我们知道地球在太阳引力场中的势能大约等于它的动能。同样,电子在氢原子中的电势能大约等于它的动能。可是电子与氢原子的原子核-质子-之间的引力相互作用就非常非常小了,它与电子的动能之比大约是10的负40次方!所以我们常常说引力是自然界中最弱的相互作用。用广义相对论的语言说,时空非常难以弯曲。看一看爱因斯坦的场方程,它的左边是曲率,右边是牛顿引力常数乘以能-动张量。能-动张量引起时空弯曲,而牛顿引力常数则很小,可以说时空的强度则很大-比任何金属要大得多。
在谈到广义相对论的实验验证时,人们常提到的是三大经典验证:引力红移,光线弯曲和水星近日点进动。时至今日,广义相对论通过了远远不止这些验证。即使当验证还很少时,人们已经认为广义相对论是有史以来最完美和最成功物理理论。恐怕即使今天人们还可以这样说。广义相对论的最完美之处在于它是一种原理理论,即整个理论建立在一些简单的原理之上,尽管它是一个物理理论,它的逻辑结构几乎可以媲美于欧几里得几何。它也是有史以来最成功的理论之一,它解释了所有己知的宏观的包含引力的系统,这包括整个可观测宇宙在内。其精度经常在万分之一,在等效原理情形,精度已达10的负13次方!
广义相对论的完美主要来源于它所用的基本语言:几何。可以说爱因斯坦的直接继承人,今天仍然活跃的即那些在gr-qc电子档案馆贴文章的人,仍然坚持用这种语言。这种语言似乎与量子力学有着本质的冲突,从而与粒子物理学家所惯用的语言有着本质的冲突。这里我们不想强调这种冲突,但了解这种冲突的存在是有好处的。60年代之前在相对论界和
粒子物理界之间存在着很少的对话,这在费曼的故事中很好地体现出来。费曼有一次参加在北卡州(NorthCarolina)召开的相对论界的会议。他出发之前忘记了带详细地址,所以他下了飞机后向人打听有无看到一些相对论专家去了何处。人家问他相对论专家是一些什么样的人,他说,就是一些嘴里不停地念叨Gmunu的人,这人很快知到他指的是谁。
广义相对论与粒子物理的语言冲突在温伯格(StevenWeinberg)的名著《引力论与宇宙论——广义相对论的原理与应用》中也显示出来。温伯格尝试着用粒子物理的方法重新表达广义相对论,仅取得部分成功。记住温伯格与费曼最早试图由自旋为2的无质量粒子及相互作用推出广义相对论,今天我们知道,人们的确可以证明广义相对论是唯一的自旋为2的无质量粒子的自洽相互作用理论。但这个证明是一级一级的证明,很难看出其中的几何原理。广义相对论与粒子物理本质的不同还可以从引力波的效应的计算看出。早在1916年爱因斯坦就指出在他的理论中存在引力波。到1918年,他给出引力幅射与引力系统的四极矩关系的公式。不同于电磁系统,自旋为2的粒子的幅射与偶极矩无关。不同于电磁系统,那里的幅射公式从来就没有人怀疑,而引力系统的引力波幅射是否完全由四极矩公式给出长期引起争论。争论的原因是引力是一个高度非线性理论,引力势能本身也会影响引力波幅射。爱因斯坦本人在1937年曾短暂地怀疑过引力波的存在。有趣的是,关于引力波幅射的第一级效应的争论直到1982年才完全得到解决:爱因斯坦的四极矩公式是正确的。当然,引力波幅射的效应已在脉冲双星系统中被间接地观察到,这个工作也已获得诺贝尔奖。今年或今后几年,引力波可能被引力干涉仪直接观测到,这将成为继最近的宇宙学中激动人心的观测又一令人激动的天文观测。这也将极大推动相对论界与粒子物理界之间的对话。
(第二节)
广义相对论应用最成功的领域是宇宙学。历史上断断续续地有人考虑过用牛顿理论研究包括整个宇宙的力学体系,但从无一个比较完备的理论,原因之一是很难用牛顿理论得到一个与观测相吻合的宇宙模型。如果假定在一定尺度之上宇宙中的物质分布大致是均匀的,从牛顿理论导出的泊松方程没有一个有限的解。如果我们被迫假定物质的质量密度只在一个有限的空间不为零,我们则回到宇宙中心论。即便如此,这个有限的引力体系也是不稳定的,终将不断地塌缩。
独立于牛顿理论的另外一个困难是奥尔伯斯(Olbers)佯谬。如果物质的主要成份是发光的星体,那么天空的亮度将是无穷大。每颗星对亮度的贡献与它距地球的距离平方成反比,而在径向上恒星的线密度与距离平方成正比,所以总亮度以线性的方式发散。假如恒星分布在一个有限区域,尽管亮度有限,但白昼黑夜的存在说明这个亮度远小于太阳的亮度,所以这个有限区域不能太大。
现代宇宙学开始于爱因斯坦。他的1917年2月份的宇宙学虽然不完全正确,却一举解决了上面的两个问题。爱因斯坦当然知道用牛顿理论建立宇宙论的困难,他的出发点却全然不同。爱因斯坦在许多重要工作中,往往从一个很深的原理,或者从一个在他人看来只是一种不切实际的信仰出发,虽然他常常达到解决实际问题的目的。这一次他的出发点是马赫原理。马赫原理大致是说,一个质点的惯性质量在一定程度上取决于其周围的物质分布,换言之,所谓惯性系实际上就是那些相对于宇宙平均物质分布匀速运动的系统。对于爱因斯坦来说,这意味着度规完全取决于物质的密度分布,而不是密度先决定曲率,然后再决定度规。
为了实现马赫原理,爱因斯坦首先引入宇宙学原理-宇宙是均匀和各向同性的。要得到物质密度分布决定度规的结果,他发现必须修改他的场方程,这样他引进了宇宙学常数。宇宙学常数项是一个正比于度规的项,在大尺度上如果忽略曲率项,则能动张量完全决定度规。在小尺度上,宇宙学常数项可以被忽略,这样广义相对论原来的结果还成立。宇宙学常数项在牛顿理论中有一个简单的对应。可以在泊松方程中加一个正比于引力势的项,相当于给这个标量场一个质量。如果物质密度是一个常数,则引力势也是一个常数,正比于物质密度,正比系数是牛顿引力中的宇宙学常数的倒数。爱因斯坦就是从这个改正的牛顿理论出发从而避免了无穷大的困难。
爱因斯坦1917年的宇宙模型是一个封闭的,静态的模型。他错误地认为在没有宇宙学常数项的情形下场方程没有满足宇宙学原理的解。他也许相信在没有物质只有宇宙学常数的情形下也没有解。这些后来都被证明是错误的。德西特(deSitter)在爱因斯坦的文章发表后很快就发现只有宇宙学常数情形下的解,这就是德西特空间。弗里德曼(Friedmann)于1922年发现了没有宇宙学常数的解,这是一个膨胀宇宙模型。哈伯(Hubble)于1929年发现宇宙学红移,从而证实膨胀宇宙模型。哈伯是观测宇宙学鼻祖,他在1924年首先证实一些星云存在于银河系之外,从而大大扩大了宇宙的尺度。爱因斯坦后来很后悔当初引进宇宙学常数从而没能预言宇宙的膨胀,后来他终于放弃了马赫原理。爱因斯坦没能预见到宇宙学常数是
非常可能存在的,所以这个他那时认为是他一生中所犯的最大错误也许会成为他的最大成就之一-他的最大成就也太多了,最近刚获得诺贝尔的实验也与他的名字有关。我们将来在讨论弦论如何对待宇宙学常数问题时再介绍最近的宇宙学常数的天文观测。
宇宙学在60年代之前是一门高雅的学问,文章不多,但质量很高。60年代末彭齐亚斯(A.Penzias)和威尔逊(R.Wilson)偶然发现了宇宙微波背景幅射,宇宙学遂成为一门大众学问,也就是说它成为一门主流学问,大学物理系和天文系开始有了专门研究宇宙学的教授。早在40年代伽莫夫等人已经将广义相对论与粒子物理和统计物理结合起来,预言了核合成与微波背景幅射。标准宇宙模型开始形成,大暴炸宇宙无论从什么角度看都是唤起公众想象力的最好的东西,它却是爱因斯坦理论的一个应用,一个并不是最深刻的应用。
狄基(R.Dicke)在我看来是一个很了不起的人。他对广义相对论的实验和理论都作出很有原创力的贡献。实验如等效原理的精确检验。当人们满足于宇宙学原理是一种第一原理时(爱因斯坦早期认为是马赫原理的一个推论),他开始怀疑均匀各向同性应是早期宇宙动力学过程的结果。宇宙学原理只是他问的标准宇宙模型不能解答的三个问题之一。另外两个问题是,为什么宇宙在早期的空间曲率与物质密度相比非常非常小,为什么早期相变的遗迹几乎不可观察到,如磁单极。正是他在康乃尔大学的演讲促使顾思(A.Guth)提出暴涨宇宙论(Inflation),从而一举解决了宇宙论中的三个“自然性”问题。
记得1982年考到中国科学技术大学做硕士研究生,那时暴涨宇宙论提出仅一年。我的老师从杨振宁的石溪理论物理研究所访问回来,刚刚写了一篇这方面的文章,他的文章与相变有关。他在很多场合宣传暴涨宇宙论,大弟子从剑桥回来也谈相变时的泡泡碰撞。这对一个刚刚接触理论物理的研究生来说是非常新鲜的话题,不过我心里也有点嘀咕,这个利用最新的粒子物理进展的宇宙模型要解决的问题也太哲学了,有可能被观测所证实吗?过了近十年,暴涨宇宙论的第一个间接的,有点模糊的证据才出现,这就是轰动一时的柯比(COBE)实验。该实验发现宇宙背景幅射有非常小的大约为万分之一的涨落,暴涨宇宙论的大尺度结
构形成理论需要这么大的涨落。霍金曾说柯比实验是上世纪最重要的发现,这不免有些夸大。令人兴奋的是,最近的宇宙背景幅射的功率谱的测量说明宇宙是平坦的,即宇宙目前的空间曲率几乎为零,这是暴涨宇宙论的预言之一。功率谱曲线的形状也与暴涨宇宙论的预言一致,暴涨宇宙论是否正确有望在今后几年敲死。
做类似宇宙背景幅射的功率谱的测量要花很多钱,与如今的高能物理实验相比,却又少得多。在台湾,台湾大学物理系与中研院天文研究所合作,正在极积建造微波天文望远镜,斥资数亿台币。如果成功,将对测量宇宙学参数作出贡献。我常想,为何中国大陆不做类似的实验?这类实验需要的投资要小于其它很多大型国家计划,如一些863计划。
暴涨宇宙论中大尺度结构的形成起因于量子涨落。由于在暴涨期每个量子涨落模的波长随着共动尺度一起迅速增长,波长会很快超出当时的视界。这样由于涨落的两端失去联系,涨落被固定下来。大部份暴涨宇宙模型预言涨落在波长上的分布是幂律的。很多人喜欢谈宏观量子效应,宇宙的大尺度结构如银河系,星系团是最大的宏观量子效应。一个不容忽视的问题是,暴涨宇宙论中的涨落可能起源于非常小的尺度,这些可能比普朗克尺度还要小。进一步研究涨落的谱可能会揭示量子引力的效应,这也包括弦论中的量子效应。
暴涨宇宙论对研究弯曲空间中的量子场论起到了一个推动作用,对此研究起到推动作用的另一重要发现是霍金的黑洞量子蒸发理论。从70年代中期直到80年代,弯曲空间中的量子场论是广义相对论界的一个很活跃的领域。这个领域的进展对理解量子引力并没有带来多大的好处,原因是广义相对论和量子场论在这里的结合多少有点生硬,在很多情形下,该领域的专家也没有解决一些概念问题,如什么是可观测量等等。即便如此,这里获得的一些计算结果可以用到暴涨宇宙论中去,而一些诸如共形反常的计算在弦论的发展过程中也起过一定的作用,在将来的弦论发展中还会起一定的作用。我们把这个话题留到后面再谈,我们现在先谈谈广义相对论中的一个最吸引人的话题:黑洞。
(第三节)
当贝肯斯坦(JacobD.Bekenstein)于1972年发表黑洞与热力学关系的时候,他还是普林斯顿大学的研究生。在1973年发表于物理评论(PhysicalReviewsD)的文章中,他明确指出,黑洞的熵应与它的视界面积成正比,这个正比系数普朗克长度平方的倒数。普朗克长度平方又与牛顿引力常数和普朗克常数成正比,所以黑洞熵的起源既与引力有关,又与量子有关。在贝肯斯坦之前,所有与黑洞有关的研究都是经典的,贝肯斯坦改变了一切。
贝肯斯坦现在在以色列的希伯来大学(HebrewUniversity)工作。他是那种所谓的单篇工作物理学家,在1973年的工作之后,一直在做与黑洞的量子物理有关的工作。除了黑洞熵之外,他另一个有名的工作是熵与能量的关系,叫贝肯斯坦上限,我们这里不打算介绍它。有人想出一种说法来贬低那种一生只在一个方向上做研究的人,叫做:他还在改进和抛光他的博士论文。贝肯斯坦的工作决不能作如是观,他是那种不断有新的物理想法的人。他的所有工作中最困难的数学是积分,这并不说明他的文章易读——他的物理思想要求你有足够的直觉。前段时期有人在这个论坛上说泡耳钦斯基的文章难以理解,这说明了一个问题,那就是我们要训练自己的物理直观,而不能满足于理解那些有明确数学定义的东西。
黑洞可能的存在是很容易理解的,拉普拉斯早就作过这样的猜测。在牛顿引力中,如
果一个物体的动能不足以用来克服引力场中的势能,这个物体就无法逃逸出去。如果光也不能逃逸出去,对一个远处的观察者来说,产生这个引力场的物体就是黑的。以拉普拉斯时代对光的理解,光的动能正比于光速的平方,而光的势能由牛顿引力给出,这样,如果径向距离小于2GM/c^2,势能的绝对值就大于光的动能,光就无法逃逸。如果一个引力系统的半径小这个值,这个系统就成为黑洞。这个特别的,与质量和牛顿引力常数成正比的长度叫做史瓦兹希尔德半径,史瓦兹希尔德在他去世前三个月在他的第二篇关于广义相对论的文章中讨论了这个半径。
虽然拉普拉斯得到正确的结果,他的方法不正确。正确的方法要用到爱因斯坦的光子的能量公式,光子的能量不能认为是正比于光速的平方。光子的有效质量则为能量除以光速的平方,这样,这个现代的拉普拉斯计算用到两个爱因斯坦最为著名的结果。普朗克常数最终消掉,虽然我们在中间过程中用到它。另一个等价的方法是用引力红移的公式,史瓦兹希尔德半径是引力红移成为无限大的地方。有趣的是,爱因斯坦当初讨论引力红移时有意避开用他的光量子公式。爱因斯坦竭力避免把他的一个大胆想法和另一个一个大胆想法搅在一起。
牛顿理论中的黑洞和爱因斯坦理论中的黑洞除了都有视界外,其它并无共同之处。在牛顿的黑洞中,原点是一个奇点,但这个奇点与经典电子的原点作为库伦势的奇点在本质上并无不同。在爱因斯坦理论的黑洞中,径向座标在视界上发生本质的变化。在视界之外,径向座标是类空的;在视界之内,径向座标是类时的,所以光锥在视界上才可能变为向内。“座标原点”的奇点是在时间上的一个奇点,经过塌缩的物质都撞到之这个奇点上,对于它们来说,时间完全终结了。所以人们说,黑洞的奇点是类空的,很像大暴炸宇宙中的奇点,只不过在黑洞中这个奇点是时间的终结,而大暴炸宇宙中的奇点是时间的开始。
虽然黑洞的存在在理想实验中很容易实现,要证明它们在现实世界中存在不是一件很容易的事。钱德拉塞卡(SubramanyanChandrasekhar)1934年的计算表明,当一个引力系统有足够大的质量时,自然界不存在其它相互作用能阻止引力塌缩。这个结果要经过许多年才能被大家接受,部份原因是爱丁顿(SirArthurEddington)从一开始就非常反对这个结论。对于白矮星来说,当质量大于某个质量,不稳定性就会发生,这个质量极限叫做钱德拉塞卡极限。中子星相应的极限叫做奥本海默-沃尔可夫极限(Oppenheimer-Volkoff)。这些极限都与太阳的质量相差不远。钱德拉塞卡的物理生涯起始于黑洞也终结于黑洞,他去世前的最后一本研究著作是关于黑洞的,主要研究黑洞周围的扰动。他于1982年完成这本书,时年71岁。
黑洞的存在是无庸置疑的,我们的银河系的中间就有一个巨大的黑洞。可以肯定,有十分之一的星系和活动星系核的中心都是黑洞,这些黑洞的起源还是一个谜。
我们前面说过,贝肯斯坦发现黑洞有一个不为零的熵,根据统计物理,这说明给定一个黑洞,应该有很多不同的物理态,态数的对数等于熵。这些态不能用经典物理来解释。事实上,在广义相对论中可以证明一个所谓的无毛定理,黑洞的状态由少数几个守恒量完全决定,如质量,角动量和电荷,每一个守恒量对应一个局域对称性。整体对称性所对应的守恒量,如重子数,在引力塌缩过程中是不守恒的。贝肯斯坦的熵的起源必须在量子物理中寻找,因为他的熵公式含有普朗克常数。但这个熵对于普朗克常数来说是非微扰的,当普朗克常数为零时,黑洞熵是无限大,而不是经典物理中的零。由此可见,我们不能指望用微扰量子引力来解释黑洞的熵。
在1973年,贝肯斯坦并无量子引力理论可以利用,他是如何得到他的熵公式的呢?他用的是非常简单的物理直觉。首先,那时有大量的证据证明在任何物理过程中,如黑洞吸收物质,黑洞和黑洞碰撞,黑洞视界的面积都不会减小。这个定律很像热力学第二定律,该定律断言一个封闭系统的熵在任何过程中都不会减少。贝肯斯坦于是把黑洞视界的面积类比于熵,他并说明为什么熵应正比于面积,而不是黑洞视界的半径或半径的三次方等等。为了决定熵与面积的正比系数,他用了非常简单的物理直观。设想我们将黑洞的熵增加一(这里我们的熵的单位没有量纲,与传统单位相差一个波尔兹曼常数),这可以通过增加黑洞的质量来达到目的。如果熵与面积成正比,则熵与质量的平方成正比,因为史瓦兹希尔德半径与质量成正比。这样,如要将熵增加一,则质量的增加与黑洞的原有质量成反比,也就是与史瓦兹希尔德半径成反比。现在,如何增加黑洞的熵呢?我们希望在增加黑洞熵的情形下尽量少地增加黑洞的质量。光子是最“轻”的粒子,同时由于自旋的存在具有量级为一的熵。这样,我们可以用向黑洞投入光子的方法来增加黑洞的熵。我们尽量用带有小能量的光子,但这个能量不可能为零,因为光子如能为黑洞所吸收它的波长不能小于史瓦兹希尔德半径。所以,当黑洞吸收光子后,它的质量的增加反比于史瓦兹希尔德半径,这正满足将黑洞熵增加一的要求。对比两个公式的系数,我们不难得出结论:黑洞熵与视界面积成正比,正比系数是普朗克长度平方的倒数。
贝肯斯坦的方法不能用来决定黑洞熵公式中的无量纲系数,尽管贝肯斯坦本人给出一个后来证明是错误的系数。当霍金听到关于贝肯斯坦的工作的消息时,他表示很大的怀疑。他在此之前做了大量的关于黑洞的工作,都是在经典广义相对论的框架中,所以有很多经验或不妨说是成见。类似我们在第一章中提到的威顿之于对偶,他的怀疑导致他研究黑洞的热力学性质,从而最终导致他发现霍金蒸发并证明了贝肯斯坦的结果。应当说,1973年当他与巴丁(JamesM.Bardeen)卡特(B.Carter)合写那篇关于黑洞热力学的四定律的文章时,他是不相信贝肯斯坦的。
不久,他发现了黑洞的量子蒸发,从而证明黑洞是有温度的。简单地应用热力学第一定律,就可以导出贝肯斯坦的熵公式,并可以定出公式中的无量纲系数。由于霍金的贡献,人们把黑洞的熵又叫成贝肯斯坦-霍金熵。霍金的最早结果发表在英国的<<自然>>杂志上,数学上更完备的结果后来发表在<<数学物理通迅>>。在简单解释霍金蒸发之前,我们不妨提一下关于中文中熵这个字的巧合。在热力学第一定律的表述中,有一项是能量与温度之比,也就是商,所以早期翻译者将entropy翻译成熵。黑洞的熵恰恰也是两个量的商,即视界面积和普朗克长度的平方。
霍金蒸发很象电场中正负电子对的产生,而比后者多了一点绕弯(twist)。在真空中,不停地有虚粒子对产生和湮灭,由于能量守恒,这些虚粒子对永远不会成为实粒子。如果加上电场,而虚粒子对带有电荷,正电荷就会沿着电场方向运动,负电荷就会沿着电场相反的方向运动,虚粒子对逐渐被拉开成为实粒子对。电场越强电子对的产生几率就越大。现在,引力场对虚粒子对产生同样的作用,在一对虚粒子对中,一个粒子带有正能量,另一个粒子带有负能量。在黑洞周围,我们可能得出一个怪异的结论:由于正能被吸引所以带有正能的粒子掉入黑洞,而带有负能的粒子逃离黑洞,黑洞的质量变大了。事实是,在视界附近由于引力的作用正能粒子变成负能粒子,从而可能逃离黑洞,而负能粒子变成正能粒子,从而掉进黑洞。对于远离黑洞的人来说,黑洞的质量变小了;对于视界内的观察者来说,掉进黑洞的粒子具有正能量也就是实粒子。黑洞物理就是这么离奇和不可思义。
霍金蒸发是黑体谱,其温度与史瓦兹希尔德半径成反比,黑洞越大温度就越小,所以幅射出的粒子的波长大多与史瓦兹希尔德半径接近(这很象我们上面推导贝肯斯坦熵时用的光子)。当幅射出的粒子变成实粒子后,它们要克服引力作用到达无限远处,所以黑体谱被引力场变形成为灰体谱。霍金在<<时间简史>>中坦承,当他发现黑洞幅射时,他害怕贝肯斯坦知道后拿来支持他的黑洞熵的想法。
黑洞的量子性质无疑是广义相对论与量子论结合后给量子引力提出的最大的挑战。我们虽然可以用霍金蒸发和热力学第一定律推导出黑洞熵,这并不表明我们已理解了黑洞熵的起源。最近弦论的发展对理解一些黑洞熵起了很大的作用,但我们还没有能够理解史瓦兹希尔德黑洞的熵。另外,黑洞蒸发后遗留下来的是一个量子纯态还是一个混合态,就象黑体谱一样?如果是后者,那我们就不得不修改量子力学。弦论家们大都认为量子力学不必修改,最近霍金也改变了他过去的看法加入弦论家的行列。黑洞的量子物理在过去对弦论的发展起到很大的作用,在将来注定对弦论的发展起到也许更大的作用。
第三章超对称和超引力
(第一节)
场论与量子力学的结合产物是量子场论。量子场论早期遇到的困难是紫外发散。发散对物理学家来说并不陌生,洛伦兹和彭加勒在古典电子论中已经遇到了发散,就是电子的无限大自能。他们假定电子的半径不为零,这样就得到了有限的结果。非常令人惊奇的是,如果假定电子的能量完全来自自能,他们的结果与爱因斯坦的著名的质能关系几乎一样。而洛伦兹的结果出现在1904年,比爱因斯坦发现狭义相对论早了一年。另外一种发散导致普朗克早几年引进量子的概念,这就是黑体幅射的紫外灾难。
紫外灾难与电子的无限大自能不同之处在于,后者是由于电荷集中在无限小的区域,而前者的原因是一个固定的相空间区域有无限多个态。普朗克引进量子使得每一个态占据一定的相空间,因此黑体幅射作为一种自由理论变成了有限的。量子论并没有解决相互作用的发散问题,因为这种发散的根源是,在一个固定的空间区域有无穷多个自由度。换言之,对应一个有限的空间区域,其相空间为无限大,我们必须计及无限大的动量空间。所以,普朗克的量子“正规化”了相空间,并没有将空间“正规化”。
一种人为的正规化办法是在动量空间引进截断,也就是说我们在做计算的时候假定有一个最大的动量。通过测不准原理,这样做等价于在空间上作一个小距离截断。从场论的观点讲,这等于我们假定所有的场在小于一定的距离上没有变化。这样做既排除了经典上的发散如电子的无限大自能,也排除了新的量子发散。新的量子发散来自小距离上的量子涨落,如正负电子对的产生和湮灭。当截断被去除后,通常我们还是得到无限大的结果,这就迫使人们引进“重正化”。重正化的办法是引进所谓裸参数,如电子的质量和电荷,这些裸参数是截断的涵数。而物理参数仅是物理过程涉及到的能量的涵数,其来源分成两部份,一部份是裸参数,另一部份来自介于截断和物理能量之间的量子涨落。如果所有的无限大都能用重正化来消除,我们则称该量子场论是可重正的。
以上的重正化观念是老的观念,也就是到费曼,薛温格和朝永振一郎(Tomonaga)所采用的办法,现在又叫粒子物理的重正化观念。现代有效量子场论并不要求可重正性。在有效量子场论中,如果我们仅仅对一定能量以下的物理现象感兴趣,我们可以将高能的模“积掉”,也就是说高能的模对低能模的效应可以由低能模的有效哈密顿量(Hamiltonian)或者拉氏量(Lagrangian)完全体现出来。不同的高能拉氏量可能产生相同的低能拉氏量,如果我们仅对一定能量以下的物理感兴趣,高能理论的行为就无关紧要了。一个不可重正的理论在高能区需要越来越多的参数,所以,用现代量子场论的观点来看,可重正性等价于高能区有一个不动点,这就是可重正性的可预言性的全部含义。
所以,我们并没有理由要求我们的粒子模型一定是可重正的。粒子物理的标准模型恰恰是可重正的,严格来说,这并不意味着标准模型有一个紫外(高能)不动点,但肯定意味着标准模型可以被放进一个更大的,有紫外不动点的理论。这个事实本身,从有效量子场论的角度来看,已经耐人寻味。如果把引力包括进来,我们有理由要求整个理论是可重正的,因为引力本身已经蕴涵着一个能量极限,也就是普朗克能量。当然我们也可以假定在普朗克能量之上还不断地有新的物理,这种哲学和统一观点背道而驰。也许,标准模型的可重正性以及弦论作为可重正的(其实是有限的)引力理论的存在是对持统一观点的人的极大支持。
有两种方式判定一个理论是否是可重正的。通常用的办法是微扰展开,就是从一个自由理论即没有相互作用的理论出发,加上一些相互作用项,每一项有一个对应的参数,通常叫做偶合常数。如果某个参数带有长度量纲或长度量纲的正幂次,我们称该项为无关项(irrelevantterm);如果对应的参数带有长度量纲的负幂次,则称该项为相关项(relevantterm)。一个无关项,通过量纲分析,在低能区变得不重要(无关因此得名)而在高能区变得重要,原因是其影响可通过一个无量纲参数,即偶合常数乘以能量的正幂次来确定。如果某一无关项在一能区存在,那么它在更高的能区会引出更多的不同的无关项,所以无关项又是不可重正的。
引力所对应的偶合常数是牛顿引力常数的平方根,所以引力是不可重正的。这个事实可以用以下的简单方法看出。爱因斯坦理论是非线性的,它的第一个相互作用项是度规场的立方项,其对应的偶合常数是牛顿引力常数的平方根。在四维中,如同任何一个玻色场,引力场带有质量量纲,即长度量纲的倒数。立方偶合项一定含有两次微分,这同样可以通过量纲分析来看出,因为偶合常数有长度的量纲。一个相互作用项所含的微分次数越高,它对量子涨落的发散的贡献越大,因为该项在高能区变得越来越大——每增一次微商,就多了一个能量因子。为了消除这些发散,我们就不得不引进越来越多的无关项,这样引力没有一个在高能区有好的定义的理论。
顺便提一下,我们前面说引力的最简单的相互作用项含有两次微商,这与引力子是自旋为2的粒子有关。一般的规范场所对应的量子自旋为1,其简单的相互作用项含有一次微商。更为一般的结论是,自旋为几的粒子所对应的相互作用必定含有几次微商。所以,一个含有自旋为3粒子的理论一定是不可重正的。在四维中,可以证明,可重正的量子场论最多只含自旋为1的粒子-这是70年代初量子场论的重要结果。人们实际上得到更强的结论,所有可重正的,含有自旋为1的粒子的量子场论必为规范理论,即杨-米尔斯理论。
我们上面提到,以威尔逊的现代场论观点来看,我们没有理由要求引力是可重正的。
也许真实的图象是,当我们不断地提高能量,物理理论变的越来越复杂,而爱因斯坦的理论只不过是一个低能有效理论。虽然我们不能完全排除这种可能,我们提到的普朗克能标的存在暗示着在高能区存在一个简单的量子引力理论。黑洞的存在也支持这个可能性。设想我们用带有很高能量的粒子束来探测小距离上的时空结构,如果没有引力,海森堡测不准原理告诉我们能量越高,我们探测的距离越小。引力介入后,过去很多人,特别是惠勒(JohnA.Wheeler),相信越高的能量会带来越大的时空涨落,如所谓的时空泡沫(spacetimefoams)。时空泡沫指的是在普朗克距离上时空的拓扑不确定,有许多虫洞(wormholes)结构。黑洞的形成使得这些如时空泡沫的结构能否被观察到成为很大问题。能量越高,形成的黑洞就越大,其事件视界(eventhorizon)也就越大,所有可能的复杂的时空结构都被视界所掩盖。而视界之外的时空却非常光滑,能量越高,视界之外的曲率就越小,那么低能的有效理论也就越适用。如此,对于一个外部观察者来说,高能的量子引力行为就不可能被复杂的拉氏量中的无关项所主导。我们这里所描述的可能性现在叫做紫外-红外对应,即量子引力中的紫外行为与红外物理相关。
如此,我们相信在一个有引力的量子理论中,高能理论不会象有效量子场论所指出的那样,在高能区存在许多不可预测的可能性。量子引力本身必定是有简单定义的理论,换言之,量子引力是一个更大的,可重正的甚至是有限的理论的一部份。这个理论不太可能是爱因斯坦理论的简单量子化,因为我们已知道爱因斯坦理论不可能被简单地量子化。这就迫使我们寻找一个更大的,至少是可重正的理论。我们将被历史地,在某种程度上也是逻辑地带到超对称。
(这一节写完,我发现要将这里所讲的一些道理让仅有大学物理背景的人看懂,我至少要再花上是这里几倍的篇幅。我希望大多读者没有被吓走。好消息是,如果你读完这一节后还没有被吓走,你以后大概再也不会被吓走。)
(第二节)
超对称作为一种理论上的可能的发现是一段饶有兴趣的科学史。在读完前面关于场论中的无限大之后,也许我们会想当然地猜测超对称的发明是为了消除无限大。70年代初超对称不同的发现者有不同的理由发明超对称,却没有一个理由是为了将无限大驱逐出量子场论。
前苏联物理学家尤里-高尔芳(YuriAbramovichGolfand)远在60年代末就开始寻找介于玻色子与费米子之间的对称性,他的动机是解决弱相互作用!当时温伯格-萨拉姆(Weinberg-Salam)模型还没有建立,温伯格关于弱电统一的文章发表于1967年。根据高尔芳的学生、他后来的超对称合作者伊夫金-利特曼(EvgenyLikhtman)的回忆,高尔芳在68年春已得到4维的超彭加勒代数(super-Poincarealgebra),这比西方发现超对称早了三年,比西方发现4维的超对称早了6年。可惜高尔芳并没有立即发表这个结果,因为他虽然克服了所谓的柯尔曼-满杜拉止步定理(Coleman-Mandulano-gotheorem),他还没有构造好实现这一对称的场论。这与目前信息时代的物理学家的发表态度形成鲜明的对比,我们可以在前天看到同行在网上贴出的文章,昨天作了一点推广式的计算,今天草就一篇大作,明天网上见面。顺便提一下,当我和人聊起超对称的发明的时候,常常有人将之归功于数学家盖尔芳(IsraelGelfand)。盖尔芳比高尔芳有名得多,是第一届沃尔夫数学奖得主,生于1913年,比高尔芳大9岁。盖尔芳还活着且仍在发表文章(网上能查到的最新文章出于去年9月),而高尔芳已于1994年辞世。
前段时间也是来自前苏联的、现今在明尼苏达大学的谢夫曼(M.Shifman)组织人为高尔芳出了一本纪念文集。读了谢夫曼写的前言,我才知道高尔芳在1973年至1980年之间失了业。他与利特曼的第一篇关于4维超对称场论的文章发表于1971年,这比西方第一篇4维超对称场论的文章早了三年,是关于用现代的术语讲就是超对称量子电动力学的。那么,高尔芳为什么在发表了如此重要的文章后被列别捷夫物理研究所(LebedevPhysicalInstitute)解聘呢?谢夫曼提供了二个可能的原因。一是,朗道发现了所谓的朗道极点之后苏联很少有人相信场论,(在整个60年代,西方的大多数粒子物理学家对场论也失去信心,原因是弱相互作用不可重正,而强相互作用更是一团乱麻。)他们比西方人更为保守。二是,有人认为高尔芳根本不懂他研究的东西,尽管他早在50年代末就做过重要工作,所以高尔芳就成了苏联科学院“精简-创新”的牺牲品。我们在这里猜测,如果外斯、朱米诺(JuliusWess,BrunoZumino)1974年的文章早发表两年,如果西方早两年就重视超对称,也许高尔芳的运气要好一些。高尔芳1990年举家去了以色列。
在西方,超对称的发现顺着完全不同的思路,最早的超对称的发现竟源于弦论。皮埃尔-雷芒(PierreRamond)当时在费米实验室工作,1971年,弦论被正式确认只有一年,他考虑如何在弦论中引进带半整数自旋的激发态(即费米子)。作为狄拉克矩阵的推广,他在弦运动起来的世界面上引进了费米场,并满足周期条件。非常类似狄拉克,雷芒的理论中所有弦的激发态都是时空中的费米子。注意,这里我们有意将时空与世界面区别开来,前者是弦运动的舞台,而后者类似粒子的世界线。虽然雷芒的理论中只有时空中的费米子,而弦的世界面上既有费米场,也有玻色场,这些我们留到后来再详加解释。同年,吉尔维(JeanGervais)和崎田文二(BunjiSakita)发现如果将雷芒的理论写成世界面上的作用量,则这个作用量具有两维的超对称,这是出现在西方的第一个超对称作用量,与苏联人几乎同时。雷芒的理论现在又叫雷芒分支(Ramondsector),因为它是两种可能的分支之一。
作为一个小插花,我们谈一点关于雷芒的掌故。雷芒并没有因为第一个研究费米弦而得以永久留在费米实验室,尽管他在弦论中第一次引入费米的名字。现在费米实验室理论部的有些人谈到这件往事时往往半自嘲、半开玩笑地说,我们费米实验室从来不做弦论,我们已将超弦的创始人之一给解聘了。雷芒是很有幽默感、很健谈的人,也很喜欢谈掌故。我记得有一年夏天在亚斯本遇到雷芒,在一次午饭聊天中,他向一些年青人讲我们上一节提到的威尔逊的故事。有人问他,如果威尔逊没有发现重正化群和临界现象的重正化群理论,谁会发现它?(在此之前雷芒已谈到一些量子场论中的大人物,为了不得罪人,我们姑将姓名隐
去。)他说,坎(Ken,威尔逊的名字);再问一次,他仍然说坎,可见他对威尔逊的佩服程度。当然,绝大部份真正懂威尔逊理论的人都很佩服他,不懂就无从佩服起了。我相信我的读者也都很佩服,看一看上一节贴出后的热烈讨论!雷芒也是少数自己的名字在一个专业名词中出现两次的人,这个名词就是超弦中雷芒-雷芒分支。有一次他访问芝加哥,参加一个超弦的学术演讲。当时他是听众之一,我也有幸在场。当演讲者提到雷芒-雷芒分支时,听众中的杰夫-哈维(JeffHarvey)扭头问他:“皮埃尔,谁是另外一个雷芒?”全场绝倒。
写到这里,真想再一次遇到他,犹其在我写这个演义的时候,这样可以从他那里贩卖一些关于弦论的掌故。象现在这样写下去,迟早要抖尽肚皮里的一点点存货。
以上是大家爱听的八卦,现在是谈一谈到底什么是超对称的时候了。我们先从大家熟悉的对称性讲起。日常的对称性有分立的对称性和连续的对称性,前者如一个正四边形,将之转动90度,还是原来的正四边形;后者如一个球面,以球心为原点,无论怎么转,还是原来的球面。这是一个物理系统固有的对称性,或一个物理态的对称性。在一个物理理论中,还有一种动力学的对称性。例子是,假如一个态本身不是转动不变的,但我们将之转动后,同时还转动用以描述它的座标,这样这个态的一切动力学性质和转动之前完全一样,这表明空间本身的各向同性和物理系统本身与空间的方向无关联性。在一个物理理论中,一个转动操作对应于一个算子,它将一个态映射到另一个态。现在,我们前面例子中的两个性质可以翻译成数学语言。空间本身的各向同性等于真空本身作为一个特别的态在这个算子的作用下不变;物理系统本身与空间的方向无关联性等于这个算子与哈密顿量对易(量子力学)或它与哈密顿量的泊松括号为零(经典力学)。
量子力学的法则告诉我们,一个算子如与哈密顿量对易,则它所对应的物理量是守恒的。对应一个转动算子,我们还没有一个物理量,原因是,这个转动算子是保长的,即保持态的内积不变,如我们提到的真空态。这样的一个算子叫酉算子,而一个物理量算子是厄米特算子。连续群的定理保证我们可以用厄米特算子构造酉算子,对于转动来说,相应的厄米特算子就是角动量。如果真空在酉算子作用下不变,那么它在相应的厄米特算子的作用下为零,也就是说真空没有角动量。我们可以将不同的态分类成角动量的本征态,但是一个任意态未必是本征态。
在量子场论中,有一类算子永远没有物理的本征态,尽管它们可以是厄米特的,这一类算子就是费米算子。怎么理解一个费米算子?可以将希尔伯特空间分成两个正交的子空间,一个子空间中的态全是玻色态,另一子空间中的态全是费米态,现在,定义一个费米算子,它将一个子空间中的态映射到另外一个子空间中的态。这还不是全部定义,我们再加上一个条件,就是,任一个可实现的物理态不是玻色态就是费米态,而不能是一个玻色态和一个费米态的混合。这样,很明显,一个费米算子就没有物理的本征态。根据量子力学,一个费米算子就不是一个可观测量。
尽管如此,一个费米算子可能与哈密顿量对易,也就是说在它的作用下,动力学是不变的,这就是一个超对称。超对称之所以是超的,原因是它将一个“超选择分支”(super-selctionsector)映射到另一个“超选择分支”。最简单的情形是,它将一个玻色子转动成一个费米子。这个性质与通常的对称性很不相同,通常的对称性是将两个态联系起来,这两个态完全可以通过动力学过程互相转变。如一个向上自旋的电子,通过转动变成相下自旋的电子,这个转动完全可以通过一个物理过程来实现。而一个超对称变换可以将一个电子变成一个标量粒子,但一个电子本身永远不会通过一个物理过程变成一个无自旋的粒子。我想,这种性质对一个初学超对称的人来讲是一个最大的困惑,因为我们太习惯于普通的对称了。我们可以想象转动一个正方形,但不能想象将一个正方形转成一个“超正方形”,如果后者果真存在的话,因为这种转动不是一个物理过程,因为该转动不是可观测量!
除了超对称之超外(没有对应的物理过程,也不是可观测量),它具有一切与对称相同的性质。例如,如果一个玻色系统,如两个玻色子或两个费米子或10个费米子,有一定的能量,在超对称变换后,我们得到一个费米系统,这个费米系统无论怎样与前面的玻色系统不同,它有着相同的能量。再如,如果我知道两个玻色子在一个束缚态中的相互作用能量,通过超对称变换,我就知道变换后的一个费米子和一个玻色子在一个束缚态中的相互作用能量。原因很简单,就是这个超对称保持动力学不变,它与哈密顿量对易。
(第三节)
通过上面的解释,我们看到超对称既有类似于一般对称性的地方,也有很不相同的地方。这种不相同的地方往往引起初学者的迷惑,由此可知对于发明超对称的人来说,非凡的想象力和大胆是不可或缺的。
那么,既然超对称原则上可以存在,什么样的超对称可以在相对论量子场论中实现?对于一般对称性来说,我们要求有一个群结构或李代数结构。一个转动后再做一个转动,我们还是得到一个对称转动,这是群的结构。这个要求在无穷小的变换下翻译成李代数的要求。现在,我们将这个要求加于一个对称元和一个超对称元,我们得到的结论是,这个对称元和一个超对称元的对易子必是另一个超对称元。如果我们想用超对称元来构造群,我们就得用一种新的数,相互是反对易的,叫格拉斯曼数(Grassman),原因还是因为超对称不是通过物理过程实现的对称,所以其对应的转动参数不是实数或复数,否则我们可以问这个参数的物理含义,就象通常转动的转动角一样。
以上所写,已经不很通俗了,我还没有更简单的办法,如有,就得象费曼写<>一样,上面的一段话将被拉长几倍或几十倍。所以为了节省大家的时间,特别是作者自己的时间,我们还是假定读者已有一定物理背景,或是天才儿童。这样我写完一段话后还有一些时间看真正的研究论文,挖空心思想一点怪招好凑一篇论文,用以对付上司每年索要的年终总结。否则,我真的要改行写科普,好混一点稿费,研究员就可以不当了。
回到原来的话题,什么样的超对称是允许的。我们已说到一个超对称元和一个对称元的对易子必是一个新的超对称元,把所有这样的对易子放到一起,我们发现超对称元的集合形成对称李代数的一个表示。在相对论量子场论中,最重要的对称就是彭加勒对称,所以超对称元形成彭加勒代数的一个表示。在四维中,最简单的费米子表示就是旋量了。超对称中有几个这样的旋量,我们就说这是N等于几的超对称。高尔芳和利特曼1971年发表的场论就是N等于1的超对称场论。
在西方,最早的超对称是在弦的世界面上发现的,这就是1971年的吉尔维-崎田文二两维超对称场论。弦论中的时空超对称的发现是很后来的事,我们等一会儿再谈。朱米诺似乎是注意弦论中时空超对称的第一人,这也许启发他后来与外斯一道发现四维的超对称和超对称场论。在1974年的外斯-朱米诺的工作中,他们构造了四维时空中最简单的超对称场论,这个场论只含一个基本的旋量场(只有两个自旋为1/2的粒子,形成一个旋量表示),两个标量场。之所以有两个标量场也是因为有超对称,根据我们上一节说的道理,有多少费米态就应当有多少玻色态。这个最简单的超对称场论一般称为外斯-朱米诺模型,是两个外斯-朱米诺模型之一。另外一个外斯-朱米诺完全与超对称无关。
朱米诺应是所有年纪稍大而在事业上无大成的人的榜样,他是一个大器晚成的人。我经常以朱米诺的例子来期许自己和他人,也许我最终也难成大器,但这仍不失是取法乎上得乎其中的办法。在1973年底他和外斯完成4维超对称的理论,他已超过50岁,外斯也接近40了。他与外斯的另一重要工作,即另一外斯-朱米诺模型也不过是1971年的作品。毫无疑问,超对称是他一生最重要的工作。我还不知道在粒子物理这一竞争激烈的领域(注1)还有第二个人能在50开外作出他一生最重要的工作。
朱米诺和外斯在同一年将他们的超对称场论的推广到含有自旋为1即光子的情形,这也就是3年前高尔芳和利特曼构造的理论。朱米诺和外斯还研究了这个理论的量子性质,发现超对称有助于使紫外发散减弱,当然他们在第一篇文章中已讨论过量子行为。
接触过量子场论的人都知道,任何场论中都有发散的零点能。对于一个自由场论来说,场的每个富里叶模是一个谐振子,根据量子力学的测不准原理,谐振子不可能处于能量为零的状态,它的最低能不为零,这就是零点能。当谐振子处于第一个激发态时,对应于一个基本的量子,或粒子,其动量和能量与这个模相同,而零点能只有一个粒子的一半,所以不能将它解释成一个可观察到的物理态。我们因此将之归于真空的能量,将所有模加起来,这个能量是无限大,这个无限大显然来自紫外的模,我们在本章第一节中一提到过,这对应于空间在小尺度上没有截断。奇怪的是,来自一个玻色子的零点能是正的,而来自一个费米子的零点能是负的。如果对应一个玻色子,存在一个有相同质量的费米子,那么两者的零点能就完全抵消。超对称理论恰恰有这种性质,所以超对称理论中,我们无须人为地扔掉自由场的零点能。
对于每一个场,如果我们引进动量上的截断,零点能的密度则是这个截断的4次方,这是4维场论中的最大的发散。考虑一个可重正的场论,如果理论中没有标量场,除去零点能外,最严重的发散是对数发散,如量子色动力学。标准模型含有标量场,就是黑格斯(Higgs),标量场涉及的最严重的发散是二次发散。这种发散带来所谓的等级问题(hierachy)。等级问题最简单的描述是这样的,标准模型中的最大能标是弱电自发破缺能标,大致可以看成是黑格斯场的一个耦合参数,数量级大约是100京电子伏(100Gev)。考虑在标准模型之上还存在一个新能标,如普朗克能标。假定在弱电能标和这个新能标之间没有另外能标,通过重正化流,这个新能标会在标准模型的各个参数中体现出来,如弱电能标。由于标量场的二次发散性,弱电能标含有一个与新能标的平方成正比的项,另一项是弱电能标这个耦合参数在新能标上的“裸”参数。我们要求弱电能标是100Gev,我们就必须要求其“裸”参数与新能标的平方几乎抵消,这就是所谓的微调问题(finetuning)。有了超对称,与新能标的平方成正比的项不再存在,所以80年代初很多人研究超对称大统一理论。这是超弦集团之外的唯象粒子物理学家相信超对称存在的主要原因之一。
超对称的生成元越多,无限大的抵消就越成功,但人们为此付出的代价是模型越来越不现实。当理论有8个超对称元,也就是N等于2的超对称,极小理论中的费米子增加到4个,不再是具有唯一手征的理论,但是标准模型中的弱相互作用破坏宇称,必须是带手征的。我们可以暂时不管这个实际问题,一直增加超对称的数目,我们就会发现当超对称元的个数超过16时,我们不得不引进自旋为2的粒子以构造超对称多重态,这样就引进了引力。所以不包括引力的最大超对称有16个元,也就是N等于4的超对称。实现这个超对称的场论一定包含规范场,这类场论几乎是唯一的,只有两个参数可以改变,一个是规范群,或即群的种类和阶数,另一个是耦合常数。这类极大超对称场论在80年代初被三组不同的人证明是完全有限的。而实现N等于2的超对称场论在微扰论中只有单圈发散。
N等于4的超对称规范理论的有限性在当时看来是唯一的,记得有一位德高望重的人说(忘记是谁了),他当时相信这个理论一定有很大的用处,上帝造出这么完美的理论而不加利用是不可能的。他等了几年,人们并没有发现这些理论与粒子物理有什么关系,他从此
再也不相信超对称理论有什么用处了。N等于4的超对称规范理论的确有许多与众不同的地方,后来它们在超弦发展中起了很大作用,如强弱对偶,反德西特(deSitter)空间上的量子引力与超对称场论的对偶。
也是在1974年,萨拉姆(AbdusSalam)和斯特拉思蒂(J.Strathdee)在看到外斯、朱米诺的工作后很快发现了超空间表示。发现这一点似乎不需要太多的想象力,如果通常的对称性与可观察到的时空有关,如空间的平移和空间中的转动,那么超对称就应和超空间有关。的确,萨拉姆和斯特拉思蒂证明超对称变换可以被看成是超空间中的平移,这些超空间座标是格拉斯曼数,从而是不可观察到的,这正类似于超对称变换不是实验室中可实现的变换,但是,如果人们将来发现超对称粒子,就等于间接地发现了超空间。我为了写这段话查了一下萨拉姆和斯特拉思蒂当年的文章,发现虽然预印本是74年11月的,发表该文的核物理一期也是74年的。可见发表的速度实在与是否处在电子信息时代无关。虽然我说发现超空间不需太多的想象力,并不意味着对于一个新手来说超空间是很容易接受的。记得当年年轻气盛,考研后问我的老师什么是最时髦最有前途的研究方向,老师随手从书架上拿了一本法叶(P.Fayet)和费拉拉(S.Ferrara)1976年写的超对称评述。我拿回去之后发狂猛啃,很坐了一段飞机。现在回想,如在昨日,当年对超对称的生吞活剥也许在日后起了一点作用。
注1:之所以讲粒子物理是一激烈的领域并非因这一领域对人的智力或体力或任何其它能力的要求与任何其它领域有何不同,凝聚态物理中就有许多很难的问题需要特殊的智力才能解决。粒子物理与众不同的地方在于问题比较集中,人力的投入也比较集中。其它领域如凝聚态物理中问题比较分散,学派比较多,一个派别如同一个庄园,有大庄主二庄主三庄主,有打长工的也有打短工的。当然每位庄主也少不了有一帮弟子。所以这么一个派别可以自给自足,在江湖上扬名立万。写这么长的注记以博大家一笑。
(第四节)
谈过超对称量子场论之后,我们回到弦论中的超对称这个话题。毕竟超对称在西方的发现源于弦论,所以应当追溯一下历史以了解超对称超引力在西方发展的脉络,这样做以达到孔夫子所说的温故而知新。
在第二节中我们谈到雷芒在弦论中引入费米子,所有弦的模式在时空中的体现都是费米子,因为他在弦的世界面上引入了类似狄拉克矩阵的东西。世界面上也因此有了超对称,但时空中没有超对称,因为只有费米子。从某种意义上来说,狄拉克1928年引入狄拉克矩阵就等于在粒子的世界线上引进了超对称。狄拉克算子的平方是达朗贝尔算子,就如同超对称算子的平方等于哈密顿量。1974年,法国人纳吾(A.Neveu)和我们在第一章就提到的史瓦兹希望能在雷芒的模型中加入时空中的玻色子。为了避免狄拉克矩阵的出现,他们要求雷芒的世界面上的费米场没有零模,这样所有的模的阶就必须是半整数,换句话说,世界面上的费米场满足反周期条件。这样构造出的弦的激发态都是时空中的玻色子。这个新的分支叫纳吾-史瓦兹分支,独立于雷芒分支。注意,对于纳吾-史瓦兹分支来说,世界面上仍有超对称,因为世界面上的超对称是局域的。当然,1974年还没有人知道什么是局域超对称,在超引力发现之后,1976年布林克(L.Brink)、蒂韦基亚(P.DiVecchia)、豪(P.Howe)等人才发现原来的两维世界面上的超对称其实是局域的。后来我们更详细地谈超弦的时候,我们还要回过头来谈两维局域超对称的重要性。
将费米弦的两个分支,雷芒分支和纳吾-史瓦兹分支,加起来,似乎就有了时空超对称,事情并没有这么简单。超对称的一个基本要求还没有被满足,就是给定一个质量,必须有相同多的玻色子和费米子。要等到1976年,也就是外斯-朱米诺工作的两年之后,一个意法英联军,格里奥日(F.Gliozzi)、舍尔克和奥立弗(就是那位奥立弗-曼通宁对偶中的奥立弗)
发现可以将两个分支中的一些态扔掉而不破坏理论的自恰性,这样得到的理论有同样多的玻色子和费米子。他们还不能立刻证明时空超对称,但他们作了这样的猜想。要再等5年,这个经过所谓的格舍奥投射(GSOprojection)的雷芒-纳吾-史瓦兹理论才由格林(MichaelGreen)和史瓦兹证明具有完全的时空超对称,他们也同时证明,这些超弦理论包含相应的时空超引力。
超对称被发现之后,对一部份人来说,超引力的存在就是显而易见的事了。杨-米尔斯构造规范理论不久,内山菱友(RyoyuUtiyama)用规范对称重新解释了爱因斯坦的引力理论。对于内山来说,引力场无非是对应于时空平移的规范场,也就是说,如果我们要求时空平移不仅仅是整体对称性,同时也是局域对称性,我们就要引进引力场来使平移“规范化”。超对称是时空对称性的推广,特别是,两个超对称元的反对易子给出一个时空平移。这样,如果我们将时空平移局域化,我们就不得不将超对称也局域化,反之亦然。如此得到的理论就是超引力。在这个理论中,对应于时空平移的引力场仍在,对应于超对称的规范场是自旋为3/2的场,通常叫做引力微子,这是一个费米场。有一个简单的方法来判断规范场的自旋,如果局域对称性是一种内部对称性,也就是说对称元不带时空指标,那么相应的规范场比对称元多一个时空的矢量指标,相应的粒子自旋为1;如果对称元带一个空间矢量指标,则规范场带两个空间矢量的指标,这就是引力场;进一步,如果对称元带一个旋量指标,如超对称,那么规范场就多带一个空间的矢量指标,这个场就是引力微子场了。
首先在4维时空中构造超引力的三位中有两位当时在纽约州立大学石溪分校。1976年以前,三位仁兄各做各的事情。范-纽文豪生(P.vanNieuwenhuizen)基本做引力的微扰量子化,明显是受了他的老师蒂尼-维尔特曼(MartinusVeltman)的影响,佛里德曼(DanielZ.Freedman)大约是个唯象学家,费拉拉(SergioFerrara)则是唯一做超对称的。当然他们都有研究唯象学的底子。据范-纽文豪生说,他们的第一个超引力模型,4维的N等于1超引力,一半是靠手算,一半是靠计算机折腾出来的。记得我当年于生吞活剥法叶-费拉拉之后,接着去找来范-纽文豪生的超引力综述。这回更是云山雾绕,什么1次方式(firstorderformalism),2次方式,最后又搞出1.5次方式。1次方式大约是说,你将度规场和联络场都看成是独立的场,2次方式则将联络看成是度规的涵数,天知道1.5次方式是什么,有兴趣参看范-纽文豪生的综述。
一个最简单的、经典的超引力已将人折腾得七荤八素,更不用说复杂的超引力了。N等于2以上都叫推广的超引力(extendedSUGRA),当然这种翻译有点勉强。我当时觉得还是泛超引力来得简洁些,省了两个汉字,现在看来,乾脆就叫超引力算了。4维中有很多不同的泛超引力,一直到N等于8。当N超过8时,就必须引进自旋大于2的场了,这从场论的角度来看,似乎是危险的,因为人们不知道如何构超自恰的场论。N越大,对称性越高,场的数目就越多。广义相对论中只有10个场,就是度规的份量,在N等于8的超引力中,仅仅标量场就有70个。场多了的好处是,有可能将标准模型中所有的场都纳入一个超对称多重态中,坏处是作用量越来越复杂,不是专家不可能写对作用量。从统一的角度看,N等于8的超引力还是不够大,因为规范群是O(8),还不能将标准模型的规范群放进去。
超引力除了可以在N的方向推广,也就是引进越来越多的超对称,同时也可以在D的方向推广,就是引进越来越高的维数。D最大的可能是11,再大就要引进高自旋场。这两个方向实际上是相关的,低维的泛超引力可以由高维的简单一点的超引力通过维数约化得到(dimensionalreduction),如4维的一些N等于2的超引力可以由6维的N等于1超引力得到。而4维的N等于8的一些超引力可以由11维超引力通过维数约化或紧化(compactification)得到。所以一时之间,很多人认为11维超引力就是终极理论了。霍金说,基于谨慎乐观的态度,有理由相信,一个完备的理论已经逐渐成型,理论物理快到头了。
超引力与超对称场论一样,紫外发散比没有超对称来得轻得多。超对称的数目越多,紫外行为越好。在任何一个4维超引力中,单圈和双圈图都是有限的,这个性质在超引力出现一年之后就被发现。虽然紫外发散要在三圈才出现,在超引力时代还没有人敢计算三圈图(想一想,经典作用量已经那么复杂!),直到最近才有人计算三圈图,而用到的计巧居然是弦论中的技巧。最新的结果表明,极大超引力的两圈图直到6维都是有限的。也就是说,11维超引力仅仅在单圈才是有限的,所以从重正化的角度看,11维超引力比爱因斯坦的理论好不了多少。最新的结果又表明,4维的极大超引力可能在四圈上也是有限的,这比老结果要好。
无论超引力的紫外行为多么好,或迟或早人们要遇到发散。这使得人们渐渐对超引力失去信心,当然终结超引力的8年疯狂时代的是第一次超弦革命。
我念研究生时恰逢超引力时代的尾巴,已经强烈感受到热力,把研究生仅有的一点经费都用来复印超引力的文章,后来装订成厚厚的几大本,成天把脑袋埋在超引力的张量计算中。我甚至在科大的研究生杂志上写过一篇介绍超引力的文章,开头用了“上帝说要有光,于是就有了光,”可见信心十足,不过当时校对的人太懒,文章错字连篇。
超引力造就了一代不畏臃长计算的人。超引力的三位创始人都是天然计算机。以范-纽文豪生为例,当时他是领导潮流的人。美国超弦的公众人物之一贺来道夫(MichioKaku)在他的科普作品《超空间》(Hyperspace)中有一段描写,不妨转述如下(不是字字照抄,
这一节还请打假诸兄注意)。范-纽文豪生生得高大威猛,最适合做防晒油的广告明星。研究超引力需要非凡的耐心,而范-纽文豪生是最非凡的一个。温伯格(StevenWeinberg)说,“看看超引力的情形,在过去的10年中研究超引力的人个个杰出,有些人比我年轻时认识的任何人更为杰出。”范-纽文豪生用一个硕大无朋的夹纸板,每次演算,从左上角开始用蝇头小草一直写到右下角,写满后翻过一页接着写。他可以一直这样演算下去,中间唯一的间隙用来将铅笔放进电动削笔刀中削尖,接着继续演算,直到数小时后大功告成。有一段时间,石溪分校物理系的研究生竞相仿效,每人夹着一个大夹纸板在校园中走来走去,不可一世。
超引力风流一时,而超引力中的领袖人物也领导潮流于一时。超引力在我们的演义中还会出现,还在起很大的作用,尽管如此,过去的风流人物大多不再活跃,不免使人生出许多感慨:江山代有才人出,各领风骚三五年。
第四章第一个十五年
(第一节)
从1968年威尼采亚诺发表以他的名字命名的散射振幅公式到1984年的超弦第一次革命,弦论的初级阶段大概延续了15年。转眼之间,弦论的第二个15年也已过去。我们仅用一章来谈第一个15年,第二个15年将是本演义的主要话题,要看作者的能力、精力和时间,写到那儿就是那儿。
我们早在第一章就已提过,弦论起源于60年代的强相互作用的研究。60年代粒子物理主流是强相互作用,原因很简单,因为加速器的能量正好处在探测强相互作用的能区,即几个京电子伏(Gev)和几十京电子伏之间。建在加州大学柏克利分校的同步加速器所达到的能量是6.2京电子伏,在50年代末和60年代初提供了大量的关于强相互作用的数据,不断地产生新的强子。所以柏克利的丘(GeoffreyF.Chew)近水楼台先得月,成了60年代粒子物理领导潮流的人。由于新强子的不断产生,人们很快认识到场论无法用来描述强相互作用。由于高自旋强子共振态的存在,场论无法避免一些令人不快的性质,如不可重正性。朗道等人也早就证明即使是最成功的量子场论,量子电动力学,在根本上是不自恰的理论。量子电动力学是可重正的,但是它的耦合常数随着能量的提高而变大,且在一定的能量上达到无限大。这个能量叫朗道极点。朗道极点的来源是有限的电子质量和在这个能量上有限的耦合常数。如果我们希望将朗道极点推到无限大,那么低能的耦合常数只能是零,这就是有名的莫斯科之零。
由于以上所说的原因,整个60年代量子场论被看成是过时的玩意。丘等人强调场本来就是不可观察量,只有散射振幅是可观察的,所以散射矩阵理论成了60年代的时尚。坚持研究量子场论的人廖若晨星,我记得丘当年的一个学生谭崇义经常告诉我,就连盖尔曼(M.Gell-mann)都不得不跟随潮流,可见丘及其跟随者的影响力。谭崇义在提到这些往事时是得意的,因为丘不仅影响大,而且看问题有一定的哲学深度。维尔特曼后来的话很好地体现了研究场论的人少到的程度:他自己是恐龙时代少数的量子场论哺乳动物。公理化场论的创始人惠特曼(A.Wightman)在他的普林斯顿办公室的们上贴了张纸条,上书:本办公室应丘的指令已经关闭。
散射矩阵理论被看作唯一可以描述粒子物理的理论。散射矩阵理论拒绝讨论任何局域可观察量,虽然不排除适当的局域性。散射矩阵理论首先要求绝对稳定的粒子态存在,这些粒子态和相应的多粒子态形成渐进态集合。散射矩阵无非是从渐进态集合到渐进态集合的一个线性映射。散射矩阵满足数条公理:对称性,么正性和解析性。对称性无非是说散射矩阵元在一些对称变换之下不变,最一般的对称性就是彭加勒对称性,一些内部对称性也是允许的。么正性就是量子力学中的机率守恒。最后,解析性是散射矩阵理论中最有意思,也是最不容易理解的性质。所谓解析性是指一个散射矩阵元作为一些动力学量如质心能量、交换能量,角动量的函数是解析函数。对于一些简单的散射过程,人们可以证明解析性是相对论性因果律的推论,最早的色散关系就是这样导出的。事实上,离开局域量子场论,人们只能假定一般的解析性是宏观因果律的推论。
最常见的,也是分析得最透彻的是两个粒子到两个粒子的散射振幅。两个粒子当然可以通过散射变成许多不同的粒子,把所有这些过程都包括的结果叫全散射过程(inclusiveprocess),而仅考虑两个粒子散射成两个固定的粒子的过程叫排他过程(exclusiveprocess)。解析性通常只是针对排他过程而言。这样一个过程,除了各个粒子本身的标记,可变动力学量只有两个,就是两个粒子在质心系的总能量和粒子散射过程中的能量转移。第二个量在质
心系中又和粒子的散射角有关,这两个动力学量是更一般的叫做曼德斯塔姆变量(Mandelstam)的一种特殊情形。将粒子散射振幅看做曼德斯塔姆变量的函数,并将这个函数延拓到每个变量的复平面上,除了一些特殊的点之外,散射振幅是每个曼德斯塔姆变量的解析函数。这个重要特徵在很多情况下可以用来几乎完全决定整个散射振幅。
60年代的实验表明,很多两个粒子到两个粒子的散射振幅满足一种对偶性,这种对偶
性叫s-t道对偶,也就是说散射振幅作为两个曼德斯塔姆变量s和t的函数是一个对称函数。物理上,这等于说散射振幅的s道贡献等于t道的贡献。我们现在解释一下何为s道贡献何为t道贡献。在粒子散射过程中,如果两个散射粒子先结合成第三个粒子,这第三个粒子再分裂成两个粒子,这个过程就叫s道过程。我们举两个s道过程的例子。第一个例子是,光子与电子的散射,也就是康普顿散射。在这个散射过程中,电子先吸收光子变成一个可能不在质壳上的电子,然后发射出一个光子再回到质壳上上去。另一个例子是,一个电子与一个正电子湮灭成一个光子,然后这个光子再分裂成一个电子和一个正电子。我们叫这种过程为s道过程的原因是中间过程中的第三个粒子的能量就是质心系中的总能量,也就是s。t道的物理过程的定义是,在两个粒子的散射过程中,这两个粒子并无直接接触,而是通过交换一个粒子进行相互作用。这个被交换的粒子的能量就等于交换能量,也就是t,所以这种过程叫t道过程。通过以上的描述,我们看到s道贡献和t道贡献的贡献完全不同,直觉告诉我们这两个道对一个散射振幅的贡献不可能相等。如果我们用量子场论来计算,s道贡献和t道贡献的确不等,所以如果s-t道对偶在强相互作用中是严格的,那么强相互作用就不可能用量子场论来描述。当然我们可以推广量子场论使其包括无限多个场,这样每个道都有无限多个过程,虽然s道中的每一个过程不与t道中的某一个过程相等,这两个无限之和却有可能相等。
1968年,威尼采亚诺猜到了一个简单的但具有s-t道对偶性的散射振幅公式。这个公式的确可以拆成无限多个项,每一项对应一个s道过程,中间第三个粒子的自旋可以任意大,而质量也可以任意大。这个公式同样也可以拆成无限多个t道的贡献,每个被交换的粒子有自旋和质量。对于一个固定的自旋,粒子质量有一个谱,这个谱的下限与自旋有关。数学上,最小质量的平方正比于自旋,这个公式叫雷吉轨迹(Reggetrajectory),是雷吉在分析散射振幅作为角动量的解析函数时发现的。这个发现早于威尼采亚诺的发现。雷吉轨迹又和雷吉行为有关,雷吉行为是,当质心系中的总能量很大时,散射振幅作为质心系能量的函数是幂律的,这个幂与交换能量成正比。这种行为在t道中有简单的解释:每个t道的贡献与总能量的幂次成正比,幂次就是被交换粒子的自旋;而最大自旋又与该粒子的质量平方成正比,对整个振幅贡献最大的粒子的质量平方接近于交换能量的平方。
威尼采亚诺公式在当时来说仅适用于一种两个粒子到两个粒子的散射。这个公式在当年和第二年被许多人作了在不同方向上的推广,如巴顿和陈(J.E.PatonandH.Chen)将它推广到散射粒子带有同位旋量子数的情形,他们引进的同位旋因子在以后构造含有规范对称的开弦中起到不可或缺的作用。现为的里雅斯特国际理论物理中心主任的维拉所罗(M.Vorasoro)将威尼采亚诺公式推广到针对三个曼德斯塔姆变量完全对称的散射振幅,这个维拉所罗公式后来被证明是闭弦的散射振幅。不下于4组人独立地将威尼采亚诺公式推广到包括任意多个粒子参与散射的情形。富比尼(Fubini)和威尼采亚诺本人证明这些散射振幅可以分解为无限多个两个散射振幅的乘积,这两个散射振幅通过一个中间粒子联接起来,而这个中间粒子可以表达为谐振子的激发,这离发现弦的表述只有一步之遥。
(第二节)
弦的一般散射振幅被发现满足因式分解的性质后,很清楚这些散射振幅实际上是一种树图散射振幅,因为联接两个因子的粒子通常被看做自由粒子。基于这样一种看法,很自然地人们应寻找作为中间态的无穷多个粒子的解释。
自从威尼采亚诺散射振幅发表之后,匆匆又过两年,所有推广的威尼采亚诺散射振幅同时被三个人证明是弦散射振幅,这三个人分别是,南部(Y.Nambu),萨氏金(LeonardSusskind)和尼尔森(H.B.Nielsen)。不同寻常的是,这三个人都是有数的非常有原创性的人,我有幸在不同的时期和其中两个人有较长时间的接触,而仅在最近才和第三个人有过直接的交谈,我在解释弦的表示后再谈对这三个人的看法。
如同任何一个散射矩阵理论,当初态中的所有粒子的总能量和动量满足一个在壳关系,即总能量和动量可以看作一个理论中存在的一个粒子的能量和动量,这个散射矩阵元必须满足分解关系,分解成两个散射矩阵元的乘积,其中间态就是那个粒子。威尼采亚诺公式正满足这个分解关系,不但如此,它满足一组无数个分解关系,有无数个可能的中间粒子态。这些态的质量和自旋可以任意大。
最为不同寻常的是,有一个质量为零自旋为2的中间粒子,这和引力子相同。这个重要特徵在早期基本上为大家忽略。根据散射矩阵所满足的么正性,所有出现于中间态的粒子也应为可能的初态,也就是说,包含威尼采亚诺散射振幅的理论含有无穷多个粒子。这些粒子可以用一组谐振子简单的表达出来,上面提到的三位的工作说明,这组谐振子实际上就是在时空中运动的弦的量子化。
当一根弦在时空中运动起来,如不发生相互作用,它划出的世界面是一个柱面。当然,不同于我们通常所看到的,这个柱面很不光滑,因为弦在运动的过程中,除了振动之外,还有量子涨落。当弦有相互作用时,弦在运动的过程中可能从中间断开,变成两根弦;也有可能与另一根弦结合成一根弦。从弦自身的角度来看,这种相互作用是局域的,就是说,相互作用总是发生在弦上的某一点,而不是在许多点同时发生作用。从时空的角度讲,这种相互作用有一定的非局域性:比如说,两根闭弦(closedstrings)形成一根闭弦,在时空中,我们看到的是一个类似裤衩的图,其中两个裤腿是两根初态弦划出的世界面。裤衩交叉处应为相互作用点,如果我们拿刀来切,如果切出一个八字形,交叉处即为相互作用点。可以想象一下,不同的切法会得到不同的八字形,从而得到不同的相互作用点。这些不同的切法有物理对应,即不同惯性参照系中等时截面。既然相互作用点都不能完全确定,弦的相互作用的确有一定的非局域性。
以上描述的非局域性是弦论中相互作用最不同于点粒子相互作用的地方。这种非局域性是导致弦微绕计算没有通常的紫外发散的原因之一。在弦论的微扰论中,一个圈图在拓扑上是一个黎曼面,没有任何奇点。而点粒子相互作用的圈图,通常的费曼图,每一个相互作用点就是一个奇点。用数学的术语说,弦的圈图是流形,而粒子的圈图不是流形,是一个复形(complex)。
威尼采亚诺振幅是弦论中最简单的包含动力学信息的振幅,它对应一个树图,这是微
扰论中的最低一级。所以中间态看起来都是稳定粒子态,这里所谓的粒子无非是弦的一个激发态。如果将圈图包括进来,绝大部份粒子态变成不稳定态。在散射矩阵理论中,不稳定粒子态对应于一个有着复质量的极点,其虚部与该粒子的寿命成反比。
可以证明,我们可以在弦的微扰论中引进一个常数,而保证不破坏散射矩阵的么正性。这个常数就是耦合常数,每个圈图都与这个常数的一个幂次成正比,幂正比于圈图的圈数。计算圈图是一种很特殊的工作,要用到黎曼面的很多数学理论。在弦论早期,计算高圈图的唯一的工具是曼德斯塔姆的光锥规范(light-conegauge)下的技术,这也仅适用于纯玻色弦。
现在我们简单介绍一下发现弦论的三个人。南部这个人在物理界以非常有原创性著名,他的南部-哥德斯通(Goldstone)定理应为他的最为人熟知的工作,他也是最早提出夸克概念的人之一。有人说过这样的话:你如果想知道十年后物理中流行什么,你只要注意南部现在的工作。这说明南部工作的两个特点,一是他很少追逐流行的东西,二是他想得比很多人远而且深,没有足够的时间他的想法和工作不易为他人所了解。南部是很谦虚的人,如果你第一次见到他,很难相信他是一个对物理学作出那么大贡献的人。我在芝加哥待了三年,现在对他的印象和第一次见到他留下的印象完全一样。
当南部在一个会议上提出他的弦论的解释时,他的年纪已远不止四十岁。而同时提出弦的概念的萨氏金和尼尔森则不到三十,他们分别于最近两年度过六十。南部和尼尔森在早期涉足弦论后,虽也偶尔回到弦论上来,大部份都是关于强相互作用的弦的解释。萨氏金则不同,他除了在唯象上有一些重要工作外,他主要的精力是放在弦论和黑洞问题上。萨氏金的演讲表演才能是人所共知的,据说是继承了费曼的衣钵。他有一次自己开玩笑说,他是一个巡回演出的马戏团。关于他最著名的故事是一次他去康乃尔大学演讲,因脱光在一个湖中游泳被警察以有伤风化罪拘留。
现在来看,已有很大的把握说,萨氏金到目前为止最大的贡献是M理论的矩阵模型。这是他和另外三个人在1996年提出的。那时他也早已过了五十。他目前还是十分活跃,我想这种罕见的学术长寿与他的佻达个性不无关系。
尼尔森个性的特别大概还在萨氏金之上,他似乎只有一根神经,就是物理。起码在我看来,他与人讨论或聊天的方式奇怪之极,很不容易把握他说的是什么。我在玻尔研究所时,由于是一个人,往往在所里待到深夜。他当然比我大很多,有一个女友,南斯拉夫人。他不管这些,每天在所里待得比我还晚。有时喝咖啡在休息室遇到他,不免坐下聊天。虽然我只听懂他所讲物理的百分之二十到三十,出于礼貌,我频频点头。他的讨论物理,对人有催眠作用。
尼尔森的特点是绝不研究潮流问题,由于他的很多想法和见解非常独特,知道他的人都非常尊重他。多年来,他的一个主要想法是,在最微观的层次上,物理的定律是随机的。我们看到的规律是重正化群向一个不动点流动的结果。这当然与弦论背道而驰。
再回到弦论本身上来。在早期,虽然散射振幅的计算技术已发展得相当成熟,而一些重要的基本东西是相对晚些时候才被发现,如玻色弦只在26维才有可能是自洽的。在另外的任何维数中,洛伦兹对称总是被破坏。原因是,自旋为二的粒子及其同伴的质量不为零,
但粒子数目要小于有质量的粒子应有的数目。只有在26维中,这些粒子是无质量的。
(第三节)
在弦论的早期,最令人困惑的问题是弦的基态和时空的维数。弦的基态质量由雷吉轨迹公式中的一个常数,即所谓的截矩(intercept)来决定。在雷吉轨迹公式的左边是质量的平方,右边是对应这个质量的最大的自旋,再加上这个截矩。还有一个带质量平方量纲的常数,与弦的张力成正比。截矩是时空维度的涵数,通常是负的,所以玻色弦的基态的质量平方是负的,也就是快子,说明所谓的真空是不稳定的:真空的“激发态”中包括随时间成指数增长的模。
当时空维度恰为2时,所谓的快子变成零质量的粒子。在这个两维的玻色弦中,维一可被激发的粒子就是这个无质量的“快子”,所以这个弦理论很简单。在早期,由于有很多事情要做,并没有人来注意这个两维的弦理论。直到1989年,当其它的研究放慢时,人们才投入极大的精力来研究这个玩具模型,这是后话。
再说玻色弦为什么只在26维中是“自恰”的,这里自恰用引号原因是我们先忽略快子问题。首先,我们看弦的第一激发态,即自旋为2的粒子及其夥伴,我们在上一节末尾已提过,这些激发态只有在26维中才是无质量的,才可能成为洛伦兹群的一个表示,从而整个理论才可能有洛伦兹对称性。无质量这一问题在玻利雅可夫(A.M.Polyakov)的表示中并不明显,因为通过所谓顶点算子(vertexoperator)决定出的质量在任意维中都为零。此时的问题是,由于弦世界面上的绝对标度是一个动力学量,顶点算子本身的定义就成问题:因为顶点算子要在世界面上做积分,故世界面上的度量要有好的定义。弦世界面上的绝对标度只有在26维才可以“合法”地认为可以扔掉,也就是脱耦,我们后面再仔细谈这件事。
如同任何含有高于0的整数自旋的理论一样,弦论也有一个如何脱耦鬼场的问题。这些鬼场的能量可以是负的,在一个量子理论中同样带来稳定性问题。一个“初等”的例子是量子电动力学,其中矢量场的时间分量对应的量子就是鬼场,这里人们利用规范对称性来消除鬼粒子。同样,弦论中有很多鬼场,人们可以用光锥规范(lightconegauge),这样鬼场自然消失,但洛伦兹不变性就不能直接看到。如改用协变规范–明显洛伦兹不变的规范,我们就要证明,所有鬼场在物理量中,即散射振幅中不出现。这被哥德斯通等人于1973年证明(P.
Goddard,J.Goldstone,C.Rebbi,CharlesB.Thorn),证明中的关键要用到维拉所罗(M.Vorasoro)代数的限制。维拉所罗代数的来源很类似量子电动力学中去掉纵向自由度的限制,起源于在简化南部作用量(非线性的)过程中(从而得到线性作用量)的限制。在后来,这些限制联系到弦的世界面上的共形不变性,同样我们在将来再解释。
以上说的是微扰弦论最重要的特点,这些是与通常量子场论的不同之处,可惜这些重要结果不能用更通俗的方法来解释清楚。这大概可以被拿来说明为什么弦论目前还处在一个初级阶段。
经常有人将超弦的微扰论的有限性质归结于超对称,在场论中,这种说法自然是正确的,见我们在第三章中的介绍。在弦论中这样说是错误的,超对称只是有限性的一个部份原因。真正重要的原因是弦本身的延展性,就是我们前面早就提过的高能区自由度少于场论中的自由度。表面上看来,这样说正好与弦的一次量子化所得结果相反,因为随着质量的增加,
不同粒子的个数与质量是一个指数关系。弦的美妙之处在于,虽然粒子个数无限制地增加,弦的相互作用的方式使得散射振幅在高能区变得越来越小于任何场论中的结果。
这种反直觉的结果有一个非常直观的物理解释。在场论中,当我们提高能量时,我们所用的“探针”如对撞的粒子能探测到越来越小的空间。这样在小空间的量子涨落会越来越多地影响粒子间的相互作用,从而引起紫外发散,我们在第三章中已谈过。弦的不同之处是,当我们提高能量,能量的一部份自然用来加速弦的质心,而更多的能量实际是耗费在加大弦的尺度,所以能量越高我们并不能将能量集中在一个小区域。相反,能量越高我们可能在探测一个更大的空间。这就是近来大家谈得很多的紫外–红外对应。
举一个例子,最简单的量子贡献是单圈图。这个图就象一个面包圈,有两个半径。当能量很高时,两个圆之一的半径越来越小,这类似于粒子的费曼图,那个粒子传播的圈越来越小。由于世界面上的共形不变性,将这个面包圈放大,则小圆变大,而大圆就更大。将变得更大的大圆看作是弦的传播轨迹,这是红外的单圈图。所以,如果有任何紫外发散,这个紫外发散就应对应于一个红外发散。在量子场论中,通常的红外发散说明我们取的场论“基态”不是真正的基态,应该修正无质量场的真空取值。当然,如果理论中含有快子场,也有红外发散。很快我们就要说到超弦,在超弦中不存在快子,唯一可能的是与无质量粒子相关的红外发散。如果有足够多的超对称,就不会有任何红外发散,从而紫外发散也就可以避免了。谈谈后话,1988年,格罗斯(DavidGross)和他的学生门笛(P.Mende)比较系统地研究了弦的散射振幅在高能极限下的行为,发现随着能量的增大,振幅成指数衰减(当散射角固定时),比场论中常见的幂次衰减要快得多。其原因与我们上面说的散射振幅有限的原因一样,散射振幅与弦世界面的面积成指数衰减的关系,能量越大,世界面的面积越大。他们由此得出一个新的测不准关系,即测量的距离不但有一项于能量成反比,还有一项于能量成正比。无疑,这个关系在弦的微扰论中是正确的。
与此几乎同时,日本的米谷民明(TamiakiYoneya)论证,出于类似的理由,特别是世界面上的共形不变性,应存在一个时空测不准关系。该测不准关系说,测量的纵向距离和测量过程的时间成反比。这是一个很有预见性的工作,在当时并没有受到足够的重视,在弦论的第二次革命中,我和他证明了这个关系实际上在非微扰的层次上也是正确的。我们相信,这个测不准原理应是弦论甚至是M理论中最重要的原理之一。当然,弦论目前的发展还没有很好地体现这一原理。
这个原理也应和目前流行的量子引力的全息原理有深刻的联系,我本人一直很关注这个问题,希望时常能在研究中回到这个问题上来。当然在这个谈超弦的第一个十五年的章节中提这件事不是为了顺便吹嘘一下自己,而是想让读者留下对我钟爱的话题一个较深的印象。
(第四节)
超弦的引进我们在第三章第四节已讲过,这里作一下简单的回顾。法国人雷芒,其时在费米实验室工作,首先在弦上引入费米场,这相当于狄拉克矩阵的推广,所以时空中也就有了费米子。纳吾-史瓦兹也引入弦上费米场,但满足反周期条件,这样就有了时空中的玻色子。1976年,格舍奥三人引入格舍奥投射,去掉雷芒分支以及纳吾-史瓦兹分支中一些态,这样时空中就有了超对称,特别是原来的快子也被投射出去,也就没有了真空稳定性问题。
同样基于洛伦兹不变性的要求,超弦所在的时空必须是十维的。十维对于粒子物理学家来说是太大了,对于数学来说不算什么,但也有点特别。对于研究卡鲁查(Kaluza)克来茵(Klein)理论的人来说不算特别大,正好比最高维的超引力低一维,从由紧化而得唯象模型来说也许正好,这是后话,是第二次超弦革命的重要话题之一。
对于开弦来说,格舍奥投射只有一种可能,因为法则是唯一的,开弦中雷芒分支和纳吾-史瓦兹分支每样只有一个。在威尼采亚诺公式提出后不久,张(译音)(Hong-MoChan)和巴顿(J.E.Paton)于1969年指出如何对每个弦态引入内秉自由度,他们称作同位旋。用现在的眼光来看,无非在开弦的两个端点引进电荷。这是一个关键的概念,这样规范场才有可能在弦论中出现。我们知道,非阿贝耳规范场所带的“电荷”是一个连续群的伴随(adjoint)表示,也就是说,每一个内秉对称性都有一个规范场与之对应。现在,如果开弦的每个端点带一个电荷,那么整个弦的电荷是端点电荷的“直积”。有意思的是,理论上的自洽要求这个直积就是一个群的伴随表示。
理论上的自洽要求对称群是三个系列的一种,这个要求就是散射振幅的因子化,因子化的概念我们也在前面提到过。三个系列的群分别是酉群,辛群和正交群。前两者对应的开弦是可定向开弦,即在时空中运动的一个位形对应于两个不同的弦,在弦上有一个箭头。这从端点的电荷,张-巴顿电荷来看很容易理解。对于酉群和辛群来说,有两个最基本的表示,电荷“相反”,开弦的一端带“正电荷”,另一端带“负电荷”,所以弦有一个明显的指向,即从“负电荷”到“正电荷”。正交群则不同,只有一个基本的表示,类似空间中的矢量。在这种情况下弦的两端点带类似的电荷,弦也就是不可定向的。
开弦的另一个重要特点是,一个自洽的理论不可避免地要含有闭弦,如果有相互作用的话。这是因为开弦的相互作用发生在端点,例如,两个开弦通过端点的连接成为一个开弦。如果这样,一个开弦本身的两个端点也可以连接起来成为一个闭弦,这是比较直观的解释。数学上,当我们计算开弦的单圈散射振幅时,我们遇到弦的世界面为环面的情形,如果数个弦态进入环面的一个边界,而另外几个弦态由环面的另一个边界出来,其中间态是一个闭弦。散射矩阵的么正性要求,任何一个中间态也应成为初始态或末态。由于闭弦态含有引力子,这样一个开弦理论也应包括引力子。而在开弦中,由于规范不变性,有规范粒子,这样在这个理论中自旋为1的粒子和自旋为2的粒子就统一了起来。
纯粹闭弦的理论理论中的弦必须是可定向的。这是因为,在闭弦理论中总存在伴随于引力子一种反对称张量粒子,这些粒子可以认为是对应于弦的规范场,在某种意义上整个弦带有这个规范场的荷,而只有可定向的闭弦能与反对称张量场耦合。闭弦还有一个特点,就是当弦振动时,在弦上向两个方向运动的模完全独立,我们称之为左手模和右手模。对于超对称闭弦来说,就有了两个独立的雷芒分支和两个独立的纳吾-史瓦兹分支,而任一个闭弦态是左手一个分支中的态和右手一个分支中的态的直积。这样就有了4个闭弦分支:雷芒-雷芒分支,纳吾-史瓦兹-纳吾-史瓦兹分支,雷芒-纳吾-史瓦兹分支,纳吾-史瓦兹-雷芒分支。前两个分支中的态都是玻色子,后两个分支中的态都是费米子。
我们在作格舍奥投射时,左手模和右手模可以独立地做。这样就有了两种可能,一种方法得到的理论叫IIA型理论,另一个叫IIB型理论,前者从时空的角度看没有手征性,也就是说存在一个弦态就存在其镜象反演态,而后者有手征性。
超弦的低能理论是超引力理论,所谓低能,是指能量低于弦的张力所确定的能标。这样的理论只包括无质量的弦态。有趣的是,几乎所有超引力的发现都在对应的弦论发现之前,型IIB例外,IIB超引力理论是史瓦兹通过弦论的导引发现的,它的构超不同一般,这里你只能写下超引力的运动方程,传统的东西如作用量和哈密顿量至今还没有人能够写出。
1974年,日本北海道大学的米谷民明(北海道是他的家乡),加州理工学院的史瓦兹以及在那里访问的法国人舍尔克独立发现弦论的低能极限是规范理论和爱因斯坦的引力理论。今天看来这也许一点也不奇怪,因为有这样的定理:包含自旋为1粒子的相互作用理论一定是规范理论,而包含自旋为2粒子相互作用理论一定是广义相对论。在当时并没有这个定理,即便有这个定理,人们也希望通过弦的相互作用直接看到规范理论和引力理论。米谷民明,舍尔克-史瓦兹所做的恰恰是这些。理论计算已经很复杂,但比计算更令人佩服的是,他们同时建议重新解释弦论,将弦论作为一种量子引力理论,也作为一种统一引力和其它相互作用的理论。在此之前,弦论一直作为一个强相互作用的理论来研究,所以弦的能标是100个兆电子伏(100Mev),如果“自然”地将弦的能标等同于普朗克能标,这样一下子将能标提高了20个量级。这是相当大胆的一步。
米谷民明当时还非常年轻,应当比他的西方竞争者都年轻。我当然认识他,从第一次在布朗大学见到他到今天也近十年了。这十年中几乎没有变,个子当然还是比较矮小,说话轻声,态度谦虚。虽然他是日本人这一行里思考最深刻的人,从他的谈话中根本感觉不到这一点。这也许是几乎所有日本人的特点,起码在学界中的日本人是这样,表面上不是很自信,但如你想改变他们的一个想法通常很难很难。
史瓦兹是在弦论第一次革命之前自始至终研究弦论唯一的人,在前期,他的主要合作者是舍尔克;后期,他的主要合作者是格林(M.Green)。当史瓦兹还在普林斯顿做助教授时,舍尔克和纳吾由法国到普林斯顿作类似博士后的研究,我说类似的原因是法国的学位不是美国的博士学位,虽然类似。那时当然是舍尔克物理研究的开始。实际上,纳吾和舍尔克首先发现开弦的低能极限包含规范理论,这种低能极限叫作零斜率极限(zeroslopelimit),原因是当弦的张力取为无限大时,雷吉轨迹公式中的斜率,弦的长度标度的平方,趋于零。这个极限是舍尔克第一个研究的。在舍尔克诸多贡献中,有上面提到的他与史瓦兹的工作,他与史瓦兹和布林克在不同时空维中构造了超对称规范理论,当然还有格舍奥投射,和史瓦兹研究了一种超对称破缺方法,等等。贯穿于他所有工作是他的物理想法,他是早期弦论中最强调物理直觉的人。可惜他没有活到弦论的第一次革命从而看到他多年的信念被很多人所接受,他在1979年底去世,应是不堪忍受病痛。在他去世前,他在强调一种反引力,其实就是弦论中反对称张量场和伸缩子(dilaton)引起的反引力,这在弦论的第二次革命中起了重要作用。我们很难想象,如果舍尔克能活到今天,他会对弦论做出多大的贡献。
史瓦兹在结束和舍尔克的合作后,和格林开始了第一次合作。他们的第一次合作的结果是证实了格舍奥等人关于弦论中超对称的猜想。在他们后来的合作中,他们主要是围绕超弦的相互作用、超弦的低能极限开展工作。主要的结果包括超对称的证实,超弦世界面上的直接实现时空超对称,超弦的各种相互作用,超引力作为超弦的低能极限。当然,最为重要的工作是发现弦论中的反常抵消,从而大大减少了可能的弦理论的数目,把弦论与粒子物理的关系推进了一步,也因此引起弦论的第一次革命。
第五章第一次革命
(第一节)
超弦在1984年之前是少数几个人的游戏。在西方,几乎所有研究超弦的人或多或少和史瓦兹有关,不是他的合作者,就是他的学生,所以可以毫不夸张地说超弦是史瓦兹和他的朋友们的游戏。米谷民明虽然在1974年也建议用弦论来描述量子引力,他也摆脱不了潮流的巨大影响,除了在1975、1976两年中还在研究一点弦论外,基本上去研究规范理论和大N展开去了。唯一例外的是1983年中的威顿。他在83年的谢耳特岛(ShelterIsland)的第二次会议上(第一次是二战之后开的)讲卡鲁查-克来茵理论中能否得到在4维中带有手征的费米子问题,得到否定的答案。这就基本否定了仅在卡鲁查-克来茵理论中得到粒子物理的标准模型。他后来说,他本打算谈弦论的,尽管他到那时为止还没有研究过弦论。因为那次已有人讲了弦论,他才打消念头。应当说威顿是从史瓦兹在82年发表的一篇综述里学到弦
论的。卡鲁查-克来茵理论的失败和弦论的可能的有限性使得威顿极其重视弦论,这大概是为什么继格林-史瓦兹84年的第一次革命的第一篇文章,他能和其他三位写出第二篇文章的原因。
我们在本章中侧重讲84–85年间的第一次弦论革命的三篇最重要的文章,依次为:1。格林-史瓦兹的关于型-I弦理论中当规范群为SO(32)时规范反常的抵消,以及后来的关于这个弦理论有限的证明;2。普林斯顿的小提琴四重奏组合关于杂化弦构造的文章。3。威顿等四人的卡拉比-丘(Calabi-Yau)紧化的文章,该文指出当型-I弦或杂化弦紧化在一个6维的卡拉比-丘流形上时,得到的四维理论具有N等于1的超对称,以及三代粒子;最后,再谈一谈其它一些重要的进展。
先谈谈反常。这是量子场论中的一个重要话题,但也是比较难以用直观的图像来解释的话题。这里试试能不能不用公式把基本道理讲出来。最好的出发点是一个两维的量子场论,其中有费米场,也有规范场。先谈费米场,这些我们在介绍弦的世界面上的理论已遇到过。和一个标量场一样,满足两维运动方程的无质量费米场有两个独立的解,也就是向右传播的波和向左传播的波。这种传播的方向性又和费米场的手征有关。如果我们不明白何谓手征性,我们暂时就用传播的方向性代替:向右模和向左模。假定这些模都是复的,那么这个简单的理论有两种对称性。一种对称性是说,将两个模同时用一个相因子转动,所得的结果不变,这种对称性不区分向右或向左,所以叫做矢量对称性(下面就谈到为何用矢量这个名字)。另一种对称性是向右模和向左莫的转动因子恰恰相反,这个变换区别方向性,所以叫做赝矢对称性。
现在再谈两维世界中的规范场。最简单的规范场如同电磁场,有两个分量,即是一个矢量。在两维中,只有一个场强,相当于沿着空间方向的电场,没有磁场的原因是因为只有一个空间方向。现在如果我们要求上面谈到的矢量对称性是一个规范对称性,也就是一个局域对称性,我们就必须引进一个规范场与之耦合,这个场是矢量,所以相应的对称性叫矢量对称性。在经典的意义上,上面谈到的赝矢对称性还是一个好的整体对称性,因为运动方程在这个变换下不变。
奇怪的是,当我们有一个不为零的电场场强时,赝矢对称性不再是一个好的量子对称性。也就是说,这个对称性对应的荷在量子力学中不再是守恒的。事实上,我们可以把矢量对称性和赝矢对称性重新归为向右模的转动对称性和向左模的转动对称性,每个对称性都有对应的荷,即向右运动的电荷和向左运动的电荷。现在,我们说的反常是,虽然在经典上这两个荷分别是守恒的,在量子力学中不再是分别守恒的。只有它们的和是守恒的,这是矢量对称性,而它们的差不再是守恒的,也就是说,赝矢对称性在量子的层次上受到破坏。
这个反常很久前就为斯坦伯格(Steinberger)和薛温格注意到,在两维中也有比较直观的解释。考虑沿着空间方向有一个电场,电场在一维空间中当然有明显的指向。在量子场论中,费米场往往有所谓的狄拉克负能海,在没有电场时,这个负能海的能级对于向右模和向左模来说没有区别。当有电场时,就有区别了,因为电场有方向性。这样,向右模和向左模的填充能海的方式就不同,从而对应的真空就不同。当然我们可以避开狄拉克负能海来解释这个问题,因这个概念不适用于玻色子。这样,向右模和向左模的电荷不在是分别守恒的。
这种反常在我们目前讨论的理论中并没有什么问题,相反,它有很多应用,如量子霍尔效应。但如果我们分别对向右模和向左模引进规范场,问题就来了。规范场存在本身要求对应的荷是守恒的,但这些荷不是分别守恒的,所以,比方说,向右荷对应的规范理论本身在量子力学中就没有办法定义。对应于总荷,我们可以定义一个规范理论,这就是上面谈的矢量规范理论,而赝矢规范理论不存在。如果一个两维的理论本身只有向右模,这个理论就不能有规范对称性。
在高维中,虽然向右或向左已不是有定义的概念,但在偶数维中存在手征这个概念,从而反常的问题也存在。在4维中,最早证明反常存在的是爱德勒(StephenL.Adler),贝尔(JohnBell)和贾克夫(RomanJakiew)。他们的文章都是在1969年发表的,内容是通常的量子电动力学,其中一个费米子带有手征性。同样,手征对称性,或即赝矢荷不再守恒,不守恒的量现在不是与电场成正比,而是与电场和磁场的内积成正比。
后来的发展表明,反常现象在所有的偶数维都存在。不仅是我们上面介绍的阿贝尔手征反常,而是所有可能的非阿贝尔手征反常都存在。反常通常可以用一个拓扑不变量来表示,在两维中,就是电场,这在数学中叫第一陈类;在4维中,是电场和磁场的内积,数学上叫第二陈类。有一个很简单的特徵,所有这些拓扑不变量都可以表达成一个全微分,这样他们的时空积分只与一个流在边界上的行为有关,而与规范场在时空内的行为无关。这些流其实是一种微分几何里称做形式的东西,本身并不是规范不变的,在4维中,特定的名字是陈-西蒙斯形式(Chern-Simons)。
除了规范场外,引力场的存在也会引起反常。引力场的反常发现比较晚,是1983年的事。发现晚的原因是,引力反常并不是在所有偶数维中都可能。最简单的引力反常发生在两维,下面就是6维,接着是10维,也就是说每隔4个维度才会有,4维中没有引力反常。系统研究引力反常的文章是1983年中阿瓦瑞智-高密(LuisAlvarez-Gaume)和威顿的文章,他们也研究了10维中的引力反常,可见威顿本人已很重视弦论了。1983年可以称作反常年,在阿瓦瑞智-高密和威顿之前,已有几组不同的人研究了高维中的规范反常,包括朱米诺、吴咏时和徐一鸿(A.Zee)。反常的非常漂亮的几何解释就是这个时候发现的,所有这些是格林-史瓦兹论证型-I弦论中没有规范反常和引力反常的重要出发点。
我们已经强调过,如果我们从一个不含手征场的高维理论出发,威顿已证明通过紧化不可能得到一个低维的带有手征场的理论,从而也不可能得到粒子理论中的标准模型。这样,我们只能从一个本来就带有手征场的高维理论出发。所有超引力中,含有最大超对称的是10时空中的IIB型超引力。这个理论是史瓦兹通过10维IIB型超弦理论的低能极限发现的,他与格林在83年证明这个理论没有引力反常。但是,10维IIB型超弦理论不含任何规范场,而要通过紧化得到标准模型的规范场,10维又不够。
这样就剩下型-I超弦理论。这个理论的低能极限含有N等于1的10维超引力,其中含有带手征的费米场;不但如此,理论中还含有N等于1的10维超杨-米尔斯理论,规范群是我们上一节中提到的三个系列,同样,其中的费米场是带有手征的。现在的问题是,在这个手征理论中,各种反常是否可以完全抵消,从而理论本身是自洽的?
这个问题的回答比以前所有的反常抵消都要微妙,因为理论中不但存在引力反常和规范反常,也存在混合反常,即有些反常项同时与引力场和规范场有关。不但如此,理论中的开弦态和闭弦态有混合,比如说,当对规范场做规范变换时,闭弦态之一的反对称张量场也随之而变,完全不同于直觉所告诉我们的。感谢这个特性,格林-史瓦兹证明,所有单圈的反常项,如果不是互相抵消,都可以通过在树图中加入与反对称张量场有关的项来抵消。而这种抵消要求规范群是SO(32),无论是规范反常也好,还是引力反常或混合反常,都要求这个群。这的确是一个几乎是不可思议的结果,因为太多的系数恰恰在这个群的情况下成为零。
格林-史瓦兹并且注意到,另一个群也满足这个要求,就是E(8)乘E(8)群。这个群还不能用开弦来实现,但他们两人已预言了这个弦理论的存在,后来的杂化弦就实现了这个预言。有趣的是,有好几个人都建议所有反常在这个群的情况下抵消,包括法国人射瑞-米格(J.Thierry-Mieg)。后者不至一次地向别人夸耀他曾向格林-史瓦兹建议这个群。
格林-史瓦兹关于反常抵消的讨论中一个重要特点是开弦的反常与闭弦的树图的规范变换的抵消,这种抵消后来统称为格林-史瓦兹机制。这可能是第一次,弦论中经典项与量子项的混合。不久,他们两人又证明了过去以为是发散的单圈图,在群为SO(32)时,也互相抵消,这说明型-I弦论本身是有限的。
格林-史瓦兹的发现启动了弦论的第一次革命,之所以有这种情况,不外乎两个原因:第一,弦论第一次表明自洽的理论的个数很少,不在是无限多个;第二,弦论中有可能实现标准模型,这是人们在研究过很多其它超对称理论后剩下的不多的可能。
(第二节)
书接上回,那里我们预告了这一节讲杂化弦。杂化弦的英文是heteroticstring,不知谁是始作俑者,估计格罗斯(D.Gross)和哈维(J.Harvey)都有可能,因为这两位都有玩弄文字游戏的爱好。杂化的含义是这个新的弦理论是两种弦的杂交,一种是10维的超弦,另一种是26维的玻色弦。由于后者中的16维是紧化的,而且没有了另一半(下面谈),所以这16维不是物理的空间,这个弦理论还是10维的弦理论。这个杂化构造有两个选择,一种产生的规范群是SO(32),另一种产生的规范群就是格林和史瓦兹预言的E(8)XE(8)群。
杂化弦的4个作者都在普林斯顿,所以他们被叫做普林斯顿弦乐四重奏。“老大”是格罗斯,早已是个著名人物,最有名的工作是与维尔彻克共同发现量子色动力学中的渐进自由。在60年代末70年代初也短暂地研究过弦论。他和史瓦兹是同学,都是邱的学生,又同时在普林斯顿作助理教授,后来只有他成为那里的永久正教授。弦乐组合的其他三人都很年轻,哈维是助教授,马丁尼克(E.Martinec)是博士后,而儒么(R.Rohm)是威顿的学生。第一次革命产生了很多超新星,儒么是其中之一。他是一个真正的超新星,非常亮,但高亮度只持续了很短一段时间,现在已几乎不可见了。
我听到过一个非正式的故事,说当另三人有了构造杂化弦的想法之前,威顿或者儒么已经有了类似的想法,不管是谁先有的,威顿建议他的学生研究这个问题。后来知道另三个人也在做类似的工作,威顿就建议他们吸收儒么。这在普林斯顿是难能的,因为有一种说法,普林斯顿高能组的人打印出自己的文章时都是跑步到打印室去的:生怕别人看到这篇文章中的想法。有没有夸大先不管,但普林斯顿人之间的竞争的确很大,历史上经常有两篇研究同样的问题的文章一起出现。
威顿在后来的一系列发展中起到了关键作用。我们前面提到,他在1982年至1983年之间已非常注意弦论的发展,因为他意识到其它的统一途径基本上行不通,而弦论中的弦的激发态中自动含有引力子的事实对他来说类似于一种启示,他后来屡次提到。在格林和史瓦兹发现反常抵消的前后,他已在普林斯顿公开和私下做了很多推动的事情。据当时在普林斯顿做学生的克来巴洛夫(I.Klebanov)后来说,普林斯顿上上下下,除了他之外,都在学习弦论,而动作比较快的弦乐组合已有了杂化弦的想法。
这个想法在物理上很简单,而数学则需要用到当时大多数研究场论的人不熟悉的相对比较新的东西。物理上,人们利用一个早已知道的事实,即弦的世界面上的两种模,向右运动和向左运动的模是独立的。我们在谈两维中的反常已谈过它们,这里,由于所有平坦空间的维度在世界面上是无质量的玻色场,右手模和左手模没有耦合,所以形式上它们可以被看作是独立的场,或自由度。同样,世界面上的费米场的右手模和左手模也是独立的。取10维超弦中的右手模,加上26维玻色弦的左手模,我们就得到杂化弦。
26维左手模中的10个维度和10维超弦的右手模中的玻色场共同形成物理的10维时空。换言之,这10维时空没有紧化,这样右手模和左手合并起来含有10空间中的引力场,所以这10维空间是真正的物理空间,因为只有当几何(其激发态是引力子)是可变的时候才是真正意义上的时空。左手玻色场剩下来的16维没有相应的右手模,从而不可能有相应的引力场,这样这16维一旦固定下来,就不会发生动力学变化,从而不能被看着是空间,这16维可以类比于量子场论中的内秉空间,它们的存在仅仅引入新的自由度而已。
稍早,一些其他人一猜测E(8)XE(8)超弦可以由26维的玻色弦获得,如芝加哥大学富润(P.G.O.Freund)。富润也知道应当用到一些新的数学,就是我们马上要提到的仿代数(affinealgebra)的顶点算子表示,但他没能有效的将右手和左手分开,所以没有得到大家后来熟知的杂化弦。
现在,仅仅是为了粗糙地理解什么是杂化弦,我们需要引进一些不熟悉的物理和数学概念,这些和环面有关。我们知道,一维的圆可以叫做一维环面,两维环面大家最熟悉,象一个轮胎的表面。同理,我们可以想象高维的环面。现在假定一些物理的空间是环面,弦在
这个环面上运动。再假定这个环面是平坦的,没有曲率,但这个环面可以有不同的形状。比如一个两维环面,可以通过黏结一个平行四边形的两对对边得到,所以这个环面可以有不同的形状。用比较数学化的语言,平行四边形的四个定点可以看作一个两维晶格上的点,而一个平行四边形本身可以看作这个晶格的一个基本格子。最后,环面通过把所有平面上的基本格子等价而得到的,这样,环面就是一种最简单的平面陪集,其等价群就是晶格所代表的群。同样,我们可以由一个高维的平坦空间出发,加上一个高维的晶格作为等价群,就可以获得任何想要得到的平坦的高维环面。
当弦在环面上运动时,它可以有振动,这一般叫做激发,而非激发的状态有两组物理量子数来决定,这些通常叫做零模。一组零模就是整个弦的沿环面的动量,而另一组是弦在环面上各个方向缠绕的次数,即绕数。这两组量子很重要,后面谈T对偶时要起很大作用。对于一个粒子来说,最简单的波函数是平面波,其中的量子数是动量。对于一个弦来说,最简单的波函数也是平面波,但当弦有绕数时,我们要推广这个平面波。这个推广很简单,就是把平面波中的座标用弦的整个座标取代,将右手模和左手模分开,就有了两组动量,而这两组动量是弦的动量和绕数的线性组合。这个平面波波函数当作世界面上的函数看待时,就叫顶点算子。
并不是所有动量和所有绕数都是允许的。我们知道,动量在量子力学中对偶于座标,由于环面上的周期性,动量必须量子化。结论很简单,就是动量也必须处在一个晶格上,这个晶格对偶于用来构造环面的晶格。当然饶数是自动量子化的,很明显,绕数处在原来的晶格上。
现在,为了构造杂化弦,我们要求去掉16维环面上的右手部份,这就要求右手的动量为零,也就是一些总动量和饶数的线性组合为零。这对原来的晶格以及它的对偶晶格加了一些限制条件。弦的一次量子化又要求弦的动量在壳条件,从顶点算子的角度来说,这个算子的左手反常权必须是1,这说明晶格上的一些基本长度是偶整数,从而晶格上的任一点的长度都是偶整数。所有这些条件加起来,我们基本上得到一个结论,就是,这个16维的晶格是一个偶的并且是自对偶的晶格(evenself-duallattice)。
巧的是,在16维中,只有两个满足这些条件的晶格,这两个晶格分别对应于两个群,就是SO(32)和E(8)XE(8),晶格恰巧是群的极大环面的晶格,也就是说,这些群每个都有一个极大的平坦环面,维数是16,用来构造这个环面的晶格满足我们上述的条件。这样,在晶格上取长度恰为2的点来构造顶点算子,这些算子再和右手模结合,得到一些完整的算子,这些算子对应于10维时空中的规范场的激发态。另一个巧合是,每个16维的晶格上恰有496个长度为2的点,和应有的规范场的个数相等。
证明这些顶点算子满足相应的李代数要用到在当时来说是相当新的数学,就是仿代数的顶点算子表示。这个数学分支有一个有趣的历史,在数学方面,先是勒泊斯基(J.Lepowsky)
和威尔逊(R.Wilson)开始研究,由富兰克(I.B.Frenkel)、凯兹(V.G.Kac)等人完成,再由哥达德(P.Goddard)和奥立弗(D.Olive)用物理的语言在84年左右表达出来。所有这些工作早年有物理学家研究过特例,如海尔朋(M.B.Halpern)。在一次革命之后,产生了很多相关工作,当然威顿的对所谓外斯-朱米诺-威顿模型的研究极大推广了这些工作的物理意义,对后来的发展有很大的影响。
杂化弦的右手部份是10维超弦的一半,所以由此而来的超对称也是10维超弦的一半,就是N等于1的10维超对称。当群为SO(32)时,零质量场的内容和型-I超弦没有任何区别。这个重要特征并没有引起任何人的重视,因为很自然地人们以为这是两种完全不同的理论。杂化弦是一个纯闭弦的理论,而型-I弦含有不可定向的开弦和闭弦。杂化弦左手部份的在环面上的16个玻色子又可以用32个费米子取代,这和两维中(世界面)的“费米化”有关。我们不谈费米化,只简单地介绍一下杂化弦在费米表示下的构造。32个费米子,可以分为两部份,对每部份独立的加周期或反周期条件(即雷芒分支,或内吾-史瓦兹分支)。在壳条件表明,只有两种可能才能得到自洽的谱,就是要么所有32个费米场满足同样的条件,这样得到群为SO(32)的杂化弦;要么32个费米子分成每组16个费米子的两个组,独立地加周期条件。可以很快地得到结论,必须用格舍奥投射(见第四章第四节或更早),这样投射的结果是在第一个激发上恰有496个态,这对应于E(8)XE(8)的规范场。可以证明,不能将32个费米子拆成更多的组。费米子表示的好处是不需要仿代数的顶点算子知识,这也是它的坏处,因李代数的结构不清楚。费米子表示也说明,16维新的空间的确是内秉空间。
(第三节)
1984年的超弦风暴在很大程度上归功于三篇经典文章中的一篇,就是威顿等人的关于卡拉比-丘紧化的文章。这篇文章大概是所有超弦文章被引用最多的一篇,后来它的引用率仅仅被一篇文章超过,就是马德西纳(J.Maldacena)的关于弦论和规范理论对偶的著名文章。
单从引用率来看,很能说明为什么卡拉比-丘紧化文章的重要。首先是唯象方面的,这篇文章为弦论在唯象学方面的应用开了一个先河,使人们看到很多不同的可能;其次,这种全新的紧化方式引发构造许许多多低维弦理论;最后,卡拉比-丘紧化使得弦论第一次和现代数学的分支代数几何发生关系。
我们前面说过,如果从一个高维理论出发,要想得到一个低维的带有手征费米场的理论,这个高维理论本身必须是手征的。现在,弦论已有三个理论在十维中带有手征,就是型-I超弦,其规范对称性是SO(32),两种杂化弦,规范对称分别是SO(32)和E(8)XE(8)。卡拉比-丘紧化文章首先关心的是,如何从这些理论得到一个四维的手征理论。当然由于十维超对称的存在,我们首先要问的是,通过紧化后,还要不要超对称?
粒子物理的标准模型中没有超对称,也就是说到目前为止,粒子物理实验还没有看到任何超对称的迹象。我们在谈超对称和超引力一章中解释了超对称的引入在理论上的意义,也谈了在解决所谓规范等级问题上的作用。所以,在某个能标以上,超对称的存在是有好处的,很多唯象学家也相信发现超对称下一阶段粒子物理实验的重要目标之一。那么,唯象学需要多少超等称?从消除发散的角度看,越多越好,而从粒子物理的角度看,四维中的N等于一超对称最合适。如果有更多的超对称,表示理论说明,如果有一个左手的费米子,则存在一个对应的右手费米子,这和弱电相互作用极大破坏手征性矛盾。所以,在某个能标以上,最好只有四维的N等于一超对称。
既然在低能理论中没有超对称,我们能不能一开始就利用紧化破坏所有的超对称?这种可能是存在的,但我们一定要在解决规范等级问题的前提下做到破坏所有的超对称。据我所知,目前还不存在一个这种紧化方式。
所以坎德拉斯(P.Candelas)、豪罗维芝(G.Horowitz)、施特劳明格、威顿等四人的文章假定在紧化后得到一个四维的N等于一的理论。这就要求,卡拉比-丘流形破坏大多数超对称。根据推广的哥得斯通定理,破坏一个超对称就必须有一个对应的零质量的费米子,这些费米子必须从10维的引力微子中产生,从超对称变换的角度说,这些费米子对应于超对称变换所产生的引力维子部份。引力微子的超对称变换含有超对称参数的协变微商,要产生不为零的引力微子场,这些协变微商要不为零。我们得出结论,如果只留下一个四维的超对称,只有这个超对称对应的协变微商为零。用数学的语言说,整个流形上只有一个基林旋量(Killingspinor)。
如果将十维时空流形看作是一个四维的平坦的时空和一个封闭的六维空间的直积,那么这个基林旋量在四维平坦时空上只是一个常数旋量,在六维空间上就比较复杂了。很多简单的封闭空间有许多基林旋量,如一个六维的环面;而大多数封闭空间没有任何基林旋量。可以很快证明,允许基林旋量存在的空间必须是里奇平坦的,即所有里奇曲率为零。如果只有一个基林旋量,那么这个里奇平坦的空间也不能过于平坦,环面是完全平坦的,但有太多的基林旋量(和旋量的份量个数一样多)。一个空间的平坦程度又可以用一个群论言语来描述。我们知道平移的概念,这个概念在欧氏空间中最简单,也可以推广到一个弯曲的空间中去。当一个空间是弯曲的时,一个矢量沿着一个闭合的路径平移后回到原点可能与原来的矢量不同。在一个平坦的空间中,沿着任何闭合路径平移后的矢量还是原来的矢量,我们说这个平坦空间的和乐群(holonomygroup)是平庸的。球面则不同,平移后的矢量好像是经过了转动,这个转动依赖于路径。所有可能的转动形成一个群,这个和乐群对于球面来说是整个转动群。现在,只允许一个基林旋量存在的六维空间的和乐群不能太小,也不能太大,必须正好是一个SU(3)群。
和乐群为SU(3)的空间是一个复空间,同时又是一个所谓的开勒空间(Kahler)。这样一个空间叫卡拉比-丘空间,原因是,卡拉比猜测和乐群为SU(3)的空间一定存在一个里奇平坦的度规–我们前面说过基林旋量的存在要求里奇曲率为零,而丘成桐证明了这个猜测。这类流形是一类特殊的复流形,卡拉比-丘紧化文章给出了一些构造。这些构造说明这些流形是代数流形,也就是说可以通过在复欧氏空间用代数方程来规定一个子流形,虽然我们形式上有了这些流形,还没有人能写出一个里奇曲率为零的度规,这就说明这些流形的确很复杂。
也许我们就认为在这种情况下很难研究紧化后的一些物理问题。的确,许多问题的回答要求我们必须知道明确的度规,幸运的是,很多重要的、低能物理的问题的回答不需要明显的度规表达式。一类问题是,紧化后,有多少四维中的零质量粒子?零质量粒子对应于六维紧化流形上的各种微分算子的零模,比如,一个零质量的标量粒子对应于六维流形上的拉普拉斯算子的零模;一个零质量的旋量粒子对应于六维流形上的狄拉克算子的零模。没有明确的度规表达式,我们不能写出这些零模的明确表达式。但要回答有多少零模,我们不需要明确的表达式。
算子的零模问题和所谓的指标定理有关。给定一个算子,可以定义其指标,这个指标是一个整数,即是这个算子的零模个数减去其对偶算子的零模个数。在很多情况下,对偶算子没有零模,那么原算子的零模个数就等于这个算子的指标。指标定理说,虽然定义中涉及到几何即度规,一个算子的指标是一个拓扑数,只和流形的拓扑有关,和几何没有关系。指标定理在很大程度上推广了欧拉定理以及后来的黎曼-罗赫定理。
当我们用代数方法构造了卡拉比-丘流形后,就可以利用代数几何的结果计算各种算子的指标,从而确定对应的无质量粒子的个数。举例来说,狄拉克算子的指标是欧拉示性数的一半。在这里,狄拉克算子的零模定义为左手零模,其对偶零模是右手零模,这样,狄拉克算子的指标等于没有配对的手征零模,而配对了的零模形成一个没有手征的零质量粒子。所以,粒子理论中的代的个数正好等于狄拉克算子的指标,也就是欧拉示性数的一半。如果能构造出一个欧拉示性数为6的流性,我们就得到一个有着三代粒子的四维理论。
标准模型中的一些重要的参数,如费米子与标量粒子耦合常数,也可以通过代数几何来确定,这些也是一些拓扑不变量,当然是一些比较细致化的拓扑不变量,与复几何有关。
紧化工作的另一个重要部份是决定四维中的规范对称性。非常有意思的是,这也和代数几何有关。如果我们从N等于一的十维理论出发,格林-史瓦兹关于反常的工作说明,不是所有的紧化都是自洽的。低能理论要求,六维流形上的一个曲率和规范场必须满足一个方程,这个方程的拓扑意义是说流形的第二陈类等于规范场的第二陈类,当然方程本身的要求比这个表述的要求还要高,相当于无限多个要求。幸运的是,这个要求在卡拉比-丘流形上
可以得到满足。举E(8)XE(8)理论为例,可以把流形的和乐群SU(3)与E(8)的一个子群完全等同起来,这样,剩下的规范对称性是所有与这个子群对议的子群,也就是E(6)XE(8)。我们可以将E(6)解释为一个大统一对称群,另一个因子E(8),由于与E(6)对易,可以解释为
不可见的分支。所以,卡拉比-丘紧化从超对称和大统一的角度来看,是一个非常成功的紧化方式。
最后,说一句题外话,历史似乎提示,所有一开始认真研究卡拉比-丘紧化的人,一生都离不开这个题目,如坎德拉斯。1984年文章的另外三个作者,后来没有将卡拉比-丘流形作为主要研究课题,所以在其它方面都做出了重要工作。
(第四节)
1984-1985年的超弦第一次革命可以说在不到一年的时间就已完成,也就是说,今后若干年所围绕发展的几个问题和重要概念在一年之间已被提出。我们在本章前三节所谈的三篇文章都在一年之间出现,这三篇文章是超弦第一次革命的三篇最重要的文章。其它几篇重要文章也都在一年左右出现。
我们在这一节谈谈其它一些重要工作。毫无疑问,谈到微扰弦论,首先想到的是两维共形场论。我们把关于两维共形场论的稍微仔细的介绍推迟到下一章,这里,只限于谈一下共形场论对于微扰弦论的重要性,以及在弦论第一次革命间及之后共形场论在弦论中的几个应用。
顾名思义,共形场论是一类特殊的场论,在其中有共形不变性。共形不变的含义是,量子场论中没有一个内秉的标度,所有物理学量,如关联函数,只和这些物理量本身带来的标度有关。譬如,在一个关联函数中,所有出现的标度只是各算子之间的相对距离。由于没有内秉标度,场论含有较高的对称性,除了我们熟悉的洛伦兹对称性外,还有变换标度不变性。在不同的维度中,标度不变性隐含着更大的对称性,通常叫做共形不变性。粗略地说,共形变换是一种只保持任何一个图形的所有夹角而改变长度的变换。在两维中,存在无限多这些变换,所以两维共形场论很特殊,在很多情况下可以作解析研究。开这种研究先河的是前苏联的几个人,贝拉文(A.Belavin)、玻利雅可夫和查莫罗德契可夫(A.B.Zamolodchikov),而他们的重要文章,简称BPZ文章,是在1984年发表的。
这个时间上的巧合也许并不奇怪,因为玻利雅可夫本人对弦论很感兴趣,他在1981年已经发表了关于所谓玻利雅可夫弦的重要文章。对于他来说,研究两维共形场论有两个目的,一是将其应用到统计物理中的临界现象上,二是应用到弦论中。给定一个时空背景,弦论中的世界面作用量定义一个两维量子场论,这个量子场论必须是一个共形场论,如果不是,我们要遇到两个基本困难。第一,如果没有共形不变性,世界面上的每一个度规都含有一个决定世界面上每一点的长度的标量场,这样定义的散射矩阵破坏了对散射矩阵的一个基本要求,就是么正性。第二,没有共形不变性,我们也无法定义计算散射矩阵的最基本的东西,即每个散射态的波函数,或即顶点算子。
共形不变的要求在弦论的微扰论中有非常重要的推论,一个看起来不可思议的结论是,要求一个定义在弯曲时空中的世界面上场论共形不变等价于时空中各个场的运动方程,特别是广义相对论中爱因斯坦场方程及其推广。
对于纯粹的玻色弦来说,世界面上的量子场论必须是一个共形场论,而对于超弦来说,这个共形场论还含有更大的对称性,就是一些两维中的超对称,这个共形场论也就叫超共形场论,除了一般的超对称外,还有无限多个新的超对称,与无限多个共形不变性类似。而在杂化弦中,场论也是一种杂化,左手模是一个普通的共形场论,而右手模是超共形场论。
可以说,在第一次革命后,研究共形场论占据了许多人的大部份精力。有人甚至把研究共形场论等价于研究弦论的所有动力学,弗里丹(D.Friedan)就是一个典型,他强调将共形场论分类以及深入研究各种世界面的集合:一个无限高维的空间,普适模空间。由于生病的原因和坚持他的这种信念,弗里丹已经多年脱离弦论的主流,基本上没有什么研究了。
另一个重要研究方向是各种各样紧化,特别是卡拉比-丘紧化。我们说过,一般的卡拉比-丘流形非常复杂,甚至一个明显的度规都写不出。所以,人们很快想到如何构造一些简单而有用的模型,所谓迹形(orbifold),就是这样被发现的。与更为普遍的流形不同的是,迹形的拓扑通常由一些“奇异”的点来实现,当我们远离这些点的时候,空间是平坦的,拓扑也是简单的。从一个平坦的欧氏空间出发,利用欧氏空间的对称性就可以构造迹形。我们已经谈过如何构造高维的环面:方法就是用欧氏空间中的晶格,将晶格单胞的“对边”等同起来。用数学的术语说,晶格本身是欧氏空间平移对称群的一个离散子群,而环面则是欧氏空间在这个离散子群作用下的等价类。环面是最简单的迹形,在这里,迹形的“迹”有明显的含义,就是,环面上的每一个点是欧氏空间的一个轨迹,这个轨迹由晶格作用在一个点上来生成。在环面的情形,每一个“迹”实际上就是一个晶格,这个“迹”是晶格群的一个忠实的表现。
更为一般的迹形是通过推广环面的构造获得。一个晶格群是欧氏空间的对称群的一个子群,欧氏空间的对称性除了平移外,还有转动对称以及反演对称。将晶格扩大为一个更大的离散群,其中包括一些转动元,我们就可以构造一般的迹形了。同样,迹形上的每一点是欧氏空间一个点的“迹”。通常,这个迹所含的欧氏空间的点和这个离散群有一一对应,在这个情况下,迹形上的点是一个普通点,也就是说,在这个点的周围,所有几何与欧氏空间没有什么不同。在特殊的情况下,有的点在离散群的一些元作用下不变,这个点生成的迹也就不会是离散群的一个忠实表示。在迹形上,这个“迹”所对应的点是奇异的,它周围的几何与欧氏空间的一个邻域有所不同。一个最简单的例子是,我们用一维晶格来构造一维的圆,再加上关于原点的反演元,我们构造出的迹形是一个线段,这个线段无非是将圆对折而获得。线段的两个端点是奇异的,所对应的在直线上的迹比一般的迹少了一半的点。一个稍微有点复杂的迹形是线段在二维的推广,我们同样通过用两维的晶格来构造两维环面,形状象一个轮胎。再加上一个针对原点的反演元,我们得到一个完全不同的迹形,其形状象一个四面体,除了四个顶角外,所有的点都是正常的。而每一个顶角是奇异的,因为绕顶角一周,我们得到的角是180度,不是360度。四面体的拓扑是一个球面拓扑,与环面完全不同。
不是所有的欧氏空间的离散子群都可以拿来构造迹形,我们要避免构造出怪异的空间。举一个例子,取一个转动元,这个转动元所对应的转动角不是360度的有理数倍,那么一个点在其作用下,无论经过多少次作用,总不会回到原来的地方。这样,这个点仅仅在这个转动元的作用下就生成无限多个点,且集中在一个圆周上,而这个圆周上的另一个点也会生成无限多个点,这两组无限多个点中有些点可以任意接近,虽然原来的两个“母点”并不接近,这样生成的迹形不是豪斯道夫空间。
弦论在迹形上有很有趣的性质,如有所谓的“扭结弦”(twistedsector)存在。这些扭结弦有很直观的图像,举圆这个最简单的迹形为例,在这里,一个扭结弦无非是一个绕在圆上的弦,可以绕圆一周,也可以绕圆许多周。所以我们通常不说这些弦态是扭结态,而说是绕态(windingmodes),他们是扭结态的特殊情形。可以这样来理解为何叫他们作扭结态。从直线出发来构造圆,直线上原来的一些态,通过平移生成无限多个象,这些象加起来对应于圆上的一个普通态(也就是说,一个圆上的普通弦态在直线上也是一个“迹”)。但是,如果有一个弦的两个端点停在一个点的两个象上面,我们会得到一个新的弦态,这个弦态在原来的直线上不存在,因为不是一个闭弦,在迹形即圆上就是一个闭弦了。由于每一个晶格群的元都会有带对应“量子数”的弦存在,我们将这些态叫作扭结态:通过用平移元扭结得到。同样,我们说过的反演元也有对应的扭结态。在线段上,有两组新的扭结态,他们起始于某一点,通过端点回来又终结于这一点。扭结态常常是局域化的,如通过线段端点的扭结态,他们不能自由地在线段上移来移去。扭结态的存在不是人为加的,如果你想构造一个弦论,其中没有扭结态,那么通过相互作用,原来的一个非扭结态可以变成两个量子数相反的扭结态。
卡拉比-丘紧化的另一个方向是研究一些抽象的共形场论,通过共形场论中弦态的谱与卡拉比-丘流形上的谱的对比,可以找出一些对应关系,已经找出的叫做盖普乐模型(Gepnermodels),是盖普乐本人首先发现的。抽象的共形场论的研究比直接研究卡拉比-丘紧化多很多好处,如可以计算严格的顶点算子,在流形上很难做到这一点。很多卡拉比-丘流形的数学性质,如所谓的镜像对称性(mirrorsymmetry),先是在共形场论中发现的。所以,物理学家再一次有机会对数学作出独特的贡献,由于现代科学的分工越来越细致,这些贡献是一个纯数学家不可能作出的。在这个特殊的领域,纯数学家能做的是对物理学家的发现作出“严格”的论证而已。
第六章黑暗时代
(第一节)
有一个非常有意思的现象,在科学领域,越是较为抽象的学科,它的发展方向和活跃的几个地方越不受流行的东西影响,或者更确切地说,这样的学科中没有流行。越是接近实用,学科越受流行的左右。前者以数学为代表,后者以物理为代表。而每个学科中,其受流行影响的程度又因不同分支而不同。以数学为例,数理逻辑研究和关心的问题大概数十年不变,而一个比较应用的分支,如计算机图形设计就会很快改变其热门方向,完全为时髦的东西左右。
同样,即使在物理中,流行的程度也因分支而异。且不说应用物理,以及与应用物理接近的凝聚态物理。高能物理本身,可以大致分为三个大方向。第一是唯象理论,所谓唯象,指的是与粒子物理的现象有关,这个分支受潮流的影响极大。例如,去年流行过一阵子谬子(muon)的反常磁矩问题,因为一些实验说观测值偏离理论值达到三个以上的标准误差。这引发一阵不大不小的谬子反常磁矩热潮,引发专门文章数十篇。后来,有人发现原来的理论计算有问题,原来的两篇理论文章作者也站出来说他们犯了错误。把这错误矫正过来,观测值离理论值只有两个标准误差了,完全不说明问题。这样,这个时髦的话题才冷下来。第二是类似超弦理论的一些比较大的纯理论分支,由于不受实验的直接影响,这些分支相对要稳定些,但也仅仅是相对而已。在这样的学科中,也有潮流,这些潮流主要为一些领导潮流的人把握。大潮流三五年来一次,小潮流一两年来一次。第三种是不能独立成为分支的一些数学物理方向,这些方向中不太容易看到潮流。
超弦理论有大小潮流。比大潮流来的更大的是所谓的革命,革命大约是十年来一次。我们在上一章中谈了第一次革命,这个革命本身持续得很短,只有一年功夫,影响远远超过一年。当影响越来越小的时候,黑暗也就来了。
黑暗的原因和表现有两个方面。其一是,一些主要问题及其推广已经研究得比较成熟,很难再做深入的研究了;其二是,革命过程中带来的未解决的问题还是未解决,并且看来是越来越难。这第二个问题会引起领域之外人的非难,因为即使是一个不太了解弦论的人也会听说到这些问题,感觉到这些是比较大的也很关键的问题,如果不解决,弦论谈何成功。一个例子是,弦论的发展带来很多不同“真空”的发现,而微扰弦论不能解决选择真空的问题。那么我们的4维的空间如何来的?4维中的标准粒子模型如何来的?这些问题不解决,局外人就觉得弦论是空对空,不是一个理论,充其量是一种应用数学。哈佛的格拉肖(S.Glashow)就是这么看的,他嘲笑道:“一个针尖上可以容许多少天使跳舞?”这种看法当然会在各个方面造成对弦论研究的不利。年轻的对弦论还没有很深体会的人会对弦论产生许多疑问,从而放弃弦论的研究。年长的,在每个学校有影响的人,也会产生疑问,这样会对弦论中的年轻人的前途产生不利的影响。这些因素综合起来,弦论在上世纪的80年代末、90年代初就进入历史上的第二个黑暗时代。
我记得很清楚,那时我每到一个地方,当有人问起我是研究什么的时候,我有点不好意思地回答:弦论。然后尽量给他人留一个我对物理的其它方面也感兴趣的印象。只有这样,人家才认为你这个人还有救,才会跟你继续谈点什么。
尽管弦论本身处于一个不利位置,大多数成熟的弦论专家还是继续着超弦的研究,所以在黑暗时代,弦论还在进步。在本章中我们谈谈这段时间中的一些主要的进展,特别是与共形场论和矩阵模型有关的一些研究。
我们前面已谈到,二维共形场论是微扰弦论的基础,因为弦的一次量子化涉及到弦的世界面,是二维的。二维共形场论的发展和弦论既有关系,也有一定的独立性。其发展,一部份与弦论有关,一部份与场论以及凝聚态物理有关。场论中,很早,例如威尔逊就提出了算子乘积的概念,苏联人玻利雅可夫早在70年代初就研究了算子乘积的共形不变性质,所以几个前苏联人在1984年发表的经典文章是那个研究的继续。
BPZ文章对研究超弦的人带来的冲击是即时而又明显的。那时,第一次超弦革命正在发生,苏联也在解冻。有一些苏联人到欧洲去访问,我不知道玻利雅可夫本人那时是否去过丹麦,但BPZ之一的贝拉文和丹麦的玻耳研究所关系密切,肯定在那个时候去过。弗里丹恰好也去访问,所以很快了解到BPZ的工作。他回美国后很快与闲克(StevenShenker)以及裘宗安写出后续文章,主要是判定所谓极小模型是否是么正的。这篇文章本身的影响极大,同时又向西方介绍了苏联人的工作。BPZ的工作先在苏联的一个杂志上发表,然后才在欧洲的核物理杂志发表。
弗里丹本人大学学的是文科,后来才转到物理。他的博士论文研究二维的非线性西格马模型(nonlinearsigma-models),论文的导师又是一个有名的数学家辛格(I.Singer),所以遭遇之奇在弦论中是少见的。当然,二维的非线性西格马模型是一个物理问题,辛格也是少数几个懂物理的大数学家之一。由于研究二维的非线性西格马模型,弗里丹可谓先天好过很多人,一下子就可以转到弦论上来,因为弦的世界面理论就是一个二维的非线性西格马模型。弗里丹的博士论文很快成为弦论的经典之一,其中得到的一个重要结果就是,一个二维模型是共形不变的条件是,背景空间上的度规必须满足爱因斯坦场方程。
我刚接触弦论时,就被逼着学弗里丹的博士论文,当然觉得是囫囵吞枣,能懂多少是多少,这样研究弦论,当然不会赶上潮流。弗里丹等人前进得很快,不但与闲克等人在二维共形场论以及超对称的二维共形场论中做出很多好工作,也与凯伦(C.Callan)等人推广了他的博士工作,系统地研究了玻色弦以及超弦在一般弯曲背景中的自洽条件,也就是背景场应满足的运动方程。这些运动方程包括弦的修正,也就是说,除了爱因斯坦方程之外,还有与弦有关的附加项,这些附加项的大小由弦的长度标度所决定。从弗里丹的故事中,我们看到,掌握发展的先机多么重要,在圈外懵懵懂懂,尽管可以做一点研究,却只能永远是边缘的研究。这是我从我个人的经验中得到的比较痛苦的总结。
我们下次要仔细谈谈二维共形场论,然后谈谈二维非线性西格马模型。
(第二节)
在凝聚态物理中,多年来有一个重要问题,就是临界现象。这种现象很早就被发现,如乳光现象,水和蒸气的共存点。后者是水在变成蒸气的过程中,气压的变化终於使得水气不分。水变成气是一级相变,其特点是很多物理量突然改变,如密度。一级相变有一个终点,在这里,不连续的量成为连续的量,而它们的导数变成不连续的,这就是二级相变。过去描述二极相变的理论是兰道平均场论,比较粗糙。后来威尔逊发展了重正化群的方法,将所有对涨落有贡献的项都计及,形成了一套非常成功的理论。
当一个系统处在二级相变点,也就是临界点时,涨落的效应最大,因为此时系统(假如是无限大的)已没有能量的间隙,用场论的语言说,所有场都是没有质量的。更严格地说,所有关联函数中没有长度或质量的标度,从而系统本身有标度不变性。只要系统比较正常,那么标度不变性就蕴涵着共形不变性。标度变换仅仅改变整体的标度,而一个普遍的共形变换可能改变形状,所保持的仅仅是原来的所有图形中的角度。很多研究得比较透彻的临界系统是两维的(三维的系统当然更实际,但很难研究),所以两维的共形场论变得非常重要。
在一个局域场论中,局域算子的概念很重要。原则上,给定任何一个空间中的点,列出所有局域算子,相当于在一个闵氏空间中知道了整个希尔伯特空间。不同点之间的算子关系可以通过空间平移来得到,从而相互之间是一个线性关系。知道了一点的算子还不等於了解了系统的所有性质,例如,我们最感兴趣的是关联函数。威尔逊指出,如果知道任意两个定义在不同点算子乘积,原则上所有关联函数都被确定了。两个算子的乘积,可以用两个算子的其中一点上的所有算子来展开。这个展开通常是渐进展开,也就是说,当把这个算子乘积代入一个关联函数的时候,得到无限多关联函数之和,这个和是一个渐进级数。由於算子乘积展开中每一项的系数随着两个算子之间的距离变小而变小,这个展开在小距离上非常有效,所以有时人们将算子乘积展开叫成短矩展开。
场论的一个特点是,关联函数通常随着距离的减小而变大。这就意味着,在算子乘积展开中,最重要的项随作距离变小而增大。而大多数项随着距离变小而变小,所以我们只须重视有限的几个项有行了。如果是共形场论,我们还可以按照标度来分类算子,在这个分类中,每一个算子在变换尺度时也变换一个因子,该因子通常随着尺度的变小而变大,这正是场论在小尺度上自由度增大的一个反映。对於每一个标度算子来说,那个变化因子是尺度变换的一个幂次,幂通常是负的,取其正数,这个正数叫这个算子的指标。我们可以将空间一点上的所有算子按指标的大小排列。随着指标的增大,算子的数目越来越多。
现在,同样可以进行算子乘积展开的研究。所有涉及的算子都有一个固定的指标,这样乘积展开中的每一项算子前的系数就是两个算子距离的一个幂次。随着算子的指标的增大,这个幂次变得越来越正,从而该项便得越来越不重要。展开中有最小指标的算子最重要,通常的情况下,其系数是距离的一个负幂次。
玻利雅可夫早期对共形场论的贡献是,他很早就意识到算子乘积在共形场论研究中的重要,他并猜测,三个算子乘积的结合性可能是研究共性场论的关键,这个结合性叫做自提升(bootstrap),这个英文词很难翻译,大意是,这是一个自洽自足的系统。如果能把所有的自提升方程都解了,整个共形场论也就被解了。
1984年的BPZ等人的文章中新添的一个关键点是无限大的共形变换代数。共形群或共形代数在两维中很特别,只有在两维中,有无限多个共形变换。这从两维的度规总可以写成一个局域的正交度规看出:取正交度规的复坐标,这样度规只有一项,就是复坐标的无限小变化乘以其复共轭,经过任何局域的全纯(也就是解析)变换,这个正交形式不变。在量子场论中,对应于每一个变换,有一个算子。大家熟知的情形是,在时间平移下,对应的算子是能量,或哈密顿量;在一个空间平移下,对应的算子是这个空间方向上的动量。同样,对应于每一个共形变换,有一个算子。无限多个共形变换有无限多个算子对应。共形变换代数对应于一个无限大的算子代数,同任何量子代数一样,这个代数可能有反常,这里的确有反常,代数的反常项是一个常数,这个常数正比于一个很重要的量:系统的中心荷,与系统的自由度有关。这个量子代数首先在弦论中出现,由维拉所罗发现,就叫维拉所罗代数。
维拉所罗代数其实是两套代数,一套对应于全纯变换,另一个对应于其复共轭。每一个代数中有一个重要的生成元,这个生成元对应于坐标的标度变换,所以,任何一个标度算子与它的对易子还正比于这个算子,正比的系数就是这个算子的全纯指标。我们以前定义的指标是全纯指标和反全纯指标的和。
由於共形变换是对称性,所有算子在共形变换下回到算子的一个线性组合,也就是说,所有的算子形成维拉所罗代数的一个表示。这个表示是可约的,可以分解成无限多个不可约的表示。当这个分解是有限的时候,该共形场论叫做一个极小共形场论。在每一个可约的
表示中,有一个特别的算子,该算子与所谓的正模维拉所罗代数元对易,所以这个算子是这个表示中的指标最小的,不然的话它与正模元的对易子给出带有更小的指标的算子。这个特别的算子叫原初算子(primaryoperator)。
给定一个原初算子,接下来就是用表示论来研究与原初算子处於同一个表示中的其它算子,其它算子叫做次级算子(secondaryoperators)。同时,给定原初算子之间的关联函数,次级算子之间的关联函数就可以通过微分等的作用由原初关联函数确定。有一写特别的算子,就零算子,表面看来不为零,其实应等价于零。这些算子通常通过用维拉所罗代数作用在一个原初算子上获得。将这个算子插入一个关联函数,应得零。但是,一个零算子通过用各种微分算子作用在原初算子上获得,这样,我们通过插入零算子的办法就获得了一些关联函数所满足的微分方程。这个结果是BPZ文章的重要结果之一。
BPZ文章中另一个重要结果是对极小模型的分类。极小模型的中心荷必须小於1,一个无质量自由标量场的共形长论的中心荷为1,所以一个极小模型中的自由度小於一个无质量的标量场。极小模型由两个整数所刻划,其中心荷是这两个整数的函数。这些场论有的是么正的(即没有负指标的算子),有的不是,甚至中心荷都可能是负的。后来,弗里丹等人进一步研究了么正极小模型的分类,通过研究态之间的内积,他们得到结论,两个整数代表的一类模型中只有一类用一个整数刻划的极小模型是么正的。
BPZ文章的第三个重要结果是关于算子乘积的系统的研究。自提升关系可以通过图形来表示,也就是所谓的交叉对称(crossingsymmetry)。通过算子乘积展开,一个四点函数又可以拆成全纯函数和反全纯函数的乘积的和。还有一个重要概念,就是聚变规则(fusionrules),这些规则说,当考虑两个分属两个不同表示的算子的乘积时,在展开中只有一些表示中的算子才会出现。自提升关系的重要作用是,一旦给定聚变规则,在很大程度上算子的乘积展开就确定了。
还有一种比极小模型范围更广的模型,叫有理共形场论。在一个有理场论中,任何关联函数都是一个有限的和,其中每一项是一个全纯函数和反全纯函数的乘积。有一段时间,在莫耳(G.Moore)和塞伯格等人的倡导下,许多人把精力化在分类有理共形场论以及研究具体的模型上面。
说到具体模型,不能不提外斯-朱米诺-威顿模型。威顿在研究玻色化时重新发现了这一大类模型,他证明了不动点,也就是标度不变点的存在。在这一类模型中,除了共形不变外,还有许多其它的对称性,这些对称性写成代数的形式就是过去在粒子物理中出现过的流代数,或者叫凯兹-莫狄(Kac-Moody)代数。我们前面说过,维拉所罗代数的存在引出一些关联函数满足的微分方程,同样,凯兹-莫狄代数也有对应的微分方程。这些微分方程至今还没有完全研究透彻,方程与数学中的一些重要问题如黎曼-希尔伯特问题有关系。外斯-朱米诺-威顿模型属於有理共形场论,其实,有理共形场论的很多特点都是从这些模型中总结出来的。
说来奇怪,当弦论的第一次革命结束时,黑暗的时代到来时,共形场论一枝独秀,使很多人几乎忘记了弦论本身,而以共形场论作为一个独立的研究方向。记得那时出国到意大利,与科大的一位同学一道虔诚地拜访威顿(相信他早已忘了这事),问他几个关于共形场论的问题。问完后,他竟然反问我们,对弦论感兴趣吗?说明他无时不刻地在想与弦论有关的问题,即使他也在专心研究共形场论。可以说,共形场论的短期繁荣某种程度上弱化了弦论的黑暗时代。
威顿是我对EdwardWitten一名的翻译。威顿去年已经过了50岁了,但他在物理领域还是很活跃,创造力也没有明显地下降。他在物理这个学科的名气大概不比任何一个在世的研究科学的在他/她自己的学科中的名气小。也许,并不是太夸张地说,他是有着最大名气的一位。数年前,正是在所谓的超弦第二次革命中,USNews象往常一样在年底出了一期介绍美国各大学在本科和研究院上面的排名,在那一期最后介绍了美国的五名最活跃的学者。我记得其中有AndrewWiles、麻省理工学院的著名语言学家NoamChomsky。威顿是第一位被介绍的,而AndrewWiles是第二位被介绍的,可见威顿在美国学术界的影响和地位。同样,两年前,美国的新闻周刊在世界末总结的一期中介绍世纪的重要人物,爱因斯坦被评为世纪最有影响的人物,是二十世纪的第一骑士。在另一期的新闻周刊中,也评出了美国的还活着的50位最有影响的人物,威顿也是榜上有名,和麦当娜紧挨着。
这么一个人,在美国公众中应当很有名了,对不起,美国虽说是科学发展得最好的国家了,一般百姓对科学没有那么大兴趣。对很多人来说,科学有点象研究不明飞行物那样的专业,离神秘主义差不了多少。在美国,出名的科学家是很会搞公关的,如霍金以及卡尔-塞根(当然霍金是英国人)。威顿恰恰相反,生性内向,性格和他的身材以及硕大的脑袋很不一致。
这里不是总结威顿成就的地方,我们主要围绕一个同学提出的问题,就是,威顿是不是当代牛顿?我的简短回答是,很象,但还没有象到是的程度。
说威顿象,主要是从他研究的擅长的角度来说。他在同行中最有名的,是他的数学能力,这种能力可能是超弦理论界独一无二的,虽然在这个窄窄的领域,大概没有人会真心地认为自己的数学不好。他的数学能力,就目前已有的成就,不下于当今任何一位数学界的高人,当然,要完全看清他的成就,还要过很多年。他在1990年得菲尔兹奖的时候,不仅数学界,就是很多他的物理同行,都觉得有点勉强,事实说明,当年极力挺他的阿蒂亚(SirMichaelAtiyah)等人的眼光是不凡的。他当年的工作,虽很有特色,却不是那么出人意外的新。很多数学界强调严格的“清教徒”更觉得他提倡的方法不严格。
恰恰是这一点,他很象牛顿。牛顿发明微积分的时候,出发点是要解决物理问题,要在物理上“严格”定义速度、加速度等等,所以他的方法对于他自己来说已经足够严格了。但微积分达到今天的严格程度,走了两个大步,每一步花了大概一百年的时间。牛顿的方法是直觉方法,这似乎是每一个大数学家都具备的,而他处于一个特殊的时代,所以成就和特点更加特出而已。威顿目前最大的数学成就,就是用量子场论的结果发明了一个非常“简单”的计算一种微分拓扑不变量的方法。当他在近8年前发现了这个简单的方法时,很多数学界这方面的专家为之惊奇,因为无论如何,没有物理背景的他们是很难理解这种方法的,所以他们以为是奇迹。仅仅这一项工作,就足以使他成为一个了不起的数学家了,所以1990年的菲尔兹奖没有给错人。他还有很多其它方面的贡献。
应当说,和物理结合,是数学在这个世纪的一大特色。威顿等人提倡的方法和途径,将会有越来越大的影响。所以,许多数学家开始学习量子力学,甚至量子场论。
在物理上,他在很多方面也是无人能及的。首先是他的高产,很多物理学家可能比他更高产,但不是都能保证高质量。威顿不同,最高产的时候,一年有近二十篇文章,篇篇精彩。据不完全统计,他发表了200余篇文章,每篇文章的平均引用率近300次,这在物理学界,包括所有不同的分支,是第一。就是和生物这样的巨大学科比,也不落后那些领头的几位多少。
再就是他每做一个问题的速度和完美,大概任何一位在某个时候和他研究同一个问题的人都有这种体会。如果不是他在你还没有摸到边的时候就已解决了问题,就是和你同时做出,但解决的方法比你的优美,解决的程度比你的彻底。他是一个少有的能将一个问题解决得干干净净的人,使后来的人惊讶于他的完美和不可思义。这方面的例子太多了。
最后,我要讲一下他的缺点,正是这种缺点使得他不能成为当代的牛顿(当然,牛顿在实验物理上的贡献,如光学,是现在任何一位理论物理学家没法比的)。这种缺点可能来自于他的无人能比的解决问题的能力。他的一篇文章很难挑出什么毛病,在早期,他的文章虽然在方法上出人意表,但由于他本人的直觉,每篇写得既全面也易懂,文章还有一种特别的文风,这在严肃的科学文章来说是
很难的。正由于这样的很少出错,他显得比较保守,很少写他自己不能肯定是正确的文章。研究学问当然要严谨,但对第一流的人来说,还要一点大胆,威顿比较缺乏大胆,所以他也失去很多机会。特别在发自1994年的超弦第二次革命中,他虽然是主要人物,却有几个最大胆、最重要的想法是别人的,他一旦意识到这个想法的重要性,他很快跟上,并将这个想法发展到极致。我们可以列出几个人,虽然总体成就没有威顿那么大,却因为提出一法得到人们的尊重,如A.Polyakov,J.Polchinski,J.Maldacena。LennySusskind更是一个极其注重直觉的人,他在缺乏很多证据和严格的论证的情况提出了很多想法,后来都证明是对的。当然,’tHooft,世纪末的两个物理学诺贝尔奖得主之一,也是一个很有原始想法的人,虽然他并没有参预超弦的研究。
威顿很喜欢与他人讨论,但令许多人尴尬的地方是,他如果没有特别好的建议,他会这样说,然后完全闭嘴。这和大部份人不同,通常人们在没有好的建议的情况下也会说点可有可无的,或者似是而非的话。
威顿本人是很在意他在物理学史上的地位的,所以他在严肃的场合往往若有所思,也还是那么用功。1995年,他处于创造力的巅峰,哈佛大学请他去作Loeb演讲,我很惊讶于他的头发已经花白,那时他不过44岁。今年8月,他应邀在北京举办的国际数学家大会上做一小时演讲,正是中国人直接接触他的机会。他将是第二次在这样的场合做一小时大会报告,这在数学家来说也是不得了的荣誉。陈省身先生也就做过两次这样的演讲。
最后,虽然我不认为他是当代的牛顿,无论从数学或物理的角度来看,应当说他是我最佩服的人之一,也是唯一一个他人仅凭努力不可企及的。祝福他在有生之年达到他事业的真正的巅峰。
2002AlanGuth,AndreLinde,PaulSteinhardt
2001JohnJ.Hopfield
2000HelenQuinn,JogeshPati,HowardGeorgi
1999GiorgioParisi
1998RomanJackiw,StephenL.Adler
1997DavidOlive,PeterGoddard
1996MartinusJ.G.Veltman,TullioRegge
1995MichaelBerry
1994FrankWilczek
1993PetervanNieuwenhuizen,DanielZ.
Freedman,SergioFerrara
1992NikolaiN.Bogolubov,YakovG.Sinai
1991StanleyM,elstam,JeffreyGoldstone
1990LudwigD.Faddeev,SidneyR.Coleman
1989MichaelB.Green,JohnH.Schwarz
1988DavidJ.Gross,EfimS.Fradkin
1987BryceDeWitt,BrunoZumino
1986Alex,erPolyakov,YoichiroNambu
1985EdwardWitten,YakovZeldovich
2002MichaelB.Green,JohnH.Schwarz
2001VladimirIgorevichArnol’d
2000SidneyColeman
1999BarryM.McCoy,TaiTsunWu,andAlexander
B.Zamolodchikov
1998NathanSeibergandEdwardWitten
1997HarryW.Lehmann
1996RoyJ.Glauber
1995RomanW.Jackiw
1994RichardL.Arnowitt,StanleyDeserand
CharlesW.Misner
1993MartinC.Gutzwiller
1992StanleyMandelstam
1991ThomasC.SpencerandJurgFrohlich
1990YakovSinai
1989JohnS.Bell
1988JuliusWessandBrunoZumino
1987RodneyBaxter
1986A.M.Polyakov
1985D.P.Ruelle
1984R.B.Griffiths
1983M.D.Kruskal
1982J.C.Ward
1981JeffreyGoldstone
1980JamesGilbertGlimmandArthurMichael
Jaffe
1979GerardtHooft
1978ElliottLieb
1977StevenWeinberg
1976StephenHawking
1975LudwigDmitriyevichFaddeev
1974SubrahmanyanChandrasekhar
1973KennethG.Wilson
1972JamesD.Bjorken
1971RogerPenrose
1970YoichiroNambu
1969ArthurStrongWightman
1968SergioFubini
1967GianCarloWick
1966N.N.Bogolubov
1965FreemanJ.Dyson
1964TullioRegge
1963KeithA.Brueckner
1962LeonVanHove
1961MarvinL.Goldberger
1960AageBohr
1959MurrayGell-Mann
2002WilliamJ.MarcianoandAlbertoSirlin
2001NathanIsgur,MikhailVoloshin,MarkWise
2000CurtisG.Callan,Jr.
1999MikhailShifman,ArkadyVainshtein,
ValentineZakharov
1998LeonardSusskind
1997ThomasAppelquist
1996WilliamA.Bardeen
1995HowardGeorgi
1994YoichiroNambu
1993MaryK.Gaillard
1992LincolnWolfenstein
1991VladimirN.Gribov
1990ToichiroKinoshita
1989NicolaCabibbo
1988StephenL.Adler
1987LucianoMaianiandJohnIliopoulos
1986DavidGross,H.DavidPolitzer,Frank
Wilczek
1985ToshihideMaskawaandMakotoKobayashi
)
2002AnatolyLarkin
2001BertrandI.Halperin
2000J.MichaelKosterlitz&DavidJamesThouless
1999C.N.Yang
1998LeoP.Kadanoff
1997RobertH.Kraichnan
1995MichaelE.Fisher
2002GordonBaym
2001GeraldE.Brown
2000IgalTalmi
1999EdwinE.Salpeter
1998JohnBahcall
(第三节)
在1995年之前,弦论集中研究微扰的行为,所以绝大部份研究与弦的世界面有关。我们前面提到的共形场论就是试图从微扰论的角度理解弦论所有自恰的背景,这样做自然是不全面的,会漏掉一些重要的可能性,我们会在谈超弦的第二次革命时回到这一点。有意思的是,漏掉的重要的情况并不多,直到今天,弦的微扰论还是研究弦论和M-理论的一个最重要的工具。
用微扰论研究弦论,一开始就先天不足,如同用费曼图研究量子场论一样,我们在开始时只有一堆“数据”,要从这堆数据中看到弦论或场论的面貌,要花很多功夫,要有许多直觉。例如,至今我们也无法从费曼图中看出量子色动力学中的禁闭现象。同理,如果想看到弦论的全貌和非微扰性质,要么不可能,要么我们要有很大的运气。当初,许多人以为通过模仿场论来研究弦场论,我们会得到弦的非微扰理论。这种想法,在今天看来,不是显得幼稚,也是在理论上存在极大困难的。
所谓弦场论,是将弦类比于粒子,然后进行二次量子化。我们先帮助大家回忆一下粒子的二次量子化。给定一个粒子,一次量子化的时候,我们无非是应用量子力学,描述一个固定的粒子的基本量是粒子的波函数。如果将这个波函数作为基本变量将其量子化,我们就得到一个更大的函数,是原来单粒子波函数的函数。这个泛涵,不但有单粒子的信息,还有任意多个多粒子的信息。我们可以用单粒子的函数来展开这个泛涵,第一项有与单粒子涵数无关,这是个真空,没有粒子。第二项与单粒子的函数成线性关系,是含有一个粒子的态,第三项与单粒子函数成双线性关系,含有两个粒子,等等。同样,弦的一次量子化的波函数是一个弦的位形的函数,因为弦的位形本身已经是一个参数的函数,所以单弦的波函数也是一个泛涵。如果我们形式上将弦的位形看作一个“波函数”,弦本身的波函数可以用这个函数来展开。第一项与弦的质心位置有关,是一个快子。弦的波函数不能任意,必须满足一些物理条件的限制,这样,展开的第二项是弦位形的二次项,代表引力子,等等。
弦场论则以上面说的弦位形的泛涵作为基本变量的量子理论,在闭弦的情形,情况十分复杂,如果要保持时空的对称形,这个理论的作用量含有无限多个项,要作量子化是基本没有希望的。在定义量子化时,还有另外一个技术上的困难,就是,弦的二次量子化波函数是一个泛涵的泛涵,没有办法处理这么复杂的东西。第一个困难可以克服,但要牺牲时空中的协变性,其实,在弦论的早期,吉川圭二(KejiKikkawa)等人于1974年已经研究了在光锥规范下的弦场论,他们发现弦场论的作用量最多含有弦泛涵的四次项,就可以完全包含弦的微扰论的所有“费曼图”了。由于这个理论不是协变的,很难推广到一般时空背景,从而对弦论作非微扰的研究。吉川圭二已从大板大学退休,是一个很温文尔雅的人。
开弦理论有一个简单而优美的表述,这就是威顿的三次弦场论,这个理论以陈-西蒙斯的形式出现,同时非交换几何也第一次在弦论中出现。非交换的概念在此出现非常自然,因为弦场的乘积是用两个弦连接而成一个弦来定义的,本身是不可交换的。这个理论在1986年被提出后,很快被证明是正确的,即可以用来导出开弦的微扰论。对它的非微扰研究也是最近才开始的。
在整个80年代,唯一与弦论的非微扰性质有关的研究是格罗斯和他的印度学生佩里维尔(V.Periwal)关于弦微扰的高阶数渐进行为的研究。在场论中,有一个很重要的结果,就是当圈数增加时,高圈效应以圈数的阶乘而增大,所以微扰级数是一个发散级数,也是一个渐进展开。只有当耦合常数很小时,前几项才是重要的。一个渐进展开对应的严格函数通常在原点处有奇点,而且是本性奇点。这个原点,在场论中就是耦合常数等于零的地方。虽然这个结果看起来比较深奥,其实一点也不,在寻常的量子力学中我们已经遇到这种行为。例如在势垒穿透问题中,穿透的几率随着一个量成指数衰减,这个量和势垒的高度和宽度有关。而高度和宽度又和“耦合常数”有关,后者越小,则穿透的几率越小,所以耦合常数为零的地方是穿透几率的一个本性奇点。这个
量子力学问题的微扰展开就是我们熟悉的半经典展开,很早以前,人们就知道半经典展开其实是一个渐进展开。随着阶数的增大,每一项贡献以阶乘的方式增大。回到格罗斯和佩里维尔的工作,他们通过对弦的世界面的模空间的研究发现,弦的微扰展开也是一个渐进展开,不但如此,这个级数的发散程度比量子力学和量子场论中的发散还要严重,因为阶乘的阶数被加倍了。这就说明,弦的耦合常数为零的一点也是本性奇点,并且,弦的非微扰效应应当比场论中的非微扰效应还要大。
在量子力学中,这样的非微扰效应往往与隧道穿透一类的过程有关,这些过程不是实过程,因为只有在量子论中才有,其完成的时间是瞬时的。在场论中,这种过程和四维的欧氏时空中的经典解有关,代表的过程与隧道穿透一样,最有名的是非阿贝尔规范理论中的瞬子解。所以瞬子所代表的穿透过程是一种非微扰效应,这个本性奇点会在微扰论的高阶行为中体现出来。当然,高阶发散行为的体现不仅仅是瞬子和隧穿,在场论中,还有和场论的紫外发散有关的贡献,如所谓的“重正子”贡献(renormalon)。这些效应太技术化,这里就不谈了。
特霍夫特为了研究场论的非微扰行为,引进了所谓的大N展开。这中展开只有在非阿贝尔规范理论一类的矩阵理论中才能做,原因是这里展开的参数不再是通常的耦合常数,而是矩阵阶数的倒数。因为矩阵的阶通常用N来代表,所以这个展开叫大N展开,实际上是1/N展开。这个新的参数很像我们熟悉的耦合常数,只不过,这个耦合常数不是以明显的方式在作用量中或者微扰计算出现。
在特霍夫特那里,大N展开有一个非常有意思的几何解释。我们通常将费曼图画在一张纸上,看起来是一个平面图。常常,我们不得不将线段交叉地画,如果这种情况不可避免,我们就说这个费曼图不是平面图。可以画在平面上的又不出现交叉的图又可以画在球面上,而不可以画在平面上的图总可以画在一个更复杂的面上。比球面稍复杂的是一个环面,只能画在环面上的图我们叫作亏格为一的图。现在,特霍夫特证明,所有在大N展开中贡献最大的费曼图都可以画在平面上,或者球面上。仅次于这些图的贡献来源于能画在环面上的图,同样,更小的贡献来自于那些只能画在高亏格面上的图。这样,大N展开的阶数就成了图的亏格数。
我们不能看出,大N展开很像弦论的微扰展开,是一种拓扑展开。虽然费曼图本身是一维的,但用来分类图的方式是两维的面,如同弦的世界面。这种联系,使得人们猜测一些场论如规范理论是一种弦论,特别是,量子色动力学中的夸克禁闭可以和弦联系起来:连接两个颜色相反的夸克是一根由胶子形成的弦。到目前为止,夸克禁闭的弦理论还没有建立起来,但人们在近年来发现,一类规范理论的确可以看成是弦论。
与通常以阶乘方式发散的微扰论不同,当亏格数固定时,费曼图的个数只是以圈数的幂次增加,这就大大控制了渐进展开的发散行为。当然,如果我们提高亏格数,每个亏格的贡献也随着亏格数增加,并且是以类似弦论中的阶乘数增加的!这是矩阵理论可能是弦论的另一个证据。当然,为了研究场论本身的非微扰性质,也许我们能计算所有的平面图就可以了。在早期,人们为了仅仅数平面图的个数,发明了简单的矩阵理论。这个矩阵理论既不是场论,也不是量子力学,而仅仅是一个矩阵积分。积分的被积函数是一个指数函数,指数类似场论中的作用量,可以证明,这样简单的矩阵积分可以用来准确地计算与之相关的场论中的费曼图个数。
作为耦合常数的函数,矩阵积分有一些漂亮的解法,尤其是平面图的贡献。人们在大N极限下发现了一些和场论有关的效应,例如相变。那时,大家甚至期望一个简单的矩阵模型可以告诉我们量子色动力学中的禁闭信息,当然这是奢望。不奇怪的是,在研究矩阵模型的十年后,老结果经过发展真的和弦论联系起来,这就是我们下一节中要谈的老矩阵模型,或者,根据威顿前天的说法,是中世纪矩阵模型。
最后,我们提一下,场论中研究的矩阵模型很早就在核理论中被威格纳和戴森研究过了。在那里,矩阵的本征值是用来模仿一个大原子核的能量的本征值的,而矩阵积分与能量本征值的分布有关。
(第四节)
我们前面说过,一个规范理论,或更一般地,一个矩阵模型,可能是一个弦理论,其主要根据是大N展开的行为与弦的微扰展开极为类似。但要真正将一个矩阵模型等同于一个弦理论,却非常困难,原因是弦论往往是出人意料的方式出现。根据已知的可以等同于弦论的矩阵模型,弦论出现的方式至少有三种。我们这一节介绍第一种,即老矩阵模型,这个模型是在1989年为三个不同的小组发现的,一组人是前苏联人卡扎科夫(V.Kazakov)和法国人巴热壬(E.Brezin),一组是当时都在芝加哥的道格拉斯(M.Douglas)和闲克,第三组是格罗斯和米格德尔(A.Migdal)。米格德尔也是前苏联人,其时已和玻利雅可夫一道到普林斯顿任教去了,最近则似乎完全脱离物理,开公司了。据说,他的公司也和他做的矩阵模型有关,是搞计算技术的。
这三组人的成功建立在过去的一系列工作之上,现在我们择要说明。首先,前面已经提过,在粒子物理这个系统中,大N展开的鼻祖是特霍夫特,概念起源于他若干个尝试解决夸克禁闭的工作之一。其后,很多人,特别是巴热壬、伊日克逊(C.Itzykson)、巴里舍(G.Parisi)和朱拜(J-B.Zuber)等四人的重要工作系统地研究了一类简单矩阵模型的平面解。不久,伊日克逊、朱拜和白西斯(D.Bessis)又发展了解简单模型中的高亏格贡献的方法。这些方法的发明,完全是为了研究量子色动力学,在当时并没有引起太多的注意。有意思的是,在超弦第一次革命期间,前苏联和几个欧洲人独立地将矩阵模型和随机面(randomsurfaces)理论联系起来,他们的出发点还不是弦论。
要理解弦论如何从矩阵模型导出,我们首先要了解随机面和矩阵模型的关系。
既然已经知道一个矩阵模型的大N展开是两维面的拓扑展开,矩阵模型和随机面有关就是自然的了。在随机面理论中,我们计算一个“过程”是将所有可能的面以不同的权重加起来,这里包括所有不同亏格的面,以及每个亏格中有着所有不同几何的面。权重和面积以及亏格有关,例如,我们可以要求面积越大,权重越小。那么,怎么才能从矩阵模型中产生这样的权重呢?首先,我们要想办法将矩阵模型中的某个量与面上的面积等同起来。在大N展开中,给定一个费曼图,我们将这个图与随机面理论中的一个面联系起来,具体办法是这样的:在费曼图中,给定一个顶点,我们围绕这个顶点画一个多边形,这个多边形的一个边与从这个顶点出去的一根线段正交。这样,我们得到一个对偶于费曼图的面,其中每一个线段与费曼图的一个线段正交,每一个面对应费曼图中的一个顶点,而每一个新的顶点对应原来的一个圈。为什么费劲做这个对偶呢?如果矩阵模型的作用量除了正常的二次项外,只有三次“相互作用项”,这样任一个费曼图只有三顶点,就是每个顶点只有三条线段伸出。这样,每个顶点对偶于一个三角形,用我们上面描述的方法我们只能得到一个只含三角形的面。在数学中,这是一个面的三角剖分。如果我们给与这样剖分中的每一个三角形一个基本面积,这个基本面积对应的权重就是原来矩阵模型中的耦合常数。进一步,与亏格相关的权重在矩阵模型中就是参数1/N,亏格越大,这个参数出现的次数也就越多。
不难看出,上面把矩阵模型与随机面对应起来的方法只能产生被离散化的随机面,因为三角剖分只能是对一个光滑的面的近似。如果矩阵模型的作用量还含有更多高阶相互作用项,那么得到的随机面理论也就不是纯“引力”理论,这里的引力是两维引力,原则上是平庸的,只有面积项起作用。比纯引力复杂一点的,是在面上引入一些“物质场”,这些物质场,如果是标量的话,我们就得到弦的世界面嵌入一个空间中的情形,这是为什么矩阵模型和弦论有关。
1989年,三个不同的小组令人惊讶地发现了同一个事实,就是,如果将矩阵的阶数推向无限大,同微调作用量中的耦合常数,就会获得一个完全连续的随机面理论。从我们前面的讨论,我们知道微调耦合常数是必要的,否则三角剖分永远是离散的。但当维调获得连续面的时候,每一个亏格的贡献会发散,这时我们就必须取无限大N极限以获得有限的结果。
这三组人得到同样的结果也并不象表面看起来那样令人惊奇,首先,米格德尔和卡扎科夫一直在一起研究随机面理论,其次,闲克也去过法国,这是根据道格拉斯的说法。闲克很早前也研究过大N矩阵模型。道格拉斯前两天在饭桌上说,格罗斯和米格德尔的第一篇文章含有一个错误,把非纯引力的部份算错了。当然,这两位是很聪明的人,不久在一篇长文中纠正了错误,并且给出一个很好的容易理解的表述。在老矩阵模型时髦的时候,人们常常同时引用这三篇文章,而把格罗斯和米格德尔的文章放在最后,一个可能的原因是,这两位的确是受了其他几个人的启发。
矩阵模型与随机面的相关在三篇重要文章出现之前已经在卡扎科夫的一篇文章中出现了,他利用矩阵得到与用其它方法一样的结果。这些其它方法,就是传统的世界面上的路径积分方法,有两个不同的处理办法。一种是以玻利雅可夫为首的苏联人的办法,在两维的度规中取光锥规范。另一种是更协变的共形规范,由法国的大卫(F.David)和河合(H.Kawai)及狄斯特勒(J.Distler)作出。最早的连续方法也只能算出一些临界参数,而矩阵模型则更有用,可以相对容易地算出关联函数和高亏格的贡献,这是人们当时为何激动的原因。在亏格为零时,用连续的方法第一次算出关联函数的是我和马克-古里安(M.Goulian)。我当然一直在研究弦论,古里安则很早转到凝聚态里去了。现在想想,马克的转行也很自然,因为那时弦论的确处于一个低潮期,年轻人很容易动摇。记得一次在吃午饭的时候,马克谈他刚刚感兴趣的高分子,施特劳明格问他,这门学问是什么时候开始的。那年研究这个的德-建(deGennes)正好得诺贝尔奖,施特劳明格说,既然已经得奖了,现在做这个有点晚了吧。说起来漫不经心,实际是一句至理名言。现在有一些学生问我,弦论正处于低潮,值得进来研究吗?问这样问题的人,往往对研究的过程不大了解。一个比较成熟的问法是,某莫学科正处于高潮,现在值得进来吗?因为高潮的原因往往是重要的问题已经被解决。
矩阵模型虽然比连续的方法更有效,却存在两大缺点。一个缺点是,由此得到的两维面上的“物质”不够多,甚至其自由度比一个自由标量场还小。最大也就是一个标量场,加上由两维度规中出现的一个场,只有两个标量场,所以弦论最多只是一个两维弦理论。由于在通常的弦论中,度规中的标量场是脱耦的,所以低于两维的弦论行为很不同,有一个随着空间变的弦耦合常数,也就是伸缩子不是一个常数,这样的弦论叫非临界弦论。另一个困难是,虽然一些量如配分函数(相当于场论中的真空图贡献)可以计算出来,其所满足的微分方程可以逐级地解出,但要得到严格解,从而是包含非微扰效应的解,并不容易,解也不唯一。
人们尝试了从矩阵模型获得非微扰弦论的信息,结果是有限的。九一年,威顿等人发现两维的黑洞,这个黑洞的背景从弦的世界面的角度来看是一个可解的共形场论,这引起很多人的兴趣,可能弦论界很多人对黑洞的兴趣是从这里开始的。遗憾的是,虽然人们花了不少精力研究这个两维的黑洞,所取得的物理进展很少,也没有人能够成功地找到一个类似矩阵模型的理论。一批人的兴趣因此转移到研究两维的伸缩子引力及黑洞上面去,文章写了不少,进展甚微。这样的兴趣,一直持续到第二次弦论革命的开始。
除了一些有限而且很专业的进展,如卡-丘流形上的镜对称(mirrorsymmetry)的物理上的发
现,弦论在矩阵模型和两维黑洞后进入了真正的黑暗期,很多人就在此时与弦论说再见,而另一部份人则脱离了与弦论的经常性接触,虽然并没有完全离开弦论。
但是第一缕曙光往往是在最黑暗的时候出现的,看到这个曙光的人也是那些没有失掉信心和兴趣的人。我们下一章开始讲与弦论第二次革命有关的,却是完成于第二次革命之前的工作。
第七章先声
(第一节)
本想用“二次革命的先声”作为本章标题,但这样一来太象过去写国民革命的早期的文章了,故简单地用先声,以期不落俗套。
超弦第二次革命其来也突然,使得很多人一时摸不着头脑,比如像我这样一直没有离开弦论的人,也花了近半年时间来吸收。当时在国内的人,似乎还没有人意识到在美国、欧洲和印度发生了什么。我在97年回国访问,很多人还对所谓超弦革命持怀疑态度。感谢当时理论所的所长苏肇冰先生,是他的诚意使得我的那次回国成为可能。其实早在96年夏,苏先生就托他过去的学生让我写一个短文介绍对偶的发展,目的是用在他当时向上面要钱的文章里。作为一直关心场论发展的一个凝聚态物理专家,这样的态度与国内的一些场论专家形成明显的对照。我写这一段,用意有二,一是不能忘记苏先生的作用,二是提醒大家前事不忘,后事之师:虽然弦论在中国已有一定的影响,可是我们过去是怎样对待它的。
超弦的第二次革命之所以让许多人不知所措,主要原因是它的背景深藏于过去之中,要完全接纳需要一定的时间。这些背景包括我们前面已经介绍了的超对称、超引力、K-K理论,还有没有介绍的孤立子理论,以及相当多的有效量子场论。再有就是革命发生前的一些重要却没有引起足够注意的发展,如所谓的T-对偶、卡-丘流形的镜像对称性,当然最后不能忘记更早的关于S-对偶的猜测,以及森等人的较为近来的工作。所以在进入二次革命的正题前,应先介绍一下这些背景。
但在介绍这些背景之前,觉得想说点关于中国研究超弦的话,说到哪儿是哪儿。为什么到现在才提这个话题?或者有人问,为什么要讲这个?主要原因是,最近一些搞物理和数学的以丘成桐先生为首,在杭州和北京搞了两个超弦的短会,请来了一些弦论界的重要人物,如威顿、格罗斯、施特劳明格等人,再加上历来的理论物理的“形像大使”霍金,对学生和新闻界影响不小,使得弦论从几乎无人注意(当然除了本坛上一些活跃的人和读者以及历年参加国内弦论会议的人)一下子变成公众议论的话题。我记得有一次打的,司机在得知我是搞理论物理的时候问我,模世界和我们的宇宙有没有关系?既然弦论在中国已成为公众的话题,谈一下弦论在中国的历史应当是一个对大家有益的事。尤其对一些已经选弦论作为研究方向,以及希望进入弦论的学生来说,这个话题是有用的。我已写了二十一节,贡献一节给中国,当然中国对弦论的贡献远远不到二十分之一。
弦论的祖先之一,散射矩阵理论,在中国的历史和在世界的历史是一样长的。张宗燧先生的两卷本著作含有比较详细的中国人对散射矩阵理论的贡献的文献,其中值得一提的是戴元本先生的工作。可惜的是,虽然弦论起源于散射矩阵理论,由於当时中国正处於文革,中国人在早期对弦论并无贡献。中国人开始注意弦论,是在弦论的第一次革命中。记得我第一次听说弦论,是因为看到了威顿等人关于卡-丘紧化的文章。
我个人比较幸运,在弦论的第一次革命后,有机会去意大利的国际理论物理中心,接触到当时的预印本,见到很多当时活跃的人包括威顿。从而早在85年就开始写关于弦论的不重要的文章了。在国内,除了理论所外,还有科学院研究生院、浙江大学、复旦大学的一些人开始注意弦论,当然西北的侯伯宇等人也把注意力从反常转移到弦论。
作为作者,总是喜欢先谈自己以及与自己有关的人,这里也不例外。当时的情况是,科大的一些人,如方先生和他的学生,开始重视弦论。方集中精力研究他的天体物理,所以将研究弦论的事情交给他的学生,我是他的学生,高洪波也是他的学生,比我晚些。高怡泓是方的半个学生,所以如果这几个人还算对中国的弦论做了一点事情的话,方先生是间接地做了贡献。方指导学生做学问的办法是放羊,有草吃没草吃全看学生自己的能力,我是很喜欢这种方法的。当然,由於方本人不是弦论专家,不能直接告诉我们弦论中哪些是重要问题,这可能会延缓学生的成长,但却是培养了学生的独立能力。对於他能直接指导的学生来说,成效就完全不同了。尽管如此,我和高怡泓还是坚持了下来。相反,有一些专门研究场论和弦论老师的学生,却大部分离开弦论甚至理论物理了。
听说有人有科大“三剑客”的说法,感谢这些人对我们的谬奖。这“三剑客”,当年在科大的确是很“哥们”的,有酒一起喝,有文一同看。高洪波兄由於个人的事情在数年前离开弦论。但他还一直注意弦论的发展,也是我们这个坛子的常客。他的物理背景在他现在的工作中起了很大作用,他现在在加拿大已经是一个很成功的金融界人士了。只剩下我和高怡泓这两柄秃剑还在慢慢地挥舞。其实科大当时还有一个非常独立的人,不但独立於老师,也独立於“三剑客”,这人就是后来很有成就的卢建新。所以说,论对中国弦论界的贡献,科大为第一(仅卢一人就可以了)。
再谈理论物理所,前面我提到苏先生,他不研究弦论,但对场论和弦论的重视超过很多场论专家。理论所在一次革命后研究弦论的主要是老师,值得一提的是朱重远老师,他是一直支持研究弦论的。有意思的是,理论所出来的唯一长期研究弦论的学生,也是他的学生,就是熊传胜。熊有重要的工作,他和江口(Eguchi)的关于拓扑弦的工作在数学界有很大影响。可惜由於我们还不知道的原因,他也离开了物理。
浙江大学的汪容老师带了很多研究弦论的学生,包括虞跃先生。虞跃虽然后来离开弦论,他的研究弦论的经历相信对他在凝聚态物理中的研究是有很大帮助的。
复旦大学倪光炯的学生陈伟,也是早期研究弦论的有数的人之一。他也离开弦论了,但在干也许比研究弦论更有用的事:和朋友一同主持在新泽西州的一家英文科学出版社。蒙他的鼎力相助,我和吴咏时先生合作编缉的一本物理中的非交换几何已经出版(大家快掏银子买书,支持他的出版事业–银子不会到我这里)。
西北大学带出了许多学生,如陈一新等人。西北大学至今还是国内研究超弦的基地之一。北京的研究生院出了朱传界一人,也是异数。
再往后,弦论在中国越来越不受重视,就很少出人了。我知道的,也就是理论所吴可老师的学生陈斌。而现在理论所的研究员喻明也是从国外回来的。从上面的超弦在中国的简史可以看出,弦论在中国是亟需加强的。不但要寄希望于国家的更多投入,更寄希望于后来的学生。
(我很可能遗漏了很多,请大家补充)
(第二节)
上一节谈弦论在中国,其实有点离题。没有想到,离题的话居然更有市场,那一节看的人大概是最多的了。这一节把话题收回来,谈谈超弦第二次革命前的一些背景知识。
最重要的,莫过於孤立子这个概念。在很大程度上,弦论实现了爱因斯坦在研究统一场论时的一个设想:在他的一个理想中,存在一个完美的引力理论,所有物质粒子在这个理论中都是场方程的解。自1994年以来,孤立子在弦论中占有中心地位。几乎所有的物体,包括弦本身,都可以看作是孤立子。
孤立子的经验发现虽然很早,可以追溯到十九世纪罗素骑马时在一个河道中看到的一个孤立
波,但在物理中很晚才作为理论和实验的对象。水波的第一个孤立波的解的发现也是迟至上世纪六十年代由克鲁斯卡尔(Kruskal)等人作出的。孤立波或孤立子从那以后就几乎成了一个独立学科。在很多情况下,孤立子的解看起来很难找到,但在一些简单的模型里可以用简单的办法找到。
一个线性波动方程的解总是有能量弥散,开始时准备的一个能量很集中的波包经过一段时间很就逐渐地扩散开来。所以要有一个或很多孤子解,波动方程就必须是非线性的。最简单的是两维时空中的一个标量场论,其中相互作用的势能是场的四次多项式,有两个极小点。每个极小点代表一种真空,能找到一个静态解,其在两个无限远处的取值是这两个极小点。因为是连接两个真空点的解,这样的解叫纽结解(kink)。这个最简单的孤子是稳定的,因为它要是能衰变的话,两个无限远点的真空必须变成同一个真空,这是做不到的。还存在反纽结解,它的两个端点的真空与纽结解的完全相反。这样一个纽结解和一个反纽结解可以放在一起,因为纽结解的右边的真空与反纽结解左边的真空是一样的。这个系统是不稳定的,因为两边的真空是一样的了,这个不稳定性其实就是正反纽结的湮灭。
当时空的维数超过3时,有一个定理说,如果只存在标量场,就没有孤子解。通常,经典场的能量可以分为两部分,一部分与场在空间上的变化率有关,另一部分与场的势能有关。空间变化率越大,场的能量就越大,所以这一项使得场倾向于在空间上变得更均匀,从而能量比较分散。而势能项使得场变得很集中,在大部分的空间中场处於极小点。这两项有竞争的趋势,可以平衡时,就可能存在孤子解。在高维的时空中,势能项取得优势,从而不存在孤子解。
在三维时空中,解决这个问题的办法是在标量场以外再引入规范场。规范场的存在可以减小标量场空间变化对能量的贡献,从而这一项与势能项可能取得平衡,规范场本身对能量的贡献也可以是有限的。最简单的孤子解是所谓的涡旋解(vortex),这个解的特点是一个复标量场的取向与所在的空间点相对於原点的取向一致。这个解推广到三维空间中是一个弦状的解,因为这个解不依赖于第三维,从而能量集中在平行于第三维的一个轴上。这就是有名的尼尔逊-奥尔逊涡旋解(Nielsen-Olesen)。
两维时空中的纽结解和三维时空中的涡旋解同属於一类,叫拓扑孤子解,因为这两种解中有一个守恒荷,与拓扑有关。在前者,拓扑荷就是两个孤立的真空之差,是一个固定的数。在后者,荷与所谓的绕数有关,也就是,绕原点一周,复标量场也在场空间上绕原点一周。如果表量场绕原点不止一周,拓扑荷就更大。
在涡旋解的情况下,我们又说该解饱和波戈茅力(Bogomol’nyi)下限。在这个简单的电磁理论中,人们可以推出一个能量的下限,当所有的场都满足一些一阶微分方程时,这个下限被饱和。所以从经典的观点来说,这个解是绝对稳定的。
当时空的维数高于三维时,我们就得引进非阿贝尔规范理论,去得到孤子解。最简单的例子是一个四维时空中的SU(2)规范理论,加上一个在这个群下的自伴随表示的标量场。这个标量场有三个份量,数目正好与空间维数相同(与纽结解和涡旋解的情形一样)。这时,我们也引进一个势能项,使得极小点组成一个两维的面。现在构造一个解,其中标量场在场空间中的取向与空间点相对於原点的取向一致。标量场在无限远处在极小点上取值,所以标量场把无限远的两维球面映射到标量场的极小两维球面。这也是一个绕数为一的解,所以也是一个拓扑解。由於关于纯标量场的定理,我们需要一个不为零的规范场。由於在无限远处非阿贝尔对称破缺成普通的阿贝尔对称,这个一个磁单极解,带一个没有破缺的规范场的磁荷。这个解为玻利雅可夫与特霍夫特同时在1975年发现。由於标量场的方向与空间方向一致,长得象一个刺猥,所以那时又叫刺猥解(hedgehog)。请注意,纽结解、涡旋解和刺猥解这三个名称都与解的形状有关。我建议大家记住这些名称,因为这些名称包含解的大致性质。这些解都满足波戈茅力的极限,所以这些解统称为BPS解,BPS来自于三个人的名字(Bogomol’nyi,Parasad,Sommerfeld)。它们都满足一些一阶微分方程,这些方程又叫BPS方程。
假定时空的维数更高,能不能找到新的孤子解?答案是肯定的。在场论中,下一个例子是五维时空。这里,我们仅仅应用一下四维时空中得到的解,这个解是玻利雅可夫于1975年发现的瞬子解(instanton)。为何叫瞬子解?因为这个解是四维欧氏空间中的解,在场论中类似于量子力学中的隧道穿透解,不是一个实际发生的过程,而是一个量子效应。这个解仅仅需要非阿贝尔规范场,并不需要标量场了。在五维时空中,一个静态解不依赖于时间,实际上是一个四维欧氏空间中的解,所以瞬子解正好应用到这里,变成一个孤子解了。瞬子解也是一个BPS解。
我们提到的孤子解都有一个重要的特点,就是所有不为零的场在空间所有的点上都是光滑的,没有奇异性。如果放弃这个要求,那么即使在一个线性的理论中也可以找到能量集中在一个小区域的解,例如原来的点状电子为电磁场提供一个点状的源。这样的解不能叫做孤子解,因为如果象量子电动力学中本来就有电子,这个解不能代表一个独立的自由度。如果没有电子,这个解就毫无意义了。
我不知道在纯粹的场论中,高于五维时空是否存在孤子解。可能不存在。
如果有引力介入,情况就完全不同了。我们可以说,黑洞就是一个孤子解。黑洞解虽然有一个奇点,这个奇点与电子解的奇点完全不同。有两个不同之处:第一,黑洞的奇点不是存在於空间中的某个点,不是在所有时间上都存在的,用行话说,不是一个类时点,而是一个类空点,突然出现在某个时间上,有点象大爆炸宇宙的开始时的奇点;第二,黑洞的奇点被一个视界面藏起来了,站在黑洞之外的人看不到这个奇点。爱因斯坦理论是非线性的,所以这个类似孤子解的黑洞的存在很容易理解。
所有的高维的爱因斯坦理论中都存在黑洞解,所以我们可以说,与通常的场论不同,引力理论中总存在孤子解,无论时空维数有多高。也许两维时空和三维时空是特例。两维时空中,度规本身没有任何自由度,从某种角度来说,自由度甚至是负的。为了引入黑洞,就必须引入一个标量场,如伸缩场。引进这个标量场后,自由度的个数为零,即便如此,黑洞解就存在了。在三维时空中,纯引力理论的自由度也为零,如果有一个负的宇宙学常数,黑洞解也存在。
当在一个理论中找到孤子后,接下来有一个量子化的问题,必须考虑所有场的量子涨落对孤子解能量的贡献。计算这些贡献要将一个场以在孤子解附近的模来展开。对於玻色场来说,可能存在零模,也就是对能量没有贡献的模。最简单的是对应于孤子位置平移的模,这些模又叫模参数(moduiparameters),因为它们是描述孤子自由度的参数。如果存在费米场,费米场的零模也有重要的物理含义。这些零模通常是局域的,在空间上的积分是有限的。费米场的零模,作为一个算子,作用在原来的孤子解上的时候,产生一个新的能量与原来一样的态,这个态是费米子。在特殊情况下,如在纽结解情形,费米数甚至是1/2。
当存在超对称时,一个孤子解通常有几个伴随的态。如果这个孤子解不破坏一些超对称,能量可能没有量子修正,特别是在这个孤子是一个BPS解的情况下。BPS解的能量满足下限,而这个下限恰恰与一个拓扑荷有关,明显没有量子修正。当BPS解同时又不破坏一些超对称的时候,这个下限是超对称代数的一个结论。超对称代数没有量子修正,拓扑荷也没有量子修正,所以孤子解的能量没有量子修正。
可能N等於4的四维超对称规范理论最为有名,因为这里的孤子解是一个磁单极,有一半的超对称没有破缺,所以其质量没有量子修正。同时,考虑到费米场的零模后,所有的解形成一个超对称多重态,而且与原来的规范场超对称多重态的表示完全一样。这个特点,是该理论可能存在强弱对偶的一个重要暗示,因为如果用磁单极作为基本变量,我们还是得到一个超对称规范场论,且耦合常数是原来耦合常数的倒数。
以上谈到的所有孤子解在弦论中都有重要应用。弦论由於含有引力,所以也有不同于以上孤子解的新解。这些解在超弦第二次革命中起到关键的作用。
(第三节)
这一节谈谈弦论中所有对偶的最简单的一种,T对偶。这个对偶的发现比较晚,虽然人们可能要问为什么不会更早一点。T对偶又叫“靶空间”对偶(targetspaceduality),这里的“靶空间”就是一般的空间,叫成靶,是因为弦的世界面被嵌入这个靶空间。顾名思义,这种对偶是不同空间之间的对偶。
T对偶是两个日本人于1984年发现的,其中之一就是我们过去提到过的吉川圭二(K.Kikkawa,
有趣的是,如果你用google查这个名字,可以找到我先前提到他的那一节)。84年弦论刚复活,没有什么人注意到这个工作,后来大家又忙于第一次革命带来的一些时髦的问题,更没有人注意到这个工作了。最早注意到他们的工作的也是两个日本人,酒井和千田(N.Sakai,I.Senda),他们的文章是第一个引用84年的那篇文章的,这是在两年之后。很有意思的是,吉川和山崎当初写那篇文章的目的不是为了解释T对偶,而是想通过对紧化后的卡斯米尔能量的研究来使得紧化稳定。T对偶不过是他们的意外收获,就是两年后的酒井和千田的文章,也是想研究环面上的紧致化的真空能量。真正重视T对偶是1990年前后。这个事例又一次说明,很多重要的工作仅仅凭当时人的反映是不够的,有时是错误的。
当空间有一维紧化成圆时,如果没有超对称,一个量子场论会有卡斯米尔效应,同样,一个弦论也有卡斯米尔效应。要研究这个效应,就必须计算在这个紧化下弦的谱。弦在没有紧化下的谱很早就为人所熟知,分成质心运动部分和振动部分。同样,当弦在一个圆上运动时,也分成这两部分,其中振动部分与没有紧化时并无不同。质心部分就很不同了,这时,弦在圆这个维度方向上的动量不再是任意和连续的,而必须象一个粒子一样,要量子化,这和最早的玻尔量子化条件并无不同。基本的量子化单位就是一个普朗克常数乘上圆半径的倒数,所以半径越小,动量的间隙越大。
如果我们研究的对象是开弦,故事到此结束。如果是闭弦的话,除了质心运动和振动之外,弦还可以绕在圆上。开弦当然也可以绕在圆上,但由于开弦的两端是自由的,缠绕的方式在运动过程中会改变,从而没有一个守恒量与之对应。闭弦的绕数是守恒的,所以绕数是一个好的量子数,必须出现在单个弦的谱中。不但如此,在弦的相互作用过程中,弦的总绕数是守恒的,这个很容易通过想象弦的断开和连接来验证。这样,当我们考虑紧化空间是一个圆时,单个弦的谱中就多了两个分立的量子数,一个对应于量子化的动量,一个对应于弦的缠绕数。绕数对能量的贡献与圆的半径成正比。
从弦的谱来看,对两个量子数的依赖完全相同,只不过是系数不同而已。如果我们用一个新的圆代替老的,让新的圆的半径是旧半径的倒数(以弦的长度标度作单位),那么在这个新的圆上所得到的谱和老的圆上的谱完全一样,换言之,我们看不出这两个理论有什么不同。这就是T对偶了,两个理论看起来不一样,实际上是完全等价的。当然,我们要证明这个等价性还必须证明除了谱之外,弦的相互作用也完全一样。在微扰论中,要证明这一点,只须证明每个费曼图都相等就行了,也就是说,我们要求在每一个高亏格黎曼面上,两维的共形场论完全一样。这个是比较容易做到的,因为两个共形场论都是自由场论,计算关联函数是相对容易的。
有一个特别的半径是自对偶的,当它的倒数等于自身时。用弦的长度标度作单位,这个半径基本上就等于弦的长度标度。半径小于这个自对偶半径对偶于一个大于自对偶半径的半径,所以自对偶半径可以看作弦论中的最小尺度。T对偶在90年左右引起的兴趣基本上就是用来论证弦论中有最小尺度,当然人们也用弦的散射振幅来说明这一点。
T对偶在一个量子场论中是绝对不可能的,因为那里没有绕态,所以T对偶完全是弦的性质。T对偶的存在说明在弦论中,空间这个概念不是绝对的,是根据定义来的,从而是一个物理的体现。有人会问,那么当空间中的一维是圆时,我们到底怎么决定它的半径。这是一个很好的物理问题,回答也是很物理的,就是,要看容易激发的激发态是什么,以及各个态的耦合强度。我们有两个对偶的理论,弦的偶合强度在原来的全部空间中是不一样的,而在约化后的空间中(将圆除外)的耦合强度是一样的。假定原来的耦合都是弱耦合,我们就要看轻激发态是什么。如果其中一个圆的半径大于自对偶半径,那么对应的动量模比对应的绕数模轻,我们就说物理用的尺子是用动量模构造的,半径是这个大的半径。当这个半径太大时,耦合强度有可能很大,这时就要仔细分析相互作用带来的后果了。当半径变小,绕数模越来越轻,我们就可以用这些绕数模构造尺子,量的是对偶的半径,因为在这个对偶理论中,原来的绕数模变成了动量模。
对于一个简单的圆来说,T对偶就是简单地把圆的半径换成倒数,这样的操作形成一个简单的群,就是Z(2)。如果没有T对偶,我们说由半径这个模参数组成的模空间是一个半直线,从零到无限大,后者更准确地说,是一个直线,如果我们用半径的对数做模参数。有了T对偶,直线在T对偶的作用下反演了一下,我们将这个直线以自对偶半径那一点为原点对折,得到一个新的模空间,这是一个半直线。
T对偶自然地推广到包括更多的圆,这时就有更多的对偶操作,不仅仅是简单的T对偶推广。当然每一个圆的方向都可以作原来的T对偶操作,当维度增多,还有一些纯几何的对称性,如在环面情形,我们可以将环面的两个方向作交换,也可以选择两个完全不同的基本圆来形成这个环面。这种纯几何的对称性已经形成一个相当大的群,有无数个群元,可以由两个生成元产生。原来的两个T对偶相结合使得整个环面的体积变成原来的倒数,再加上对弦论中普遍存在的一个反对称张量场做变换,形成另一个群。这两个群的集合就是群SO(2,2,Z),这里我们不打算解释这个群的定义,希望学过群论的人一看就知道这是什么。
我们统一地把几何对称和弦的T对偶叫做T对偶群,这个群随着环面维度的变大越来越大,当维度是d时,这个离散群是SO(d,d,Z),作用在模空间上。现在的模空间的参数由环面上的几何参数以及反对称张量场组成。T对偶群也作用在弦的谱上,作用也有直观的解释:弦态的动量在环面上有d个分量,同样,绕数也有d个分量,由这2d个整数形成一个2d维晶格,SO(d,d,Z)是这个晶格的对称群。当我们观察质量谱时我们会发现在这个群作用下质量谱不改变。
应当提一下,我们一直没有太强调其它模参数。就世界面上的共形场论来说,只涉及到我们提到的模空间。当我们考虑弦的相互作用时,就必须计及相互作用常数,这也是一个模参数,它在T对偶的作用下也会改变。
由于T对偶的发现和证明一直局限于谱和世界面,这种对偶严格说来只是在微扰论中被证明。后来人们在简单的圆的情形利用规范对称性来说明T对偶也是一种剩余规范对称性,这样,T对偶应当是一种严格的对称性,在非微扰论中也应当是成立的。
最后,回到T对偶发现的原始文章,在那里,吉川等人计算了真空能量,发现在自对偶的半径处能量取极小,这当然是对偶的一个简单结论。
(第四节)
我们前面介绍的T对偶,既可以用在玻色弦理论中,也可以用在超弦理论中。用于玻色弦时,情况很简单,无非由一个玻色弦得到另一个玻色弦;用于超弦时,情况稍复杂,在T对偶下,IIA
理论变成IIB理论,反之亦然。这个现象有一个简单的世界面上的解释。在世界上,当我们做T对偶时,是将动量模与绕量模互换,这个互换可以通过改变世界面上对应的标量场(即紧化的那个空间)的左手模的符号达到。由於要保持世界面上的超对称,对应的世界面上的费米子的左手模也要改变符号。我们知道,时空中的费米子来源于两个雷芒分支,当世界面上的一个左手费米子改变符号时,其所在的雷芒分支的手征性改变。这样,在T对偶下,IIB弦论中本来有相同手征得雷芒分支变得具有相反的手征性了,这就成了IIA理论。
T对偶的存在说明弦论中空间这个概念不是绝对的,是根据动力学和物理解释获得的。T对偶的一个较为复杂的推广是所谓的镜像对称性(mirrorsymmetry),这是一个联系弦论和代数几何的重要现象,我虽不是专家,还是在这里谈一下。
镜像对称性关于IIA弦和IIB弦的对称性,只有当紧化空间是卡-丘流形时才有。这个对称性说,一个IIA(IIB)理论紧化在一个卡-丘流形上时等价或即对偶于一个IIB(IIA)理论紧化在另一个拓扑和几何完全不同的卡-丘流形上。拓扑上的条件是,一个卡-丘流形的凯勒(Kahler)形变的参数对应于另一个卡-丘流形上的复结构形变参数。我们先解释这个要求的物理含义。
在紧化后,我们通常要考虑每个十维的场会产生什么样的四维无质量场。例如,通过引力场在紧化了的时空方向的份量,我们可以获得四维时空中的标量场。这些标量场的数目往往与紧化空间的拓扑有关。间言之,一部分份量的零模由卡-丘流形的凯勒形变给出,另一部分零模由复结构形变给出。巧的是,这两组参数的数目之差等于四维中零质量费米子的代的个数(如果是杂化弦的话)。
在镜像对称性的作用下,上述两组零模互换,总数不变,相差得绝对值也不变。其实镜像对称性的发现相当晚,直到90年才有人认真提出来。发现得晚的原因是,这个对称性在几何上是不可思议的(要求卡-丘流形成对出现),对称性本身只有通过研究世界面上的共形场论才变得明显。
当我们研究IIA或者IIB理论时,世界面上的共形场论具有超对称,即使当一部分空间是卡-丘流形时,也有世界面上的超对称。此时世界面上有四个超对称,左手分支两个,右手分支两个(记住在共形场论中这两个分支基本上是独立的)。在每个分支中,更有超共形不变性。在这里,我们遇到将来经常遇到的概念,就是超对称BPS态。这里的态指的是世界面理论中的态,而不是时空中的态。世界面上的超共形代数定义了一些特别的态,叫手征原初态(chiralprimary),这些态带一个守恒荷,而超对称代数表明该态的标度指数(scalingdimension)等於这个荷,这个关系是超对称BPS所满足的关系。由於左手和右手都有一个超共形代数,所以一个完整的算子带两个荷。我们上面所说的两种形变参数对应于这些手征原初态,所以共形场论的知识决定了卡-丘流形的一些拓扑性质。现在,镜像对称性在共形场论中有很简单的解释,两个镜像对称的卡-丘流形的描述对应于同一个共形场论,但算子的左手荷的符号被改变了。一个近乎平庸的共形场论的对称变成了高度非平庸的空间对称性。
后来各种对偶的发展证明镜像对称性不仅有重要的物理应用,也有似乎更重要的数学应用。
现在转到二次革命前的另一个重要发现,规范场论的强弱对偶,又叫S对偶。要解释这个对偶,我们要回顾一下狄拉克1948年关于磁单极的工作。在麦克斯韦理论中,通常只假设电荷的存在,没有磁荷。在这种情况下,电场和磁场可以统一地写成电磁势,是一个时空中的四维矢量。如果没有量子力学,将电磁场分开来写或者统一地写完全是个习惯问题。有了量子力学,这就成为一个物理问题了,很明显,一个电荷在电磁场中应当直接与电磁势耦合,这已经由阿哈诺夫-玻莫效应的实验
所证实。当有磁荷的时候,通常不能直接写电磁势。例如,只有一个磁荷,也就是磁单极时,我们没有办法写出一个除了在磁荷那一点处处光滑的电磁势。如果形式上扣除从磁荷处延伸到无限远处的一个半直线,我们就可以写出电磁势。这个电磁势在扣除了的半直线处无法定义,这个半直线叫“狄拉克弦”。
当一个电荷在磁单极的磁场中运动时,我们还象过去一样假定电荷直接与电磁势耦合。但是,我们不能假定狄拉克弦真的被扣除,所以电荷本身的波函数应当与狄拉克弦的存在无关,这个要求导致磁荷和电荷量子化,叫狄拉克量子化。数学上,量子化要求电荷乘以磁荷是整数,物理上,这个乘积很自然,因为电荷与磁荷的耦合强度既正比于电荷,也正比于磁荷。
狄拉克量子化条件也有一个很漂亮的数学解释。我们用同心球面来描述整个空间,中心就是磁单极所在处。狄拉克弦与这些球面相交于球面的北极,所以电磁势在北极没有定义,换言之,磁单极的存在使得电磁势在球面上的一个开集有定义。我们现在将球面分成上半球面和下半球面,电磁势应当在这两个半球面上分别有好的定义。两个半球面相交于赤道,在赤道上,两个定义不同,但也只相差一个规范变换,这个规范变换定义了一个纤维丛。考虑电荷在球面上运动,电荷的玻函数在两个半球面上也分别有定义,在赤道上也相差一个规范变换。我们要求这个规范变换沿著赤道是周期的,这就给出狄拉克量子化条件。
对於狄拉克本人来说,如果找不到磁单极,虽然有一点遗憾,因为不能很简单地解释电荷的量子化了,故事也到此结束了。我们并不奢望电磁理论中真的存在磁单极。在有些非阿贝尔规范理论中,我们两节前说过,真的存在磁单极解,所以在这些理论中我们就不能忽略磁单极了。磁单极解,由於是孤子解,有一个孤子解的共性,不但所带的磁荷反比于理论中的基本电荷,其质量也与电荷的平方成反比。当规范理论是弱耦合时,磁荷很大,质量也很大,一般不介入低能现象。
如果我们考虑电荷与磁荷之间的耦合,由於狄拉克量子化,耦合永远是1的数量级,无论电荷本身如何小。如果考虑磁荷与磁荷之间的耦合,耦合强度与电荷之间的耦合强度成反比。自然地,人们问,有没有可能将带磁荷的孤子看成基本的激发态来构造一个新理论,在这个新理论中,原来的基本激发态如电荷成为孤子?这是一个非常动人的猜测,很难验证,所以有很长一段时期没有人认真地对待这个猜测。如果一个猜测是对的,那么新理论就是原来理论的对偶理论,其中基本相互作用强度与原来的相互作用强度成反比,所以这个对偶叫强弱对偶。
现在看来,强弱对偶不会是普遍成立的。能够找到根据的强弱对偶都涉及到时空的超对称,最典型的例子是我们提过的N等於4的超对称规范理论(superYang-Mills,经常被简化为SYM,我在台湾经常看到这个缩写,原来是三阳摩托的简称)。这个对偶是英国人奥立弗-曼通宁在1977年首先提出,后经奥斯本(H.Osborn)指出磁单极只有当有16个超对称生成元时才可能组成一个含规范粒子的超对称多重态(79年)。这个对偶猜想被冷落了许多年,据我所知,森也许是第一个重视这个对偶的人,他的出发点是弦论,最早的时间是1992年,后来史瓦兹也相信了这个猜想。另外,龚特里特(J.Gauntelett)也在1993年研究了超对称磁单极的低能动力学,目的也是为了研究强弱对偶。
N等於4的强弱对偶不仅仅是简单的强弱互换。在这个理论中,除了一个耦合常数外,还有一个耦合常数类似一个角,通常称为西它(希腊字母)角的,与一个拓扑项有关。这两个常数结合成为一个复数,强弱对偶可以推广为一个变换群,非常类似两维环面上T对偶的一个子群,就是SL(2,Z)。这些对偶变换预言,存在着无限多个磁单极和电荷的束缚态,带有任意整数个磁荷和任意整数个电荷,这两个整数互素。除了磁单极本身,最简单的束缚态含两个磁荷和一个电荷。这个束缚态的存在於94年由森所证明,从而第一次给出强弱对偶的证据。
众所周知,塞伯格和威顿94年的工作在场论界和弦论界唤起了人们对对偶的兴趣,而这两个人对对偶的兴趣一部分来自森的工作。当然,很多人许久以前就提出了其它种类的对偶,由於太缺乏
证据,没有人相信,我们下一节谈谈这些“史前”猜想和相关的工作。非常有趣的是,虽然一般地说强弱对偶比较罕见,却普遍存在於超对称规范理论中。进一步,这些强弱对偶都毫无例外地可以在弦论中实现。毫不夸张地说,弦论是一切对偶之母(起码目前如此)。
本文由奇点天文作者上传并发布,奇点天文仅提供文章投稿展示,文章仅代表作者个人观点,不代表奇点天文立场。
我要把人生变成科学的梦;然后再把梦变成现实。
教师必须具有健康的体魄;农人的身手;科学的头脑;艺术的兴味;改革社会的精神。
任何人都承认实验是科学之母;这是确定不移的真理;谁也不会否认。
科学的探讨与研究;其本身就含有至美;其本身给人的愉快就是报酬;所以我在我的工作里面寻得了快乐。
科学的进步取决于科学家的劳动和他们的发明的价值。
在科学上最好的助手是自己的头脑;而不是别的东西。
在学习中;在劳动中;在科学中;在为人民的忘我服务中;你可以找到自己的幸福。
社会一旦有技术上的需要;则这种需要就会比十所大学更能把科学推向前进。
科学的惟一目的是减轻人类生存的苦难;科学家应为大多数人着想。
我首先要求诸君信任科学;相信理性;信任自己;并相信自己。
在学习中;在劳动中;在科学中;在为人民的忘我服务中;你可以找到自己的幸福。
科学的界限就像地平线一样;你越接近它;它挪得越远。
教师必须具有健康的体魄;农人的身手;科学的头脑;艺术的兴味;改革社会的精神。
还是很难理解
👍