第二十二章 预言机

22.1接球的大脑

"给我说说未来吧,"我恳请道。

我现在正坐在导师办公室的沙发上。经过了一段艰苦的跋涉,我才来到这个位于地球能量点之一的高山哨站----新墨西哥州洛斯阿拉莫斯国家实验室。导师的办公室里,贴满了各种色彩斑斓的过去的高科技会议的海报,勾画出他近乎传奇的履历:他,还是标新立异的物理系学生时就拉一帮嬉皮黑客成立了一个地下组织,在拉斯维加斯利用可穿戴式计算机赢光了庄家的钱;他,通过研究滴水的水龙头,成了一帮离经叛道的科学家中的主要人物,正是他们发明了之后迅速发展的混沌科学;他,是人工生命运动之父;他,现在在洛斯阿拉莫斯原子武器博物馆斜对面的小实验室里领导研究复杂性这门新科学。

导师多恩·法默,又高又瘦,看上去三十多岁的样子,很像戴了饰扣式领带的伊卡伯德·克瑞恩。多恩正在着手开始他下一个不同寻常的冒险:开办一家公司,通过计算机模拟来预测股价,然后打败华尔街。

"我一直在思考未来,我有一个疑问,"我开口道,"你是想知道ibm的股票到底是会涨还是会跌!"法默带着一脸歪笑提示道:"不。我想知道未来为什么这么难以预测。""哦,这个简单。"

我之所以探询预测未来的问题,是因为预测是控制的一种形式,是一种尤其适合分布式系统的控制形式。通过预期未来,活系统能够改变其姿态,预先适应未来,以这种方式掌控自己的命运。约翰·霍兰德说:"复杂自适应系统所做的,就是预测。"

在对预测机制进行剖析的时候,法默最喜欢用这个例子来进行说明:"来,接着!"说着就朝你扔过来一个棒球。你抓住了球。"你知道你是怎么接住这个球的吗?"他问道,然后回答:"通过预测。"

法默坚信你的脑子里有一个关于棒球是如何飞行的模型。你可以采用牛顿的经典力学算式f=ma来预测一个高飞物体的运动轨迹,但是你的大脑本身却并没有存储这样的基本物理学算式。更确切地说,它直接依照经验数据建立起一个模型。一个棒球手成千次观察球棒击飞棒球的情景,成千次举起戴着棒球手套的手,成千次利用戴手套的手调整他的预测。不知怎么的,他的大脑就逐渐编制出一个棒球落点的模型----一个几乎跟f=ma不相上下的模型,只不过适用范围没有那么广而已。这个模型完全建立在过去接球过程中产生的一系列手/眼数据的基础上。在逻辑学领域中,这样的过程统称为归纳,它与导出f=ma的推演过程截然不同。

在天文学的早期,也就是在牛顿的f=ma出现之前,天体事件的预测都是根据托勒密的嵌套圆形轨道模型做出的----一环套一环。由于建立托勒密理论的核心前提(即所有天体都绕着地球转)是错误的,所以每当新的天文观察提供了某个星体更精确的运动数据时,都需要修正这个模型。不过,嵌套的复杂结构惊人地坚固,足以应付层出不穷的修修补补。每次有了更好的数据,人们就在圆环套圆环套圆环的模型里面再加一层圆环,用这种方法来调整模型。尽管有各种严重错误,这个巴洛克风格的模拟装置仍然行得通,而且还会"学习"。托勒密的这个头脑简单的体系,为日历的调节以及对天象的实际预测,恰恰好地服务了1400年!

一个棒球外野手基于经验形成的空中飞行物的"理论",很像托勒密行星模型的后期阶段。如果我们解析外野手的"理论"的话,就会发现它是不连贯的、即兴的、复杂的,而且是近似的。但是,它也是可以发展的。这是一个紊乱的理论,但它不仅有效,而且还能提高。如果非要等到每个人都能弄明白f=ma这个算式(弄明白半个f=ma还不如什么都不懂)再行动的话,就根本没有人能接住任何东西。就算你现在了解了这个算式,也没什么用。"你可以用f=ma来求解飞行中的棒球问题,但你不能在外场实时解决问题。"法默说。

"现在,接着这个!"说着,法默又扔出了一个充好气的气球。这东西在房间里放肆地漂来弹去,像喝醉了酒似的。谁也接不住这东西。而这正是混沌的一种经典表现----一个对初始条件具有敏感依赖的系统。气球在发射时的一点微不可查的变化,也能被放大成飞行方向的巨大改变。尽管f=ma这条定律仍然支配着气球,但是,另有一些力量,比如推动力、空气抬升的推与拉,造成了运动轨迹的不可预测性。在这混沌之舞中的歪歪斜斜的气球,反映的是太阳黑子周期循环、冰河时期的气温、流行性传染病、沿着管道流动的水的种种难以捉摸的华尔兹,更为切题的,是股票市场的波动。

可是,难道气球的运行轨迹真的不可预测吗?如果你试图用算式来解决气球那摇摇晃晃的飞舞运动,你会发现它的路径是非线性的,因此它几乎是不可解的,因此也是不可预测的。尽管如此,一个玩任天堂公司(一家日本游戏公司)的游戏长大的十几岁的小孩,却可以学会如何接气球。虽说不是完全准确无误,但是却比单纯靠运气要强多了。只要接过几十次之后,小孩的大脑就开始根据所获得的数据来构筑某种理论,或者说构筑某种直觉,某种归纳。放飞了上千次的气球之后,他的大脑就已经构建出了这个橡皮球的飞行的某种模型。这样的模型虽然不能精确地预测出这球到底会落到什么地方,但是却能探查出飞行物的飞行意向,比如说,是往发射的相反方向飞,还是按照某种模式绕圈子。也许,随着时间的推移,这个人抓气球的成功率,要比纯粹靠运气去抓高上10个百分点。关于抓气球,你还能有什么更高的要求呢?某些游戏里,并不需要太多的信息就可以做出有效的预测。比如逃离狮口或者投资股票的时候,哪怕只是比纯粹的运气高那么一点点,也是有重大意义的。

几乎可以明确地说,"活系统"----狮群、股票市场、进化中的种群、智能等,都是不可预测的。它们所具有的那种混乱的、递归式的因果关系,各个部分之间互为因果的关系,使得系统中的任何一个部分都难以用常规的线性外推法推断未来。不过,整个系统却能够充当分布式装置,对未来做近似的推测。

为了破解股票市场,法默在推导金融市场动向方面下了大力气。"市场的可爱之处就是,其实不需要太多的预测,就可以做很多事情。"法默说。

报纸灰色的末版里,有股票市场上下波动的走势图,只显示两个维度:时间和价格。从有股票市场的那一天起,投资者们就已经在细心解读这个在二维之间摆动的黑色线条,希望从中找出某种能够预测股市走向的模式来。只要是可靠的,哪怕只是模糊的方向性提示也能让人获得不菲的收获。正因为如此,推介这样那样的预测图表来判断未来走向的昂贵金融通讯,才会成为股票界的一个永久附件。从事这个职业的人就被称为图表分析师。

在20世纪70年代和80年代,图表分析师在货币市场的预测方面有了一点成功,这是因为,按照一种理论的说法,中央银行和财政部在货币市场中的强势角色约束了各种变量,因而可以用一种相对简单的线性算式来描述整个市场的表现。(在线性算式中,一个解可以用一条直线在图中表示。)而当越来越多的图表分析师利用这种简单的线性算式成功地找出各种趋势之后,市场的利润也就越来越薄了。自然而然地,预测者们开始把目光投向那些更为狂野和更为杂乱的地方,那些仅由非线性算式统治的地方。在非线性系统中,输出与输入之间并不成比例。而世界上绝大多数的复杂系统----包括所有的市场,都是非线性的。

随着价格低廉、具有产业优势的计算机的出现,预测者们对非线性的某些方面已经能够理解。金融价格可以体现为一种二维曲线,而通过对这种二维曲线背后的那种非线性现象进行分析,提取出可靠的模式,就可以挣钱,而且是大钱。这些预测者可以推测出图形的未来走向,然后在预测上下赌注。在华尔街,人们把破解出这种或者那种神秘方法的电脑呆子称为"火箭科学家"----股市分析高手。而这些西装革履、在各种交易公司的地下室里工作的技术怪才们,其实就是20世纪90年代的黑客。多恩·法默这位前数学物理学家,还有那些原来跟他一起进行数学冒险的同事们,将美国境内离华尔街远得不能再远的地方----圣达菲的四间砖房作为办公室,现在已经是华尔街最炙手可热的股市分析高手。

在现实中,影响股票二维图形轨迹的因素不是几个,而是数千个。当我们把股票的数千个向量绘制成一条线时,它们都被隐藏起来,只显现出了价格。同样的情况也会发生在我们用图形来表示太阳黑子的活动或者气温的季节性变化时。比如,你可以在平面图上用一条简单的、随时间变化的细线表示太阳的活动轨迹,但是,那些影响到这条线的各种因素却令人难以置信地复杂多样,相互纠结,反复循环。在一个二维曲线的表面背后,活跃着驾驭这条曲线的力量的混乱组合。股票、太阳黑子或气候的真正图表都会包括一个为所有影响力准备的轴,因而这张图也会成为一种难以描绘的千臂怪物。

数学家一直努力寻找驯服这些怪物的方法,他们称之为"高维"系统。任何有生命的造物、复杂的机器人、生态系统或者自治的世界,都是一个高维系统。而形式之库,就是一个高维系统的建筑。仅仅100个变量,就可以创造出一群数量巨大无比的可能性。因为每一个变量行为都和其他99个行为互相影响,所以如果不同时对这个相互作用的群体整体进行考察的话,你根本无法考察其中的任何一个参数。比如说,哪怕是一个简单的只有三个变量的气候模型,也会通过某种奇怪的回路连回到自己身上,从而哺育出某种混沌,让任何一种线性预测都成为不可能。(最初就是因为在气象预测上的失败才发现了混沌理论。)

22.2混沌的另一面

流行的观点认为,混沌理论证明了这些高维的复杂系统----比如天气、经济、行军蚁,当然还有股票价格,其本质上是无法预测的。这种设想如此坚不可破,以至于人们通常认为,任何一种用来预测这些复杂系统输出结果的设计,都是天真的,要不然就是疯狂的。

可是,人们大大地误解了混沌理论。它还有另外一个面孔。出生于1952年"婴儿潮"的多恩·法默用黑胶唱片打了个比方:他指出,混沌就好像是一个双面都录有音乐的热门唱片。

正面的歌词是这样的:根据混沌定律,初始秩序可以分解为原不可预测性。你无法做出远期预测。

另外一面则是这样的:根据混沌定律,那些看起来完全无序的东西,在短期内可以预测到。你可以做出近期预测。

换句话说,混沌的特性,既载有好消息,也带有坏消息。坏消息是:可做远期预测的东西,即便有,也只是一点点。而好消息,也就是混沌的另一面则是:就短期而言,有更多的东西可能比其第一眼看上去更具可预测性。而无论是高维系统的长期的不可预测性,还是低维系统的短期的可预测性,都来源于同一个事实,即"混沌"和"随机"是两回事。"在混沌中存在着秩序,"法默说。

法默肯定知道。早在混沌形成科学理论、成为时尚的研究领域之前,他就是探索这一黑暗领域的一位先驱。20世纪70年代,在时尚的加利福尼亚小城圣克鲁斯,多恩·法默和朋友诺曼·帕卡德共同建立了一个计算机迷嬉皮士公社来实践集体科学。他们同住,同吃,同煮,一起寻找解决问题的方法,一起分享科学论文的荣誉。作为混沌社成员,这伙人研究的是滴水的水龙头和其他看似随机生成的设备的古怪物理学。法默对轮盘赌的轮盘特别着迷。他坚信表面上随机旋转的轮盘里,一定隐藏着某种秩序。如果有人能在这旋转的混沌中找出隐秘的秩序,那么......哎呀,他就发财了......发大财。

1977年,在苹果机这样的商用微机诞生之前很久,圣克鲁斯的混沌社造出了一组可手动编程的小微机,装在三个普通皮鞋的底部。这些计算机用脚趾键入信息;它们的功能,是预测轮盘赌中小球的走向。法默的团队从拉斯维加斯买来二手轮盘机架在公社拥挤不堪的卧室里,对其进行研究。这种自制的计算机,运行的就是由法默依据小组的研究成果编制的代码。法默的计算机算法不是基于轮盘赌的数学规律,而是基于轮盘的物理规律。从根本上说,混沌社的编码,在鞋子里的芯片内模拟了整个轮盘赌旋转的轮盘和弹跳的小球。它完成这种模拟只用了微不足道的4k内存,而那个时代,计算机还是一些需要24小时的空调和专门人员照顾的巨型怪兽。

这个科学公社,曾经不止一次把混沌的另一面翻出来,场景大致如此:在赌场里接上线,由一个人(通常是法默)穿上一双魔法鞋来测定轮盘操作员对轮盘的弹击、球的跳动速度以及轮盘摆动的倾角。附近,同社的一个人穿着第三只无线电信号联接的魔法鞋,在台面上实际下注。而在这之前,法默已经用脚趾头调整他的算法,仿定了赌场的一部轮盘机。此时,就在小球落下到最终停下来之间的短短15秒左右的时间里,他的鞋计算机就模拟完成了这个球的整个混沌运行过程。法默用他的右脚大趾点击预测装置,生成这个球的未来落点的信号,其速度要比一个真球落到号码杯中的速度快上大约100万倍。法默动一下左脚大趾,把这个信息传递给他的同伙,后者从他自己的脚底"听"到这个信息,然后,一本正经地在小球落定之前把筹码放到已经预先确定了的方格中。

如果一切都运转良好的话,这一注就赢了。不过,这个系统所预测的从来都不是那个会赢下赌注的准确号码;混沌社员是一些现实主义者。他们的预测装置预报出一小片相邻的号码----轮盘的一个小扇面,作为球在赌桌上的目的区。而参赌的同伙则会在小球停止转动的过程中在这个区域内遍撒筹码。最后,其中一个赢得赌注。尽管下在它旁边的那些筹码输了,可这个小区域作为一个整体,往往能赢,而且足以超过赔率。从而挣到钱。

后来,因为这个系统的硬件不可靠,小组把整个系统卖给了别的赌博者。不过,从这次冒险中,法默却学到了三件对于预测未来非常重要的事情:

首先,你可以抽取混沌系统内在的固有模式,取得良好的预测。

其次,进行一次有用的预测用不着看得太远。

第三,即使是一点点有关未来的信息,也是非常有价值的。

22.3具有正面意义的短视

法默牢记着这些经验,又跟另外5个物理学家(其中一个是前混沌社成员)组建了一个新公司。这一回,他们要破解的是所有赌徒的梦想:华尔街。而且,这一回,他们将用上高性能的计算机。他们会把这些计算机装上实验性的非线性动力,以及火箭科学家秘不外传的其他诀窍。他们将从旁思考,让这种技术在没有他们控制的情况下承担尽可能多的责任。他们要创造出一个东西,如果你愿意也可以说,创造出一个有机体来,它能自行完成数百万美元的赌博。他们会让这个有机体......(嗯,请把鼓擂起来)预测未来。这帮老练的家伙有点虚张声势地挂出了新招牌:预测公司。

预测公司里的这些人领会到,要想在金融市场里挣到大钱,只要能够提前几天预见要发生的事情就足够了。的确,法默和同事们待过的圣塔菲研究所最近的研究就解释了"看得远并不意味着看得好"。当你埋首真实世界的复杂性时,少有清晰界定的选择,不完全的信息又蒙蔽了所有的判断,这个时候,要评判过于遥远的选择就达不到预期的目的了。尽管这个结论似乎符合人类的直觉,但是,我们还不清楚为什么它也应该符合计算机和模型世界。人类的大脑很容易分散注意力。但是,假定说,你已经拥有了无限的计算能力,而且专注地执行着预测的任务。那么,为什么看得更深更远还并不是更好呢?

这个问题的简单答案就是:当极小的误差(由有限的信息引起的)持续到非常遥远的未来的时候,将会汇聚成极为严重的误差。即使计算本身是免费的(而它从来就不是免费的),处理这些成指数增长、被误差污染的可能性所需要的代价也是巨大的,而且根本就不值得付出。圣塔菲研究所研究员、耶鲁大学经济学家约翰·吉纳考普劳斯和明尼苏达的教授拉里·格雷曾经用一个国际象棋比赛的计算机程序作为他们预报工作的试验台。(最好的计算机象棋程序,比如顶级的"深思"程序,能够击败除几个最顶尖的大师之外的所有人类棋手。)

结果却和计算机科学家们的预料完全相反,无论是"深思"程序,还是人类的象棋大师,其实都不需要看得太远就能下出非常好的棋。这种有限的前瞻就是所谓的"有正面意义的短视"。一般来说,这些大师会首先纵览盘面的局势,只对各个棋子下一步的走法做一个预测。接下来,他们会挑选出最可能的一种或两种走法,更深入地去考虑这些走法的后果。尽管每多向前推演一步,可能的走法就会以指数的数量级爆炸性增长,但是在每一个回合,那些伟大的人类大师却只会把注意力集中在有限的几个最有可能的应对着法上。在遇到以往经历过的熟悉环境、深知其间利害取舍的情况下,他们偶尔也会往前多探几步。但是,一般来说,大师们(现在再加上"深思")都是凭经验布置棋局。例如:首选那些增加选择余地的着法;避开那些结果不错但要求弃子求兑的着法;从那些毗邻多个有利位置的有利位置着手。在对局势的前瞻与切实通盘关注当前状况之间取得平衡。

我们每一天都会遇到类似的折中。无论在商业、政治、技术还是生活中,我们都必须预估隐匿在犄角旮旯的情况。可是,我们从来都得不到充足的信息来做出完全有见地的决策。我们在黑暗中经营。为了做出补偿,我们只能凭借经验或者粗略的指导原则,而国际象棋中的经验规则,是可以指靠的相当不错的生活规则。(我的女儿们,这里注意了:首选那些增加选择余地的着法;避开那些结果不错但要求弃子求兑的着法;从那些毗邻多个有利位置的有利位置着手。在对局势的前瞻与切实通盘关注当前的状况之间取得平衡。)

常识使这种"有正面意义的短视"具体化。与其花费数年的时间去搞一本预测一切可能发生状况的公司员工手册----它在付印之际就过时了,不如采用那种有正面意义的短视,也不要去想那么远,这显然要好得多。也就是说,先设计出一些一般的指导原则来应对那些看起来一定会在"下一步"发生的事情,等那些极端事例真的发生的时候再来应付。如果你身在一个陌生的城市,又想在交通高峰时段出行,你可以在地图上计划好穿越整个城市的详细路线----想得比较远,又或者试探一下,比如"一直向西,到达沿河路时,再左转"。通常,我们两种方法都会尝试一些。我们会尽量忍着不去想得太远,又确实会关注眼前马上要发生的事情。我们会蜿蜒向西,或上坡,或下坡,同时,不管到了哪里,都会拿出地图看看下一个马上要到的路口。我们使用的方法,实际上是由经验规则引导的有限的前瞻。

预测机制即使看起来没有先知的样子也一样好使,只要它能从随机和复杂的伪装背后发现有限的模式----几乎什么样的模式都行。

22.4从可预测性范围里挣大钱

按照法默的说法,有两种不同的复杂性:内在的和表面的。内在的复杂性是混沌系统"真正的"复杂性。它造成晦暗的不可预测性。另外一种复杂性是混沌的另外一面,掩盖着可利用秩序的表面复杂性。

法默在空中画了一个方框。往上,表面复杂性增加;对角向上穿过正方形,内在复杂性增加。"物理学通常是在这里工作,"法默指着两类复杂性低端共聚的底角,即那个简单问题所在的区域说道。"而到了那边,"法默指着方框中跟这个底角相对的那个上角说道,"都是些难题。不过,我们现在是要滑到这个位置,到了这里,问题就会比较有趣----这里表面的复杂性很高,而真正的复杂性仍然保持比较低的水平。到了这里,复杂的难题中有些成分是可以预测的。而那些正是我们要在股票市场中找的东西。"

预测公司希望能够借助那些简陋的计算机工具,那些占了混沌的另一面的便宜的工具,来消灭金融市场中简单的问题。"我们正在运用我们能找到的所有方法,"前混沌社成员,公司的合伙人诺曼·帕卡德说道。这个想法是把得到了验证的各种来路的模式搜寻策略都变成数据,然后"不断地敲打它们",以此对算法进行最优化。找到模式最清晰的提示,然后使真相大白。这是一种赌徒的心态:任何利益都是利益。

激励法默和帕卡德的信念是从他们自己的经验中得来的,即混沌的另一面非常稳定,足以依赖。没有比他们在拉斯维加斯的轮盘赌试验中挣到的那一大把实实在在的钞票更能打消疑虑的了。不利用这些模式就太傻了。正如那位记录他们高赢率冒险尝试的作者《幸福的馅饼》(eudaemonicpie)一书里大声疾呼的那样:"干嘛不在鞋里穿上计算机去玩轮盘赌?"

除了经验之外,法默和帕卡德在他们通过混沌研究创造出来的颇受人敬重的理论中还注入了大量的信念。不过,他们现在还在测试自己最狂野、最有争议的理论。与绝大多数经济学家的怀疑相反,他们相信其他那些复杂现象中的某些区域也能精确预测。帕卡德把这些区域称为"可预测性范围"或者"局部可预测性"。换句话说,不可预测性在整个系统中的分布并不是统一的。绝大多数时间,绝大多数复杂系统也许都不能预报,但是其中一小部分也许可以进行短期预报。回头去看,帕卡德相信,正是这种局部的可预测性才让圣克鲁斯混沌社通过对轮盘上的小球的近似路径进行预报来挣到钱的。

即使真的存在这种可预测性范围,它们也肯定被掩埋在一大堆不可预测性之下。局部可预测性的信号,会被上千个其他变量产生的盘旋杂乱的干扰所掩盖。而预测公司的6位股市分析高手,则利用一种混合了旧与新、高端与低端的搜索技术来对这个庞杂的组合信号堆进行扫描。他们的软件既搜寻那些从数学上来讲属于高维空间的金融数据,也寻找局部区域----不管什么样的局部区域,只要它能够和可预测的低维模式相匹配就好。他们是在金融的宇宙中寻找秩序的迹象----任何秩序。

他们做的这种实时的工作,也可以称为"超实时"的工作。就跟在鞋子计算机里模拟出来的弹跳球会在真球停下来之前停下来一样,预测公司的这种模拟金融模式也会比在华尔街那边的实际运行要快。他们在计算机里重新制定股票市场的一个简化部分。当他们探测到正在展开的局部秩序的波动时,就会以比真实生活更快的速度进行模拟,然后把筹码下在他们想见的这一波动可能结束的点位。

戴维·拜瑞比曾经在1993年3月的《发现》杂志上用一种非常可爱的比喻来形容这种寻找可预测性范围的过程:"看着市场中的混沌,就好像看着波涛汹涌、浪花四溅的河流,它充满了狂野的、翻滚着的波涛,还有那些不可预料的、不断盘旋着的漩涡。但是,突然之间,在河流的某个部分,你认出一道熟悉的涡流,在之后的5~10秒内,就知道了河流这个部分中的水流方向。"

当然,你是没有办法预测水流在下游半英里处的流向,但是,就有那么5秒钟----或者在华尔街那5个小时的时间里,你可以预测这个演示的进展。而这也正是你致用(或者致富)所需要的。找出任意一个模式,然后利用它。预测公司的算法,就是抓住飞逝的一点点秩序,然后利用这个转瞬即逝的原型来挣钱。法默和帕卡德强调说,当经济学家们遵循职业操守对这些模式的原因进行挖掘的时候,赌徒们却没有这种约束。预测公司的重要目标并不是模式形成的确切原因。在归纳式的模型----预测公司构造的那种模型中,事件并不需要抽象的原因,就跟具有意念之中的棒球飞行路线的外野手,或者一只追逐抛出的棍子的狗一样不需要抽象的原因。

应该操心的,不是这类充斥着因果关系循环的大规模集群式系统中因与果之间模糊不清的关系,而是如法默所说:"要击败股票市场,关键性的问题是,你应该关注哪些模式?"哪些模式掩盖了秩序?学会识别秩序而不是原因,才是关键。

在使用某个模型下注之前,法默和帕卡德会用"返溯"的方法对它做一个测试。在运用"返溯"技术(专业的未来学家常用到的方法)时,要通过来自人力管理模型中的最新数据建立模型。一旦系统在过往数据,比如说20世纪80年代的数据里,发现了某种秩序,就把过去那几年的数据提供给它。如果系统能够依据80年代的发现准确地预测出1993年的结果,那么这个模式搜索器就可以拿到奖章了。法默说:"系统得出20个模型。我们会把所有这些模型都运行起来,用诊断统计学把它们筛一遍。然后,我们6个人就会凑在一起,选出真正要运行的那个。"这种建模活动,每一轮都可能要在公司的计算机上运行上好几天。不过,一旦找到了某种局部秩序,根据这种秩序进行预测就只需要百万分之一秒的时间。

最后的一步,也就是在它手里塞上大捆的真钱来实际运行这个程序,还需要这几位博士中的一位在键盘上敲一下"回车"键。这个动作就会把选定的算法投入到那个高速运转、钱多得能让脑子停转的顶级赛事的世界。割断了理论的缰绳,自动运行起来,这个充实起来的算法就只听到它的创造者们喃喃低语:"下单啊,呆瓜,下单啊!"

"只要我们能够超过市场盈利5个百分点,那么我们的投资者就能挣到钱了。"帕卡德说。关于这个数字,帕卡德是这么解释的:他们能够预测出55%的市场走向,也就是说,比随机的猜测高出5个百分点,不过,如果他们真的猜对了话,那么最终得到的结果会高出200%,也就是说,比市场的赢率高两倍。那些为预测公司提供金融支持的华尔街大佬(当前是奥康纳及关联公司),可以获得这个算法的独家使用权,作为交换,他们则要根据算法所得到的预测结果的具体表现支付公司一定的费用。"我们还是有一些竞争者的,"帕卡德笑着说道,"我知道有另外4家公司也在琢磨同样的事情,用非线性动力学去捕捉混沌中的模式,然后用这些模式进行预测。其中的两家已经发展起来了。里面还有一些是我们的朋友。"

花旗银行就是使用真钱交易的竞争者之一。从1990年开始,英国数学家安德鲁·科林就已经开始搞交易算法了。他的预报程序首先随机生成数百个假设,这些假设的参数影响着货币数据,然后再用最近5年的数据来检验这些假设。最可能产生影响的参数会被传送到计算机神经网络,由它调整每一个参数的权重,以求更好地与数据吻合,采取给最佳参数组合加权的办法,以便产生出更优的猜测。这个神经网络系统也会不断地把得到的结果反馈回来,通过某种自我学习的方式不断打磨自己的猜测。当一个模型跟过去的数据吻合,它就会被传送到未来。1992年,《经济学人》杂志曾经有一篇文章这样写道:"经过两年的实验,科林博士估计他的计算机虚拟交易资金能够获得每年25%的回报......这已经是绝大多数人类交易者期望值的好几倍了。"当时伦敦的米兰银行有8位股市分析高手在研究预测装置。他们计划由计算机生成算法。不过,和在预测公司一样,在"敲回车"之前,计算机生成的算法还是要由人类来评估。直到1993下半年,他们一直是用真钱交易。

投资者们喜欢向法默提出的一个问题是,他怎么证明人们确实可以凭借这么一点点信息上的优势就在市场中挣到钱。法默举了一个"现实存在的例子",即华尔街上像乔治·索罗斯这样的人,通过货币交易或者其他别的的交易,年复一年地赚取数百万的金钱。成功的交易者,法默不平地说,"被那些学院派呸呸连声地瞧不起,以为他们只是超级有运气而已----可是证据却显示说事情完全不是这样的"。人类交易者会在无意识中学会如何在随机数据的海洋里识别出那些属于局部可预测性的模式。这些交易者之所以能够挣到数以百万计的美元,是因为他们为了做出预测,先发掘出了模式(虽然他们说不清道不明),然后建成内部模式(虽然他们并未意识到)。他们对自己的模型或理论的了解并不比他们对自己如何抓住飞球的了解更多。他们就这么做了而已。不过,这两种模型都是基于经验,以同样的托勒密式归纳法建立起来的。而这也正是预测公司利用计算机来对飙升的股票进行建模的方法----以数据为起点,自下而上。

法默说:"如果我们在现在所做的事情上取得基础广泛的成功,那就证明机器的预报能力比人强,而且,算法是比米尔顿·弗里德曼还要优秀的经济学家。交易师已经在猜疑这个东西了。他们感受到了它的威胁。"

困难之处是要保持算法的简洁。法默说:"问题越复杂,最后要用到的模型就越简单。跟数据严丝合缝其实并不难,但如果你真的去做了,那你最后一定只是侥幸成功。概括是关键。"

说到底,预测机制其实是生产理论的机制,是产生抽象和概括性的设备。预测机制仔细咀嚼那些看似随机、被鸡爪刨过,源自复杂、活生生的东西的杂乱数据。如果有日积月累的足够大的数据流,这个设备就能从中分辨出星星点点的模式。慢慢地,这种技术就会在内部形成专门特定的模式,以解决如何产生数据的问题。这种机械不会针对个别数据对模式做"过度调校",它倾向于有几分不精确的概括性的模糊拟合。一旦它获得了某种概括性的拟合,或者说,某种理论,它就能够做出预测。事实上,预测是整套理论的重点。法默宣称:"预测是建立科学理论之后最有用、最实在的结果,而且从许多方面来说,也是最重要的结果。"尽管制造理论是人类大脑擅长的创造性的行为,可是具有讽刺意味的是,我们却没有如何制造理论的法则。法默把这种神秘的"概括模式搜寻能力"称为"直觉"。华尔街的那些"走运的"交易员,利用的恰恰就是这种能力。

我们在生物学中也可以见到这种预测机制。正如一家名为interval的高技术智囊公司的主管戴维·李德所说,"狗不会数学",但是经过训练的狗却能够预先计算出飞盘的路径然后准确地抓住它。一般而言,智能或者聪明,根本就是一种预测机制。同样地,对预测与预报而言,所有适应与进化,也都是相对更为温和、分布更为稀疏的机制。

在一次各家公司ceo的私人聚会上,法默公开承认:"对市场进行预测并不是我的长期目标。老实说,我是那种一翻开《华尔街日报》看金融版的时候就觉得无比痛苦的人。"对一个死不改悔的前嬉皮士来说,这也没有什么可奇怪的。法默规定自己花5年的时间研究股票市场预测的问题,大挣一笔,然后转移到更有趣的问题上,比如,真正的人工生命、人工进化和人工智能。而金融预测就跟轮盘赌一样,只不过是另外一个难题而已:"我们之所以对这个问题感兴趣,是因为我们的梦想是要生产出预测的机制,一种让我们能够对很多不同的东西都进行预测的机制----天气、全球气候、传染病,等等,所有能够产生很多让我们吃不透的数据的事物。"

"最终,"法默说道,"我们希望能够使计算机感染上某种粗略形态的直觉"。

至1993年年底,法默和预测公司公开报告说他们已经成功运用"计算机化的直觉"对市场进行了预测,而且采用了真钱交易。他们与投资者之间的协议不允许他们谈论具体的业绩表现,虽然法默非常想这么做。不过,他确实说过,再过几年,他们就能够获得足够多的数据来"用科学的标准"证明他们在交易上的成功不仅仅是统计上的运气所致:"我们确实在金融数据中找到了在统计上非常重要的模式。确实存在着可预测性范围。"

22.5前瞻:内视行动

在对预测和模拟机制进行调研的过程中,我获得了一个去拜访位于加州帕萨迪那的喷气推进实验室的机会。那里正在开发一种最先进的战争模拟系统。应加利福尼亚大学洛杉矶分校的一位计算机科学教授的邀请,我来到喷气推进实验室。这位教授一直以来都在拓展计算机能力应用的领域。而和很多缺乏资金支持的研究者一样,这位教授也不得不依靠军方的资助来进行他那些前沿的理论实验。按照交易协议,他这一方需要做的,就是挑一个军事方面的问题来检验他的理论。

他的实验台要观察的是大型分散式控制并行计算(我称其为"集群计算")能怎样提高计算机模拟坦克战的速度,是一种他并不太感兴趣的应用软件程序。另一方面,我倒真的非常有兴趣看一场顶尖水准的战争游戏。

一到实验室繁忙的前台,就直接进行安检。由于我拜访的是一个国家级的研究中心,而且当时美国军队在伊拉克边境正处于红色警戒的状态,保安已算是相当热情了。我签了一些表格,就我的忠诚和公民身份起誓,别上一个大徽章,然后就跟教授一起被护送到楼上他的舒适的办公室里。在一个灰暗的小会议室中,我遇到了一个留着长发的研究生,他借着研究如何用数学方法来模拟战争的名义,探寻关于宇宙计算理论的某种创新概念。接着,又见到了喷气推进实验室的头头。他因为我作为记者出现在这里感到紧张不安。

为什么?我的教授朋友问他。模拟系统并不是什么机密的东西;研究结果是发表在公开文献中的。实验室负责人的说辞一大堆:"啊,嗯,你看,现在正在打仗,而且,我们在过去差不多一年的时间里都在泛泛推演那个情节----我们选择那个游戏纯属偶然,根本没有预测的意思,现在却真的打起来了。我们开始测试这个计算机算法的时候,总要选择一些情节,随便什么情节,来试用模拟的效果。所以我们就挑了一个模拟的沙漠战争,参战的......有伊拉克和科威特。现在既然这个模拟战争真打起来了,那么我们这里就多少有点像在现场。有点敏感。对不起。"

我没能看到那场战争模拟。不过,在海湾战争结束了大概一年之后,我发现其实并不只有喷气推进实验室一个地方偶然预演了那场战争。佛罗里达州的美军中央司令部在战前就推演了另外一个更有实用价值的沙漠战模拟。美国政府在战前对科威特战争做了两次模拟,愤世嫉俗者认为,美国政府两次模拟了科威特战争,这描画出它帝国主义的嘴脸,以及蓄谋已久发动科威特战争的欲望。而在我看来,预测性的种种场景,与其说它狠毒,倒还不如说它诡异、离奇以及具有指导性。我用这个实例来勾画预测机制的潜能。

在世界各地,大概有24个操作中心进行着这种以美国为蓝军(也就是主角)的战争游戏。这些地方绝大多数都是军校或者训练中心下属的小部门,比如阿拉巴马州马克斯韦尔空军基地的兵棋推演中心,罗德岛钮波特美国海军军事学院传奇的全局博弈室,或者堪萨斯州莱温沃斯的陆军野战理念部的那个经典的"沙盘"桌面推演装置。而为这些战争游戏提供技术支持以及实用重大知识的,就是一些躲在无数准军事智囊团里面的学术人员或者专业人士,这些智囊团要么沿华盛顿环城路撒布,要么窝藏在如喷气推进实验室、加利福尼亚的劳伦斯·利弗莫尔国家实验室等各个国家实验室角落的研究区夹道里。当然了,这些玩具战争模拟系统,都冠以首字母缩写,比如:tacwar,jess,rsac,saga,最近的一份军事软件的目录上,列出了有大约400种不同的军事游戏或者其他军事模型,而且都是列架销售的。

美国的任何一次军事行动,其神经中枢都会设在佛罗里达州的中央司令部。中央司令部作为五角大楼的一个机构,其存在的目的就是像猎鹰一样替美国国会和美国人民紧盯住一个主要的战局,即蓝军对红军这个超级大国之间的游戏,而其中唯一配做美国对手的是苏联。20世纪80年代,诺曼·施瓦茨科夫将军到任的时候,却并不接受这种观点。施瓦夫茨科夫----一位有思想的将军,提出了一种新的看法,而他用来表达这个新看法的那句话,在全军上下广为流传:"苏联狗不出猎。"于是,施瓦夫茨科夫将他的作战计划制定者们的注意力引向替代战局上。而高居榜单前列的,就是伊拉克边境沿线的中东沙漠战争。

1989年初,中央司令部的一位官员,加里·威尔,开始以施瓦茨科夫的直觉为基础建立战争模型。他和一组军事未来学家一起搜集整理数据,以便能够创造出一个模拟的沙漠战争。这一模拟的代号是"内视行动"。

任何模拟都只能做到与它们的基础数据一样强,而威尔希望"内视行动"能尽可能地贴近现实。这意味着,要收集当下驻中东部队的近十万的细节数据。这部分工作,绝大多数都极度沉闷乏味。战争模拟需要知道部署在中东的车辆数目,食物和燃料的物资储存量,武器的杀伤力,气候条件,等等。而这些细枝末节的东西,绝大部分都没有现成的,甚至军方都不容易弄到。所有这些信息都处在持续不断的变化之中。

一旦威尔的团队形成军队组织的方案,战事推演员就会编制整个海湾地区的光碟地图。而这个模拟沙漠战的基础----这块疆域本身,则是从最新的卫星数字照片中转过来的。等这个工作结束之后,战争游戏的玩家就会把科威特、沙特这些国家的地形压缩到cd上。这时他们就可以把这些数据输入tacwar这个计算机战争游戏主体模拟程序里。

威尔是从1990年初开始在虚拟的科威特和沙特战场上进行沙漠战争的。7月,在佛罗里达州北部的一个会议室里,加里·威尔向他的上级概述了"内视行动"的各种成果。他们审看了这样的一种局势:伊拉克入侵沙特,然后美国/沙特反击。意想不到的是,威尔的模拟恰恰预测了一场为期30天的战争。

就在两周之后,萨达姆·侯赛因突然入侵了科威特。最开始的时候,五角大楼的高层们还根本不知道他们已经拥有了完全可操作的、数据翔实的模拟。只要转动启动钥匙,这个模拟程序就预测无尽的变局下这个地区可能发生的战事。当这个有先见之明的模拟程序的消息传出之后,威尔就像玫瑰般闻着都香。他承认说:"如果等到侵略发动时才开始着手去干的话,那我们就永远都赶不上趟了。"未来,标准的军备条例可能会要求给指挥中心配置一个盒子,里面运转着包括种种可能的战事的并行宇宙,随时发动。

萨达姆入侵之后,战事推演员立刻把"内视"转向运行变化无穷的"真实"局势的模拟。他们的注意力重点集中在一组围绕变量产生的可能性上:"如果萨达姆不断地进攻,事态会怎样?"对预测到的30天内的战事做迭代运算,威尔的电脑只花了大概15分钟的时间。通过在多个方向上运行这些模拟,威尔的团队很快就得出了这样一个结论:空中力量将是这场战争的决定性因素。进一步精确的迭代非常清楚地显示,如果空战打赢了,美国就能取胜。

不仅如此,根据威尔的预测机制得到的结果,如果空中力量确实能够完成分配给他们的任务,那么美国的地面部队就不会有重大的损失。而高级官员对这一结论的理解就是:先行进行精确的空中打击,是美国低伤亡率的关键。加里·威尔说:"在保持我们部队的绝对最小伤亡这方面,施瓦茨科夫非常强硬,以至于低伤亡变成了我们所有分析工作的基准。"

这样一来,预测性的模拟给了军方的指挥团队这样的信心,即美国可以以最小的损失换得战争的胜利。这种信心引领了沉重的空中打击。威尔说:"模拟绝对影响了我们(在中央司令部)的思维。不是说施瓦茨科夫事前对此没有强烈的感受,而是模型给了我们信心去贯彻这些理念。"

作为预测,内视行动确实获得了非常好的成绩。尽管在最初的军力平衡上有些变化,而且空中作战和地面作战的比例方面有一点小的差异,但是模拟出的30天空中与地面的战役与真正发生的战事非常接近。地面战斗基本上是按照预测逐步展开的。和所有不在现场的人一样,模拟人员对施瓦茨科夫在前线那么快就结束了最后一轮的较量感到惊奇。威尔说:"不过,我得告诉你,我们当时并没料到能在100个小时的时间里[在战场上]取得这样的进展。根据我的回忆,我们当时预测的是要用6天的时间来进行地面战,而不是100个小时。地面部队的指挥官曾经跟我们说,他们当时曾经预想行动得会比模拟所得出的结果快。结果他们行动得确实像自己预测的那么快。"

按照这个战争游戏的预测机制的计算,伊拉克人的抵抗会比实际中他们的抵抗要大一些。这是因为,所有的战斗模拟都会假设说敌对方会全力以赴调用他们的所有可用的资源。但是实际上伊拉克根本就没有那么用力。战事推演员曾经厚着脸皮开玩笑说,没有一种模型会把举白旗纳入武器序列。

由于战争进展实在太快,结果这些模拟者再也没时间依次考虑下一步的模拟:以日报模式预报战事的进展。尽管计划者尽可能详细地记录了每天发生的事件,而且他们也可以随时计划到未来,但是,他们还是感觉:"最初的12个小时之后,就不需要天才来推算未来的发展了。"