欢迎光临散文网 会员登陆 & 注册

控制论与科学方法论——第一章 控制和反馈

2023-03-09 19:57 作者:终究是寂寞的  | 我要投稿

第一章 控制和反馈

有始也者,有未始有始也者,有未始有夫未始有始也者。

庄周

 

 

1.1 可能性空间

        一切科学研究都必须有一个出发点。几何学的大厦是建立在公理基础上的,控制论和系统论的研究则开始于可能性空间。

        什么是可能性空间呢?我们先来举一个化学方面的例子。

        很久以来,化学家发现有两种氨基酸分子,它们的化学组成完全相同,不同的是原子的排列方式,化学家分别把它们称为L型和D型旋光异构体。它们的化学性质是相同的,照理说它们都可能组成蛋白质。奇怪的是,人们发现今天地球上所有生物的蛋白质都是由L型氨基酸组成的,这是怎么回事儿呢?原来,D型氨基酸只能与D型氨基酸组成蛋白质,L型也只能与L型组成蛋白质,D型不能与L型组成混合的蛋白质链。同一型氨基酸组成的生物才能形成一个生命系统。

        这样,在生命起源的最初阶段,大自然就面临着一个重要的选择:是选择D型呢还是选择L型?看起来这有点像掷硬币游戏,掷中正面还是掷中反面往往可以决定赌棍的命运。也许,后来发展出生命的那个原始的核蛋白凑巧是L型氨基酸构成的,它通过自我复制和生存竞争,繁衍出了清一色的后代。L型氨基酸具有左旋的光学性质。有人开玩笑地说,上帝在创造生物时单单选中了L型,看来上帝是个左撇子。

        不过这件事给我们一个启发:世界上许多事物并不是从一开始就注定要发展成现在这个样子的,在事物发展的初期,它们往往有多种发展的可能性,由于条件或者纯粹机遇的关系,最终才沿着某一个特定的方向发展下去。既然事物的发展都是从最初的可能性开始的,就不能不使人们对它发生浓厚的兴趣,如果对它作更深一步的研究,可以发现它跟控制论中“控制”这个概念有着密切的关系。

        顾名思义,控制论是关于控制的理论。“用计算机控制宇宙飞船”、“基因控制着遗传”、“这个病人的癌症已经不可控制了”······现在“控制”这个词,已成为人们习以为常的口语了。如果我们仔细地分析各种不同的控制过程,发现虽然“控制宇宙飞船”、“控制遗传”、“控制癌症”的控制对象不同,但作为控制过程,有几点却是它们共有的:

        (1)被控制的对象必须存在着多种发展的可能性。

        如果事物的未来只有一种可能性,就无所谓控制了。比如光在真空中的传播速度是确定的,每秒299793公里,既不会高于这个速度也不会低于这个速度,只有一种可能性。因此人们不会说“控制了光在真空中传播速度”之类的话。某一事物在发展变化中的未来有哪些可能性,是由事物本身决定的。对于鸡蛋,它下一时刻面临的发展可能有鸡蛋、小鸡、碎鸡蛋等几种,而石头面临的可能性就完全不同。

        (2)被控制的对象不仅必须存在多种发展的可能性,而且,人可以在这些可能性中通过一定的手段进行选择,才谈得到控制。

        比如一座火山,它在下一时刻面临着爆发或不爆发两种可能性,但目前人类的能力还不能在这两种可能性中选择。所以,我们也不会说“控制了火山爆发”这样的话。所谓我们不能控制,就是无法选择或不存在选择的余地。

        由此可见,控制的概念与事物发展的可能性密切相关。我们将事物发展变化中面临的各种可能性集合称为这个事物的可能性空间。它是控制论中最基本的概念。

        任何事物,都有它一定的可能性空间,但这仅仅是可能性而已,至于事物具体发展成为可能性空间中哪一个状态,要看条件而定。当事物变到某一状态后,它又面临着新的可能性空间。鸡蛋一旦变成小鸡,它下一时刻面临的就是活鸡、死鸡等可能性了(图1.1)。因此,一个事物发展过程中的可能性空间就像树枝一样向无限远处伸展开去。

         世界上第一个认真考虑过事物可能性空间性质的可能是中国战国时期著名的哲学家杨朱。《列子》里有一个“歧路亡羊”的故事,说有一天杨朱的邻居走失了一只羊,许多人去找也没找回来。杨朱问邻居是怎么回事儿,邻居说:“岔路太多了,而且岔路之中又有岔路,不知道它到底跑到哪条路上去了。”杨朱听了很有感触,终日沉默无言,闷闷不乐。“歧路之中,又有歧焉”,这位哲学家所感叹和研究的,正是事物可能性空间这种重要的展开方式。

        这方面最令人感兴趣的例子便是生物进化。如果我们不否认生命在地球上只起源过一次,我们就得承认所有的物种,包括蚊子、牡丹、企鹅、人类和酵母都有着一个共同的祖先。生命的多样性来自连续不断的进化过程,在这个过程中一个种产生几个后代种。这实际上就是生物发展和适应环境的几种可能性。

        生物学家常常用生命之树(图1.2)来表达生物的进化过程,这种生命之树正是物种在其发展过程中按可能性空间展开的形象体现。

         人们估计现在生存着约五百万到一千万种生物,其中每个种都跟它最近的亲族有显著的差异,每一个种内的千万个成员又有不同的遗传特征,这还不包括地球上曾经生存过但已灭绝的为数更多的物种。生物界众生纷纭变异多端的可能性空间,凭人的想像几乎难以琢磨。研究生物在一定条件下按可能性空间展开的方式,成为群体生物学的中心问题。它回答现有动物、植物、真菌的种类和数量是如何来的,什么力量作用于这些群体使它们保持现状或发生变化,以及对某些物种发展的可能性可以作出哪些预测等等。

 

 

1.2 人通过选择改造世界

        事物的可能性空间为什么总像图1.2那样是树状的,而不会像图1.3那样呈一条直线呢?很明显,这是因为事物面临的可能性空间往往不止一个状态。那为什么事物的可能性空间不止一个状态呢?这是因为事物变化具有“不确定性”。

        不确定性也就是事物的矛盾性。“矛盾”一词来自一个古老的寓言。一个商人夸口说,他的盾十分坚牢,什么东西也戳不穿它。过了一会儿,又吹嘘他的矛说,他的矛是最锋利的,随便什么东西,一戳就穿。有人听了,便接口问他:“如果用你的矛来戳你的盾,结果怎样呢?”这个富有哲理的故事实际上包含了事物不确定性的道理。商人先夸他的盾好,什么东西也戳不穿,就是说事物A只面临着B_%7B1%7D%20(盾不穿),这样一种可能性(图1.4a)。接着他说他的矛什么都能戳穿,也就是A只面临着B_%7B2%7D%20(盾穿)这样一种可能性(图1.4b)。“以子之矛,陷子之盾”的时候,却出现了一种新的情况,A可能发展为B_%7B1%7D%20,也可能发展为B_%7B2%7D%20,具体变到哪一种是有条件的,不能在事先完全确定,这就是事物的不确定性(图1.4c)。那个商人面对着对立的矛盾,却不承认事物的不确定性,把话说得这么死,结果闹了一场笑话。

        事物的矛盾性,使事物的可能性空间至少面临着肯定自身和否定自身两种状态。事物在发展的过程中这样分化是不断进行着的,这样终究要形成“歧路之中,又有歧焉”的结果。

        从不确定性的角度来看待事物的发生和发展,是现代科学和经典决定论的一个重要区别。今天的物理学已不再仅仅处理那些必然发生的事情,而是处理那些最可能发生的事情了。今天的生物学也不再把某个物种的出现看作进化过程中必然的现象,而只把它们理解为可能发生的种族中的一员。这样一种思想从本世纪初统计物理学创立以来已经扎根于科学家的头脑。

        粗看之下它也许并不难于理解,但它确实是本世纪科学思想的一次革命。在经典的牛顿物理学里,宇宙被描述成一个结构严密的确定性机器,一切都是按照某种定律精确地发生的,未来的一切都是由过去的一切严格决定的。科学家意识到矛可能戳穿盾也可能戳不穿盾这个简单的真理,是走过了漫长道路的。

        事物发展的可能性空间,或事物的不确定性,是由事物内部的矛盾决定的。人们根据自己的目的,改变条件,使事物沿着可能性空间内某种确定的方向发展,就形成控制。控制,归根结底是一个在事物可能性空间中进行有方向的选择的过程。我们不难发现,人类从衣、食、住、行到变革自然的实践活动都和选择密切相关,走路是不断选择自己在空间的位置。制造工具是选择各种材料及材料的某种组合。

        现代生产是更复杂更严格的选择过程。有人会问,人制造出自然界原来没有的东西,如人造纤维,这是不是选择过程呢?人类在制造人造纤维时进行的工作也仅仅是选择:选择了自然界本来有的物质(基本原料),选择了适当的温度、压力、催化剂。正是人类选择的条件的结合才制成了自然界不存在的物质—人造纤维。如果没有人的选择作用,这么多条件的适当配合在自然界出现的可能性是极小的。这种纤维的合成,只是原来物质变化的可能性空间的一种。

因此,一切控制过程,实际都是由三个基本环节构成的:

        (1)了解事物面临的可能性空间是什么。如一个人得了病,他可能好转、恶化、死亡。

        (2)在可能性空间中选择某一些状态为目标。如治病的目标是使病情好转。

        (3)控制条件,使事物向既定的目标转化。

        对于一个复杂的过程,事物的可能性空间不仅有许多状态,而且这些状态有复杂的展开方式,影响事物发展的条件也错综复杂。与之相应的选择过程也是复杂的,需要在事物发展的不同阶段控制不同的条件,同时注意各种条件之间的配合和状态的相关作用。

 

 

1.3 控制能力

        最后一个天花病例发生以后,经过两年观察,人们终于在1979年宣布天花病例绝迹了。这种在几个世纪前曾经夺去无数人生命的可怕疾病,可以说已经完全地被人类控制住了。只要世界上几个保留天花病毒的研究机构不把它们逸漏出来,人类将永远保持在“没有天花病人”这样惟一的状态里。可以说这是一个非常理想的控制过程。有人也许会想,一切控制过程如果都像人类控制天花那样完全就好了。可是实际上这是办不到的。

        对于绝大多数控制过程,人们并不是把事物的可能性空间精确地缩小到某个惟一的状态,而只是把可能性空间缩小到一定的范围就达到控制的目的了。如果任何控制过程都想以某个惟一状态为目标,不但没有必要,而且还会使控制失灵。我国古代有一个寓言,深刻地说明了控制过程的这个重要特征。

        有一个人看见猎人用网捕鸟,觉得很有趣。他研究了半天,发现最后把鸟卡住的不是整张网,而是一个小网眼,这使他非常惊奇,他想既然最后把鸟卡住的只是一个小网眼,那为什么还需要一张大网呢?他决定发明一种新的工具去捕鸟。他用绳子做了一个小圆圈,用它来代替网。结果当然一只鸟儿也没抓住。为什么呢?

         道理非常简单,把鸟儿网住,这是一个控制过程,我们最后是把鸟儿控制到可能性空间S(网)之中,S是一个比较大的范围,包括A、B、C······许多网眼(图1.5),鸟儿随便在S内的任何一个状态,对猎人来说都算完成了控制。而那个聪明人想一下子把鸟儿控制到一个网眼这样惟一的状态里,结果反而失败了。

        任何恒温箱都只能把温度控制在一个目标值附近的小区间内。虽然在这个区间温度每一时刻有一个特定的值,但是这个值究竟是多少并不是我们事先确定的,只要温度值在确定的区间之内,就算实行了控制。同样的道理,任何机械加工都必须规定出一定的误差范围。

        不过,我们可以肯定,每实行一次控制后,事物发展的可能性空间缩小了。可能性空间缩得越小,标志着我们的控制能力越强。射手用步枪打靶,实际上是他用步枪对子弹飞出去的位置实行某种控制。射击前,子弹运动的可能性空间很大。一个命中8环的射手比命中5环的优秀,因为他能将子弹控制到一个比较小的范围。命中10环的射手控制能力最强,因为他将子弹的可能性空间缩小到几乎是一个点的范围。在射击这种控制中,我们用环数来表示射手水平的高低。实际上,环数也是控制能力的一种表示方法。

        我们知道,有精确到0.1克、0.01克、0.001克、0.0001克的各种天平。所谓天平精确到0.1克,就是说0.1克以后的各位数字,这天平是不能确定的。精确到0.0001克的天平,它就能把可能性空间缩小到小数点后面4位。它的控制能力要比前者大得多。这里,天平的精确度,就是天平控制能力的一种表示方法。

        又比如吃饭过程,一个刚刚会拿勺子的小孩往往把勺子送到下巴、面颊上,弄得满脸满桌都是饭。勺子运动的可能性空间大,我们就说这个小孩对勺子的控制能力小。

        更一般地,我们把实行控制前后的可能性空间之比称为控制能力。如果某一事物的可能性空间为M,实行控制后,可能性空间缩小为m,那么控制能力就是M/m。如果可能性空间状态为无限多,并且互相连续,我们可以用面积大小的比例来表示它(图1.6)。

         控制能力这个概念很重要。我们所使用的一切工具实际上都只有一定的控制能力,因此在使用工具之前我们往往需要根据它的控制能力来判断是否能达到预定的控制目的。如果超过了每次使用工具的控制能力,无论我们怎样改变操作方法,都不会达到控制目的的。猎人用网来捕鸟,那个聪明人用一个小圆圈来捕鸟,相比之下,猎人只要把鸟儿控制到一个范围较大的空间就行了。也就是说,猎人要达到控制目的,需要的控制能力比那个聪明人小,因此猎人比那个聪明人更有成功的可能。

        有一个智力游戏,问怎样用一架天平称出12个乒乓球中惟一的然而轻重未知的废品,只许称3次。怎么称呢?2次行不行?4次有没有必要?我们用控制能力来分析,这个问题就变得很简单。

        首先我们要确定废品存在的可能性空间有多大。一共有12个球。未称之前,每个球都可能是废品,每一个球都可能是轻或重两个状态中的一个。因此,总的可能性空间大小是12x2=24个状态。

        其次,既然我们最终要决定哪个球是废品,那也就是经过控制后废品的状态必须是惟一的,因此整个控制过程要求的控制能力24/1=24。

        再来看看我们的选择工具天平每一次的控制能力有多大。天平每称一次的可能状态有3个:左边重,右边重,水平。这3个状态的含意不同,每称一次,天平的可能性空间缩小到原来的1/3,因此天平每称一次的控制能力为3。称3次的总控制能力为3x3x3=27。27>24,这样,我们就用控制能力这个计算方法证明称3次是可以解决问题的。但是具体把称法搞出来,还要进一步分析。

        设第一次称x个球,留下y个球,如果天平是平的,那废品一定在y个球中,还有两次要称出就必须有:

%E2%80%8B2y%2F9%E2%89%A41         (1)

        如果天平不平,那么废品一定在x个球中,但已知其中x/2个不会是轻的,x/2个不会是重的,所以可能性空间为x。还有两次要称出就必须有:

x%2F9%E2%89%A41            (2)

x%2By%3D12       (3)

        解方程组(1)、(2)、(3),得x=8,y=4。用同样的方法可获得第二次、第三次的具体称法,从而完全解决12个乒乓球的问题。

        现在我们可以把问题稍微引申一下:如果乒乓球不是12个而是13个或14个,这个问题还可解吗?

        13个球的可能性空间是26,因为26/27<1,所以看来也是可解的。但在进一步分析时我们就发现像前面那样的方程组在这儿是无解了。这是否意味着13个球是称不出的呢?

        回头来仔细想想,题目要求我们的仅仅是找出废品,而不一定要完全弄清废品的轻重,因此我们可以利用这种情况。方程组便变为:

        得x=8,y=5。继续使用这个方法,就可以确定13个乒乓球的问题是能解的。若是14个球,可能性空间是14x2=28,而28/27>1,因此不能称出。

        当然,用天平称球的问题人们常常只把它看作一种数学游戏,很少从控制能力这个角度来分析问题。实际上,我们用一定精度的仪器来观察客体,或者用某种工具来控制客体,在什么条件下我们选择什么样的仪器、工具的组合才最有利于达到我们的目的,这个问题本质上跟上面那个数学游戏是一致的。有兴趣的读者一定会找到许多其他可以用估计控制能力的方法来解决问题的例子。

        讨论了有关控制的一些基本概念之后,我们再来研究一下控制的方法问题。人们在工作中采用各种方法来达到自己的目的,其中有一些方法人们经常采用,它们虽然简单,却又是基本的控制艺术,如随机控制、有记忆的控制、共轭控制、负反馈控制等。它们是一切复杂控制方法的基础。

 

 

1.4 随机控制

        世界上最省事的方法莫过于碰运气了。我们如果遇到一件棘手的事情,又想不出其他办法来解决,山穷水尽疑无路的时候,常常硬着头皮说:“那么,就碰碰运气吧。”把碰运气也称为一种方法,很多人或许会感到勉强。不过科学家可不这么看,也许是由于科学家经常跟棘手的难题打交道的缘故吧,他们对碰运气这种方法挺感兴趣,不但认真地对它进行了研究,而且还给它取了个雅号,叫“随机控制”。

        我们已经讨论过,控制就是可能性空间的缩小。随机控制也是可能性空间缩小的过程,不过它有一个特点,就是在随机控制过程中,系统的可能性空间只有在达到目标值时才缩小,不达到目标值时,可能性空间不缩小。

        例如,操场上许多孩子在自由地活动,杂乱无章地跑来跑去,如果我们找其中的一个孩子就只好一个一个地碰,直到碰上那个孩子为止。显然,这中间的每一次选择,如果出现的结果不是所需要的目标,那么控制仅仅表现在否决结果,把选择继续下去。一旦选择的结果是目标,就停止选择,结束控制。随机控制方法也称为寻找或探索,可用图1.7表示。

         设可能性空间是a、b、c、d4个状态,目标是c。第一次选择的结果是a,因a≠c,所以否定a,第二次选择的可能性空间是a、b、c、d。如果选中了c,就肯定结果,如果选中了a、b、d,就否定结果,继续选下去。

        随机控制的应用非常广泛,效果又很直观。人们遇到棘手的科学问题时,即使对解决问题所必需的条件完全不了解,对于对象的性质一无所知,仍然可以采用随机控制的方法来找到问题的答案。比如我们要进一个上了锁的房间,手里有一大串钥匙,但不知道其中哪一把钥匙能把锁打开。人们所采用的最通常的方法就是“一个一个地试试看”,不行就换一把钥匙,直到把锁打开。

        因此在科学发展的某些阶段,尤其当人们对某一个领域的研究刚刚开始,还不能用其他方法来控制对象时,随机控制往往就成为人们惟一可以采用的方法。

        远古的时候,人们没有任何科学知识,没有仪器,对疾病的本质和药物的性质都一无所知,我们的祖先是如何对付疾病的呢?据《淮南子·修务训》记载:“神农······尝百草之滋味,水泉之甘苦,令民知所避就。当此之时,一日而遇七十毒。”这个记录生动地反映了蒙昧初开之际我们远古的祖先采用随机控制法与疾病作斗争的史实。

        这个记录告诉我们,药物对人体的作用,祖先们是从开始了解的。也就是说,人得了病,就用各种树皮草根、水泉矿石来试着服用。吃吃这种,没有用,吃吃那种,也没有用,吃吃另外一种,好了。这样就形成了控制,并开始了对药物治疗作用的了解。我们的中国医药学,就是在随机控制积累了无数数据的基础上发展起来的。

        随机控制在现代科学中也有很多用途。生命起源的问题始终是个谜。我们知道,生命的基础是蛋白质,而蛋白质又是由氨基酸组成,在生命起源之前,氨基酸又是怎样出现的呢?是不是由于一种神秘的外力呢?要回答这个问题,必须提出有力的证据,证明在一定的条件下,氨基酸能从简单的无机物合成出来。

        20世纪50年代,米勒运用随机控制巧妙地解决了这个问题。他用甲烷、氨、氢和水蒸气组成一种混合气体,放进容器中,然后连续通以电火花,模拟了一个有生物前的地球环境。这样,各种无机物在容器中就开始了随机组合。经过8天时间,终于在这个无机的体系中得到5种构成蛋白质的重要氨基酸:甘氨酸、谷氨酸、丙氨酸、天门冬氨酸和丝氨酸。此后,运用同一控制原理,人们在电火花、紫外线、X射线或其他高能粒子束的参与下得到了更多的氨基酸以及组成核苷酸的嘌呤、嘧啶等物质。这些实验证明了原始地球发生氨基酸的可能性。

        如果随机控制的对象可能性空间很大,就有一个选择速度的问题。我们手里的那串钥匙如果只有3把,都试一遍也不费什么事。如果有10把,就比较讨厌了。如果这串钥匙有一万把,我们就可能没有耐心把钥匙试一遍,除非每试一把的速度相当快,否则多数人情愿把锁撬开了进门。不过这件事如果交给电子计算机去干,就会干得非常漂亮。电子计算机不但有耐心去做那些最单调最没有乐趣的随机选择工作,而且选择的速度还相当地快。

        电子计算机可以在极短的时间内从几万个方案里选中一个最合适的方案,可以从几十万本图书里立即找到你所要索取的那本图书。为了破案,公安人员常常要核对指纹,这是件细心的活儿,很费时间,有些国家的警方用电子计算机存储了成百上千万种指纹,需要核对时,就交给电子计算机处理,用不了多少时间就可以从几百万个人里把有作案嫌疑的人找出来。因此尽管问题面临的可能性空间很大,只要选择速度快,随机控制还是相当有效的。由于随机控制在很大程度上要依赖选择速度,提高逻辑运算的速度就成为电子计算机的一个重要指标,目前最快的巨型机已达每秒1.5亿次到2.0亿次。

        除了速度问题,随机控制还要注意什么呢?显然,要随机控制有效,目标必须包括在探索的范围之内。也就是说,对事物面临的可能性空间必须有充分的估计。如果开锁的钥匙不在我们手上这一串之内,我们再试也是白搭。这看来是再明确也没有了,但在处理实际问题时往往被人忽略。

        有一个故事,说父子俩拿着几根竹竿去钓鱼,可是出城门的时候就遇到了麻烦。父亲把竹竿竖起来,竹竿比城门高,出不去。把竹竿横过来,竹竿比城门宽,也出不去。怎么办呢?最后还是儿子想出了一个办法,他爬到城楼上,把竹竿一根一根从城墙上面递过去,这才出了城门。做父亲的高兴得不得了,连连称道儿子聪明。这个故事就是挖苦人们在随机控制时最容易犯的那种错误。竖起来不行,横着也不行,恰恰就忽略了把竹竿直过来顺着城门送出去的可能性。如果父子俩在城门下好好考虑一下扩大随机控制的探索范围问题,就用不着爬上城楼了。

        19世纪末,瑞典发明家拉瓦尔在研究改进蒸汽轮机工作时,碰到了看来几乎无法克服的困难。轮机的转速快得惊人,这样快的速度要求非常精确地保持转轮的平衡,对轴的要求是很严格的。为了达到这个目的,应采取什么办法呢?他认为,轴越硬,越粗,就越不易变形,就越好。至于要什么样的材料,需要随机控制来加以选择。这时,选择的可能性空间是:“各种金属杆,各种硬度大的金属杆”。选择目标是:“使轮子保持平衡的轴。”

        拉瓦尔试验了很多次,但是他发现,无论用多么硬的轴,随着转速增加,机器逐渐发生振动,轴总要变形。最后,他知道再增加轴的硬度是不行了。他决定采用相反的方法,将一个笨重的木盘子装在一根藤条上转动。他惊讶地发现,有弹性的软轴在高速转动中能自然地保持平衡,这对他的设计思想是一个很大的震动。有什么理由认为越硬的轴越好呢?这是由常识造成的一种偏见,正是这种偏见,使最初的探索范围遗漏了一部分重要的可能性空间。

        因此,在随机控制中,不断地扩大和改变探索范围是很重要的。许多大理论家、大发明家之所以高人一等,往往在于甩开了世俗的偏见,在一般人想不到的领域创出了奇迹。

 

 

1.5 有记忆的控制

        随机控制的缺点是如果碰得不巧,要花费很长时间才能碰上目标。这样我们就面临着改进随机控制的问题。一个常用的办法是加一个记忆装置,使随机控制成为有记忆的。

        所谓一个选择者具有记忆力,就是指,凡被证明不是目标的状态就不再当作选择对象了,这些状态将从下一个可能性空间中排除出去。与无记忆的控制比较,有记忆控制的可能性空间在到达目标值之前是随着选择次数逐一缩小的。很明显,这就提高了控制的效率,可以较迅速地找到目标。

        例如一个人要找一封信,他一个抽屉一个抽屉地翻,直到找到这封信他才会停止自己的行动。一个粗心的人会把同一个抽屉来回翻几次,这相当于前面说的随机控制。但如果是一个细心的人,凡是翻过的抽屉他都记得,不再翻了,这样,他的寻找范围就可以逐步缩小,比较快地达到目标。这个过程可以用图1.8表示出来。

        还是假定可能性空间为a、b、c、d四个状态,目标为c。第一次选择结果是a,a≠c,所以否定a。第二次可能性空间为b、c、d,如果选择b,那么第三次可能性空间是c、d。因为a、b已证明不是目标,把它们从以后的可能性空间中排除了,这样最多只要4次选择,就可以找到目标了。而图1.7那种无记忆的控制,最长的选择链是很长很长的。

        有记忆的选择值得注意的是千万别记错,如果碰到了目标,没有认清楚,就轻易地把它否定掉,并将这种否定记忆在脑子里,就使目标不在选择范围中了。这样会落入陷阱,这是记忆控制中常犯的错误。

        无论随机控制还是有记忆的控制,都必须注意事物发展的可能性空间本身是否存在着陷阱。在探索过程中,必须记住这些陷阱,避开这些陷阱。比如致病人死的药是无论如何不能用的,因为一旦进入“死”这个状态,可能性空间就永远停留在这个状态,再也不能被我们控制了。更明确一点讲,在随机控制中,那些可能削弱我们控制能力的状态是不应该最先尝试的。有时候,这些陷阱是由控制手段造成的。

        例如我们要从一种溶液中把两种金属分别提纯出来,溶液中一种金属离子含量很大,另一种含量很小。一般的方法是加一种物质,使金属离子产生特定的沉淀。但是先沉淀溶液中含量大的成分好呢,还是先沉淀含量小的好?初看起来,这无关紧要,实际却有讲究。如果先沉淀含量大的那种金属离子,生成的沉淀量很大,就可能把含量小的金属离子吸附在自己身上带下来。这样,第二次沉淀时,溶液中我们要选择的对象已经部分失去了。

        也就是说,有时选择方法和选择得到的结果之间会发生相互作用,以致影响以后的选择余地。因此我们要适当地考虑控制的顺序。

 

 

1.6 共轭控制

        人和猿的一个基本区别是人能够制造并使用工具。通过工具,人们可以完成许多直接用双手不能完成的工作,人的控制范围扩大了。一件工具发明出来,开始的时候它的使用范围也是有限的,人们为了完成更复杂的工作,又得研究使用工具的方法以及使用工具的工具。人类在自己历史的每一个阶段,总要面临一大堆在当时拥有的控制手段无法直接完成而又需要完成的工作,也就是扩大自己的控制范围的问题。

        当人们要扩大控制范围的时候,通常要用到一种叫共轭控制的方法。这种方法并不涉及某一具体的工具的发明,但却包含了一切工具的控制原理。它专门研究如何将一件人们无法完成的工作变成能够完成的工作。说起来有人也许觉得有点奇怪,其实这种方法我们几乎每天都在接触,有时候连小孩子也懂得运用。好了,让我们先讲一个关于小孩子的故事吧。

        三国时候,有人送了一头大象给曹操。曹操想知道大象有多重。可是当时还没有那么大的秤可以称象。他召集了群臣来问,满朝文武竟没有一个能想得出办法来。这时有一个叫曹冲的小孩,倒想出了一个主意。他建议把象引到一只大船上,在船上刻下吃水深浅的记号,再把大象换成石块,也使船沉到同一个吃水线上,只要称一下石块的重量就是大象的体重了。曹操和大臣们听了大吃一惊,想不到一个五六岁的小孩会有这么高明的方法。曹冲的这个方法实际上就是用了共轭控制的方法。

        我们来分析一下。要直接称出大象是人们办不到的事,但一块块石头的重量却是可以称出来的。

        1、曹冲用大船的沉浮先把象的重量变换成石头重量,我们把这一步变换过程用L表示;

        2、接着再称出石头的重量,这一步用A表示;

        3、最后又将石头的重量变换成大象的重量。这一步跟L交换恰好相反,我们用L%5E-%201表示。

        三步连起来可以写成L%5E-%201AL,它表示先实行L,再实行A,最后实行L%5E-%201。这样就把大象重量称出来了。

        数学上一般把L%5E-%201AL称作A过程的共轭过程。我们将L%5E-%201AL称为与A共轭的控制方法,它通过L变换和L%5E-%201变换,把我们原来不能控制的事变为我们可以控制的A过程去完成。A的控制范围在施行了LL%5E-%201变换后扩大了。

        这个L%5E-%201AL过程虽然简单,但它的运用极其广泛。比如为了使两种固体粉末能够完全进行化学反应,在实验室中,常常要把它们混合均匀。但无论我们怎样把两种固体放在一起搅拌或研磨,都做不到混合至分子水平的均匀地步。怎么办呢?我们知道如果是两种溶液,不难把它们充分混匀到分子水平。只要将它们倒在一起,加以搅拌,利用分子的运动和扩散就混匀了。我们设:

        A——控制液体混匀的方法,

        L——将固体溶于某种液体,

        L%5E-%201——L的反变换,将溶液蒸干。

        这样一个L%5E-%201AL过程就使混合液体的方法扩大了控制范围,可用于混匀固体。

        可以说,几乎人类制造和使用的一切工具,本质上都包含有这样一个控制范围扩大的过程。最简单的杠杆中,LL%5E-%201是通过一根有支点的棍子来实现的。现代化的自动控制设备,LL%5E-%201分别有自己的专有名称。L通常称为感受器,L%5E-%201通常称为效应器。感受器和效应器是怎样工作的呢?例如控制对象为某一生产过程,人坐在操作台上按电钮控制生产。人按电钮就是在进行选择,这个选择过程用A表示(图1.9)。

为了使这个选择能控制生产,必须有两套装置。

        第一种装置把反映生产过程进行状况的各因素,如温度、压力、流速等等变成电脉冲形式,并用仪表显示出来,这就是L。人通过按电钮控制了这些电脉冲,在各种可能之中进行选择。

        第二套装置是L变换的反变换,把电脉冲变成生产过程中各种控制因素,这就是L%5E-%201。通过这样的L%5E-%201AL过程,我们控制了生产。

        任何感受器和效应器的关系在本质上都能从L%5E-%201AL的关系中得到说明。人类使用共轭控制的方法还可以追溯到数字和语言的起源。处于原始社会的人类,想到可以用小石头来计算动物。从动物变换为小石头,又从小石头变换为数的概念,人类学用抽象思维来代替形象思维。如今人们已经完全习惯于同抽象的数字打交道,不论是天上的星星,世界的人口或者原子的数目,以致我们已经难于理解把一切变换成数字来运算是怎样一个巨大的进步。同样,人类只有在把思想变换成语言和符号来交流和思维以后,才真正使大脑发达起来,成为一个有文明的物种。

        甚至在我们人体内部,也存在着这样一个由共轭变换构成的控制系统。我们的感官,比如眼睛就是一个感受器,我们的四肢,比如手就是一个效应器。我们的眼睛不断把外界对象的状态变换成生物电脉冲送到大脑中去,大脑经过信息加工后,再由手执行相反的变换,把生物电脉冲信号变成对外界对象状态的控制。

        共轭控制揭示了人类使用工具过程的本质。也许有人会问,把使用工具这么一件直观的事情表述成那样复杂的一种结构,有什么意义呢?其意义在于运用控制论方法后,就可以用数学语言来确切地描述这一过程了,并且可以把很多数学上关于共轭控制的成果运用到制造和使用工具的研究中去,得出许多凭直观想像不到的结论来。

 

 

1.7 负反馈调节

        如果我们选择了某一目标,但我们所具备的控制方法达不到所需要的控制能力又怎么办呢?例如我们向月球发射一枚火箭,火箭要击中38万公里远的月球,这就好像在10公里外用步枪瞄准一只苍蝇的眼睛一样困难。有人会以为火箭里一定装有一个非常精确的瞄准器,发射之前一定按照算好的提前量对准月球发射的,就像步枪打飞鸟那样。其实这完全办不到。火箭在运动中要飞越38万公里的路程,有许多干扰根本无法事先估计到。发射前把轨道算得再精确,把发射方向控制得再准也不行。也就是说,仅仅依靠发射时控制方向是完全达不到这么大控制能力的。那么我们是不是就束手无策了呢?当然不是。我们有一些非常巧妙的方法来增强我们的控制能力。不过要解决这个问题还要先从“负反馈”这个概念谈起。

        二次大战前后,随着科学技术的发展,飞机的速度越来越快,性能越来越好,用老式高射炮来击落飞机也就越来越困难了。人们发现,无论怎样提高高射炮的准确性,总是有限的。飞机飞行的轨道因驾驶员动作的随机性几乎是不能预先求出的,经典的思想方法暴露出一些根本的缺点。

        其实,这一类被工程师视为极困难的问题我们可以从自然界不少动物身上找到答案。鹰击长空,不但能准确地扑到固定目标,甚至连飞速躲避的兔子、老鼠也不能逃脱。显然,鹰没有也不可能事先计算自己和目标的运动方程。鹰不是按照事先计算好的路线飞行的。鹰发现兔子后,马上用眼睛估计一下它和兔子的大致距离和相对位置,然后选择一个大致的方向向兔子飞去。在这个过程中它的眼睛一直盯着兔子,不断向大脑报告自己的位置跟兔子之间差距。不管兔子怎么跑,大脑作出的决定都是为了缩小自己跟兔子位置的差距。这种决定通过翅膀来执行,随时改变着鹰的飞行方向和速度,调整鹰的位置,使差距越来越小,直到这个差距为零时,鹰的爪子就够着兔子了。

         我们来仔细分析一下这个过程。实际上这个控制系统主要由眼睛、大脑和翅膀三部分组成(图1.10),眼睛在盯住兔子的同时,也注意到了自己的位置,并把这两者作一个比较,图1.10中的—是一个比较符合。经过比较以后的信号代表鹰的位置跟兔子位置的差距,通常称为目标差,眼睛主要是接收这种目标差信息,并把它传递到大脑。大脑指挥着翅膀改变鹰的位置,使鹰向目标差减小的方向运动,这个控制重复进行,就构成了鹰抓兔子的连续动作。这里最关键的一点是大脑的决定始终使鹰的位置向减小目标差的方向改变,控制论中把这类控制过程称为负反馈调节。

        负反馈调节的本质在于设计了一个目标差不断减少的过程,通过系统不断把自己控制后果与目标作比较,使得目标差在一次一次控制中慢慢减少,最后达到控制的目的。因此,作为一般的负反馈调节机制必定要有两个环节:

        (1)系统一旦出现目标差,便自动出现某种减少目标差的反应。

        (2)减少目标差的调节要一次一次地发挥作用,使得对目标的逼近能积累起来。

        这两个条件如果不完全满足,就不能算完善的负反馈调节。比如一般输电线路中的保险装置,如果电流值增大到某个限度,偏离控制目标,保险丝熔断,使供电中断。高压锅的压力过分偏离所允许的限度,锅盖上的合金塞熔开放气,这些都是出现目标差时系统减少目标差的调节机制。但它们都不是完全的负反馈调节,因为它不满足第二个条件,目标差的减少不能通过一次一次调节积累起来。这一类半反馈调节在控制中广泛应用,但它们都不如负反馈调节来得完备和精确。

 

 

1.8 负反馈如何扩大了控制能力

        现在我们回到那个控制能力扩大的问题上来。看看导弹和火箭专家是怎样从老鹰抓兔子那里得到启示的。

        我们先把鹰的动作看成一系列俯冲的连续,每一次向目标的俯冲可以看作对自己位置的控制。鹰的控制能力是有限的,它不能一次到达目标,只能逐步向目标接近。我们把鹰位置的可能性空间表示为平面上的点(图1.11)。目标(兔子的位置)用m表示。

        鹰的第一次俯冲使位置的可能性空间由A缩小到B。这时鹰的控制能力为%5Cfrac%7BA%7D%7BB%7D%20。如果鹰只作这一次飞行,那么它跟炮弹没什么两样,控制能力不大,只能处在B范围内某一点,不能抓到兔子。如果在第一次俯冲后,马上进行第二次,将可能性空间再次缩小,由B到C,第二次俯冲的控制能力就是%5Cfrac%7BB%7D%7BC%7D%20。这样两次俯冲的控制能力就是%5Cfrac%7BA%7D%7BB%7D%20%5Ccdot%20%5Cfrac%7BB%7D%7BC%7D%20%3D%5Cfrac%7BA%7D%7BC%7D%20,即通过反馈,鹰扩大了自己的控制能力。如此第三次、第四次······不断地反馈选择下去,鹰的总控制能力为%5Cfrac%7BA%7D%7BB%7D%20%5Ccdot%20%5Cfrac%7BB%7D%7BC%7D%5Ccdot%20%5Cfrac%7BC%7D%7BD%7D%20%5Ccdot%20%5Ccdot%20%5Ccdot%20%20%5Cfrac%7Bx%7D%7Bm%7D%3D%5Cfrac%7BA%7D%7Bm%7D%20

        由于目标差每控制一次都在缩小,即:%5Cfrac%7BA%7D%7BB%7D%20%EF%BC%8C%20%5Cfrac%7BB%7D%7BC%7D%5C%20%EF%BC%8C%5Ccdot%20%5Ccdot%20%5Ccdot%20%EF%BC%8C%20%5Cfrac%7Bx%7D%7Bm%7D都大于1,这样%5Cfrac%7BA%7D%7Bm%7D%20就比%5Cfrac%7BA%7D%7BB%7D%20%EF%BC%8C%20%5Cfrac%7BB%7D%7BC%7D%5C%20%EF%BC%8C%5Ccdot%20%5Ccdot%20%5Ccdot%20%EF%BC%8C%20%5Cfrac%7Bx%7D%7Bm%7D中任一个都大得多。也就是说,通过负反馈,系统的控制能力是积累起来了。这样通过有限次的俯冲,可能性空间就由A缩小到m,老鹰终于抓着兔子了。当然,实际上老鹰的各次俯冲动作是连续的,在飞速运动中看来就像一下子往兔子身上扑过去似的。

        老鹰所使用的这套抓兔子的办法现在被人们用来控制导弹打飞机。工程师们给导弹安上了眼睛——红外线寻的装置,配上大脑——电子计算机,同时给它一付可以调节的翅膀——姿态控制装置。这样导弹就可以向着不断减少目标差的方向运动,直到把飞机击落。当然,把火箭发射到月球上去也采用了这样的办法。

        显然,负反馈控制之所以应用如此广泛,如此有效,就是因为它可以把某种有限的控制能力累积起来,扩大了控制能力。每一次反馈,实际都是将上一次作为输出的可能性空间作为输,让控制机构在这个已被缩小了的范围内进行新的选择。

        用通常的话来说,负反馈调节就是“做起来看”。实际上我们要做一件没有做过的复杂事情,总不能事先把一切都安排得周周到到的。客观事物总是在不断变化着,意外的情况随时可能发生,即使我们事先考虑得再周密,也会遇到一些不可预测的麻烦来干扰我们。因此最好的办法是干起来再说。一边干一边观察,随时修正自己的行动和方法,采取一步一步的办法逼近目标。

        居里夫妇发现镭的过程就是一个很好的例子。居里夫妇发现在沥青铀矿中含有一种新元素,具有极强的放射性,除此之外,对这种未知元素的性质一无所知。怎么把它从沥青铀矿中提炼出来呢?当时,居里夫妇考虑既然这种元素的放射性比铀大得多,那么只要找到一种方法处理沥青铀矿,使得处理后的放射性比以前更强烈,新元素就一定是在富集。这实际上就是一个负反馈过程,控制着整个提纯过程向放射性提高的方向进行(图1.12)。

        就这样,运用反馈控制,经过几年的努力,他们把一次一次实验的控制能力积累起来,达到了一次实验看起来是不可能控制的结果,终于从以吨计的沥青铀矿中提出了1克新元素——镭。

        在教学工作中,老师怎样控制自己讲课的过程以达到比较理想的状态呢?这里,有经验的教师也是利用负反馈来扩大自己控制能力的。教师讲课,向学生传递各种信息的同时,也必须开辟另一条信息通道,取得学生接受知识情况的信息。在课堂上有经验的教师都十分注意观察学生的眼色,判断他们听懂了没有,分析他们的心理活动,或者采取提问的方式,直截了当地进行试探。课外批改同学的作业以及适当地安排考试也是一些重要的了解学生听课情况的通道。通过这些教学环节,教师就能比较正确地把握自己讲课的深浅和进度了。课讲得太慢就加快些,太深就浅近些,使教学达到比较理想的目标。

        从这些例子我们可以看出,负反馈调节实际上跟目的性这个概念有关。负反馈是一种趋向目的的行为。目的性是生物行为中一个重要方面,对于有意识的人类,目的性更成为社会能动性意识。

        控制论指出,当人的一次控制能力不能达到目的时,可以用负反馈调节放大控制能力。特别对于生物界和有机体,它们的每一次控制能力都很有限,因此,在生物界和人类行为中几乎所有的达到目的的控制过程都运用了负反馈原理。揭示出目的性与负反馈调节的内在联系是很有意义的。

 

 

1.9 正反馈与恶性循环

        负反馈是目标减少的过程,自然界有没有相反的过程,即目标差不断增大的过程呢?有的,这就是正反馈。

        晋朝时有两个人在一起对诗,对诗规则是说一件危险的事,说得越危险越好。第一个人说了句:“矛头淅米剑头炊”。要在刀剑的尖头上淘米烧饭,可是一件危险的事儿。比这危险的该说什么呢?第二个人想了半天,说:“百岁老翁攀枯枝”。一个风烛残年的老头儿去爬枯树,这当然比刀尖上淘米做饭危险。再往下该怎么说呢?第一个人灵机一动说:“盲人骑瞎马,夜半临深池。”这可是绝妙的句子,至今人们还常常引用来形容很危险的事物。可惜这两个人没有按这个规矩继续比赛下去,否则一定会越说越玄乎,说不定会有些更好的句子比出来。这场对诗所规定的原则实际上就是正反馈。

        我们可以把两个有正反馈耦合关系的系统表示为图1.13。

         两个系统的状态分别用带指针的表盘来反映,第I系统的目标是平衡状态,其为0。如果第I系统由于某种原因稍微偏离了目标,那么第II系统所产生的反应是使第I系统下一次的状态更加偏离目标。这样,在互相作用中,它们各自偏离目标越来越远,这样的耦合关系就叫正反馈。

        正反馈使人联想到超级大国之间的军备竞赛,每一方得知对方发明了一种新武器就立即研制一种更厉害的武器来对付。于是,原子弹、氢弹、远程导弹、逆火式轰炸机、多弹头导弹、中子弹······就这样不断地被制造出来,远远偏离了“缓和”这种平衡目标值。

        在电子技术中,正反馈原理被用来放大信号,如最简单的再生回路是把三极管的集电极跟基极耦合起来,集电极电流增大使基极电位偏负,基极电位偏负会使集电极电流更增大,同时使基极电位更偏负,这样的耦合使最初的信号迅速得到放大。

        在许多场合,正反馈现象的名声不太好,人们常常把它叫做恶性循环由于它是一个目标差不断扩大的过程,因此,它往往标志着达到预定目标的控制过程的破坏,即表示一个失去控制的过程。

        医学上单纯的正反馈几乎无一例外地导致疾病,因为人体的健康跟内环境的稳定状态密切相关,而单纯的正反馈会使人体状态离必须控制的稳定状态越来越远。对此中医和西医的理论是一致的。

        例如祖国医学认为脾和心是两个互为反馈的耦合系统,如果脾气虚,食欲不振,运化失职,就使血的来源不足,导致心血虚,产生心悸,健忘,面色不华,脉搏无力等症状。而心血虚又无以滋养于脾,进一步加重脾气虚。心血虚和脾气虚之间这样互相影响,也形成一种正反馈式的恶性循环,导致心脾两虚的征候。治疗时可以采取补脾气或者补心血的办法,也可以采用其他的措施。

        西医病理学认为,在某种病态下,机能代偿失调,病情向严重方向发展,也会造成这种恶性循环。如心力衰竭时,血液输出量减少,动脉血压下降。而冠状动脉血流量减少,心肌营养不足,更使心肌收缩力减弱,相继血液输出量进一步减少,病情会迅速恶化。

        这种正反馈发展到了极端,系统的状态大大超过稳定的平衡状态,就会导致组织的崩溃和事物的爆炸。例如炸药爆炸,我们可以看作化学反应和热量释放之间形成了正反馈耦合。

        负反馈描述目标差减少的调节,而正反馈描述目标差越来越大的过程,从对控制目标的偏离来说,它们正好相反。我们说正反馈差不多都和恶性循环有关,这仅仅是就控制而言的,这决不是指正反馈在所有场合都是“坏”的。我们后面将谈到,对于系统结构的演化,正反馈是极为重要的。并且控制论指出,正反馈和负反馈是可以互相转化的。负反馈搞得不好会变为正反馈,正反馈的失控过程经过适当调整也可以变为负反馈。

        要揭示它们之间的关系和转化条件,我们必须将研究范围从“控制方法”中拓广开去,进一步探讨控制过程的传递、事物间互相作用的方式和整体结构。这就是我们在第二、第三两章要研究的内容:“信息与系统”。



控制论与科学方法论——第一章 控制和反馈的评论 (共 条)

分享到微博请遵守国家法律