原文連結: The 1975 ACM Turing Award Lecture
授獎引言
1975 年的 ACM 圖靈獎於 10 月 20 日在明尼亞波利斯的 ACM 年會上聯合授予 Allen Newell 和 Herbert A. Simon。圖靈獎委員會主席 Bernard A. Galler 在介紹獲獎者時宣讀了以下引文:
「能夠將 ACM 圖靈獎頒發給兩位長期的朋友,來自 Carnegie-Mellon 大學的 Allen Newell 教授和 Herbert A. Simon 教授,是我的榮幸。」
「在長達二十年的共同科學努力中,最初是在 RAND Corporation 與 J.C. Shaw 合作,隨後與 Carnegie-Mellon 大學的眾多教師和學生同事合作,他們在人工智慧、人類認知心理學和列表處理(list processing)方面做出了基礎性貢獻。」
「在人工智慧領域,他們為確立該領域作為科學探索領域做出了貢獻,為啟發式程式設計(heuristic programming)的普遍發展,特別是啟發式搜索(heuristic search)、手段-目的分析(means-ends analysis)和歸納方法(methods of induction)的發展做出了貢獻;提供了這些機制足以解決有趣問題的證明。」
「在心理學領域,他們是人類認知可以用符號系統來描述這一思想的主要倡導者,他們在許多任務領域發展了關於人類問題解決、語言學習和歸納行為的詳細理論,使用體現這些理論的電腦程式來模擬人類行為。」
「他們顯然是列表處理的發明者,並且一直是軟體技術和將電腦視為操縱符號結構的系統而非僅僅是數值數據處理器的概念發展的主要貢獻者。」
「Newell 教授和 Simon 教授獲得此獎項是一種榮譽,但 ACM 能夠將他們的名字加入我們的獲獎者名單也是一種榮譽,因為他們的存在將增加 ACM 圖靈獎的聲望和重要性。」
電腦科學作為實證探究:符號與搜索
Allen Newell and Herbert A. Simon
電腦科學是研究圍繞電腦的現象的學科。本學會的創始人在將自己命名為電腦機械協會 (Association for Computing Machinery) 時非常清楚這一點。機器——不僅僅是硬體,而是經過程式設計的、活生生的機器——是我們研究的有機體。
這是第十次圖靈講座。在我們之前登上這個講台的九位人士呈現了九種不同的電腦科學觀點。對於我們的有機體,機器,可以在許多層次上、從許多方面進行研究。我們今天非常榮幸能在此演講,並提出另一種觀點,這種觀點貫穿了我們因此而被引用的科學工作。我們希望將電腦科學視為實證探究 (empirical inquiry)。
我們的觀點只是眾多觀點之一;之前的講座清楚地說明了這一點。然而,即使將所有講座合在一起,也未能涵蓋我們科學的全部範圍。它的許多基本方面並未在這十個獎項中得到體現。如果有一天,當然不會很快,當羅盤的方位都被標定,當電腦科學的方方面面都被討論過時,那將是重新開始循環的時候。因為作為講座者的兔子必須每年進行一次衝刺,才能追上科學技術發展的烏龜在他穩健前行中累積的微小增量收益。每年都會產生新的差距,需要新的衝刺,因為在科學中沒有最終定論。
電腦科學是一門實證學科。我們本可以稱之為實驗科學,但像天文學、經濟學和地質學一樣,它的一些獨特的觀察和經驗形式並不符合實驗方法的狹隘刻板印象。儘管如此,它們仍然是實驗。每一台建造出來的新機器都是一次實驗。實際建造機器向自然提出了一個問題;我們通過觀察機器的運行並使用所有可用的分析和測量手段來分析它,從而傾聽答案。每一個編寫出來的新程式都是一次實驗。它向自然提出了一個問題,其行為為答案提供了線索。機器和程式都不是黑盒子;它們是經過設計的人造物,包括硬體和軟體,我們可以打開它們並觀察內部。我們可以將它們的結構與其行為聯繫起來,並從單一實驗中吸取許多教訓。我們不必建造 100 個,比如說,定理證明器,來統計證明它未能如預期那樣克服搜索的組合爆炸。根據幾次運行檢查程式就能揭示缺陷,讓我們繼續下一次嘗試。
我們建造電腦和程式的原因有很多。我們建造它們是為了服務社會,作為執行社會經濟任務的工具。但作為基礎科學家,我們建造機器和程式是作為發現新現象和分析我們已知現象的一種方式。社會常常對此感到困惑,認為電腦和程式只應為其經濟用途而建造(或作為導致這種用途的發展序列中的中間項目)。它需要理解圍繞電腦的現象是深刻而模糊的,需要大量的實驗來評估其性質。它需要理解,就像在任何科學中一樣,從這種實驗和理解中獲得的收益以永久獲得新技術的形式回報;正是這些技術將創造工具來幫助社會實現其目標。
然而,我們在這裡的目的不是為了向外部世界尋求理解。而是要檢視我們科學的一個方面,即通過實證探究發展新的基礎理解。最好通過例證來完成。如果我們冒昧地利用這個場合,從我們自己的研究領域中選擇例子,還請見諒。正如將會顯而易見的那樣,這些例子涉及人工智慧的整個發展,尤其是在其早期。它們所依賴的遠不止我們個人的貢獻。即使在我們做出直接貢獻的地方,也是與他人合作完成的。我們的合作者尤其包括 Cliff Shaw,我們在五十年代末那個激動人心的時期與他組成了三人團隊。但我們也與 Carnegie-Mellon 大學的許多同事和學生合作過。
時間只允許舉兩個例子。第一個是符號系統 (symbolic system) 概念的發展。第二個是啟發式搜索 (heuristic search) 概念的發展。這兩個概念對於理解資訊如何被處理以及智慧如何實現都具有深遠的意義。然而,它們遠未窮盡人工智慧的全部範圍,儘管在我們看來,它們對於展示電腦科學這一部分基礎知識的性質很有用。
I. 符號與物理符號系統
電腦科學對知識的基本貢獻之一是在一個相當基礎的層面上解釋了符號 (symbols) 是什麼。這種解釋是關於自然界的一個科學命題。它是經驗性地得出的,經歷了一個漫長而漸進的發展過程。
符號是智慧行動的根源,而智慧行動當然是人工智慧的主要課題。就此而言,這也是所有電腦科學的一個主要問題。因為所有的資訊都是由電腦為達成目的而處理的,我們通過一個系統在面對任務環境提出的變化、困難和複雜性時實現既定目的的能力來衡量其智慧。當完成的任務範圍有限時,電腦科學在實現智慧方面的普遍投入會被掩蓋,因為那時環境中的所有變化都可以被準確預見。當我們將電腦擴展到更全局性、更複雜和知識密集型的任務時——當我們試圖讓它們成為我們的代理,能夠獨自處理自然世界的全部偶然性時,這一點變得更加明顯。
我們對智慧行動的系統需求的理解是逐漸形成的。它是複合的,因為沒有單一的基本事物能在所有表現形式中解釋智慧。沒有「智慧原則」,就像沒有「生命原則」能通過其本質傳達生命的精髓一樣。但缺乏一個簡單的「解圍之神」(deus ex machina) 並不意味著智慧沒有結構性要求。其中一個要求是儲存和操縱符號的能力。要提出科學問題,我們可以借用 Warren McCulloch [1961] 一篇著名論文的標題:什麼是符號,以使智慧可以使用它?什麼是智慧,以使它可以使用符號?
定性結構定律
所有的科學都描述了它們所研究系統的基本性質。這些描述在本質上總是定性的,因為它們設定了可以發展更詳細知識的術語。它們的本質通常可以用非常簡短、非常普遍的陳述來捕捉。人們可能會因為這些普遍定律的有限特異性而判斷它們對一門科學的總貢獻相對較小,但歷史證據表明它們是最重要的成果。
生物學中的細胞學說 (The Cell Doctrine in Biology)。定性結構定律的一個好例子是生物學中的細胞學說,它指出所有生物體的基本組成單位是細胞。細胞有各種各樣的形式,儘管它們都有一個被細胞質包圍的細胞核,整個結構被一層膜包裹。但是這種內部結構在歷史上並不是細胞學說規範的一部分;它是後來通過深入研究發展出來的特異性。細胞學說幾乎完全可以通過我們上面給出的陳述來傳達,再加上一些關於細胞可能大小的模糊概念。然而,這一定律對生物學的影響是巨大的,在它逐漸被接受之前,該領域的無用功相當可觀。
地質學中的板塊構造學說 (Plate Tectonics in Geology)。地質學提供了一個有趣的定性結構定律的例子,之所以有趣,是因為它在過去十年中獲得了認可,所以其地位的提升記憶猶新。板塊構造學說認為,地球表面是由巨大的板塊集合而成——總共大約幾十個——這些板塊相互之間以及相對於彼此移動(以地質速度),進入地球中心,在那裡它們失去了自己的身份。板塊的運動解釋了大陸和海洋的形狀和相對位置,火山和地震活動區域,深海海脊等等。再加上一些關於速度和大小的附加細節,基本理論就已經確定了。當然,直到它成功解釋了許多細節,所有這些細節都相互關聯(例如解釋了西非和南美洲東北部之間植物、動物和地層的一致性),它才被接受。板塊構造學說是高度定性的。既然它已被接受,整個地球似乎到處都為它提供了證據,因為我們是以它的術語來看待世界的。
疾病的細菌理論 (The Germ Theory of Disease)。巴斯德闡述疾病的細菌理論至今僅僅一個多世紀,這是一條定性結構定律,它在醫學領域引發了一場革命。該理論提出,大多數疾病是由微小的單細胞生物在體內的出現和繁殖引起的,而傳染則在於這些生物從一個宿主傳播到另一個宿主。該理論的很大一部分闡述在於識別與特定疾病相關的生物體,描述它們,並追溯它們的生活史。該定律有許多例外——許多疾病並非由細菌引起——這一事實並不減損其重要性。該定律告訴我們要尋找特定種類的原因;它並不堅持我們總能找到它。
原子論 (The Doctrine of Atomism)。原子論為我們剛剛描述的三個定性結構定律提供了一個有趣的對照。正如它從道爾頓及其關於化學物質以固定比例結合的證明工作中出現的那樣,該定律提供了一個典型的定性結構例子:元素由微小的、均勻的粒子組成,不同元素的粒子不同。但是因為基礎的原子種類如此簡單且種類有限,很快就形成了定量理論,這些理論吸收了原始定性假設中的所有一般結構。對於細胞、構造板塊和細菌,結構的多樣性如此之大,以至於基礎的定性原則仍然清晰可辨,其對整個理論的貢獻也清晰可見。
結論 (Conclusion)。定性結構定律在科學中隨處可見。我們一些最偉大的科學發現就屬於它們。正如例子所示,它們常常設定了整個科學運作的術語。
物理符號系統
讓我們回到符號的話題,並定義一個物理符號系統 (physical symbol system)。形容詞「物理的」表示兩個重要特徵:(1) 這類系統顯然遵守物理定律——它們可以由工程組件構成的工程系統來實現;(2) 儘管我們使用術語「符號」預示了我們意圖的解釋,但它並不限於人類符號系統。
物理符號系統由一組實體組成,稱為符號 (symbols),它們是物理模式 (physical patterns),可以作為另一種類型實體——稱為表達式 (expression)(或符號結構 (symbol structure))——的組件出現。因此,一個符號結構由多個符號的實例(或標記 (tokens))以某種物理方式關聯而成(例如一個標記緊鄰另一個標記)。在任何時刻,系統都將包含這些符號結構的集合。除了這些結構,系統還包含一組作用於表達式以產生其他表達式的過程 (processes):創造、修改、複製和銷毀的過程。物理符號系統是一台隨時間產生不斷演變的符號結構集合的機器。這樣的系統存在於一個比這些符號表達式本身更廣闊的對象世界中。
對於表達式、符號和對象的這種結構,有兩個核心概念:指稱 (designation) 和解釋 (interpretation)。
指稱 (Designation)。如果給定一個表達式,系統可以影響對象本身,或者以依賴於該對象的方式行事,那麼該表達式就指稱一個對象。 在這兩種情況下,都已通過表達式獲得了對該對象的訪問權,這是指稱的本質。
解釋 (Interpretation)。如果表達式指稱一個過程,並且給定該表達式,系統可以執行該過程,那麼系統就可以解釋該表達式。 解釋意味著一種特殊的依賴性行動:給定一個表達式,系統可以執行所指示的過程,也就是說,它可以從指稱它們的表達式中喚起並執行自己的過程。
一個能夠進行上述意義上的指稱和解釋的系統,還必須滿足若干額外的完備性和封閉性要求。我們只能簡要提及這些;所有這些要求都很重要,並具有深遠的影響。
(1) 一個符號可以用來指稱任何表達式。也就是說,給定一個符號,它能指稱什麼表達式並非先驗規定的。這種任意性只適用於符號;符號標記及其相互關係決定了一個複雜表達式所指稱的對象。(2) 存在指稱該機器所能進行的每一個過程的表達式。(3) 存在用於創建任何表達式以及以任意方式修改任何表達式的過程。(4) 表達式是穩定的;一旦創建,它們將繼續存在,直到被明確修改或刪除。(5) 系統可以容納的表達式數量基本上是無限的。
我們剛剛定義的這類系統對於電腦科學家來說並不陌生。它與所有通用目的電腦有著強烈的家族相似性。如果將一種符號操作語言,如 LISP,視為定義了一台機器,那麼這種親緣關係就真的如同兄弟一般。我們提出這樣一個系統的意圖並非提出新事物。恰恰相反:它是為了展示目前已知和假設的關於滿足此類特徵的系統的知識。
我們現在可以陳述一個普遍的科學假說——一個關於符號系統的定性結構定律:
物理符號系統假說 (The Physical Symbol System Hypothesis)。物理符號系統擁有一般智慧行動 (general intelligent action) 的必要和充分手段。
所謂「必要」(necessary),我們指的是任何展現一般智慧的系統,經過分析都將證明是一個物理符號系統。所謂「充分」(sufficient),我們指的是任何足夠大的物理符號系統都可以被進一步組織以展現一般智慧。所謂「一般智慧行動」,我們意指與我們在人類行動中看到的相同範圍的智慧:在任何真實情況下,能夠發生適合系統目的並適應環境要求的行為,在一定的速度和複雜性限制內。
物理符號系統假說顯然是一條定性結構定律。它指定了一個通用類別的系統,在這個類別中可以找到那些能夠進行智慧行動的系統。
這是一個經驗性假說 (empirical hypothesis)。我們定義了一類系統;我們希望探究這個類別是否能解釋我們在現實世界中發現的一系列現象。智慧行動在生物世界中隨處可見,主要體現在人類行為中。無論是由人類還是非人類執行,我們都可以通過其效果來識別這種行為形式。這個假說確實可能是錯誤的。智慧行為並非輕易就能產生,以至於任何系統都能隨意展現。事實上,有些人的分析基於哲學或科學理由得出結論認為該假說是錯誤的。從科學角度來看,人們只能通過提出關於自然世界的經驗證據來攻擊或捍衛它。
我們現在需要追溯這個假說的發展歷程,並審視支持它的證據。
符號系統假說的發展
物理符號系統是通用機器 (universal machine) 的一個實例。因此,符號系統假說意味著智慧將通過通用電腦來實現。然而,該假說遠遠超出了通常基於一般物理決定論提出的論點,即任何可實現的計算都可以由通用機器實現,只要它被指定。因為它特別斷言智慧機器是一個符號系統,從而對智慧系統的性質做出了特定的架構斷言。理解這種額外的特異性是如何產生的很重要。
形式邏輯 (Formal Logic)。該假說的根源可以追溯到 Frege 以及 Whitehead 和 Russell 將邏輯形式化的計劃:將數學的基本概念概念捕捉到邏輯中,並將證明和演繹的概念建立在安全的基礎上。這項努力最終形成了數理邏輯——我們熟悉的命題邏輯、一階邏輯和高階邏輯。它發展出一種特有的觀點,常被稱為「符號遊戲」(symbol game)。邏輯,以及通過併入的所有數學,都是根據某些純粹的句法規則,用無意義的標記進行的遊戲。所有的意義都被清除了。人們得到了一個機械的、儘管是寬容的(我們現在會說非確定性的)系統,可以證明關於它的各種事情。因此,進步首先是通過遠離所有看似與意義和人類符號相關的東西而取得的。我們可以稱之為形式符號操縱 (formal symbol manipulation) 的階段。
這種普遍態度在資訊理論的發展中得到了很好的體現。人們一再指出,Shannon 定義的系統僅適用於通信和選擇,與意義無關。人們對將如此通用的名稱「資訊理論」賦予該領域表示遺憾,並試圖將其重新命名為「選擇性資訊理論」——當然,這都是徒勞的。
圖靈機與數位電腦 (Turing Machines and the Digital Computer)。第一代數位電腦和自動機理論的發展,從 Turing 本人在 30 年代的工作開始,可以放在一起討論。它們在對本質的看法上是一致的。讓我們使用 Turing 自己的模型,因為它很好地展示了這些特徵。
圖靈機由兩個記憶體組成:一個無限長的紙帶和一個有限狀態控制器。紙帶儲存數據,即著名的 0 和 1。機器在紙帶上只有一小組基本操作——讀、寫和掃描操作。讀操作不是數據操作,而是根據讀頭下的數據提供到控制狀態的條件分支。正如我們都知道的,這個模型就其能力而言,包含了所有電腦的本質,儘管其他具有不同記憶體和操作的電腦可能以不同的空間和時間要求來執行相同的計算。特別是,圖靈機模型內在地包含了不可計算性的概念和通用機器的概念——即能夠完成任何機器所能完成的任何事情的電腦。
我們應該驚嘆,我們對資訊處理的兩個最深刻的見解是在三十年代,在現代電腦出現之前就已經達成的。這是對 Alan Turing 天才的致敬。這也是對當時數理邏輯發展的致敬,證明了電腦科學對其的深厚淵源。與 Turing 的工作同時出現的是邏輯學家 Emil Post 和(獨立地)Alonzo Church 的工作。他們分別從邏輯系統(Post 產生式和遞迴函數)的獨立概念出發,得出了關於不可判定性(undecidability)和通用性(universality)的類似結果——這些結果很快被證明意味著所有三個系統都是等價的。事實上,所有這些定義最通用資訊處理系統類別的嘗試的趨同,為我們確信我們已經在這些模型中捕捉到了資訊處理的本質提供了一些力量。
在所有這些系統中,表面上看,都沒有符號作為指稱某物的概念。數據被視為僅僅是 0 和 1 的字串——事實上,數據是惰性的對於將計算簡化為物理過程至關重要。有限狀態控制系統一直被視為一個小型控制器,人們玩邏輯遊戲來看可以使用多小的狀態系統而不破壞機器的通用性。據我們所知,從未有過動態地向有限控制器添加新狀態的遊戲——將控制記憶體視為儲存系統大部分知識的地方。在這個階段完成的是解釋原則(principle of interpretation)的一半——表明機器可以根據描述來運行。因此,這是自動形式符號操縱(automatic formal symbol manipulation)的階段。
儲存程式概念 (The Stored Program Concept)。隨著四十年代中期第二代電子計算機(在 Eniac 之後)的發展,出現了儲存程式概念。無論是在概念上還是在實踐上,這都被理所當然地譽為一個里程碑。程式現在可以是數據,並且可以像數據一樣被操作。當然,這種能力已經隱含在圖靈的模型中:描述與數據在同一條紙帶上。然而,這個想法只有在機器獲得足夠的記憶體,使得將實際程式定位在某個內部位置成為可能時才得以實現。畢竟,Eniac 只有二十個暫存器。
儲存程式概念體現了解釋原則的後半部分,即系統自身的數據可以被解釋。但它尚未包含指稱(designation)的概念——即意義背後的物理關係。
列表處理 (List Processing)。下一步是在 1956 年採取的列表處理。數據結構的內容現在是符號,在我們的物理符號系統的意義上:可以指稱、具有所指對象的模式。列表包含允許訪問其他列表的地址——因此有了列表結構的概念。在列表處理的早期,當同事們會問數據在哪裡時——也就是說,哪個列表最終儲存了作為系統內容的位元集合——這多次向我們證明了這是一個新的觀點。他們覺得奇怪的是,沒有這樣的位元,只有指稱其他符號結構的符號。
列表處理在電腦科學的發展中同時是三件事。(1) 它是在一台此前被認為具有固定結構的機器中創建了真正的動態記憶結構。它在我們原有的替換和更改內容的操作集合中,增加了那些建立和修改結構的操作。(2) 它早期證明了一個基本的抽象概念,即電腦由一組數據類型和一組適用於這些數據類型的操作組成,因此計算系統應使用任何適合應用的數據類型,獨立於底層機器。(3) 列表處理產生了一個指稱(designation)的模型,從而定義了我們今天在電腦科學中使用的符號操縱(symbol manipulation)概念。
正如經常發生的那樣,當時的實踐已經預示了列表處理的所有元素:地址顯然用於獲取訪問權限,磁鼓機使用了連結程式(所謂的一加一尋址),等等。但是列表處理作為一個抽象概念的構想創造了一個新的世界,在這個世界裡,指稱和動態符號結構是其定義特徵。早期列表處理系統嵌入到語言(IPLs, LISP)中常常被詬病為阻礙了列表處理技術在整個程式設計實踐中的傳播;但正是這種載體將抽象概念凝聚在了一起。
LISP。還有一步值得注意:McCarthy 在 1959-60 年創建了 LISP [McCarthy, 1960]。它完成了抽象的行為,將列表結構從它們在具體機器中的嵌入中提升出來,創建了一個帶有 S-表達式的新形式系統,可以證明它與其他通用計算方案等價。
結論 (Conclusion)。指稱符號和符號操作的概念直到五十年代中期才出現,這並不意味著早期的步驟既不重要也不那麼重要。整個概念是可計算性、物理可實現性(並且可以通過多種技術實現)、通用性、過程的符號表示(即可解釋性),以及最後的符號結構和指稱的結合。每一步都為整體提供了不可或缺的一部分。
這個鏈條的第一步,由 Turing 創始,是理論驅動的,但其他的步驟都有深厚的經驗根源。我們是被電腦本身的演進所引導的。儲存程式原則源於 Eniac 的經驗。列表處理源於構建智慧程式的嘗試。它從隨機存取記憶體的出現中獲得啟示,後者在地址中提供了一個指稱符號的清晰物理實現。LISP 源於列表處理不斷發展的經驗。
證據
我們現在來看看支持物理符號系統能夠進行智慧行動,以及一般智慧行動需要物理符號系統這一假說的證據。這個假說是經驗歸納而非定理。我們不知道有任何方法可以純粹基於邏輯理由來證明符號系統與智慧之間的聯繫。由於缺乏這樣的證明,我們必須審視事實。然而,我們的中心目的不是詳細審查證據,而是利用眼前的例子來說明電腦科學是一個實證探究領域這一命題。因此,我們只會指出存在哪些類型的證據,以及測試過程的一般性質。
物理符號系統的概念在 1950 年代中期基本形成,可以從那時起算,人工智慧作為電腦科學的一個連貫子領域開始發展。此後二十年的工作見證了兩大類經驗證據的持續積累。第一類致力於證明物理符號系統足以產生智慧,試圖構建並測試具有這種能力的特定系統。第二類證據致力於證明只要展現出智慧,就必須擁有物理符號系統。它從我們最了解的智慧系統——人類——開始,試圖發現他的認知活動是否可以解釋為物理符號系統的運作。還有其他形式的證據,我們稍後會簡要評論,但這兩者是重要的。我們將依次考慮它們。第一種通常稱為人工智慧,第二種稱為認知心理學研究。
建構智慧系統 (Constructing Intelligent Systems)。最初檢驗疾病細菌理論的基本範式是:識別一種疾病;然後尋找細菌。一個類似的範式啟發了人工智慧領域的大部分研究:識別一個需要智慧的任務領域;然後為數位電腦建構一個能夠處理該領域任務的程式。首先研究的是簡單且結構良好的任務:謎題和遊戲、排程和資源分配的運籌學問題、簡單的歸納任務。至今已經建構了數十個,甚至數百個這類程式,每個程式都能在相應領域展現一定程度的智慧行動。
當然,智慧並非全有或全無,在特定領域,績效水平一直在穩步提高,任務領域的範圍也在不斷擴大。例如,早期的西洋棋程式,如果能合法地下棋並表現出一定的目的性,就被認為是成功的;稍後,它們達到了人類初學者的水平;在十年或十五年內,它們開始與認真的業餘棋手競爭。進展緩慢(投入的總程式設計工作量很小),但持續不斷,建構-測試的範式以規律的週期進行——整個研究活動在宏觀層面上模仿了許多 AI 程式的基本生成-測試循環。
智慧行動可及的領域正在穩步擴大。從最初的任務開始,研究已經擴展到建構能夠以多種方式處理和理解自然語言的系統、解釋視覺場景的系統、手眼協調的系統、設計系統、編寫電腦程式的系統、語音理解系統——這個列表即使不是無窮無盡,至少也非常長。如果存在該假說無法企及的界限,它們尚未顯現出來。到目前為止,進展速度主要受制於相當有限的科學資源投入,以及每個新的重大項目不可避免地需要大量的系統建構工作。
當然,正在發生的事情遠不止是簡單地堆砌適應特定任務領域的智慧系統範例。如果結果證明執行這些不同任務的 AI 程式除了都是物理符號系統的實例之外,沒有任何共同之處,那將是令人驚訝和不具吸引力的。因此,人們對尋找具有通用性的機制,以及在執行各種任務的程式之間尋找共同組件抱有極大興趣。這項搜索將理論從最初的符號系統假說推進到對人工智慧中有效的特定類型符號系統的更完整描述。在本文的第二部分,我們將討論處於第二個特定層次假說的一個例子:啟發式搜索假說。
對通用性的追求催生了一系列旨在將通用問題解決機制與特定任務領域需求分開的程式。通用問題解決器 (General Problem Solver, GPS) 可能是其中的第一個;而它的後代包括像 PLANNER 和 CONNIVER 這樣的當代系統。對共同組件的尋找導致了目標和計劃的廣義表示方案、建構區分網路的方法、樹搜索控制程序、模式匹配機制和語言解析系統。目前正在進行實驗,以尋找表示時間序列和時態、運動、因果關係等的便捷設備。越來越有可能以模組化的方式從這些基本組件組裝大型智慧系統。
我們可以通過再次轉向細菌理論的類比來獲得一些視角。如果說由該理論激發的第一波研究主要在於為每種疾病找到對應的細菌,那麼隨後的工作轉向了了解細菌是什麼——在基本的定性定律之上建立一個新的結構層次。在人工智慧領域,旨在為各種幾乎隨機選擇的任務構建智慧程式的最初一波活動,正在讓位於目標更明確的研究,旨在理解此類系統的共同機制。
人類符號行為的建模 (The Modeling of Human Symbolic Behavior)。符號系統假說意味著人類的符號行為之所以產生,是因為他具有物理符號系統的特徵。因此,用符號系統建模人類行為的努力成果成為該假說的重要證據部分,人工智慧的研究與通常稱為資訊處理心理學的研究密切合作進行。
在過去二十年中,尋求用符號系統解釋人類智慧行為的探索取得了巨大成功;以至於資訊處理理論已成為當代認知心理學的主導觀點。尤其在問題解決、概念形成和長期記憶領域,符號操縱模型現在佔據了主導地位。
資訊處理心理學的研究涉及兩種主要的實證活動。第一種是對人類在需要智慧的任務中的行為進行觀察和實驗。第二種,與人工智慧中的平行活動非常相似,是編寫符號系統程式來模擬觀察到的人類行為。心理學的觀察和實驗導致了關於受試者正在使用的符號過程的假說的形成,這些是構建程式想法的重要來源。因此,GPS 基本機制的許多想法來源於對人類受試者在執行問題解決任務時進行「放聲思考」(thinking aloud) 所產生的協議的仔細分析。
電腦科學的實證特性在這與心理學的聯盟中表現得最為明顯。不僅需要心理學實驗來檢驗模擬模型作為人類行為解釋的真實性,而且實驗中也產生了設計和建構物理符號系統的新想法。
其他證據 (Other Evidence)。我們尚未考慮的符號系統假說的主要證據體系是負面證據:缺乏關於智慧活動如何可能實現的具體競爭性假說——無論是由人還是由機器實現。大多數建立此類假說的嘗試都發生在心理學領域。在這裡,我們有一系列理論,從通常標記為「行為主義」(behaviorism) 的觀點到通常標記為「格式塔理論」(Gestalt theory) 的觀點。這兩種觀點都不能作為符號系統假說的真正競爭者,原因有二。首先,行為主義和格式塔理論都沒有證明,甚至沒有展示如何證明,它們所假定的解釋機制足以解釋複雜任務中的智慧行為。其次,這兩種理論的表述都沒有達到人工智慧程式那樣的具體性。事實上,這些替代理論足夠模糊,以至於給它們賦予資訊處理的解釋,從而將它們吸收到符號系統假說中,並不太困難。
結論 (Conclusion) 我們試圖以物理符號系統假說為例,具體說明電腦科學是通常意義上的科學事業:它提出科學假說,然後尋求通過實證探究來驗證。然而,我們選擇這個特定例子來說明我們的觀點還有第二個原因。物理符號系統假說本身就是一個重要的科學假說,屬於我們早期稱為「定性結構定律」的那種類型。它代表了電腦科學的一項重要發現,如果經驗證據證明了這一點,事實上似乎正在發生,那麼它將對該領域產生持續的重大影響。
我們現在轉向第二個例子,即搜索在智慧中的作用。這個主題,以及我們將要考察的關於它的特定假說,在電腦科學,特別是人工智慧領域,也扮演了核心角色。
II. 啟發式搜索
知道物理符號系統提供了智慧行動的基礎,並不能告訴我們它們是如何完成這一切的。我們關於電腦科學中定性結構定律的第二個例子解決了後一個問題,斷言符號系統通過使用啟發式搜索(heuristic search)的過程來解決問題。這個概括,如同前一個一樣,基於經驗證據,並沒有從其他前提形式化推導出來。然而,我們稍後會看到,它確實與符號系統假說有一些邏輯聯繫,也許我們可以期待未來某個時候形式化這種聯繫。在那一天到來之前,我們的故事必須再次是關於實證探究的。我們將描述關於啟發式搜索的已知知識,並回顧顯示它如何使行動變得智慧的經驗發現。我們首先陳述這個定性結構定律,即啟發式搜索假說。
啟發式搜索假說 (Heuristic Search Hypothesis)。問題的解表示為符號結構。物理符號系統通過搜索——也就是說,通過生成並逐步修改符號結構,直到產生一個解結構——來在問題解決中運用其智慧。
物理符號系統必須使用啟發式搜索來解決問題,因為這樣的系統處理資源有限;在有限的步驟內,在有限的時間間隔內,它們只能執行有限數量的過程。當然,這不是一個非常強的限制,因為所有通用圖靈機都受此限制。然而,我們打算在更強的意義上理解這個限制:我們指的是實際上的限制。我們可以設想一些系統在實踐上不受限制,例如,能夠以恆定的速率並行搜索指數級擴展樹的節點,每深入一層搜索一個單位。我們在這裡不關心這樣的系統,而是關心那些計算資源相對於它們面臨情況的複雜性而言稀缺的系統。這個限制不會排除任何真實的符號系統,無論是在電腦中還是在人腦中,在真實任務的背景下。有限資源的事實允許我們,在大多數情況下,將符號系統視為一個串行的、一次處理一個過程的設備。如果它在任何短時間間隔內只能完成少量處理,那麼我們不妨將其視為一次只做一件事。因此,「有限資源符號系統」和「串行符號系統」在實踐上是同義詞。將稀缺資源從一個時刻分配到另一個時刻的問題,如果時刻足夠短,通常可以被視為調度串行機器的問題。
問題解決
由於解決問題的能力通常被視為一個系統具有智慧的主要指標,因此人工智慧的大部分歷史都與建立和理解問題解決系統的嘗試有關,這是很自然的。兩千年來,哲學家和心理學家一直在討論問題解決,話語中充滿了神秘感。如果你認為符號系統解決問題沒有任何問題或神秘之處,那麼你就是今天的孩子,你的觀點是在本世紀中葉之後形成的。Plato(以及根據他的記載,Socrates)甚至難以理解問題如何能被提出,更不用說如何能被解決了。讓我提醒你他是如何在《美諾篇》(Meno) 中提出這個難題的:
美諾:蘇格拉底啊,對於你所不知道的事物,你將如何去探究呢?你會提出什麼作為探究的主題呢?即使你找到了你想要的,你又如何知道這就是你所不知道的那個東西呢?
為了處理這個難題,Plato 發明了他著名的回憶理論:當你認為你在發現或學習某樣東西時,你實際上只是在回憶你在前世已經知道的東西。如果你覺得這個解釋很荒謬,那麼今天有一個基於我們對符號系統理解的更簡單的解釋。它的近似陳述是:
陳述一個問題就是指稱 (1) 對一類符號結構(問題的解)的測試,以及 (2) 一個符號結構(潛在的解)的生成器。解決一個問題就是使用 (2) 生成一個滿足 (1) 的測試的結構。
如果我們知道我們想做什麼(測試),並且我們不知道如何立即做到它(我們的生成器不能立即產生滿足測試的符號結構),那麼我們就有一個問題。符號系統可以陳述和解決問題(有時),因為它可以生成和測試。
如果問題解決就這麼簡單,為什麼不立刻生成一個滿足測試的表達式呢?事實上,這就是我們在許願和做夢時所做的。“如果願望是馬,乞丐也能騎。” 但在夢境之外,這是不可能的。知道我們如何測試某物,一旦它被構建出來,並不意味著我們知道如何構建它——即我們有任何用於這樣做的生成器。
例如,眾所周知,“解決”贏得西洋棋比賽的問題意味著什麼。存在一個簡單的測試來識別獲勝局面,即對敵方國王的將死 (checkmate) 測試。在夢境世界中,人們只需生成一個策略,該策略對所有對手的反制策略都能導致將死。可惜,現有的符號系統(人或機器)都不知道有能做到這一點的生成器。相反,好的西洋棋走法是通過生成各種替代方案,並利用旨在指示某條特定走法路線通往獲勝局面的可能性的近似且常常錯誤的度量標準來 painstaking 地評估它們來尋找的。走法生成器是有的;獲勝走法生成器則沒有。
在能夠為一個問題產生走法生成器之前,必須有一個問題空間 (problem space):一個可以表示問題情境,包括初始情境和目標情境的符號結構空間。走法生成器是將問題空間中的一個情境修改為另一個情境的過程。物理符號系統的基本特性保證了它們可以表示問題空間並且擁有走法生成器。它們如何在任何具體情境中合成一個適合該情境的問題空間和走法生成器,這個問題仍然處於人工智慧研究的前沿。
因此,當一個符號系統被呈現一個問題和一個問題空間時,它面臨的任務是利用其有限的處理資源來生成可能的解決方案,一個接一個,直到找到一個滿足問題定義測試的方案。如果系統對潛在解決方案的生成順序有一定的控制權,那麼安排這個生成順序,使得實際解決方案有很高的可能性早期出現,將是可取的。符號系統的智慧程度取決於它成功做到這一點的程度。對於資源有限的系統來說,智慧在於做出明智的下一步選擇。
問題解決中的搜索
在人工智慧研究的最初十年左右,問題解決的研究幾乎等同於搜索過程的研究。從我們對問題和問題解決的描述中,很容易看出為什麼會這樣。事實上,人們可能會問,是否可能有其他方式。但在我們試圖回答這個問題之前,我們必須進一步探索在那十年活動中揭示出來的搜索過程的性質。
從問題空間中提取資訊 (Extracting Information from the Problem Space)。考慮一組符號結構,其中一個小子集是給定問題的解。進一步假設,這些解隨機分佈在整個集合中。我們的意思是,不存在任何資訊能讓任何搜索生成器比隨機搜索表現得更好。那麼,在解決這個問題上,沒有哪個符號系統能表現出比其他系統更多的智慧(或更少的智慧),儘管一個系統可能比另一個運氣更好。
因此,智慧出現的一個條件是解的分佈並非完全隨機,符號結構的空間至少表現出一定程度的秩序和模式。第二個條件是符號結構空間中的模式或多或少是可檢測的。第三個條件是潛在解的生成器能夠根據它檢測到的模式表現出差異化的行為。問題空間中必須有資訊,並且符號系統必須能夠提取和使用它。讓我們先看一個非常簡單的例子,其中的智慧很容易獲得。
考慮解一個簡單代數方程的問題: AX + B = CX + D 測試將解定義為任何形式為 X = E 的表達式,使得 AE + B = CE + D。現在,可以使用任何能夠產生數字的過程作為生成器,然後通過代入後一個方程來進行測試。我們不會稱之為智慧生成器。
或者,可以使用利用以下事實的生成器:原始方程可以通過在兩邊加減相等的量,或者兩邊乘以或除以相同的量來修改——而不改變其解。但是,當然,我們可以通過比較原始表達式與解的形式,並精確地對方程進行那些保持其解不變,同時又使其達到所需形式的更改,來獲得更多資訊以指導生成器。這樣的生成器可以注意到原始方程右側有一個不需要的 CX,將其從兩側減去並再次合併項。然後它可以注意到左側有一個不需要的 B 並減去它。最後,它可以通過除法去掉左側不需要的係數 (A - C)。
因此,通過這個現在展現出相當智慧的過程,生成器產生連續的符號結構,每個結構都是通過修改前一個結構得到的;這些修改旨在減少輸入結構形式與測試表達式形式之間的差異,同時保持解的其他條件。
這個簡單的例子已經說明了符號系統用於智慧問題解決的許多主要機制。首先,每個後續的表達式並非獨立生成,而是通過修改先前產生的表達式而產生。其次,這些修改並非隨意進行,而是依賴於兩類資訊。它們依賴於對這類代數問題來說是恆定的、並且內建於生成器結構本身的資訊:所有表達式的修改都必須保持方程的解不變。它們也依賴於每一步都在變化的資訊:檢測當前表達式與所需表達式之間形式上的差異。實際上,生成器包含了部分解必須滿足的測試,因此不滿足這些測試的表達式永遠不會被生成。使用第一類資訊保證了只生成所有可能表達式中的一個微小子集,但沒有從這個子集中丟失解表達式。使用第二類資訊通過一系列近似來達到所需的解,採用一種簡單的手段-目的分析形式來指導搜索。
引導搜索的資訊來自何處並無神秘之處。我們不必像 Plato 那樣,賦予符號系統一個它早已知曉解的前世。一個中等複雜的生成器-測試系統就能完成任務,無需借助輪迴轉世。
搜索樹 (Search Trees)。這個簡單的代數問題似乎是一個不尋常的,甚至是病態的搜索例子。它肯定不是試錯搜索,因為雖然有幾次嘗試,但沒有錯誤。我們更習慣於將問題解決搜索想像成生成茂密分叉的部分解決方案可能性的樹,這些樹在產生解決方案之前可能會增長到數千甚至數百萬個分支。因此,如果生成器從它產生的每個表達式創建 B 個新分支,那麼樹將以 B^D 的速度增長,其中 D 是其深度。為代數問題生成的樹的特殊性在於其分支度 B 等於 1。
下棋的程式通常會生成廣闊的搜索樹,在某些情況下達到一百萬或更多的分支。(雖然這個例子有助於說明我們關於樹搜索的觀點,但我們應該注意,西洋棋中搜索的目的不是生成建議的解決方案,而是評估(測試)它們。)遊戲程式研究的一個方向一直集中在改進棋盤的表示以及在其上走子的過程,以加快搜索速度並使搜索更大的樹成為可能。當然,這個方向的理由是,動態搜索越深,其末端的評估就應該越準確。另一方面,有充分的經驗證據表明,最強的人類棋手,特級大師,很少探索超過一百個分支的樹。
這種節省並非通過比下棋程式搜索得淺來實現,而是通過在每個節點上非常稀疏和有選擇性地分支來實現。只有將更多的選擇性內建到生成器本身,使其能夠僅選擇那些極有可能產生關於局勢的重要相關資訊的分支進行生成,才可能在不導致評估惡化的情況下做到這一點。
這個討論引出了一個聽起來有點矛盾的結論:搜索——潛在解決方案結構的連續生成——是符號系統在問題解決中運用智慧的一個基本方面,但搜索量並不是所展現智慧量的度量。使一個問題成為問題的不是解決它需要大量的搜索,而是如果沒有應用必要的智慧水平,就需要大量的搜索。當試圖解決問題的符號系統對該做什麼有足夠的了解時,它會直接朝著目標前進;但每當它的知識變得不足,當它進入未知領域(terra incognita)時,它就面臨著在找到出路之前可能需要進行大量搜索的威脅。
在每種生成問題解決方案的方案中都存在的搜索樹指數級爆炸的可能性,警示我們不要依賴電腦的蠻力——即使是最大、最快的電腦——來彌補其生成器的無知和缺乏選擇性。一些人心中仍然週期性地點燃希望,認為可以找到一台足夠快的電腦,並且可以足夠聰明地編程,通過蠻力搜索下出好棋。關於西洋棋的理論中沒有任何東西排除了這種可能性。關於在規模可觀的樹中管理搜索的經驗研究結果平平,使得這個方向比起最初選擇西洋棋作為人工智慧的合適任務時,前景黯淡得多。我們必須將此視為使用西洋棋程式進行研究的重要經驗發現之一。
智慧的形式 (The Forms of Intelligence)。那麼,智慧的任務就是避免搜索指數級爆炸的持續威脅。如何實現這一點?
第一條途徑,已經由代數例子和僅生成「看似合理」的走法以供進一步分析的西洋棋程式所說明,是將選擇性(selectivity)內建到生成器中:只生成那些有希望成為解或處於通往解路徑上的結構。這樣做的通常結果是降低分支率,而不是完全阻止它。最終的指數級爆炸並未避免——除非在像代數例子那樣結構異常高度化的情況下——只是被推遲了。因此,一個智慧系統通常需要用其他利用資訊的技術來補充其解生成器的選擇性,以引導搜索。
在各種任務環境中管理樹搜索的二十年經驗產生了一套小型通用技術工具包,這是當今每位人工智慧研究人員的裝備之一。由於這些技術已在像 Nilsson [1971] 的通用著作中有所描述,這裡可以非常簡要地總結一下。
在串行啟發式搜索中,基本問題始終是:下一步該做什麼?在樹搜索中,這個問題又包含兩個組成部分:(1) 我們下一步應該從樹的哪個節點開始搜索?(2) 我們應該從那個節點朝哪個方向搜索?有助於回答第一個問題的資訊可以解釋為衡量不同節點與目標的相對距離。最佳優先搜索(Best-first search)要求下一步從看起來最接近目標的節點開始搜索。有助於回答第二個問題——朝哪個方向搜索——的資訊通常是通過檢測當前節點結構與解的測試所描述的目標結構之間的特定差異,並選擇與減少這些特定類型差異相關的行動來獲得的,正如代數例子所示。這就是被稱為手段-目的分析(means-ends analysis)的技術,它在通用問題解決器(General Problem Solver)的結構中扮演著核心角色。
通過追溯大量問題解決程式中這兩個核心思想——最佳優先搜索和手段-目的分析——的歷史,可以清楚地證明經驗研究作為 AI 研究中一般思想來源的重要性。最佳優先搜索的雛形早在 1955 年的邏輯理論家(Logic Theorist)中就已存在,儘管當時尚未命名。體現了手段-目的分析的通用問題解決器(General Problem Solver)大約出現在 1957 年——但它將其與改進的深度優先搜索(depth-first search)相結合,而不是最佳優先搜索。出於節省記憶體的考慮,西洋棋程式通常固守深度優先搜索,大約在 1958 年後輔以強大的 alpha-beta 剪枝(alpha beta pruning)程序。這些技術中的每一種似乎都被重新發明了數次,很難在 1960 年代中期或晚期之前找到關於這些概念的通用、獨立於任務的問題解決理論討論。它們從數學理論中得到的形式化支持仍然微乎其微:一些關於使用 alpha-beta 啟發式方法可以確保搜索減少的定理,一些關於最短路徑搜索的定理(由 Nilsson [1971] 綜述),以及一些關於帶有概率評估函數的最佳優先搜索的非常近期的定理。
「弱」方法與「強」方法 ("Weak" and "Strong" Methods)。我們一直在討論的技術致力於控制指數級擴張而非阻止它。因此,它們被恰當地稱為「弱方法」(weak methods)——當符號系統的知識或問題空間中實際包含的結構量不足以完全避免搜索時使用的方法。將一個可以表述為,比如說,線性規劃問題的高度結構化情況,與像旅行推銷員問題或排程問題這樣結構化程度較低("結構化程度較低" 指的是關於問題空間結構的相關理論不足或不存在)的組合問題情況進行對比是有啟發性的。
在解決線性規劃問題時,可能需要大量的計算,但搜索不會分支。每一步都是通往解決方案的一步。在解決組合問題或證明定理時,樹搜索通常無法避免,成功取決於我們一直在描述的那種啟發式搜索方法。
並非所有 AI 問題解決研究流派都遵循了我們一直在概述的路徑。定理證明系統的研究提供了一個略有不同的觀點的例子。在這裡,從數學和邏輯中引進的思想對研究方向產生了強烈影響。例如,當無法證明完備性(completeness)屬性時,啟發式方法的使用受到了抵制(有點諷刺,因為大多數有趣的數學系統已知是不可判定的)。由於對於最佳優先搜索啟發式方法或許多類型的選擇性生成器,完備性很少能被證明,因此這個要求的影響相當抑制。當定理證明程式不斷因其搜索樹的組合爆炸而癱瘓時,人們開始思考選擇性啟發式方法,在許多情況下,這些方法被證明是通用問題解決程式中使用的啟發式方法的類似物。例如,支持集啟發式(set-of-support heuristic)是一種反向工作(working backwards)的形式,適用於歸結定理證明(resolution theorem proving)環境。
經驗總結 (A Summary of the Experience)。我們現在已經描述了我們的第二條定性結構定律的運作方式,該定律斷言物理符號系統通過啟發式搜索來解決問題。除此之外,我們還考察了啟發式搜索的一些輔助特性,特別是它始終面臨的搜索樹指數級爆炸的威脅,以及它用來避免這種威脅的一些手段。關於啟發式搜索作為問題解決機制的有效性,意見不一——意見取決於考慮哪些任務領域以及採用何種充分性標準。可以通過設定較低的期望水平來保證成功——或者通過設定較高的期望水平來保證失敗。證據大概可以總結如下。很少有程式能夠在「專家」專業水平上解決問題。Samuel 的跳棋程式和 Feigenbaum 與 Lederberg 的 DENDRAL 可能是最著名的例外,但也可以指出一些用於運籌學問題領域(如排程和整數規劃)的啟發式搜索程式。在一些領域,程式的表現達到了稱職的業餘愛好者水平:西洋棋、一些定理證明領域、許多種類的遊戲和謎題。具有複雜感知「前端」的程式——視覺場景識別器、語音理解器、必須在真實空間和時間中機動的機器人——尚未接近人類水平。儘管如此,已經取得了令人印象深刻的進展,並積累了大量關於這些困難任務的經驗。
對於已經出現的特定績效模式,我們沒有深入的理論解釋。然而,基於經驗,我們可以得出兩個結論。首先,從對西洋棋等任務中人類專家表現的研究中得知,任何能夠匹敵該表現的系統,很可能必須在其記憶體中存儲非常大量的語義信息。其次,人類在具有大量感知成分的任務中的部分優勢,可以歸因於人眼和人耳的特殊用途、內建的並行處理結構。
無論如何,績效品質必然取決於問題領域和用於處理它們的符號系統的特性。對於我們感興趣的大多數現實生活領域,領域結構尚未證明足夠簡單,以至於(迄今為止)能夠產生關於複雜性的定理,或者除了經驗之外告訴我們,現實世界問題相對於我們的符號系統解決它們的能力有多大。這種情況可能會改變,但在那之前,我們必須依賴經驗探索,使用我們所知道的最好的問題解決器,作為了解問題難度量級和特徵的主要知識來源。即使在像線性規劃這樣高度結構化的領域,理論在加強支撐最強大解決方案演算法的啟發式方法方面,比在提供複雜性的深入分析方面更有用得多。
無需大量搜索的智慧
我們對智慧的分析將其等同於提取和使用關於問題空間結構的資訊的能力,以便能夠盡可能快速和直接地生成問題解決方案。那麼,提高符號系統問題解決能力的新方向可以等同於提取和使用資訊的新方法。至少可以確定三種這樣的方法。
資訊的非局部使用 (Nonlocal Use of Information)。首先,幾位研究者已經指出,在樹搜索過程中收集到的資訊通常只在局部使用,以幫助在生成該資訊的特定節點做出決策。通過對後續分支子樹的動態分析獲得的關於西洋棋局勢的資訊,通常只用於評估該局勢,而不評估可能包含許多相同特徵的其他局勢。因此,相同的事實必須在搜索樹的不同節點被重複發現。僅僅將資訊從其產生的上下文中取出並普遍使用並不能解決問題,因為該資訊可能僅在有限的上下文範圍內有效。近年來,已經進行了一些探索性的努力,試圖將資訊從其起源的上下文傳輸到其他適當的上下文。雖然現在評估這個想法的力量,甚至確切地說如何實現它還為時過早,但它顯示出相當大的前景。Berliner [1975] 一直在進行的一項重要研究路線是使用因果分析來確定特定資訊有效的範圍。因此,如果西洋棋局勢中的一個弱點可以追溯到導致它的那一步棋,那麼可以預期在來自同一步棋的其他後續局勢中也會出現同樣的弱點。
HEARSAY 語音理解系統採取了另一種方法來使資訊全局可用。該系統試圖通過在多個不同層次上進行並行搜索來識別語音字串:音素層、詞彙層、句法層和語義層。當這些搜索中的每一個提供和評估假設時,它將其獲得的資訊提供給一個可以被所有來源讀取的共同「黑板」。例如,這個共享資訊可以用來消除假設,甚至消除整個類別的假設,否則這些假設將不得不由其中一個過程進行搜索。因此,提高我們非局部使用樹搜索資訊的能力有望提升問題解決系統的智慧。
語義識別系統 (Semantic Recognition Systems)。提升智慧的第二個活躍可能性是為符號系統提供關於其正在處理的任務領域的豐富語義信息。例如,對西洋棋大師技能的經驗研究表明,大師技能的一個主要來源是儲存的信息,這些信息使他能夠識別棋盤上大量的特定特徵和特徵模式,以及利用這種識別來提出適合所識別特徵的行動的信息。當然,這個總體想法幾乎從一開始就被納入西洋棋程式中。新的是認識到可能需要儲存多少這樣的模式和相關信息才能達到大師級水平:大約在 50,000 個的數量級。
用識別代替搜索的可能性之所以產生,是因為一個特定的,尤其是罕見的模式,可以包含巨大的信息量,前提是它與問題空間的結構緊密相連。當該結構「不規則」,且不受簡單數學描述約束時,了解大量相關模式可能是智慧行為的關鍵。在任何特定的任務領域是否如此,是一個更容易通過經驗調查而不是理論來解決的問題。我們對於擁有豐富語義信息和用於訪問它的模式識別能力的符號系統的經驗仍然極其有限。
以上討論特別指的是與識別系統相關的語義資訊。當然,還有一整個龐大的關於語義資訊處理和語義記憶組織的 AI 研究領域,超出了我們在本文中討論的主題範圍。
選擇適當的表徵 (Selecting Appropriate Representations)。第三條研究路線關注的是通過選擇適當的問題空間來減少或避免搜索的可能性。一個標準的例子,它戲劇性地說明了這種可能性,是殘缺棋盤問題 (mutilated checkerboard problem)。一個標準的 64 格棋盤可以用 32 個骨牌(每個骨牌是一個覆蓋恰好兩個格子的 1x2 矩形)完全覆蓋。現在假設,我們切掉棋盤對角線上的兩個方格,總共剩下 62 個方格。這個殘缺的棋盤能用 31 個骨牌完全覆蓋嗎?憑藉(字面上)天上的耐心,可以通過嘗試所有可能的排列來證明實現這種覆蓋是不可能的。對於那些耐心較少、智慧更多的人來說,另一種方法是觀察到棋盤的兩個對角方格顏色相同。因此,殘缺棋盤的一種顏色比另一種顏色少兩個方格。但是每個骨牌覆蓋一種顏色的一個方格和另一種顏色的一個方格,任何一組骨牌必須覆蓋相同數量的每種顏色的方格。因此,沒有解決方案。符號系統如何發現這個簡單的歸納論證,作為在所有可能的覆蓋中進行搜索以解決問題的絕望嘗試的替代方案?我們會給找到解決方案的系統打上高分,以示其智慧。
然而,或許在提出這個問題時,我們並沒有擺脫搜索過程。我們只是將搜索從可能的問題解決方案空間轉移到了可能的表徵(representations)空間。無論如何,從一種表徵轉移到另一種表徵,以及發現和評估表徵的整個過程,在問題解決研究領域基本上是未被探索的領域。支配表徵的定性結構定律仍有待發現。對它們的探索幾乎肯定會在未來十年受到相當大的關注。
結論
這就是我們關於符號系統和智慧的闡述。從 Plato 的《美諾篇》到現在,是一條漫長的道路,但或許令人鼓舞的是,這條道路上的大部分進展都是在二十世紀初之後取得的,其中很大一部分是在本世紀中葉之後取得的。思想在現代形式邏輯將其解釋為形式標記的操作之前,仍然是完全無形和不可言喻的。而且它似乎仍然主要棲息在柏拉圖式理想的天堂,或者同樣晦澀的人類心靈空間,直到電腦教會我們符號如何能被機器處理。我們今天紀念的 A.M. Turing,在本世紀中葉這些從現代邏輯通向電腦的發展的十字路口做出了他的偉大貢獻。
物理符號系統 (Physical Symbol Systems)。邏輯和電腦的研究向我們揭示了智慧存在於物理符號系統中。這是電腦科學最基本的定性結構定律。
符號系統是模式和過程的集合,後者能夠產生、銷毀和修改前者。模式最重要的屬性是它們可以指稱對象、過程或其他模式,並且當它們指稱過程時,它們可以被解釋。解釋意味著執行被指稱的過程。我們所熟悉的最重要的兩類符號系統是人類和電腦。
我們目前對符號系統的理解,如前所述,是通過一系列階段發展起來的。形式邏輯讓我們熟悉了符號,將其視為思想的原始材料,並在句法上進行處理,以及根據仔細定義的形式過程來操縱它們的想法。圖靈機使得符號的句法處理真正像機器一樣,並肯定了嚴格定義的符號系統的潛在通用性。電腦的儲存程式概念重申了符號的可解釋性,這在圖靈機中已經隱含。列表處理將符號的指稱能力推向了前沿,並以允許獨立於底層物理機器固定結構的方式定義了符號處理。到 1956 年,所有這些概念都已可用,同時還有實現它們的硬體。符號系統智慧的研究,即人工智慧的主題,得以開始。
啟發式搜索 (Heuristic Search)。AI 的第二條定性結構定律是,符號系統通過生成潛在解並測試它們,也就是說,通過搜索來解決問題。解通常是通過創建符號表達式並按順序修改它們,直到它們滿足解的條件來尋求的。因此,符號系統通過搜索來解決問題。由於它們資源有限,搜索不能一次性完成,而必須是順序的。它留下的是從起點到目標的單一路徑,或者,如果需要修正和回溯,則是這樣路徑的一整棵樹。
當符號系統被純粹的混亂包圍時,它們無法表現出智慧。它們通過從問題領域提取資訊並使用該資訊來指導它們的搜索,避免走錯路和繞遠路,從而運用智慧。問題領域必須包含資訊,也就是說,一定程度的秩序和結構,這種方法才能奏效。《美諾篇》的悖論通過觀察到資訊可以被記住,但新的資訊也可以從符號所指稱的領域中提取出來而得到解決。在這兩種情況下,資訊的最終來源都是任務領域。
實證基礎 (The Empirical Base)。人工智慧研究關注的是符號系統必須如何組織才能表現出智慧行為。該領域二十年的工作積累了相當多的知識體系,足以填滿幾本書(它已經做到了),其中大部分是以關於特定類別符號系統在特定任務領域行為的相當具體的經驗形式存在的。然而,從這些經驗中,也產生了一些概括,跨越了任務領域和系統,關於智慧的一般特徵及其實現方法。
我們今天上午試圖陳述其中的一些概括。它們大多是定性的而非數學的。它們更具有地質學或進化生物學的味道,而不是理論物理學的味道。它們足夠強大,使我們今天能夠為相當廣泛的任務領域設計和構建中等智慧的系統,並對人類智慧在許多情況下的運作方式獲得相當深入的理解。
下一步是什麼? (What Next?) 在我們今天的敘述中,我們提到了懸而未決的問題和已解決的問題;兩者都很多。我們沒有看到過去四分之一個世紀以來圍繞這個領域的探索熱情有任何減退。兩個資源限制將決定下一個這樣時期的進展速度。一個是將可用的計算能力。第二個,可能更重要的,是將被吸引到這個研究領域作為他們能應對的最具挑戰性領域的有才華的年輕電腦科學家的數量。
A.M. Turing 在他著名的論文《計算機器與智慧》("Computing Machinery and Intelligence") 的結尾寫道:
「我們只能看到前方很短的距離,但我們能看到那裡有很多需要做的事情。」
Turing 在 1950 年看到的許多需要做的事情已經完成了,但議程仍然像以往一樣滿滿當當。也許我們對他上面那句簡單的陳述解讀過多了,但我們傾向於認為,Turing 在其中認識到了所有電腦科學家本能地知道的基本真理。對於所有物理符號系統,注定要對問題環境進行串行搜索的我們來說,關鍵問題始終是:下一步該做什麼?
參考文獻
Berliner, H. [1975]. Chess as problem solving: the development of a tactics analyzer. Ph.D. Th., Computer Sci. Dep., Carnegie-Mellon U. (unpublished). McCarthy, J. [1960]. Recursive functions of symbolic expressions and their computation by machine. Comm. ACM 3, 4 (April 1960), 184-195. McCulloch, W.S. [1961]. What is a number, that a man may know it, and a man, that he may know a number. General Semantics Bulletin Nos. 26 and 27 (1961), 7-18. Nilsson, N.J. [1971]. Problem Solving Methods h2 Artificial Intelligence. McGraw-Hill, New York. Turing, A.M. [1950]. Computing machinery and intelligence. Mind 59 (Oct. 1950), 433-460.