1975 ACM 圖靈獎講座

1975年 ACM 圖靈獎在10月20日於明尼亞波利斯舉行的 ACM 年會上聯合頒發給 Allen Newell 和 Herbert A. Simon。圖靈獎委員會主席 Bernard A. Galler 在介紹獲獎者時,宣讀了以下引文:

「我很榮幸能將 ACM 圖靈獎頒發給我的兩位老朋友,均來自 Carnegie-Mellon University 的 Allen Newell 教授和 Herbert A. Simon 教授。

他們在長達二十多年的聯合科學研究中,最初與 RAND Corporation 的 J.C. Shaw 合作,隨後又與 Carnegie-Mellon University 的眾多教職員工和學生同事合作,為人工智能、人類認知心理學和列表處理做出了基礎性貢獻。

在人工智能領域,他們為該領域確立為科學探究領域、普遍啟發式程式設計的發展以及特別是啟發式搜尋、手段-目的分析和歸納法的發展做出了貢獻;並透過展示這些機制足以解決有趣問題來提供了證明。

在心理學方面,他們是人類認知可以用符號系統描述的觀點的主要推動者,並且他們在許多任務領域開發了詳細的人類問題解決、口語學習和歸納行為理論,並使用體現這些理論的電腦程式來模擬人類行為。

他們顯然是列表處理的發明者,並且對軟體技術以及電腦作為一個操縱符號結構而不僅僅是處理數字數據的系統概念的發展做出了重大貢獻。

Newell 教授和 Simon 教授獲得此獎是他們的榮譽,但 ACM 能將他們的名字列入我們的獲獎者名單,對 ACM 而言也是一種榮譽,因為他們的存在將增加 ACM 圖靈獎的聲望和重要性。」

電腦科學作為經驗探究:符號與搜尋

Allen Newell 和 Herbert A. Simon

電腦科學是對環繞電腦現象的研究。本協會的創立者深知此點,故稱自身為電腦機械協會 (Association for Computing Machinery)。這台機器——不僅是硬體,而是經過程式設計的、活生生的機器——是我們研究的有機體。

這是第十場圖靈講座。在我們之前登上這個平台九個人,提出了九種不同的電腦科學觀點。因為我們的有機體,這台機器,可以在許多層面上和從許多方面進行研究。我們今天很榮幸能來到這裡,並呈現另一種觀點,即滲透於我們獲獎的科學工作的觀點。我們希望探討電腦科學作為一種經驗探究。

我們的觀點只是眾多觀點之一;之前的講座已清楚表明了這點。然而,即使將它們合在一起,這些講座也未能涵蓋我們科學的全部範疇。它的許多基本方面尚未在這些圖靈獎中得到體現。而且,如果時間到了,當然不是現在,當羅盤已然歸位時,當電腦科學已從各方面討論完畢時,就該重新開始這個循環了。對於圖靈講座來說,每一年都必須進行新的衝刺,以超越科學和技術發展這隻烏龜在他穩步前行中累積的微小增益。每一次勝利都將創造一個新的差距並呼喚一次新的衝刺,因為在科學中沒有最終的話語。

電腦科學是一門經驗學科。我們本來會稱它為實驗科學,但與天文學、經濟學和地質學一樣,它的一些獨特的觀察和經驗形式不符合狹隘的實驗方法刻板印象。儘管如此,它們仍然是實驗。每一台新製造的機器都是一個實驗。實際建造機器向自然提出了一個問題;我們透過觀察機器的運行並利用所有可用的分析和測量方法對其進行分析來聆聽答案。每一個新編寫的程式都是一個實驗。它向自然提出了一個問題,而它的行為則提供了回答的線索。機器和程式都不是黑盒子:它們是人工產物,無論是硬體還是軟體都經過設計,我們可以打開它們並查看內部。我們可以將它們的結構與它們的行為聯繫起來,並從單一實驗中吸取許多教訓。我們無需建造100個定理證明器來統計證明它未能如預期那樣克服搜尋的組合爆炸。對程式進行檢查並進行少量運行,就可以發現其缺陷,並讓我們繼續下一次嘗試。

我們建造電腦和程式出於許多原因。我們建造它們是為了服務社會,並作為執行社會計算任務的工具。但作為基礎科學家,我們建造機器和程式是為了發現新現象和分析我們已經知道的現象。社會經常對此感到困惑,認為電腦和程式應該只為了它們的經濟用途(或作為導致這種用途的發展序列中的中間項目)而建造。社會需要理解,環繞電腦的現象既深刻又隱晦,需要大量的實驗來評估其性質。社會需要理解,正如任何科學一樣,從這種實驗和理解中獲得的收益,將永久獲得新技術;而正是這些技術將創造出幫助社會實現其目標的工具。

然而,我們在這裡的目的並非向外界爭取理解,而是審視我們科學的一個方面,即透過經驗探究發展新的基礎理解。這最好透過範例來實現。如果我們藉此機會,從我們自己的研究領域中選擇範例,希望得到諒解。正如將要顯而易見的,這些範例涉及人工智能的整體發展,特別是在其早期階段。它們遠遠超出了我們個人的貢獻。而且,即使我們做出了直接貢獻,這也是與其他人合作完成的。我們的合作者特別包括 Cliff Shaw,我們在五十年代後期那個激動人心的時期與他組成了一個三人團隊。但我們也與 Carnegie-Mellon University 的許多同事和學生合作過。

時間只允許我們探討兩個範例。第一個是符號系統概念的發展。第二個是啟發式搜尋概念的發展。這兩個概念對於理解信息處理和實現智能具有深刻意義。然而,它們遠未窮盡人工智能的全部範疇,儘管我們認為它們對於展示電腦科學這部分基礎知識的性質很有用。

Key Words and Phrases: symbols, search, science, computer science, empirical, Turing, artificial intelligence, intelligence, list processing, cognition, heuristics, problem solving. CR Categories: 1.0, 2.1, 3.3, 3.6, 5.7. Copyright © 1976, Association for Computing Machinery, Inc. General permission to republish, but not for profit, all or part of this material is granted provided that ACM's copyright notice is given and that reference is made to the publication, to its date of issue, and to the fact that reprinting privileges were granted by permission of the Association for Computing Machinery. The authors' research over the years has been supported in part by the Advanced Research Projects Agency of the Department of Defense (monitored by the Air Force Office of Scientific Research) and in part by the National Institutes of Mental Health. Authors' address: Carnegie-Mellon University, Pittsburgh.

I. 符號與實體符號系統

電腦科學最重要的貢獻之一,是在相當基礎的層面上解釋了符號是什麼。這個解釋是關於自然的科學命題。它是透過經驗推導出來的,經過漫長而漸進的發展。

符號是智能行為的根源,這當然是人工智能的首要主題。就此而言,這也是所有電腦科學的首要問題。因為所有信息都是由電腦為了某個目的而處理的,我們根據系統在面對任務環境的變化、困難和複雜性時實現既定目標的能力來衡量其智能水平。當完成的任務範圍有限時,這種對智能的普遍投入會被模糊,因為這時環境的全部變化可以準確預見。隨著我們將電腦擴展到更具整體性、更複雜、更知識密集型的任務——隨著我們試圖讓它們成為我們的代理,能夠獨立處理自然世界的全部突發事件——這種投入變得更加明顯。

我們對智能行為所需系統要求的理解緩慢地形成。它是複合的,因為沒有一個單一的基礎事物能夠解釋智能的所有表現。沒有一個「智能原則」,正如沒有一個本質上就能傳達生命精髓的「生命原則」。但是,缺乏一個簡單的 deus ex machina 並不意味著智能沒有結構性要求。其中一個要求是儲存和操縱符號的能力。為了提出這個科學問題,我們可以改寫 Warren McCulloch [1961] 一篇著名論文的標題:符號是什麼,以至於智能可以使用它,而智能又是什麼,以至於它可以使用符號?

定性結構定律

所有科學都描述其研究的系統的本質。這些描述在性質上都是定性的,因為它們設定了發展更詳細知識的框架。它們的本質常常可以用非常簡短、非常籠統的陳述來概括。人們可能會認為這些一般性定律對科學總量的貢獻相對較小,因為它們的特異性有限,但歷史證據表明它們是極為重要的成果。

生物學中的細胞學說:定性結構定律的一個很好的例子是生物學中的細胞學說,它指出所有生命有機體的基礎構件是細胞。細胞有多種形式,儘管它們都有一個被原生質包圍的細胞核,整個結構被一層膜包裹。但這種內部結構在歷史上並非細胞學說規範的一部分;它是透過深入研究隨後發展的特異性。細胞學說幾乎完全可以用我們上面給出的陳述來傳達,再加上關於細胞大小的一些模糊概念。然而,這個定律對生物學的影響是巨大的,在它逐漸被接受之前,這個領域的許多無效努力是相當多的。

地質學中的板塊構造學說:地質學提供了一個有趣的定性結構定律範例,之所以有趣,是因為它在過去十年中才獲得接受,因此其地位提升的記憶猶新。板塊構造理論主張地球表面是由數十個巨大的板塊組成的,這些板塊(以地質學速度)相互移動、相互疊壓並下沉到地球中心,在那裡它們失去身份。板塊的移動解釋了大陸和海洋的形狀和相對位置、火山和地震活動區域、深海海脊等。再補充一些關於速度和大小的細節,本質理論就已明確。當然,直到它成功地解釋了許多細節並將其串聯起來(例如,解釋西非與南美洲東北部的植物、動物和地層一致性)之後才被接受。板塊構造理論是高度定性的。如今它被接受後,整個地球似乎處處都提供了證據,因為我們用它的術語來看待世界。

疾病的細菌理論:距巴斯德闡述疾病的細菌理論,一個在醫學上引起革命的定性結構定律,僅僅一個多世紀。該理論提出,大多數疾病是由微小的單細胞活體有機體在體內的出現和繁殖引起的,而傳染則是這些有機體從一個宿主傳播到另一個宿主。該理論闡述的大部分內容是識別與特定疾病相關的有機體,描述它們並追溯其生命史。該定律有許多例外——許多疾病並非由細菌引起——這並未減損其重要性。該定律告訴我們尋找特定類型的原因;它並未堅持我們總能找到它。

原子論:原子論與我們剛剛描述的三個定性結構定律形成了有趣的對比。當它從道爾頓的工作以及他對化學物質按固定比例結合的證明中出現時,該定律提供了定性結構的典型範例:元素由微小的、均勻的粒子組成,不同元素之間存在差異。但由於底層原子種類如此簡單且變化有限,很快就形成了定量理論,將原始定性假設中的所有一般結構都納入了其中。對於細胞、構造板塊和細菌,結構的多樣性非常大,底層的定性原則仍然清晰可見,它對總體理論的貢獻也清晰可辨。

結論:定性結構定律在科學中無處不在。我們最偉大的科學發現中有一些就在其中。正如這些範例所示,它們經常為整個科學的運作設定了框架。

實體符號系統

讓我們回到符號的話題,並定義一個實體符號系統。形容詞「實體」表示兩個重要特徵:(1)此類系統顯然遵循物理定律——它們可以由工程系統製成,由工程組件實現;(2)雖然我們使用「符號」一詞預設了我們預期的解釋,但它並不限於人類符號系統。

一個實體符號系統由一組稱為符號的實體組成,這些符號是物理模式,可以作為另一類實體(稱為表達式或符號結構)的組成部分。因此,符號結構由許多符號的實例(或標記)以某種物理方式關聯組成(例如,一個標記緊鄰另一個標記)。在任何時刻,系統都將包含一批這些符號結構。除了這些結構之外,系統還包含一組處理程序,這些處理程序對表達式進行操作以產生其他表達式:創建、修改、複製和銷毀的處理程序。一個實體符號系統是一台隨時間推移產生不斷演進的符號結構集合的機器。這種系統存在於一個比這些符號表達式本身更廣泛的對象世界中。

表達式、符號和對象的這種結構中有兩個核心概念:指稱(designation)和解釋(interpretation)。

指稱:一個表達式指稱一個對象,如果給定該表達式,系統能夠影響該對象本身或以依賴於該對象的方式行事。在這兩種情況下,都獲得了透過表達式訪問該對象的能力,這是指稱的本質。

解釋:如果一個表達式指稱一個處理程序,並且如果給定該表達式,系統能夠執行該處理程序,那麼系統就可以解釋一個表達式。解釋意味著一種特殊的依賴性行動形式:給定一個表達式,系統可以執行指示的處理程序,也就是說,它可以從指稱其自身的表達式中喚起並執行自身的處理程序。

一個能夠進行如上所述的指稱和解釋的系統,還必須滿足一系列額外的要求,包括完整性和封閉性。我們只能簡要提及這些要求;所有這些都很重要並具有深遠的影響。(1)一個符號可以用來指稱任何表達式。也就是說,給定一個符號,它不是先驗規定它能指稱哪些表達式。這種任意性僅適用於符號;符號標記及其相互關係決定了複雜表達式指稱什麼對象。(2)存在能夠指稱機器能夠執行的所有處理程序的表達式。(3)存在用於創建任何表達式以及以任意方式修改任何表達程序的處理程序。(4)表達式是穩定的;一旦創建,它們將繼續存在,直到被明確修改或刪除。(5)系統能夠容納的表達式數量基本上是無限的。

我們剛剛定義的系統類型對於電腦科學家來說並不陌生。它與通用電腦具有很強的家族相似性。如果將一種符號操縱語言(如 LISP)視為定義了一台機器,那麼這種親緣關係就真正成為了兄弟。我們闡述這樣一個系統的目的不是要提出什麼新事物。恰恰相反:它是為了展示關於滿足此類特徵的系統現已知曉和假設的事物。

我們現在可以陳述一個一般性科學假說——符號系統的定性結構定律:

實體符號系統假說:一個實體符號系統具備實現通用智能行為的必要且充分的手段。

所謂「必要」,我們的意思是任何表現出通用智能的系統,經分析後都將證明是一個實體符號系統。所謂「充分」,我們的意思是任何足夠大的實體符號系統,都可以進一步組織起來以表現通用智能。所謂「通用智能行為」,我們希望指代我們在人類行為中看到的那種智能範圍:在任何現實情況下,系統的行為都能夠適應其目標並對環境的需求做出適應,在一定的速度和複雜性限制內。

實體符號系統假說顯然是一個定性結構定律。它指定了一個通用系統類別,其中可以找到那些具備智能行為能力的系統。

這是一個經驗假說。我們定義了一類系統;我們希望探究這一類別是否能夠解釋我們在現實世界中發現的一系列現象。智能行為在生物世界中無處不在,主要體現在人類行為中。這是一種我們可以根據其效果來識別的行為形式,無論它是否由人類執行。該假說確實可能是錯誤的。智能行為並非輕而易舉即可產生,以至於任何系統都能隨意展現出來。實際上,有些人基於哲學或科學理由認為該假說為假。從科學角度來說,只能透過提供關於自然世界的實證證據來攻擊或辯護它。

我們現在需要追溯這個假說的發展並審視其證據。

符號系統假說的發展

實體符號系統是通用機器的實例。因此,符號系統假說意味著智能將由通用電腦實現。然而,該假說遠遠超出了基於物理決定論等一般理由提出的論點,即任何可實現的計算都可以由通用機器實現,前提是其經過規範。因為它明確斷言智能機器是一個符號系統,從而對智能系統的本質做出了特定的架構性論斷。理解這種額外特異性是如何產生的非常重要。

形式邏輯:該假說的根源可以追溯到 Frege 以及 Whitehead 和 Russell 形式化邏輯的計畫:在邏輯中捕捉數學的基本概念,並將證明和演繹的概念建立在穩固的基礎上。這項努力最終形成了數理邏輯——我們熟悉命題邏輯、一階邏輯和高階邏輯。它發展出一種特有的觀點,通常稱為「符號遊戲」。邏輯,以及透過整合而包含的數學,是一個使用無意義的符號根據某些純粹語法規則進行的遊戲。所有的意義都被清除了。人們得到了一個機械的、儘管是允許的(我們現在會說非確定性的)系統,關於這個系統可以證明各種事物。因此,進步首先是透過遠離所有與意義和人類符號相關的事物來實現的。我們可以稱之為形式符號操縱階段。

這種普遍態度在信息論的發展中得到了很好的體現。人們一次又一次地指出,Shannon 定義了一個僅對通信和選擇有用、與意義無關的系統。人們對這個領域被賦予「信息論」這樣一個廣泛的名稱表示遺憾,並嘗試將其改名為「選擇性信息理論」——當然是徒勞的。

圖靈機與數位電腦:數位電腦和自動機理論的發展,始於圖靈本人在30年代的工作,可以合併討論。它們在什麼是本質的問題上達成一致。讓我們使用圖靈自己的模型,因為它很好地展示了這些特徵。圖靈機由兩個記憶體組成:一個無限的帶和一個有限狀態控制。帶上存放數據,即著名的零和一。機器有一組非常小的基本操作——讀取、寫入和掃描操作——在帶上。讀取操作不是數據操作,而是根據讀取頭下的數據提供對控制狀態的條件分支。眾所周知,這個模型包含所有電腦的本質,就它們能做的事情而言,儘管具有不同記憶體和操作的其他電腦可能以不同的空間和時間需求執行相同的計算。特別是,圖靈機模型內含了什麼是不可計算的以及通用機器的概念——可以執行任何機器能夠執行的任何事情的電腦。

我們應該驚嘆,資訊處理的兩個最深刻的見解是在30年代——現代電腦誕生之前——實現的。這是對 Alan Turing 天才的致敬。這也是對當時數理邏輯發展的致敬,並證明了電腦科學對其的深度義務。與圖靈的工作同時出現的還有邏輯學家 Emil Post 和(獨立的)Alonzo Church 的工作。他們從獨立的邏輯系統概念(Post 產生式和遞歸函數)出發,得出了關於不可判定性和普適性的類似結果——這些結果很快被證明意味著所有三個系統是等價的。實際上,所有這些定義最普遍信息處理系統嘗試的匯聚,提供了我們相信我們已經在這些模型中抓住了資訊處理本質的部分力量。

在這些系統中,表面上並沒有將符號視為指稱某物的概念。數據被視為僅僅是零和一的字串——確實,數據是惰性的,對於將計算歸約為物理過程至關重要。有限狀態控制系統始終被視為一個小型控制器,並且進行邏輯遊戲以查看可以使用多小的狀態系統而不破壞機器的普適性。據我們所知,從未進行過動態地向有限控制添加新狀態的遊戲——將控制記憶體視為存儲系統大部分知識的地方。這個階段完成的是解釋原理的一半——展示機器可以從描述中運行。因此,這是自動形式符號操縱階段。

儲存程式概念:隨著40年代中期(在 Eniac 之後)第二代電子機器的發展,出現了儲存程式概念。這被理所當然地譽為一個里程碑,無論是在概念上還是在實踐上。現在程式可以作為數據,並且可以像數據一樣被操作。當然,這種能力已經隱含在圖靈的模型中:描述與數據在同一個帶上。然而,直到機器獲得足夠的記憶體,使得將實際程式放在某些內部位置成為可行時,這個想法才得以實現。畢竟,Eniac 只有二十個暫存器。

儲存程式概念體現了解釋原則的後半部分,即關於系統自身的數據可以被解釋的部分。但它尚未包含指稱的概念——即支撐意義的物理關係。

列表處理:下一個步驟是在1956年採取的列表處理。資料結構的內容現在是符號,是我們實體符號系統意義上的:即指稱的、具有指代的模式。列表存放了地址,這些地址允許訪問其他列表——因此產生了列表結構的概念。早期列表處理時期,同事們經常詢問數據在哪裡——也就是說,哪個列表最終存放了構成系統內容的位元集合——這向我們證明了這是一個新觀點。他們覺得奇怪的是沒有這樣的位元,只有指稱其他符號結構的符號。

列表處理在電腦科學的發展中同時是三件事:(1)它在一個迄今為止被認為具有固定結構的機器中創建了一個真正的動態記憶結構。它為我們的操作集增加了建造和修改結構的操作,除了替換和改變內容的操作之外。(2)它是對基本抽象的早期證明,即電腦由一組數據類型和與這些數據類型相應的操作組成,因此一個計算系統應該使用適合於應用的任何數據類型,而不依賴於底層機器。(3)列表處理產生了一個指稱模型,從而定義了我們今天在電腦科學中使用這個概念的符號操縱。

正如經常發生的那樣,當時的實踐已經預示了列表處理的所有要素:地址顯然用於獲得訪問,鼓式機器使用連結的程式(所謂的一加一尋址),等等。但是,列表處理作為一種抽象的概念,創建了一個新的世界,其中指稱和動態符號結構是其定義性特徵。將早期列表處理系統嵌入語言(IPL、LISP)中,經常被批評為阻礙了列表處理技術在程式設計實踐中的傳播;但它是將抽象結合在一起的載體。

LISP:還值得注意的是 McCarthy 在1959-60年創建的 LISP [McCarthy, 1960]。它完成了抽象的行為,將列表結構從其在具體機器中的嵌入中提升出來,創建了一個新的形式系統,具有 S-表達式,這些表達式可以證明與其他通用的計算方案等價。

結論:指定符號和符號操縱的概念直到五十年代中期才出現,這並不意味著早期的步驟不是必要的或不那麼重要。總體概念是計算性、物理可實現性(以及透過多種技術)、普適性、程式的符號表示(即可解釋性),以及最後,符號結構和指稱的結合。每一個步驟都提供了整體中必不可少的部分。

這個鏈條中的第一個步驟,由圖靈提出,是理論驅動的,但其他步驟都具有深厚的經驗根源。我們是被電腦本身的演進所引導的。儲存程式原理產生於 Eniac 的經驗。列表處理產生於建構智能程式的嘗試。它從隨機存取記憶體的出現中獲得啟發,隨機存取記憶體在地址中提供了指稱符號的清晰物理實現。LISP 產生於列表處理不斷演進的經驗。

證據

我們現在來看支持實體符號系統能夠進行智能行為的證據,以及通用智能行為需要實體符號系統的證據。該假說是一個經驗概括,而不是一個定理。我們不知道有任何方法可以從純邏輯角度證明符號系統與智能之間的聯繫。缺乏這種證明,我們必須審視事實。然而,我們的中心目標不是詳細審視證據,而是利用面前的例子來說明電腦科學是一個經驗探究領域的命題。因此,我們只會說明存在哪些類型的證據,以及檢驗過程的普遍性質。

實體符號系統的概念在1950年代中期基本成形,從那時起,人工智能作為電腦科學的一個連貫子領域開始發展。此後的二十年工作中,實證證據不斷積累,主要有兩種。第一種是關於實體符號系統生成智能的充分性,試圖建構和測試具有這種能力的特定系統。第二種證據是關於存在智能時需要實體符號系統的必要性。它從人類開始,這是我們最了解的智能系統,並試圖發現其認知活動是否可以解釋為實體符號系統的工作。還有其他形式的證據,我們稍後會簡要評論,但這兩種是重要的。我們將依次考慮它們。第一種通常稱為人工智能,第二種是認知心理學研究。

建構智能系統:病菌理論初期檢驗的基本範式是:確定一種疾病;然後尋找病菌。類似的範式啟發了人工智能的許多研究:確定一個需要智能的任務領域;然後為數位電腦建構一個能夠處理該領域任務的程式。首先研究的是簡單且結構良好的任務:謎題和遊戲、運籌學的排程和資源分配問題、簡單的歸納任務。到目前為止,已經建構了數十甚至數百個此類程式,每個程式都在相應領域中展現出一定程度的智能行為。

當然,智能並非全有或全無的事情,在特定領域達到更高水平的表現以及擴大領域範圍方面,都取得了穩步進展。例如,早期的西洋棋程式如果能夠合法地進行遊戲並表現出一些目的性,就被認為是成功的;稍後,它們達到了人類初學者的水平;在十到十五年內,它們開始與認真的業餘愛好者競爭。進展緩慢(並且投入的總程式設計精力很少)但持續不斷,並且建構-測試範式按照規律的循環進行——整個研究活動在宏觀層面上模仿了許多人工智能程式的基本生成-測試循環。

智能行為的可實現範圍正在穩步擴大。從最初的任務開始,研究已擴展到建構能夠以各種方式處理和理解自然語言的系統、解釋視覺場景的系統、手眼協調系統、設計系統、編寫電腦程式系統、語音理解系統——這個列表即使不是無限,也至少很長。如果這個假說存在無法超越的限制,它們尚未顯現出來。迄今為止,進展速度主要受限於投入的科學資源數量相當有限,以及每個新的重大事業都不可避免地需要進行大量的系統建構工作。

當然,發生的事情遠不止是簡單地累積適應特定任務領域的智能系統範例。如果執行這些不同任務的 AI 程式除了都是實體符號系統的實例之外沒有其他共同點,那將是令人驚訝且缺乏吸引力的。因此,人們對尋找具有通用性的機制以及執行各種任務的程式中的共同組件產生了極大的興趣。這種尋找將理論推向了最初的符號系統假說之外,更完整地描述了在人工智能中有效的特定類型符號系統。在本文的第二部分,我們將討論這個第二級特異性假說的一個範例:啟發式搜尋假說。

對通用性的尋求催生了一系列程式,旨在將通用的問題解決機制與特定任務領域的要求分開。通用問題解決器 (GPS) 可能是其中第一個;而其後代則包括當代系統,如 PLANNER 和 CONNIVER。對共同組件的尋求導致了目標和計畫的通用表示方案、建構辨別網路的方法、控制樹狀搜尋的程序、模式匹配機制以及語言解析系統。目前正在進行實驗,以尋找方便表示時間和時態序列、運動、因果關係等的設備。越來越多地,可以從這些基本組件模組化地組裝大型智能系統。

回頭再看細菌理論的類比,我們可以對正在發生的事情獲得一些視角。如果說那個理論刺激的最初研究浪潮主要是尋找與每種疾病對應的細菌,那麼隨後的工作則轉向了解細菌是什麼——在基本定性定律的基礎上建構一個新的結構層次。在人工智能中,最初旨在為幾乎隨機選擇的各種任務建構智能程式的活動浪潮正在轉向更具針對性的研究,旨在理解此類系統的共同機制。

模擬人類符號行為:符號系統假說意味著人類的符號行為之所以產生,是因為他具有實體符號系統的特徵。因此,用符號系統模擬人類行為的努力結果,成為該假說的重要證據,人工智能研究與資訊處理心理學(通常稱為此名稱)的研究密切合作進行。

在過去的二十年中,以符號系統來解釋人類智能行為的嘗試取得了巨大的成功;以至於資訊處理理論成為當代認知心理學的主流觀點。特別是在問題解決、概念達成和長期記憶等領域,符號操作模型現在佔據主導地位。

資訊處理心理學的研究涉及兩種類型的實證活動。第一種是對需要智能的任務中的人類行為進行觀察和實驗。第二種,與人工智能中的平行活動非常相似,是為符號系統程式設計以模擬觀察到的人類行為。心理學觀察和實驗引導出關於受試者使用的符號過程的假說,這些假說是建構程式想法的重要來源。因此,GPS 基本機制的許多想法,都源自於對人類受試者在執行問題解決任務時大聲思考的協議進行仔細分析。

電腦科學的經驗特徵,在這與心理學的聯盟中表現得淋漓盡致。不僅需要心理學實驗來檢驗模擬模型作為人類行為解釋的真實性,而且從實驗中也產生了新的設計和建構實體符號系統的想法。

其他證據:我們尚未考慮的關於符號系統假說的主要證據是反面證據:缺乏具體的競爭性假說,關於智能活動如何實現——無論是透過人還是機器。大多數建構此類假說的嘗試都發生在心理學領域。在這裡,我們有一系列連續的理論,從通常標記為「行為主義」的觀點到通常標記為「格式塔理論」的觀點。這兩種觀點都沒有作為符號系統假說的真正競爭對手,原因有二。首先,行為主義和格式塔理論都沒有證明,甚至沒有顯示如何證明,其假設的解釋機制足以解釋複雜任務中的智能行為。其次,這兩種理論都沒有像人工智能程式那樣具有精確性。事實上,替代理論足夠模糊,以至於不難給予它們資訊處理解釋,從而將它們同化到符號系統假說中。

結論

我們試圖利用實體符號系統假說的範例,來具體說明電腦科學是通常意義上的科學事業:它提出科學假說,然後透過經驗探究來驗證這些假說。然而,我們選擇這個特定範例來說明我們觀點還有第二個原因。實體符號系統假說本身就是我們之前稱之為「定性結構定律」的重要科學假說。它代表了電腦科學的一項重要發現,如果得到經驗證據的支持(事實上似乎正在發生),將對該領域產生持續重大的影響。

我們現在轉向第二個範例,即搜尋在智能中的作用。這個主題,以及我們將檢驗的關於它的特定假說,也在電腦科學,尤其是人工智能中,發揮了核心作用。

II. 啟發式搜尋

知道實體符號系統為智能行動提供了基礎,並不能告訴我們它們是如何實現這一點的。我們關於電腦科學中定性結構定律的第二個範例解決了後一個問題,它主張符號系統透過使用啟發式搜尋過程來解決問題。這個概括,與上一個一樣,基於經驗證據,並且尚未從其他前提中形式化推導出來。然而,我們稍後將看到,它確實與符號系統假說有一些邏輯聯繫,或許我們可以期待將來有一天能夠形式化這種聯繫。在那之前,我們的故事必須再次是關於經驗探究。我們將描述關於啟發式搜尋的已知知識,並回顧顯示它如何使行動具有智能的實證發現。我們首先陳述這個定性結構定律,即啟發式搜尋假說。

啟發式搜尋假說:問題的解以符號結構表示。一個實體符號系統透過搜尋——即透過生成並逐步修改符號結構直到產生一個解結構——來運用其智能進行問題解決。

實體符號系統必須使用啟發式搜尋來解決問題,因為此類系統的處理資源有限;在有限的步數和有限的時間間隔內,它們只能執行有限數量的處理程序。當然,這不是一個非常強的限制,因為所有通用圖靈機都受到這個限制。然而,我們打算以更強的意義來限制:我們指的是實際上受限。我們可以設想一些在實際意義上不受限制的系統,例如,它們能夠以恒定速率搜尋指數擴展樹的節點,對於深度每增加一個單位都如此。我們在這裡不關心這些系統,而是那些相對於它們所面臨情境的複雜性而言計算資源稀缺的系統。這個限制不會排除任何真實的符號系統,無論是電腦還是人,在現實任務的情境下。有限資源的事實讓我們可以在大多數情況下,將符號系統視為一個序列的、一次一個處理程序的裝置,如果它在任何短時間間隔內只能完成少量處理,那麼我們也可以將其視為一次做一件事。因此,「有限資源符號系統」和「序列符號系統」實際上是同義詞。瞬間分配稀缺資源的問題,如果時間瞬間足夠短,通常可以視為一個序列機器排程的問題。

問題解決

由於解決問題的能力通常被視為系統是否具有智能的首要指標,因此人工智能的大部分歷史自然都圍繞著建構和理解問題解決系統的嘗試。哲學家和心理學家兩千年來一直在討論問題解決,其論述充滿著神秘感。如果你認為符號系統解決問題沒有什麼問題或神秘感,那麼你就是今日之子,你的觀點是在本世紀中葉之後形成的。柏拉圖(以及據他所述的蘇格拉底)甚至難以理解問題是如何被提出的,更不用說它們是如何解決的。讓我提醒你在《美諾篇》中他如何提出了這個難題:

美諾:蘇格拉底,你如何探究你所不知道的事物呢?你會提出什麼作為探究的主題?如果你找到了你想要的東西,你又如何知道這正是你所不知道的東西呢?

為了解決這個謎題,柏拉圖發明了他著名的回憶理論:當你以為自己在發現或學習某物時,實際上只是在回憶前世已經知道的事物。如果你覺得這種解釋荒謬,今天有一種更簡單的解釋,基於我們對符號系統的理解。其近似陳述是:

陳述一個問題是指定 (1) 一類符號結構的測試(問題的解),和 (2) 一個符號結構的生成器(潛在的解)。解決一個問題是利用 (2) 生成一個滿足 (1) 測試的結構。

如果我們知道我們想要做什麼(測試),並且我們不立即知道如何做(我們的生成器不能立即生成滿足測試的符號結構),我們就有一個問題。一個符號系統可以陳述和解決問題(有時)因為它可以生成和測試。

如果問題解決僅此而已,為什麼不直接生成一個滿足測試的表達式呢?這實際上就是我們在許願和做夢時所做的事情。「如果願望是馬,乞丐就可以騎。」但在夢境之外的世界,這是不可能的。知道我們建構出來後如何測試某物,並不意味著我們知道如何建構它——我們沒有任何生成器可以做到。

例如,眾所周知「解決」贏棋問題意味著什麼。存在一個簡單的測試來識別獲勝局面,即檢驗對方國王是否被將死。在夢境世界中,人們只需生成一個針對對手所有反制策略都能導致將死的策略。可惜的是,現有的符號系統(人或機器)中並不存在能夠做到這一點的生成器。相反,西洋棋中的好棋是透過生成各種替代方案,並使用近似且通常是錯誤的度量標準仔細評估它們來尋找的,這些度量標準據稱指示特定行棋路線通往獲勝局面的可能性。有走棋生成器;沒有贏棋生成器。

在問題有走棋生成器之前,必須有一個問題空間:一個符號結構的空間,其中可以表示問題情境,包括初始情境和目標情境。走棋生成器是將問題空間中的一個情境修改為另一個情境的過程。實體符號系統的基本特徵保證它們可以表示問題空間,並且它們擁有走棋生成器。現在,在任何具體情境中,它們如何合成適用於該情境的問題空間和走棋生成器,這個問題仍然是人工智能研究的前沿。

因此,當一個符號系統面臨一個問題和一個問題空間時,它面臨的任務是利用其有限的處理資源生成可能的解,一個接一個,直到找到一個滿足問題定義測試的解。如果系統能夠控制生成潛在解的順序,那麼期望安排生成順序,使得實際的解有很高的可能性早期出現。一個符號系統能夠做到這一點的程度就代表了它展現智能的程度。對於一個處理資源有限的系統來說,智能在於明智地選擇下一步要做什麼。

問題解決中的搜尋

在人工智能研究的頭十年左右,問題解決的研究幾乎等同於搜尋過程的研究。從我們對問題和問題解決的描述來看,很容易理解為什麼會這樣。事實上,可能會有人問是否可能不是這樣。但在我們試圖回答這個問題之前,我們必須進一步探索在那十年的活動中搜尋過程揭示出的本質。

從問題空間提取資訊:考慮一組符號結構,其中一小部分是給定問題的解。進一步假設解在整個集合中隨機分佈。我們的意思是,沒有任何資訊能夠使任何搜尋生成器比隨機搜尋表現得更好。那麼,沒有任何符號系統在解決問題時能夠展現比其他系統更多的智能(或更少的智能),儘管一個系統可能比另一個運氣更好。因此,智能出現的一個條件是解的分佈不完全隨機,即符號結構的空間至少表現出一定程度的順序和模式。第二個條件是符號結構空間中的模式或多或少是可檢測的。第三個條件是潛在解的生成器能夠根據其檢測到的模式表現出差異性。問題空間中必須有資訊,並且符號系統必須能夠提取並使用它。讓我們首先看一個非常簡單的範例,其中智能很容易獲得。

考慮解決一個簡單代數方程式的問題: AX + B = CX + D

測試將解定義為形式為 X = Z 的任何表達式,使得 AZ + B = CZ + D。現在,人們可以將任何產生數字的過程用作生成器,然後將其代入後一個方程式進行測試。我們不會稱這是一個智能的生成器。

或者,可以使用那些利用了原始方程式可以透過在兩邊加上或減去相等量,或兩邊乘以或除以相同量來修改而不改變其解的事實的生成器。當然,透過比較原始表達式與解的形式,並精確地進行那些在方程式中不改變其解,同時使其達到所需形式的更改,我們可以獲得更多資訊來指導生成器。這樣的生成器可能會注意到原始方程式右側存在不需要的 CX,從兩邊減去它並重新收集項。然後它可以注意到左側存在不需要的 B 並減去它。最後,它可以透過除以左側不需要的係數 (A - C) 來消除它。

因此,透過這個過程(現在展現出相當的智能),生成器產生了連續的符號結構,每個結構都是透過修改前一個結構獲得的;並且這些修改旨在減少輸入結構的形式與期望表達式形式之間的差異,同時保持解的其他條件。

這個簡單的範例已經說明了符號系統用於智能問題解決的許多主要機制。首先,每個連續的表達式不是獨立生成的,而是透過修改先前生成的表達式產生的。其次,修改不是隨機的,而是依賴於兩類資訊。它們依賴於在這類代數問題中恒定不變的資訊,這些資訊內建在生成器本身的結構中:所有表達式的修改都必須保持方程式的解不變。它們也依賴於每個步驟都在變化的資訊:檢測當前表達式與期望表達式之間仍然存在的形式差異。實際上,生成器包含了部分解必須滿足的測試,因此不符合這些測試的表達式永遠不會被生成。使用第一類資訊保證了實際生成的只是所有可能表達式中的一小部分,但這個子集中不會丟失解表達式。使用第二類資訊則透過一系列近似,利用一種簡單形式的手段-目的分析來指導搜尋,從而達到期望的解。

指導搜尋的資訊來源沒有什麼神秘之處。我們不需要像柏拉圖那樣賦予符號系統一個前世,在那個前世它已經知道解。一個稍微複雜的生成器-測試系統,無需借助轉世就能完成任務。

搜尋樹:簡單的代數問題可能看起來是一個不尋常的,甚至是病態的搜尋範例。它肯定不是試錯搜尋,儘管有一些嘗試,但沒有錯誤。我們更習慣於將問題解決搜尋想像為產生茂密分支的局部解可能性樹,這些樹可能在找到解之前增長到數千甚至數百萬個分支。因此,如果生成器從它生成的每個表達式中創建 B 個新分支,那麼樹將以 B^D 的形式增長,其中 D 是其深度。代數問題的樹增長具有其分支度 B 等於一的特殊性。

玩西洋棋的程式通常會生成寬廣的搜尋樹,在某些情況下甚至達到一百萬個或更多分支。(雖然這個例子將用於說明我們關於樹狀搜尋的要點,但我們應該注意,西洋棋搜尋的目的不是生成建議的解,而是評估(測試)它們。)對遊戲程式的研究路線之一,一直以來都集中於改進棋盤的表示以及在棋盤上走棋的過程,以加速搜尋並使其能夠搜尋更大的樹。這個方向的基本原理是,動態搜尋越深,結束時的評估就應該越準確。另一方面,有很好的經驗證據表明,最出色的人類棋手(大師)很少探索超過一百個分支的樹。這種效率並非源於比西洋棋程式搜尋得更淺,而是源於在每個節點上進行非常稀疏和有選擇性的分支。這只有在不導致評估惡化的情況下才可能實現,透過將更多選擇性內建到生成器本身中,使其能夠僅選擇那些極有可能為該位置提供重要相關資訊的分支進行生成。

這段討論得出了一個有些自相矛盾的結論:搜尋——潛在解結構的連續生成——是符號系統在問題解決中運用智能的基本方面,但搜尋的數量並非智能展現程度的度量。問題之所在不在於解決它需要大量搜尋,而在於如果沒有應用必要的智能,則需要大量搜尋。當試圖解決問題的符號系統對要做的事情了解得足夠多時,它就會直接朝著目標前進;但只要其知識不足,當它進入未知領域時,它就面臨著在再次找到方法之前必須經歷大量搜尋的威脅。

潛藏在每個生成問題解決方案方案中的搜尋樹呈指數級爆炸的潛力,警告我們不要依賴電腦的蠻力——即使是最大最快的電腦——來彌補其生成器的無知和非選擇性。人們心中仍會週期性地燃起希望,希望找到一台足夠快、並且可以足夠巧妙地程式設計的電腦,透過蠻力搜尋來下出好棋。在理論上關於西洋棋遊戲,沒有任何已知事物排除了這種可能性。對大型樹木進行適度結果的搜尋管理進行的實證研究,使得這個方向比西洋棋最初被選為人工智能的適當任務時更有希望。我們必須將此視為西洋棋程式研究的重要實證發現之一。

智能的形式:那麼,智能的任務就是阻止搜尋呈指數級爆炸的潛在威脅。如何實現這一目標呢?第一條途徑,已經透過代數範例和僅生成「合理」棋步供進一步分析的西洋棋程式所說明,就是將選擇性內建到生成器中:只生成那些看起來有望成為解或處於通往解路徑上的結構。這樣做的通常結果是降低分支速度,而非完全阻止它。最終的指數級爆炸並未避免——除了在特別高度結構化的情境中(如代數範例)——而只是推遲。因此,一個智能系統通常需要補充其解生成器的選擇性,並運用其他資訊使用技術來指導搜尋。

二十年在各種任務環境中管理樹狀搜尋的經驗,產生了一套通用的技術工具包,這是今天每位人工智能研究人員必備的。由於這些技術已在 Nilsson [1971] 等一般著作中描述過,這裡可以簡要總結一下。

在序列啟發式搜尋中,基本問題始終是:下一步該做什麼?在樹狀搜尋中,這個問題又包含兩個組成部分:(1)我們應該從樹中的哪個節點開始搜尋,以及(2)我們應該從該節點朝哪個方向搜尋?有助於回答第一個問題的資訊可以解釋為衡量不同節點與目標的相對距離。最佳優先搜尋(Best-first search)要求從距離目標看起來最近的節點開始搜尋。有助於回答第二個問題——朝哪個方向搜尋——的資訊通常像在代數範例中一樣,透過檢測當前節點結構與解測試描述的目標結構之間的具體差異,並選擇與減少這些特定類型差異相關的行動來獲得。這就是稱為手段-目的分析的技術,它在通用問題解決器 (General Problem Solver) 的結構中起著核心作用。

經驗研究作為人工智慧研究中通用思想來源的重要性,可以透過追蹤這兩個核心思想——最佳優先搜尋和手段-目的分析——在大量問題解決程式中的歷史來清晰地展示。最佳優先搜尋的雛形早在1955年的 Logic Theorist 中就已經存在,儘管當時並未命名。通用問題解決器,體現了手段-目的分析,大約在1957年出現——但它將其與修改後的深度優先搜尋結合,而非最佳優先搜尋。西洋棋程式通常由於記憶體經濟的原因而依賴深度優先搜尋,並在大約1958年後輔以強大的 alpha beta 剪枝程序。這些技術似乎都曾被多次重新發明,很難找到直到1960年代中期或後期才有基於這些概念的、與任務無關的、關於問題解決的通用理論討論。它們從數學理論獲得的形式化支持仍然微乎其微:一些關於使用 alpha-beta 啟發式可以減少搜尋的定理,一些關於最短路徑搜尋的定理(由 Nilsson [1971] 回顧),以及一些關於帶有概率評估函數的最佳優先搜尋的最新定理。

「弱」方法與「強」方法:我們一直在討論的技術致力於控制指數擴展而非防止它。因此,它們被恰當地稱為「弱方法」——當符號系統的知識或問題空間中實際包含的結構量不足以完全避免搜尋時使用的 S。將可以公式化為線性規劃問題的高度結構化情境與組合問題(如旅行商問題或排程問題)的結構較弱情境進行對比是很有啟發性的。(這裡的「結構較弱」是指關於問題空間結構的相關理論不足或不存在。)

在解決線性規劃問題時,可能需要大量的計算,但搜尋不會分支。每一步都是通往解決方案的途徑。在解決組合問題或證明定理時,很少能避免樹狀搜尋,而成功取決於我們所描述的那種啟發式搜尋方法。

並非所有人工智能問題解決的研究方向都遵循我們所概述的道路。定理證明系統的工作提供了一個略有不同的範例。在這裡,從數學和邏輯引入的思想對探究方向產生了強烈影響。例如,當無法證明完整性屬性時(這有點諷刺,因為大多數有趣的數學系統已知是不可判定的),人們曾抵制使用啟發式。由於無法證明最佳優先搜尋啟發式或許多類型選擇性生成器的完整性,這一要求相當具有抑制作用。當定理證明程式不斷因其搜尋樹的組合爆炸而癱瘓時,人們開始考慮選擇性啟發式,這些啟發式在許多情況下證明是通用問題解決程式中使用啟發式的類比。例如,支持集啟發式是向後工作的形式,適用於歸結定理證明環境。

經驗總結:我們現在已經描述了我們第二個定性結構定律的運作,該定律主張實體符號系統透過啟發式搜尋來解決問題。此外,我們還研究了啟發式搜尋的一些輔助特徵,特別是它總是面臨的搜尋樹指數級爆炸的威脅,以及它用來避免這種威脅的一些手段。關於啟發式搜尋作為問題解決機制的有效性,人們意見不一——意見取決於考慮哪些任務領域以及採用哪種適當性標準。透過設定低目標可以保證成功——或透過設定高目標而失敗。證據可以總結如下。很少有程式在「專家」專業水平上解決問題。Samuel 的西洋跳棋程式以及 Feigenbaum 和 Lederberg 的 DENDRAL 是最著名的例外,但也可以指出一些用於調度(scheduling)和整數規劃(integer programming)等運籌學問題領域的啟發式搜尋程式。在許多領域,程式的表現達到稱職業餘者的水平:西洋棋、一些定理證明領域、許多遊戲和謎題。對於具有複雜感知「前端」的程式,例如視覺場景識別器、語音理解器、必須在真實空間和時間中操縱的機器人,程式尚未達到接近人類的水平。儘管如此,已經取得了令人矚目的進展,並且在這些困難任務上累積了大量的經驗。

我們對已經出現的特定績效模式沒有深入的理論解釋。然而,從經驗角度來看,我們可以得出兩個結論。首先,從人類專家在西洋棋等任務中的技能學到的知識來看,任何能夠與其績效相匹配的系統,都必須在其記憶體中訪問大量語義資訊。其次,人類在感知成分較大的任務中的部分優勢,可以歸因於人類眼睛和耳朵的特殊內建平行處理結構。

無論如何,效能的品質必然取決於問題領域和用於解決問題的符號系統的特性。對於我們感興趣的大多數真實任務領域,領域結構尚未證明足夠簡單,以至於(目前)能產生關於複雜性的定理,或透過經驗以外的方式告訴我們,現實世界問題相對於我們的符號系統解決能力有多大以及有哪些特性。這種情況可能會改變,但在它改變之前,我們必須依賴經驗探索,使用我們知道如何建造的最佳問題解決器,作為了解問題難度大小和特性的主要知識來源。即使在線性規劃等高度結構化的領域,理論在加強最強大解決算法的啟發式方面,也比在提供深入的複雜性分析方面更有用。

不需大量搜尋的智能

我們對智能的分析將其等同於從問題空間中提取和使用資訊的能力,以便盡快直接地生成問題的解。因此,提高符號系統問題解決能力的新方向,可以等同於提取和使用資訊的新方法。至少可以確定以下三種方法。

資訊的非局部使用:首先,一些研究人員注意到,在樹狀搜尋過程中收集的資訊通常只在局部使用,僅用於幫助生成資訊的特定節點做出決策。透過對變化的子樹進行動態分析獲得的關於西洋棋位置的資訊,通常僅用於評估該位置,而不是評估可能包含許多相同特徵的其他位置。因此,相同的事實必須在搜尋樹的不同節點上重複發現。簡單地將資訊從其產生的環境中取出並普遍使用並不能解決問題,因為資訊可能僅在有限的環境範圍內有效。近年來,已經進行了一些探索性努力,將資訊從其起源環境傳輸到其他適當的環境。雖然現在判斷這個想法的力量如何,甚至如何確切實現它,還為時過早,但它顯示出相當大的希望。Berliner [1975] 一項重要的研究方向是使用因果分析來確定特定資訊有效的範圍。因此,如果西洋棋位置的弱點可以追溯到導致它的棋步,那麼在源自同一棋步的其他位置中也可以預期出現相同的弱點。

HEARSAY 語音理解系統採用了另一種方法來使資訊全局可用。該系統透過在多個不同層面上(語音、詞彙、語法和語義)進行平行搜尋來識別語音字串。當這些搜尋中的每一個提供並評估假說時,它會將其獲得的資訊提供給所有來源都可以讀取的共享「黑板」。例如,這種共享資訊可以用來消除假說,甚至整個類別的假說,否則這些假說將必須由其中一個處理程序進行搜尋。因此,提高我們非局部使用樹狀搜尋資訊的能力,有望提高問題解決系統的智能。

語義識別系統:提高智能的第二個積極可能性,是為符號系統提供關於其正在處理的任務領域的豐富語義資訊。例如,對西洋棋大師技能的實證研究表明,大師技能的一個主要來源是儲存的資訊,這些資訊使他能夠識別西洋棋盤上的大量特定特徵和特徵模式,以及利用這種識別來建議與識別出的特徵相關的行動。當然,這個一般思想從西洋棋程式誕生之初就已經納入了其中。新穎之處在於認識到,達到大師級水平所需的此類模式和相關資訊的數量可能非常龐大:大約需要50,000個。用識別替代搜尋的可能性之所以出現,是因為一個特定的,尤其是罕見的模式,如果與問題空間的結構緊密聯繫,則可以包含大量資訊。當該結構「不規則」,且無法用簡單的數學描述時,那麼了解大量相關模式可能就是智能行為的關鍵。在任何特定任務領域是否如此,是一個更容易透過經驗研究而不是理論來解決的問題。我們利用豐富語義資訊和用於訪問這些資訊的模式識別能力建構符號系統的經驗仍然極其有限。上面的討論專門指與識別系統相關的語義資訊。當然,關於語義資訊處理和語義記憶組織的人工智慧研究領域也很大,不在本文討論範圍之內。

選擇適當的表徵:第三個研究方向關注的是透過選擇適當的問題空間來減少或避免搜尋的可能性。一個能戲劇性地說明這種可能性的經典例子是殘缺棋盤問題。一個標準的 64 格西洋跳棋盤可以用 32 個 1x2 的矩形方塊完全覆蓋,每個方塊覆蓋兩個格子。現在假設我們從棋盤的兩個對角相對的角切掉格子,剩下總共 62 個格子。這個殘缺的棋盤可以用 31 個方塊完全覆蓋嗎?透過(字面上)天賜的耐心,可以透過嘗試所有可能的排列來證明無法實現這樣的覆蓋。對於耐心較少但智能較高的人來說,另一種方法是觀察西洋跳棋盤的兩個對角相對的角顏色相同。因此,殘缺的棋盤比另一種顏色少兩個格子。但是每個方塊覆蓋一種顏色的一個格子和另一種顏色的一個格子,任何一組方塊都必須覆蓋相同數量的每種顏色的格子。因此,沒有解決方案。符號系統如何發現這個簡單的歸納論證作為解決問題的一種替代方法,而不是徒勞地試圖在所有可能的覆蓋中進行搜尋?如果一個系統找到這個解決方案,我們將給予它很高的智能分數。

然而,或許在提出這個問題時,我們並沒有逃離搜尋過程。我們只是將搜尋從可能的解決方案空間轉移到可能的表徵空間。無論如何,從一個表徵轉移到另一個表徵,以及發現和評估表徵的整個過程,在問題解決研究領域仍然是 largely unexplored territory。關於表徵的定性結構定律還有待發現。尋找它們在未來十年幾乎肯定會受到相當多的關注。

結論

這就是我們關於符號系統和智能的論述。從柏拉圖的《美諾篇》到現在,道路漫長,但也許令人鼓舞的是,這條道路上的大部分進展是自二十世紀之交以來取得的,其中很大一部分是在本世紀中葉之後取得的。思想仍然完全是無形的、不可言喻的,直到現代形式邏輯將其解釋為對形式標記的操縱。而且它似乎仍然主要棲息在柏拉圖理念的天堂,或同樣模糊的人類心靈空間,直到電腦教我們符號如何被機器處理。我們今天紀念的 A.M. Turing,在從現代邏輯到電腦的這些發展的世紀中葉交叉點上做出了他的偉大貢獻。

實體符號系統:對邏輯和電腦的研究向我們揭示,智能存在於實體符號系統中。這是電腦科學最基本的定性結構定律。

符號系統是模式和處理程序的集合,後者能夠產生、銷毀和修改前者。模式最重要的屬性是它們可以指稱對象、處理程序或其他模式,並且當它們指稱處理程序時,它們可以被解釋。解釋意味著執行被指稱的處理程序。我們熟悉的兩種最重要的符號系統類別是人類和電腦。

正如前面所述,我們目前對符號系統的理解是透過一系列階段發展起來的。形式邏輯使我們熟悉了作為思想原料的、在語法上處理的符號,以及根據精心定義的形式化處理程序操縱它們的想法。圖靈機使符號的語法處理真正像機器一樣,並證實了嚴格定義的符號系統的潛在普適性。電腦的儲存程式概念再次證實了符號的可解釋性,這在圖靈機中已經隱含。列表處理將符號的指稱能力推向前沿,並以允許獨立於底層物理機器固定結構的方式定義了符號處理。到1956年,所有這些概念都已可用,並擁有實現它們的硬體。對符號系統智能的研究,即人工智能的主題,可以開始了。

啟發式搜尋:AI 的第二個定性結構定律是符號系統透過生成潛在解並測試它們來解決問題,即透過搜尋。通常透過創建符號表達式並依序修改它們直到滿足解決條件來尋找解。因此符號系統透過搜尋解決問題。由於它們資源有限,搜尋無法一次性完成,必須是序列的。它留下了一條從起點到目標的單一路徑,或者如果需要更正和回溯,則留下整個此類路徑的樹。

當符號系統被純粹的混亂包圍時,它們似乎無法展現智能。它們透過從問題領域提取信息並利用這些信息來指導搜尋,避免走錯路和繞遠路來運用智能。問題領域必須包含信息,即一定程度的秩序和結構,方法才能奏效。美諾悖論透過以下觀察得到解決:信息可以被記憶,但新的信息也可以從符號指稱的領域中提取。在這兩種情況下,信息的最終來源都是任務領域。

經驗基礎:人工智能研究關注符號系統必須如何組織才能表現智能。該領域二十年的工作已經積累了相當可觀的知識,足以填滿幾本書(實際上已經如此),其中大部分是以關於特定類別符號系統在特定任務領域行為的相當具體的經驗形式存在。然而,從這些經驗中,也出現了一些跨越任務領域和系統的概括,關於智能及其實現方法的一般特性。

今天早上我們試圖闡述其中的一些概括。它們大多是定性的而非數學性的。它們更像是地質學或演化生物學的味道,而不是理論物理學的味道。它們足夠強大,使我們今天能夠為相當廣泛的任務領域設計和建構中等智能系統,並對人類智能在許多情境下如何運作獲得相當深入的理解。

下一步?在我們今天的論述中,我們提到了懸而未決的問題和已解決的問題——兩者都很多。我們認為過去四分之一個世紀環繞這個領域的探索的興奮感並未減弱。未來一段時間的進展速度將由兩個資源限制決定。一個是可用的計算能力。第二個,也許更重要的,是願意投身這個領域研究作為最具挑戰性任務的年輕電腦科學家數量。

A.M. Turing 在他那篇著名的「計算機器與智能」論文結尾寫道: 「我們只能看到很短的距離,但我們可以看到那裡有很多需要做的事情。」

圖靈在1950年看到的許多需要做的事情已經完成,但待辦事項仍然像以往一樣充滿。也許我們對他上面這句簡單的陳述過度解讀了,但我們願意認為圖靈在其中認識到所有電腦科學家本能地知道的基本真理。對於所有實體符號系統而言,正如我們註定要在問題環境中進行序列搜尋一樣,關鍵問題永遠是:下一步該做什麼?

參考文獻

Berliner, H. [1975]. Chess as problem solving: the development of a tactics analyzer. Ph.D. Dis., Computer Sci. Dep., Carnegie-Mellon U. (unpublished). McCarthy, J. [1960]. Recursive functions of symbolic expressions and their computation by machine. Comm. ACM 3, 4 (April 1960), 184-195. McCulloch, W.S. [1961]. What is a number, that a man may know it, and a man, that he may know a number. General Semantics Bulletin Nos. 26 and 27 (1961), 7-18. Nilsson, N.J. [1971]. Problem Solving Methods in Artificial Intelligence. McGraw-Hill, New York. Turing, A.M. [1950]. Computing machinery and intelligence. Mind 59 (Oct. 1950), 433-460.