介紹

很高興歡迎各位來到 ACM AM 圖靈講座。這場年度講座由 ACM AM 圖靈獎得主發表,圖靈獎是以偉大的英國數學家和電腦科學家 Alan M. Turing 命名,他是圖靈測試的創始人,我們一直在慶祝他的百歲誕辰,大約兩週前在舊金山的 ACM 舉辦了一場盛大的慶祝活動。圖靈獎常被稱為計算領域的諾貝爾獎,是電腦科學家能獲得的最負盛名的獎項,並附帶 250,000 美元的獎金,由 Intel 和 Google 慷慨提供。今年 ACM 圖靈獎的得主和我們今天上午的演講者是 Judea Pearl,他是加州大學洛杉磯分校的電腦科學與統計學教授。他獲此殊榮是為了表彰他在人工智慧領域的基礎貢獻,這些貢獻源於他對機率與因果推論演算的發展。因此,他能在此會議上向各位聽眾發表演講非常恰當,因為他是推動人工智慧科學與藝術的真正先驅之一。我使用「藝術」一詞並非輕率,因為如果您了解 Pearl 教授的任何著作或書籍,您會知道他既是一位科學家,也是一位哲學家。他今天上午演講的主題是因果推論的機械化:一項迷你圖靈測試及更遠大目標。我很榮幸介紹 Judea Pearl。謝謝,Kelly。謝謝 Kelly 精彩的介紹。我很高興來到這裡。我確實要求以這種形式發表這次圖靈講座,因為我認為重要的是,我不僅與你們分享這個獎項的榮耀,你們當然值得與我在這個遊戲的早期階段一同分享,而且我認為你們也應該聽取自從我們上次一同在沙盒中玩耍並建造那些城堡以來,這場冒險中發生的進展報告。此外,我認為感謝這個組織在我的工作尚未流行、甚至有些人說它充滿爭議或惡作劇時對其給予的培育也很重要。但我要感謝各位,首先,你們都是我將要談論的這些發展的夥伴,包括同事、共同作者、共同首席研究員,以及學生和審稿人。我不知道我是否應該感謝我的審稿人。值得注意的是,我最重要的三項工作有兩項發表在 AAAI 的會議記錄中。所以我想從這裡開始。我的第一張投影片是關於 AAAI 作為我談論的一些惡作劇想法的溫床。一個是發生在 1982 年的事情。我相信你們中沒有多少人記得在匹茲堡乘船的那次旅行,那就是我關於樹狀結構中信念傳播的第一篇論文發表的地方。然後我注意到一篇關於 Du-calculus 的早期論文發表在 1994 年西雅圖的 AAAI 會議上。那是一篇與 Adnan Dawish 合作的論文。您可以看到標題中出現了一個符號,Du A。它沒有被拒絕。我敢肯定它不會發表在任何其他會議記錄中,也許是統計學或其他任何領域。我想提及的第三篇論文是同一場會議,1994 年西雅圖,那篇與 Balki 合著的關於反事實查詢機率評估的論文。我選擇這三篇論文是因為它們是我們今天擁有的因果推論三層次階層的標題。它們已經被確立為一個非常穩固的階層,很少混淆,您可以從語法上判斷一個句子是機率性的、因果性的還是反事實的。

圖靈與迷你圖靈測試

但這不是關於我的工作的演講。這是關於 Turing 的演講。所以讓我從 Turing 和他的圖靈測試開始。我們都讀過他 1950 年發表在 Mind 雜誌上的論文,以及這項測試,它是許多人工智慧工作的引擎。Turing 對於電腦能否思考這個問題的答案非常簡單。可以,如果它的行為像是在思考,而「行為」指的是它能回答關於一個故事、一個主題或一個情境的非瑣碎問題。我關注的是「非瑣碎」的問題。我沒有選擇一個主題或故事,而是選擇了一種模式。所以我要向你們展示我們許多人在不同領域進行迷你圖靈測試的工作,但我認為因果推論領域的工作劃分了這個領域,它選擇了一項任務,這項任務在其使用的模式方面是獨特的,而不是在領域方面。所以這裡就是 Turing 如何描述與機器的假設性對話。首先是關於一首十四行詩的問題,關於詩歌。答案當然是迴避性的。但其中仍然帶有人類的元素。我從來寫不出詩來。第二個答案是關於算術。一個關於算術的問題。你能把這個和那個加起來嗎?答案也是人性的。你會停頓 30 秒,然後給出答案。這也是一個非常簡單的領域。然後 Turing 說,我們來看國際象棋。你玩國際象棋嗎?是的。我的王在 K1,沒有其他棋子。你只有一個王在 K6,一個車在 R1。輪到你走了。你會怎麼下?機器當然在停頓後回答,將死。所以這些是 Turing 在他第一篇論文中舉例說明的三個問題。狹窄的領域:算術、詩歌和國際象棋。合理的答案。

論兒童機器

然後在他書的第七章,Barbara Gross 向我展示了,他談論兒童機器。所以他更進一步說,他基本上談論的是機器學習。我們為什麼要考慮一個成年人呢?我們為什麼不從兒童機器開始呢?他說,這應該更容易,因為兒童不需要像我們期望成年人那樣多的背景知識。我們的希望是,兒童大腦中的機制很少,很容易就能被程式化。我認為 Turing 低估了視覺和運動行為在我們高級智能中扮演的角色。所有來自兒童世界的隱喻在兒童處理數學的能力中發揮了巨大的作用。我認為 Turing 低估了從兒童大腦開始的難度。然後他轉向了機器學習,並對機器學習與演化之間的聯繫發表了一些革命性的言論。他說適者生存是一種衡量優勢的緩慢方法。實驗者,也就是程式設計師,透過運用智能,應該能夠加速它。如何加速?透過在需要的地方創造人工突變。如果他能追蹤到某些弱點的原因,他可能會想到一種能夠改善它的突變。我認為這裡有一個偉大的願景,預見了兒童的能力。他的想法是程式設計師能夠追蹤程式的弱點到關鍵點,然後創造一個突變。但問題是,機器為什麼要有自己的藍圖,能夠精確定位弱點的根本原因,然後改變競爭性計算資源之間的優先順序呢?

迷你圖靈測試:因果推論範例

我現在將向你們解釋為什麼我選擇因果推論作為一個值得冠以迷你圖靈測試稱號的領域。所以想像一下,你這裡有實驗室,中間有一個隔板,就是審問者和機器之間那個著名的隔板。輸入會是一個關於記錄(一個已知領域)的故事。然後問題會限定於三種類型:是什麼 (what is)、如果…會怎樣 (what if)、以及為什麼 (why)。預期的答案是「我相信結果會是這樣」。這裡的故事,我在 1988 年的書和後來的《Causality》中多次使用。故事是這樣的:你走出家門,看到人行道可能濕或乾,可能滑或不滑。你處於乾季或濕季,你懷疑如果人行道濕了,那要麼是下雨了,要麼是灑水器開著。一個非常簡單的故事,五個二元變數,與你的日常生活經驗高度相關。然後任務是將故事告訴機器,並程式設計機器,讓它能回答關於這三種模式類型的簡單問題。問題如下。第一個問題:如果現在是乾季,而且人行道很滑,下雨了嗎?你期望得到的答案是「不太可能」。灑水器開著的可能性更大,只有非常小的可能性是它根本沒濕。可能還有其他原因導致它滑。這是你在什麼基礎上期望得到的答案?你將故事程式設計進機器的方式。以及你程式設計各種事件可能性之間關係的方式。所以這是一個關於預期、證據、觀察以及結果可能性的例子。

論賽爾的中文房間論證

接著是關於行動的問題。你是否意味著,如果我們真的打開灑水器,下雨的可能性會變小?你希望機器回答「不,看見和行動是不同的。」「不,不,下雨的可能性會保持不變,但人行道肯定會變濕。」現在是反事實性質的問題。假設我們看到灑水器開著,人行道濕了。如果灑水器當時沒開呢?我稍後會解釋為什麼我如此執著於反事實,但首先我想讓你們替機器回答這些問題。我期望機器會說「人行道會是乾的,因為很可能是乾季。」也就是說,你接受這裡的觀察結果,並推斷,「哦,這一定是個乾季。」那麼如果灑水器當時沒開,過去保持不變。改變的是未來。所以答案應該是「因為很可能是乾季,而人行道是濕的。」這是一種非常非常微不足道的問題-回答環節,我們對其有所期待。我們都記得中文房間的論點。他說「不,光是回答這個問題並不代表機器會思考,因為這裡假設機器根據一本規則書來回答中文問題。規則書中印有中文或英文的每個句子,都有相應的中文或英文答案。」「這並不意味著機器理解中文,僅僅因為它在書中查找答案。」那麼,Searle 忽略的是事實上宇宙中沒有足夠的分子來組成那本書,因為如果你只計算句子的數量,可能的組合數量,有人計算過,宇宙中沒有足夠的分子。那麼,僅僅因為你遇到組合難題,機器就會思考嗎?是的。答案是肯定的。因為當你必須克服這樣的問題時,唯一的方法就是利用約束條件。而理解約束條件就是我們所說的理解。這是理解的必要組成部分。所以即使對於灑水器的例子,如果你只是,姑且說,10 個二元變數,如果你只用 Searle 的中文書方法來計算所需的表格條目數量,你很快就會得出僅用於機率就需要 1000 個條目,再乘以另一個 1000 用於每個行動,然後當你轉到反事實時,你又有另一個 1000。所以僅僅這個簡單的人行道故事,你就已經有了一個十億長的表格。所以因為這些模式,關於會發生什麼,如果我做什麼,或者如果我沒做某事,或者如果某事件沒發生,之間有許多許多約束條件。即使是兒童也能相當清晰地回答這些問題。問題是如何做到?

因果推論為何重要

下一個問題我必須向你們解釋的是,為什麼我認為因果對話很重要,以及為什麼我們應該在這上面進行圖靈測試。首先,有很多圖靈測試。圖靈從詩歌、算術和國際象棋開始。你可以想像有人為股票市場建造了圖靈測試。我認為這是最容易做的圖靈測試之一,因為那裡沒有任何約束條件或專業知識。它非常像詩歌。我為什麼要轉向因果推論呢?第一,因為它在人類認知和倫理中如此普遍存在。我有一些關於這個的投影片。而且它在兒童的發展中根深蒂固。第二,我認為它是科學思維的基石。第三個原因是它對機器人學很重要。第三個原因,這個原因可能佔據了我五年或十年以上的生活,那就是有很多客戶。存在許多可以從因果推論的任何見解中受益的資料密集型科學應用。我說過,有數千個渴求且漫無目的的客戶。我應該說他們不是窮到渴求。他們資源充足。所有製藥公司都是這些客戶領域的一部分。但他們渴求的是想法,因為他們漫無目的。因為因果推論尚未被形式化。我們透過努力讓機器人理解因果關係而獲得的任何見解,都可以立即轉化為在這些領域可以節省數百萬美元的方法。

人類認知與倫理中的因果關係

讓我從人類認知和倫理開始。我喜歡從 Adam 和 Eve 開始。還有哪裡可以開始呢?你可以立刻看到,當上帝問 Adam,「嘿,你吃那棵樹上的果子了嗎?」 Adam 問道,他沒有回答是或否。我的意思是,事實是給上帝的,藉口是給人的。她遞給我果子,我就吃了。而 Eve 當然在因果解釋方面也不遜色。她說,「那條蛇,別怪我,蛇欺騙了我,我就吃了。」所以,推卸責任給別人的需要,在人類認知中是根深蒂固的。

正義感與科學的基石

接著是我們正義感的基礎。你們都記得上帝告訴 Abraham 他即將毀滅 Sodom 和 Gomorrah 城嗎?Abraham 說,「嘿,你難道要將義人與惡人一同毀滅嗎?你不能那樣做。」「I shall fetch all her arrets, loyaseh mishpat」,請原諒我的希伯來語,但三千年前聽起來就是這樣。「I shall fetch all her arrets, loyaseh mishpat」。如果城裡有五十個義人呢?這裡有聖經中的第一個反事實句。如果當時有五十個呢?看看上帝怎麼說。如果我在 Sodom 城裡找到五十個好人,我會為了他們赦免整個地方。你認為 Abraham 在那時放棄了嗎?沒有。他降到地上說,「那四十五個呢?我的意思是,你會為五個人大動干戈嗎?」上帝說,「不,我不會毀滅它。」然後他降到四十個,然後是三十個,二十個,十個,你知道接下來發生了什麼。其餘的都是歷史了。問題當然是,Abraham 想做什麼,玩什麼遊戲?Abraham 是在懷疑上帝數數的能力,還是分辨義人與惡人的能力?不是的。Abraham 是第一個科學家。他試圖找到一個通則。門檻在哪裡?關於集體懲罰的通則。從這個意義上說,他是第一個科學家。因為科學是什麼?就是試圖找到一個通則,而不是關於這個特定事件。

科學中的因果關係

所以在這裡我轉向科學來向你們證明反事實確實是科學的基礎。我們都習慣於做物理學中的問題,比如虎克定律告訴你,彈簧的長度 y 等於一個常數,我取二,乘以重量。所以 y 等於 2x,而 x 等於一公斤。計算出彈簧的長度是多少,你以為這全都是算術,對吧?這裡就是解法。你只需要解一個兩個未知數的方程式組。問題是,這個方程式組與那個方程式組等價嗎?根據我的代數書,兩個方程式組如果保留解,就是等價的。這兩個保留解。但它們等價嗎?你會說當然不等價。因為左邊的方程式組可以回答右邊不能回答的問題。所以它們不等價。這裡有一個問題,這裡有第三個替代方案。我會告訴你我為什麼把它放在那裡。因為左邊的方程式組可以回答一個反事實問題。如果當時 x 是三,y 就會是六。這可以翻譯成,如果我們把重量提高到三,長度會是多少?會是六。我們是怎麼做到的?我們抹去了方程式 x 等於一。我們用 x 等於三替換它。我們解一個新的方程式組,這個新的方程式組現在被新的資訊修改過了。我們給你答案。唰,y 等於六。我們為什麼在這裡沒這麼做呢?它是等價的,對吧?我抹去了 x 等於二分之一 y。用 x 等於三替換它。我得到 y 等於四。那是錯誤的答案,對吧?所以每個高中生在解物理問題時,都在從事反事實推論。他們知道要抹去哪個方程式,要保留哪個方程式。他們保留傳達通用規則的方程式,並抹去那些要麼是邊界條件,要麼是受反事實前提影響的方程式。所以如果情況是這樣,那麼我們之前看到的等號並不是真正衡量等價的標誌。它實際上是一個方便的替代符號,替代了電腦程式語言中的賦值符號。它想像著自然界在決定彈簧長度之前,會環顧四周尋找所有可能影響長度的變數,看著重量說,「啊,就是它。」參考彈簧上的重量,並決定長度的值。所以這是物理學的概念。自然界看著變數,經過某些過程,然後為其他變數賦值。如果真是這樣,那就需要一種不同的代數,因為它涉及抹去方程式,我們在圖中用箭頭而不是賦值符號來表示。這就是結構圖、因果圖中箭頭的意義。它是自然法則策略的描述。

哲學觀點

好的,我現在說服你們物理學全都是關於反事實的了。我記得我和某人的一次談話,他說,「你在開玩笑吧,這不可能。」總之,那就是我的歷史。反事實和因果關係在人類推論中的作用並沒有被許多哲學家忽略。早在公元前 430 年的希臘時代,Democritus 就說,「我寧願發現一個因果關係,也不願當波斯王。」當時當波斯王不像今天這麼危險。而 Hume 當然對此感到困惑,他說,「這個因果關係的概念是什麼?我得解決它。」他提出了這樣一個概念:因果關係不是神的恩賜,而是我們從經驗中學習到的東西。這是他著名的段落。我們記得見過這種我們稱之為火焰的物體,並感覺過這種我們稱之為熱的感覺。我們不作任何進一步的儀式,就稱前者是冷的…

因果推論機械化的挑戰

我們需要,如果他們自己學不會,我們至少需要有辦法透過指導或花時間(如果我們理解發生了什麼)坐下來教他們我們所知道的,以便他們能夠正確地行動並回答關於因果關係的查詢。這並非微不足道,因為你可能會說,因為現在哲學家面臨的難題轉化為工程問題。如何從環境中獲取因果資訊的問題轉化為機器人如何從環境中獲取因果資訊?我們人類如何得出因果標籤的問題轉化為機器人應該如何使用從其創造者程式設計師那裡收到的因果資訊來理解或正確回答查詢?第二個問題雖然看起來微不足道,但實際上並不微不足道。因為如果你只遵循規則,你會得到一些意想不到的結果。如果輸入是「如果草是濕的,那就下雨了。」「如果你打破這個瓶子,草就會變濕。」你不會想要得到這樣的輸出:「如果我們打破瓶子,那就下雨了。」所以僅僅改變規則是行不通的。你需要一些更多的東西。那更多的東西是什麼?

演講綱要

在我們談到那裡之前,先給一個我將要講述的概要。我將談論三層次階層,問題範圍從「如果我看到什麼」,這是機率和信念,到「如果我做什麼」,再到「如果我做了不同的事」,這是一個反事實問題。如果你想用機率來修飾它們,答案有多可能,但這不是必須的。是什麼,如果什麼,以及為什麼?現在我將向你們報告我們從舊有的貝氏網路到因果和反事實的旅程。我們必須理解它們的區別以及橫亙在我們道路上的心智障礙。我將討論這個。我們必須談談什麼讓一個因果模型成為因果模型,而不是其他東西。它如何被檢驗?這兩者是相關聯的。如果一個模型有可檢驗的含義,那麼你就可以希望能透過學習它來發現它。一個沒有任何可檢驗含義的模型無法從資料中被發現。然後我將談論三個應用。介入的效果、Du-calculus 的演變、以及反事實的論證。然後我將談論應用。這三個任務在理論上已經相對完整地解決了。應用將包括評估計畫和政策,其次是中介分析,區分直接原因和間接原因,第三個是泛化,Elias 今天下午將向你們講述這個(拼寫錯誤)。

統計學與因果推論的範式差異

這裡才是真正的統計學。這是凌駕於統計思維和機器學習之上的範式。其核心思想是,在幕後某個地方有一個名叫聯合機率分佈的聖誕老人,他偶爾慷慨地吐出資料。然後我們的工作是從資料中推斷出聖誕老人(聯合分佈函數)的性質或某方面。估計平均值,或者得出一個分類器,或者判斷購買了產品 A 的客戶是否也會購買產品 B。你看,這類問題是整潔且形式化的,因為它可以用機率論的語言清晰地表達出來。你甚至有一個簡短的句子,「找到 B 發生在 A 發生的條件下的機率」,這是條件機率,這個概念源於 250 年前的貝葉斯神父。除了問題的複雜性之外,沒有什麼特別的。Q 可以非常非常複雜。聯合分佈可以定義在許多許多變數上,連續的、二元的等等。所以這不容易,但範式是一樣的。因果推論處理的是一個不同的範式。你問一個問題,例如,推斷購買了產品 A 的客戶在我們價格翻倍後是否會購買產品 B。所以我們早上起床,我們預期,我們變得異想天開地貪婪。只是想知道如果我們提高價格會發生什麼。我們問一個問題,在 A 發生且我們做了某件可能以前從未做過的事情(我們價格翻倍)的條件下,B 的機率會是多少?這甚至不是 P 的一個方面,因為它不同於 P 在價格翻倍時的條件機率。這是看見價格翻倍和讓價格翻倍之間的區別。這裡是一個反事實問題。如果當時我們價格翻倍了呢?這不是聖誕老人 P 先生的一個方面或性質。那這是什麼呢?這是資料生成模型的性質,它在聯合機率分佈背後。是的,聯合機率吐出資料。是的,我們得到這些樣本,我們需要推斷出一些性質,但推斷的是什麼?不是 P 的性質,而是資料生成模型的性質。這就是我之前向你們談到的自然界不變的策略,有時稱為機制、法則、定律、協定或反事實,自然界依據這些策略來為變數賦值進行分析。對我們來說,這絕對是個技巧,對統計學家來說是折磨。這需要一點點想像力的飛躍,去思考自然界,而不是實驗者,也不是測量。這對人工智慧領域之外的人來說是一次創傷性經歷。所以如果你能和外人交談,我希望你意識到這一點。

因果模型的形式化

一旦我們接受了這個概念,讓我們將其泛化。讓我們想像整個世界只是一系列彈簧的集合。所以它由一系列為這裡數萬億個不同變數賦值的函數所驅動。系統中的每個 vi 都是一個函數,它的值取決於系統中的其他變數。其中一些是外生的,你不關心解釋,你關心效果,而一些是內生的。我們的工作是將這些編碼到機器上,以便機器能夠回答我們那些非常合理的問題,提供合理且可信的答案。比如「如果看到灑水器開著呢?」這是一個線性情況下,這些 fi 中的典型方程式。Y 被賦予一個值。在自然界花了一些時間,也許十億分之一秒,觀察 X,乘以一個常數,加上一些雜訊,然後決定 Y 應該得到一個小 y 的值。大自然的傑作,女士們先生們。我們的工作是加密或解密自然的映射關係,但這非常雄心勃勃。至少,如果我們從自然界獲得了資料,我們應該能夠回答反事實查詢。我們都熟悉電路圖。這是一個反事實的神諭機,因為如果你看電路圖,你就能回答反事實問題。如果我把這個邏輯或閘換成一個邏輯與閘會怎麼樣?或者如果我把這個 Y 連接到一個 3.5 伏特的電源會怎麼樣?即使電路的設計者從未預料到如此瘋狂的問題和事件,比如將其連接到電源,工程師瞥視電路圖後,就有能力思考答案並正確地做到。所以這一切從何而來?它來自於這一系列函數的一些基本性質。其中最基本的一個,最終由此衍生出其他一切,是如果你碰巧很幸運,你的方程式是遞迴的,沒有迴圈,並且擾動恰好是相互獨立的,那麼不論你的函數是什麼,不論擾動的分佈是什麼,你都能說出你觀察到的機率分佈的一些情況。所以那一系列彈簧的結構決定了你的分佈函數中非常基礎的東西,那就是一個積形式,也就是條件獨立性。從中得出的下一個推論是你有能力回答關於介入的問題。一旦你有這個積形式,如果有人問你,「如果我採取行動會怎樣?」你只需簡單地取一個截斷積。這被稱為操控定理或截斷因子化。這是同一個積形式,但你從積中刪除了那些因為被強制設定為常數而不再聽從其父節點的變數。

從貝氏網路到因果模型

這裡又回到我們的灑水器例子。在你行動之前,你有根據這個菱形形狀的組成,這個由那裡找到的積形式寫下來,變數在給定其父節點條件下的積,變數在給定其父節點條件下的積,這沒什麼特別的,但如果你採取一個行動,比如打開灑水器,你就從討論中刪除了那個過程,因為 Sprinkler 先生不再聽從 Season。Sprinkler 先生在你打開它時被你的肌肉奴役。所以它被一個常數取代了,讓我看看現在。我還剩 12 分鐘。我會比預期的快一點,但你們這麼專心。我討厭讓你們失望。我有很多好聽的故事要告訴你們。這是一段美好的旅程,我必須告訴你們。

思想與演算的演變

好的,所以我們現在有了一個關於行動的形式化方法,而且它並非萌芽於人工智慧。它起源於經濟學家 Havelmo 在 1943 年提出的想法,關於如何模擬政府對經濟的干預,比如固定價格或徵稅,他當時的想法是加入一個方程式,政府採取行動使價格保持恆定,這裡 Ri 是常數,再加入另一個力量來平衡其他力量,以便 Ri 保持恆定。後來被 Storz 和 Wald 取代為抹去一個方程式,用一個常數替換它,然後 Svirtus 和 Glimo 將其轉化為一種圖形外科手術程序,即抹去指向被操控變數的箭頭,這導致了截斷因子化,我非常認真地對待它並說,你知道嗎,我們這裡有一個新的演算,值得代數支援,並將其轉化為一個新的演算,然後我們將其應用於反事實,這就是這些思想的演變。我將繼續…

y 取值小 y,同時 z 取值小 z,如果當時 x 取值小 x,如果當時 w 取值…任何你能想到的句子。你現在有了尋找那個聯合複雜句子機率的語義。它很少出現在我們必須處理的句子中。特別是涉及行動的句子,這是我們所做的,以及涉及歸因的句子。考慮到事實上患者已死亡並服用了該藥物,若當時未服用該藥物,他今天仍會活著的可能性有多大?這是一個語言中的句子。語義是存在的。如果你有模型,計算就行了。每個人都知道如何解方程式,對吧?語義非常簡單。Joe Holperin 和我的學生 Galex 對此提出了一個完整的公理化體系。我們為什麼需要公理化?這樣如果有人說你可以用不同的或非常規的方式來做反事實,我們只需要比較公理,說「不,這在邏輯上是等價的。」而其工作主力是一個組成的原則,它告訴你,如果你做了無論如何都會發生的事情,你就等於什麼都沒做。這本質上是說,我們的世界比任何其他可能世界都更接近我們自己的世界。你去看它的可能世界詮釋。

因果模型的檢驗與推論

我給你一個你可以用它做什麼的例子。一堆方程式。你認為自然就是這樣運作的。你要問自己的第一個問題是,它可檢驗嗎?它有任何可檢驗的含義嗎?正如我之前說過的,如果它沒有可檢驗的含義,你就學不到它。這裡的想法很簡單。我們用貝氏網路做的一切,現在都轉化為因果貝氏網路,而消失(指遺失的連結)給你提供了一個有限集合的可檢驗含義。只需查看遺失的箭頭。每個箭頭都蘊含著檢驗的可能性。如果檢驗失敗,模型就是錯誤的。它還能為你做什麼?它可以回答介入問題。它是介入的神諭機。所以如果你有一個問題,比如尋找 X 或 Y 的平均因果效應,已知你可以測量變數 W1、Z1 等,你能在不操控的情況下,僅透過觀察來完成嗎?答案是可以的,如果你能針對變數 H(種族,其他)進行調整,那麼你就能保證可以透過簡單的調整(比如迴歸)來無偏倚地回答查詢。但這當然建立在圖中編碼的假設之上。每一個遺失的連結都是一個因果性質的假設,而不是統計性質的假設。所以再來看另一個例子。這是一個困難的例子。假設我們希望估計平均因果效應,而且我們只允許進行一次測量,應該測量哪個變數。結果是這個變數就能幫你完成任務。對於知道前門準則的人來說,這就是前門準則,好的?這裡是一個高度相關的例子。你從事醫藥、運動醫學行業,你想知道熱身是導致運動傷害的原因還是預防運動傷害。這對我們的社會、我們的文化來說是極其重要的問題,對吧?這裡有一些你可以進行的測量,比如先前的受傷、球隊的侵略性等等,你會測量哪一個?每一次測量都需要花費很多錢,而答案是自動給你的。你應該測量這個,你就會沒事。你不應該測量那個,因為你會得到偏倚。你應該測量那個,沒問題。這裡有另一種選擇,等等。所以你可以根據它們的成本和可靠性來選擇測量項目。這裡就是驅動這個回答機制的引擎。四分鐘。四分鐘內能完成什麼,你將會看到。

Do-Calculus 引擎

所以這就是引擎,三個規則,它接收一個圖,重複應用這些規則,然後給你答案。這裡有一個例子,吸菸導致癌症。問題是給你一個因果符號。一個紅色的符號表示「如果我做」。我們沒有「做」。我們無法對吸菸者進行隨機對照實驗。所以我們必須透過分析來完成。我們應用規則,一個接一個,唰,我們擺脫了所有紫色的符號。如果我們擺脫了紅色的符號,結果證明你可以透過非介入性的被動觀察來完成,而且你可以回答問題。是的,吸菸導致癌症的程度就是這樣。

反事實與哲學

它還能為你做什麼?讓我們跳過這個。找到等價模型,識別反事實查詢,中介分析(我有時間會談論這個,我確定),找到結果的原因,解釋,以及可轉移性(Elias 今天下午四點將在他的海報展示中向你們講述,也就是將你在一個領域學到的知識推廣到另一個無法進行任何實驗的領域)。反事實非常有趣,因為哲學家們費盡心力去理解為什麼我們能對反事實形成共識。這是一個典型的例子。如果我告訴你這幾個句子,你會對第一個說「是的,是的,是的」,對另一個說「不,不,不」,而我們文化中的人們通常能形成共識。我們怎麼能做到呢?這對許多哲學家來說是一個難題。Jung 試圖用反事實來解釋原因,David Lewis 也試圖解釋它。我認為困惑點不同,為什麼他們試圖定義,為什麼我們不試圖用原因來定義反事實,而是反過來呢?反事實問題較少嗎?顯然如此,因為我們確實對反事實形成共識,甚至這兩位哲學巨擘都試圖用反事實來定義原因。這意味著我們這裡確實有一個快速可靠的反事實引擎,而我們形成共識是因為我們共享這個引擎的架構。所以這是一個人工智慧問題,而不是哲學問題。事實上,Lewis 提出的反事實可能世界語義學,依賴於評估 Nixon 按下按鈕後的世界與我們還活著的世界有多接近,相對於 Nixon 按下按鈕但有人斷開了電線的世界。這是一個典型的哲學問題,評估世界有多相似。在這種結構世界中,你不依賴世界之間的相似性,你依賴的是共同的方程式,比如物理定律,以及修改那些方程式。

近期的進展與應用

我沒有時間談論反事實的勝利,也就是區分直接效應和間接效應的能力,這很重要,因為我們就是這麼談論的,我們判人入獄是因為他們直接負責謀殺還是僅僅間接負責,這在我們社會中非常重要,而且它賦予我們能力來回答關於不同類型介入的問題,在這種介入中,你啟用和禁用某些機制,而不是像我之前談到的那樣固定變數。我將跳過這個。這現在是統計學及其他領域中一個蓬勃發展的領域,關於直接和間接效應,稱為中介分析,其動力來自反事實。我們能夠透過反事實來表達間接效應的概念,就像您在這裡看到的一樣。看,間接效應的定義是,當我們保持輸入不變,但改變中介變數的預期變化,改變的程度是你本應透過輸入變化而獲得的結果。所以這是一個巢狀反事實。這現在是被許多人接受的間接效應定義。它不涉及固定變數。所以我認為這是一個勝利,但我將繼續講述下一個勝利,它就在這裡,可轉移性,我說這是一個勝利,因為在這裡,Du-calculus 彷彿浴火重生般出現了。我們沒有預料到它會在像這樣一個與介入關係很小的領域中展現其潛力。想像一下,你希望將從實驗中學到的關係轉移到另一個未進行任何實驗的環境中。所以我們可以想像在駕駛艙訓練一個機器人,然後將他或她轉移到另一個只允許觀察、不允許實驗的環境中。機器人在駕駛艙獲得了多少因果知識是可以轉移的?我們想要一個邏輯上的答案,是或否。在我們知道關於這兩個環境的情況下,某個關係是否可轉移。令人驚訝的是,這個問題已經獲得了一個完整的答案,是的,這將會談到這裡的完備性,好的?一個完整的答案,這意味著你不可能做得更好。這意味著所有從事機器轉移、他們稱為領域轉移的人,在我們的答案說無法完成的情況下會遇到困難。他們可能不知道為什麼,或者實務工作者可能會對其不起作用感到驚訝。但所以我們正在努力獲得是或否的答案,前提是我們對這兩個環境之間的差異和共同點做出了某些假設。我想我快接近尾聲了。我還有五秒鐘,我確實有。好的,這裡有許多你們將會錯過的精彩例子。

最重要的例子是這一個。你給我一個圖,你在上面標示出兩個領域不同或懷疑不同的地方,我會告訴你關於某個關係,是或否。它能否轉移。如果可以,那麼這裡,綠色的部分告訴你應該在實驗領域進行的測量,而藍色或紫色的部分告訴你應該在目標人群中進行的測量,那裡不允許任何測量,這就是你如何將它們結合起來,在完成時獲得正確的無偏倚結果。所以完備性是四點鐘,叮、叮、叮。哦,我還沒有談到我的新東西,那就是統合分析,大數據在這裡發揮作用。想像一下,你有來自美國或世界各地數千家醫院的資料,每一家都在不同條件下,不同人群中進行,你需要將它們全部結合起來,以便在另一個不允許任何測量的環境中回答一個查詢。你所知道的只是…

結論與致謝

謝謝 Carroll 教授,提醒我們科學不僅源於哲學,而且哲學與科學持續相互高度相關。作為一個贈品,一個小而相關的贈品,感謝您在此會議上發表的演講,我們想向您贈送這個贈品。再次感謝您。