無限猴子定理是來自埃米爾·博雷爾一本1909年出版談概率的書籍,當中介紹了“打字的猴子”的概念。
發展簡史
無限猴子這個定理是概率論中的安德雷·柯爾莫哥洛夫的零一律的其中一個命題的例子。不過,當埃米爾·博雷爾在書中提出零一律的這個特例時,柯爾莫哥洛夫的一般敘述并未給出(柯爾莫哥洛夫那本概率論的著作直到1933年才出版)。
零一律是概率論中的一個定律,它是安德雷·柯爾莫哥洛夫發現的,因此有時也叫柯爾莫哥洛夫零一律。其內容是:有些事件發生的概率不是幾乎一(幾乎發生),就是幾乎零(幾乎不發生)。這樣的事件被稱為“尾事件”。尾事件是由無限多的隨機變量的序列來定義的。比如它不是與X1的值無關。比如我們扔無限多次硬幣,則連續1000次數字面向上的事件是一個尾事件。
定義
一般關于此定理的敘述為:有無限只猴子用無限的時間會產生特定的文章。其實不必要出現了兩件無限的事物,一只猴子打字無限次已經足夠打出任何文章,而無限只猴子則能即時產生所有可能的文章。
其他取代的敘述,可能是用大英圖書館或美國國會圖書館取代法國國家圖書館;另一個常見的版本是英語使用者常用的,就是猴子會打出莎士比亞的著作。歐洲大陸還有一種說法版是猴子打出大英百科全書。在《從一到無窮大》中,作者則引用了哈姆雷特的例子。
驗證推導
簡要說明
在無窮長的時間后,即使是隨機打字的猴子也可以打出一些有意義的單詞,比如,cat, dog。因此,可以類推,會有一個足夠幸運的猴子或連續或不連續地打出一本書,即使其幾率比連續抓到一百次同花順還要低。但在足夠長的時間(長到你數不清它的秒數有多少位)后,其發生是必定的。
數學證明
兩個獨立事件同時發生的概率等于其中每個事件單獨發生的概率的乘積。比如,在某一天悉尼下雨的可能性為0.3,同時舊金山地震的可能性是0.008(這兩個事件可以視為相互獨立的),那么它們同時發生的概率是。
假設一個打字機有50個鍵,想要打出的詞是“banana”。隨機的打字時,打出第一個字母“b”的概率是,打出第二個字母“a”的概率也是,因為事件是獨立的,所以一開始就打出單詞“banana”的概率是:
這個概率小于150億分之1。同理,接下來繼續打出“banana”的概率也是。
所以,在給定的六個字母沒有打出“banana”的概率是。因為每一段(6個字母)文字都是獨立的,連續n段都沒有打出“banana”的概率 是:
隨著n變大,在變小。當n等于100萬時,大約是0.9999(沒有打出“banana”的概率是99.99%);但是當n等于100億時 大約是0.53(沒有打出“banana”的概率是53%);當n等于1000億時 大約是0.0017(沒有打出“banana”概率是0.17%);當n趨于無窮時 趨于零。這就是說,只要使n足夠大,可以變得足夠小。
同樣的論證也可以說明在無限多的猴子中有至少一個會打出一段特定的文章。這里
,其中 表示在前n個猴子中沒有一個一次打出banana的概率。當我們有1000億只猴子時,這個概率降低到0.17%,并且隨著猴子數量n趨于無窮大,沒有打出“banana”的概率 趨于0。
但是,在只有有限的時間和有限只猴子時,結論就大不一樣了。如果我們的猴子數量和可觀測宇宙中的基本粒子數量一樣多,大約10的80次方只,每秒鐘打1000個字,持續打100倍于宇宙的生命長度的時間(大約10的20次方秒)有猴子能夠打出一本很薄的書的概率也無限接近于1。
無限長的字符串
以下兩種情況可以擴展到所有的字符串:
1.給定一個無限長的字符串,其中的每一個字符都是隨機產生的,那么任意有限的字符串都會作為一個子字符串出現在其中(事實上要出現無限多次)。
2.給定一個序列,其中有無限多個無限長的字符串,其中每一個字符串中的每一個字符都是隨機產生的,那么任意有限的字符串都會出現在其中某些字符串的開頭(事實上是無限多個字符串的開頭)。
對于第二個定理,設某給定字符串出現在第k個字符串開頭的事件。有固定的且不為零的概率p是這個事件發生,而且是獨立的,所以:
事件發生無窮多次的概率是1。第一個定理可以類似地處理,先將無限長的字符串分割,使得每一段的長度和給定字符串相同,然后設是第k段等于給定字符串的事件。
概率論證
不算標點符號、空格、大小寫,一個猴子隨機打字打出的第一個字母和哈姆雷特中相同的概率是,前兩個字母相同的概率是【即】。因為概率發生了指數爆炸,前20個字母相同的概率是,約等于。而打出的字和哈姆雷特中的全部文本相同的概率降低到超出人們的想象。整部哈姆雷特大約有130,000個字母。雖然有 的概率一遍就正確地打出所有文本,在打出正確的文字之前平均需要輸入的字母數量也要,或者包括標點符號, 。即使可觀測宇宙中充滿了猴子一直不停地打字,能夠打出一部哈姆雷特的概率仍然少于。(可見其概率之低)
現實證明
不過在現實中,猴子打出一篇像樣的文章的幾率幾乎是零,因為科學家經過反復試驗后發現,猴子在使用鍵盤時通常會連按某一個鍵或拍擊鍵盤,最終打出的文字不可能成為一個完整的句子。由于英語字母有26個,加上字符等更是不止30個。因此,猴子輸出的字符幾乎全部是廢話,只能在浩如煙海的字母中,找到少許有意義的片段。
這個定理本身在現實生活中是不可能重現的,但這并沒有阻止某些人的嘗試:2003年,一家英國動物園的科學家們“試驗”了無限猴子定理,他們把一臺電腦和一個鍵盤放進靈長目園區??上У氖?,猴子們并沒有打出什么十四行詩。根據研究者的說法,它們只打出了5頁幾乎完全是字母"S"的紙。
參考資料 >