モンキーパラドックスについて詳しく解説

十分な時間があれば、このチンパンジーのようなチンパンジーは、タイプライターのキーボードをランダムに入力すれば、ほぼ確実にシェイクスピア劇のコピーを作成できるだろう。

学習された猿のパラドックスは、タイプライターのキーボードをランダムにタイプする猿は、ほぼ確実にフランス国立図書館にあるすべての本を書くことができるという定理です。この定理を英語に適応すると、サルはほぼ確実にウィリアムシェイクスピアのすべての作品を組み合わせてタイプできるようになります。

この結果は、1909 年にエミールボレルによって確率の本の中で発表されました。これらの「猿」は本物の猿ではなく、本物の猿のように行動しません。むしろ、それらは、ランダムな順序で文字を生成する抽象的な機械、たとえば、プリンターに接続されたコンピューターおよび/またはランダムジェネレーターの生きたメタファーです。

これは厳密には誤ったパラドックスであり、論理システムの欠陥を強調しているのではなく、予期せぬ真実であることに注意してください。

変異体

定理の一般的な定式化では、無限に多くのサルが無限の時間入力すると、特定のテキストが生成されると述べています。しかし、2 つの無限を主張するのは行き過ぎです。無限に入力する一匹の不滅の猿は、任意のテキストを入力し、そのテキストを無限に何度も取得することさえあります。

デモンストレーション

「独立したイベント」が何を意味するのかを言うことから始めましょう（ここでは、サルによって連続的に選択されたキー、それらは互いに「独立して」選択されることになっています、つまり、次の文字の選択は依存しません）前の手紙では、これは、たとえば、猿が金魚の記憶を持っている場合に当てはまります。 2 つのイベントが独立している場合、2 つのイベントが発生する確率は、各イベントが発生する確率の積に等しくなります。たとえば、特定の日にシドニーで雨が降る確率が0.3 で、特定の日にサンフランシスコで地震が発生する確率が 0.8 の場合、両方が同じ日に起こる確率は等しいことになります。 0.3 × 0.8 = 0.24 になります。

ここで、タイプライターに 50 個のキーがあり、入力される単語が「バナナ」であるとします。ランダムに入力する場合、最初に入力される文字がbである確率は 50 分の 1 であり、同様に、2 番目に入力される文字がaである確率は 50 分の 1 というようになります。これらのイベントは独立しているため、「バナナ」という単語の 6 文字すべてが入力される確率は 50 分の^1、6です。同じ理由で、次の 6 文字が「バナナ」という単語の文字である可能性は 50 ⁶に 1 回あります。

さて、これらの連続する 6 文字のブロックのいずれかに「バナナ」と入力されない確率は次のとおりです。

$$ {1-\left(\frac{1}{50}\right)^6} $$

。各ブロックは独立して入力されるため、6 文字の最初のnブロックの中に「バナナ」が存在しない確率P _{n は}次のようになります。

$$ {P_n = \left(1-\left(\frac{1}{50}\right)^6\right)^n} $$

。

n が非常に大きくなると、 P _{n は}0 に近づきます (等比数列です)。整数nが 100万の場合、 P _{n は}0.9999 に等しく、 nが 100 億の場合、 P _{n は}0.53 に等しく、 nが 1000 億の場合、P n は 0.0017 に等しくなります。 n が無限大になる傾向があるとき、確率P _{n は}ゼロになる傾向があると言います。

したがって、サルが6 n 回のキーストローク後に「バナナ」を入力していない確率は、常にP _nより小さくなります ( P _nは、サルが6 文字の連続ブロックの 1 つに「バナナ」を入力していない確率です。たとえば、サルは「バナナ」と入力して開始します。実際に「バナナ」と入力しましたが、検討したブロックの 1 つに「バナナ」と入力していません)。 P _{n は}0 に近づく傾向があり、限界に達すると、次のことがわかります。

サルが「バナナ」と入力しない確率は 0 です。

これは、サルがある時点でほぼ確実に「バナナ」という単語を入力することを意味します。 (そして、彼は 6 文字のブロックの 1 つに「バナナ」という単語を入力したとさえ言えます)。

前の引数は、任意の有限文字列および任意のキーボードサイズに対して引き続き有効です。

事象の確率が 1 であるのに、なぜ「ほぼ確実に」と言えるのでしょうか?起こり得る出来事の確率がゼロになるのはなぜでしょうか?考えられる結果のセット(ここではすべての無限の文字列のセット) が無限であるという事実により、微妙な点があります。たとえば、「サルは「a」のみをタイプする」というイベントは可能なイベントの 1 つですが、先ほど見た「サルは決して「バナナ」という単語をタイプしない」というイベントと同様に、確率はゼロです。

実践中！

句読点、スペース、大文字の使用に関係なく、サルがHamlet という単語の最初の文字を正しく入力できる確率は 26 分の 1 です。最初の 2 文字を入力できるチャンスは 676 回に 1 回 (26 × 26) あります。確率は指数関数的に減少するため、20 文字の場合、26 ²⁰ = 19 928 148 895 209 409 152 340 197 376 に 1 回のチャンスしかありません。これは、宝くじを 4 枚連続で購入して毎回ジャックポットを獲得する確率とほぼ同じです。ハムレットの全文の場合、確率は無視できるほど小さいため、人間が表現するのは困難です。ハムレットの本文は、句読点をすべて取り除いても、130,000 文字をはるかに超えています。

ジャン＝カルロ・ロタは確率の教科書（死亡時未完）に次のように書いています。

「もし猿がナノ秒ごとに 1 つのキーを入力できたとしたら、猿がハムレットを完全に入力するまでの待ち時間が非常に長くなり、それに比べれば宇宙の推定年齢は取るに足らないものに見えるでしょう…そしてそれは劇を書くのに良い方法ではありません。

物理学における「サルの議論」の強みは、サルが最終的に何か理解できるものを生み出す確率にあるのではなく、サルが決してそうはしないという実際的な現実にある。そのような類人猿の成功よりも可能性の低い物理的プロセスは、人間の生涯の中で、時には宇宙の年齢と比較しても不可能です。これは、熱力学の第 2 法則に関連する統計的根拠です。

学んだ猿の神話

アメリカ人の中には、非常にありそうもないことだが、ボレルがその定理の中でサルとタイプライターを使用したのは、1860年6月30日のトーマス・ヘンリー・ハクスリーの議論に触発されたものであると主張する人もいる。ハクスリーは英国国教会司教との討論中にそのことについて話したと言われている。オックスフォードのサミュエル・ウィルバーフォースは、オックスフォードで開催された英国科学進歩協会の会議で開催された。ウィルバーフォースは副会長を務めていたが、後者は7か月前にチャールズ・ダーウィンが「種の起源」について出版したことに衝撃を受けていた、1859年11月。

議論の記録は存在せず、現時点では誰もそれを証明できず、ハクスリーの回想録にはサル定理への言及は含まれていない。

この議論と学習された猿の定理とのこの仮説的な関連性はおそらく都市伝説であり、その起源はこの議論が猿についての話に堕落したという事実に由来すると考える人もいます。司教は、ハクスリーは祖母からの猿の子孫なのか、それとも猿の子孫なのかと尋ねました。と祖父が言うと、ハクスリーは、自分はそのような悪意を持って議論する司教のような人の子孫ではなく、むしろ猿の子孫だと答えた。ハクスリーがタイプライターについて言及した可能性はさらに低いです。現代のタイプライターの特許は 1714 年に付与され始めましたが、タイプライターの商業生産が始まったのは 1870 年であり、ハクスリーほど熟練した雄弁家であれば、聴衆の大多数にとってまだその存在が知られていない機械についての議論を許可するはずがありませんでした。

文学と大衆文化

ガリバー旅行記(1721) では、ジョナサン・スウィフトがこの定理の主なアイデアを先取りしており、生徒たちに向きを変えてランダムな文字列を継続的に生成させることで、すべての科学知識の完全なリストを作成しようとする偉大なラガドアカデミーの教授を描いています。メカニズムをクランクします (パート 3、第 5 章)。

同様のテーマは、ホルヘルイスボルヘスの『バベルの図書館』でも取り上げられており、ランダムな文字列で満たされた無数の巻が存在します。図書館にはすべての偉大な文学作品が建設されており、また、巨大な図書館で自分の将来を求めてさまよう人の将来の伝記も展示されています。しかし、そのような作品は凡庸な作品よりも数が多く、内容がまったく意味のない膨大な量の本に圧倒されています。リチャード・ドーキンスは、4 メガバイトのメモリがランダムに埋められるラップトップ、バベルラップトップを想像しました。ここでも、過去、現在、未来のWindowsとLinuxのすべてのカーネル (少なくとも最大 4 MB) がどこかにあります。

ボルヘスも短編小説『不滅』 （『アレフ』所収）の中でこの考えを取り上げており、ホメロスは不死であり、したがってメリットがないと仮定している。、少なくとも一度は、オデッセイ」 ^{[ 1 ]} 。

この定理に対する大衆文化の言及には次のようなものがあります。

シンプソンズ:あるエピソードでは、チャールズ・モンゴメリー・バーンズは自分の部屋のタイプライターの前に1000匹のサルを飼っており、そのうちの1匹が『二都物語』という本の最初の文で単語を間違えたとして罰せられる。 Two Cities ) 「最高の時代だった、最悪の時代だった。」 )、(「最高の時代だった、最悪の時代だった」の代わりに、「c’ は最高の時代だった、最悪の時期でした」）;
The Griffins ( Family Guy ): 猿のグループが、シェイクスピアの『ロミオとジュリエット』のセリフに沿って作業しているシーンが挿入されます。
銀河ヒッチハイク・ガイド (フォード知事とアーサー・デントは、無限のあり得ない旅の影響を受けて、ハムレットの原稿について意見を求める無数の猿に待ち伏せされる)。
漫画『ディルバート』の中で、ドッグバートはディルバートに、自分の詩は「3匹の猿と10分」かかるだろうと語った（ドッグバートによれば、シェイクスピアの作品をすべて書くには1000匹の猿と無限の時間がかかることを知っている）。

この定理は、デヴィッド・アイヴスの作品集『オール・イン・ザ・タイミング』に収録されている「ワーズ・ワーズ・ワーズ」という一幕物劇の基礎にもなっている。この劇では、ミルトン、スウィフト、カフカという名前の 3 匹の猿が、 『ハムレット』を書くまで科学者によって檻の中に閉じ込められていました。 RA ラファティの「Been a Long, Long Time」という短いユーモラスな物語があるが、そこでは天使が罰せられ、後日（何兆もの宇宙が滅んだ後）サルがデータを提供することに成功するまで、作成されたすべてのテキストを修正しなければならないという話がある。シェイクスピア作品の完璧なコピー。

トム・ストッパードの戯曲「ローゼンクランツとギルデンスターンは死んだ」では、登場人物が「もし百万匹の猿がいたら…」と言いましたが、文を続けずに主題を変えます。登場人物たちはハムレットの主役になるはずなので、これは確かにユーモラスなほのめかしです。

2000 年、インターネット標準委員会 IETF は 4 月 1 日の RFC で、無限のサルを含む農場を制御する方法である「無限サルプロトコルスイート (IMPS)」を提案しました。

作家で俳優のウィル・ウィートンの個人ページ(ブログ)には、「5万台のタイプライターの前にいる5万匹のサルが間違っているわけがない」というスローガンがあります。この機知に富んだ作品は、2002 年にブログ賞の「ベストウェブログサブタイトル」部門を受賞しました。

ロバート・ウィレンスキーはかつて、「100万台のタイプライターをタイプする100万匹のサルが、遅かれ早かれシェイクスピアの全作品を再現するだろうと誰もが聞いたことがある。今では、インターネットのおかげで、これが真実ではないことがわかった。」と面白そうに語った。

コメディアンのボブ・ニューハートは、コメディの中で「非常に多数のサル」の実験を監督する実験技師の役を演じたが、その役で、あるサルが「なるか、ならないか、それはゲゾルテンブラットだ」とタイプしたことを発見した。」。ドイツ語で「ゲゾルテンブラット」は「遠吠えの質問」を意味します。

ジョナサンローゼンバーグが描いたインターネット漫画「The Goats」では、数人の登場人物が誤って別の次元に移動する「Infinite Typewriters」と呼ばれる物語が描かれています。彼らは、この次元にはタイプライターを持ったサルが住んでおり、他の複数の次元に属する原稿をタイプしていると考えられていることが判明した。

WikipediaのパロディであるDésencyclopedia は、そのホームページですべてが学識のある猿によって書かれたと主張しています。ユーザーをLearned Monkeyと呼ぶのが慣例です。

実験用サル

これは、無限の時間または無限のサルを必要とするため、明らかに現実には実行できない思考実験です。それにもかかわらず、それは有限ランダムテキスト生成に関する数多くの作品にインスピレーションを与えてきました。

2003 年 7 月^{1 日}に開始された「シェークスピアの猿シミュレータ」サイトには、ランダムに入力する多数の猿をシミュレートするアプレットが含まれており、これらの仮想猿がシェイクスピアの劇を最初から最後まで完成させるのにどれくらいの時間がかかるかを確認することを目的としています。。 2005 年 1 月 3 日、プログラムは 24 通の連続した手紙を取得し、4 つの単語が記録されました (「噂。耳を開いてください; 9r”5j5&?OWTY Z0d “B-nEoF.vjSqj[…” from Henry VI,part 2 )」。処理能力の制限のため、このプログラムでは、実際にテキストをランダムに生成してシェイクスピアと比較するのではなく、確率モデル (乱数発生器を使用) を採用しています。シミュレーターが「一致を検出」すると (つまり、乱数ジェネレーターが特定の値を生成すると)、シミュレーターは一致するテキストを生成することでその一致に反応します。

2003年、プリマス大学の科学者らが英国デボン州のペイントン動物園でサルを使った実験を行ったとされる。6頭のスラウェシ・クレステッド・マカクを飼育していた柵の中にコンピュータのキーボードを1か月間放置したというものだ。最終的に彼らは、サルたちが長々と繰り返されたわずか数文字を含むわずか5ページしか作成していなかったことを発見し、サルたちはまず石でキーボードを攻撃し、その後その上で放尿し排便したと報告した（プライス・イグ・ノーベルも参照））。

「パラドックス」を取り除く

この段階では、「このシステムで本当に文学作品を生み出すことができるのか」という疑問が心に残るかもしれません。私たちが 1 つの問題をより大きな問題に置き換えているだけであることは明らかです。作品を構成する代わりに、何十億もの文書を読んでテストし、どの文書にその作品が含まれているかを判断できなければなりません。その過程で消費される情報量は少なくとも同程度になるだろうし、この意味でこのパラドックスはマクスウェルの悪魔のパラドックスとの類似性がないわけではなく、そこから数ヶ月間物理学では奇跡も期待できると信じられていた。

より簡単な言葉で表現すると、これは、バベルの図書館でシェイクスピアの特定の作品を見つける複雑さは、この劇を直接手でコピーすることとまったく同じであることを意味します。逆説的に言えば、バベルの図書館（または猿の作品）には情報が含まれていません。あるいは、同じことですが、それは受信者の経験、そして彼自身の経験にリンクされた文脈であり、そのような特定の「ノイズ」が彼にとって「情報」になる原因となります（彼は言語の文法を知っているため）、語彙力があり、意味を与えることができる経験があります。

^?それ自体では他の文字と区別できない一連の文字です (エベレットの理論も参照)。

そして数学では？

整った文章だけを作成することで、プロセスの時間を節約することも想像できます。これは自然言語では困難ですが、数学では数理論理学の枠組み内で簡単です。したがって、コンピュータ上での正式なコンピューティングの最初の開発では、公理と演繹規則を機械に提供し、数学者は毎日リストを調べてその日の定理を発表するだけで済むことが考えられました。言うまでもなく、問題は 1 つを除いて同じです。今回は、出力されたすべての式が正しく、つまり、適切に形成されており、正しい (デモンストレーションが提供されている) ことになります。

一方で、紙の剥離の問題は依然として残っています。さらに、数学の基礎に関する会議で、ジャン＝イヴ・ジラールは次のような発言をした（彼によれば、形式論理は学んだ猿の仕事よりも官僚の仕事に似ているという）。

「そこで生じる疑問は次のようなものである: 数学は正式な活動なのか? 数学は「官僚的な」活動なのか? フェルマーの定理をグループ・ダルクに任せることはできたのだろうか? 彼らは 300 年以内にそこに到達しただろう? まあ、それは不可能だからだ私たちにはアイデアが必要です。

機械は、それによって確立された実証を伴う、数学的に正しいステートメントを「キロメートルごとに」生成できます。それにもかかわらず、これら何百万ものステートメントの中で、それらのうちのいくつかを区別して定理を作成するという事実は、数学者の経験の一部であり、数学者の経験の一部であり、他の分野の研究との可能性があり、おそらく有益なつながりを認識しているでしょう。物理学、統計学、生物学などの知識。たとえば、タレスとピタゴラスの特定の定理は、建築や土地登記簿の確立に関する潜在的なニーズに関連付けられていました。

認識論も参照

コンピューターアート

これと同じ原理に従って、(擬似) ランダムな形状^{[ 2 ]}が抽象芸術の作成に使用されてきました。ソフトウェアは、事前にプログラムされた標準的な構造に従います。人間のユーザーは、好みに応じてこれらの構造に重みを付けて、好きな絵や音楽を作成できます。