Изменить стиль страницы

Чтобы доказать, что вещественные числа нельзя взаимно-однозначно соотнести с целыми числами, Кантор продемонстрировал: как бы вы ни пытались выстроить вещественные числа в организованную последовательность, как мы проделывали с дробями, всегда есть шанс, что всплывет какое-нибудь вещественное число, которого в этой последовательности нет.

И вот как он это обосновал. Допустим, у нас есть совокупность всех вещественных чисел (которых бесконечное количество), и мы ввели некое правило, позволяющее выстроить их по порядку. Полученная нами в результате последовательность может выглядеть, например, так:

Целое число Вещественное число
1 7,2728654901088…
2 2,0709903829756…
3 18,696243576675…
4 0,8717454638892…
5 3,8342020203020…
6 0,6766682920082…
7 3,1416269873562…

Какова бы ни была закономерность расположения чисел, она не очевидна, но речь сейчас не об этом. До тех пор, пока мы пребываем в уверенности, что можем соотнести любое вещественное число с привычным и милым нашему сердцу миром целых чисел, мы неизменно будем получать такую вот странноватую последовательность.

Итак, вы можете сунуть мне под нос этот список и похвастаться использованным правилом расположения чисел, благодаря которому любое взятое с потолка вещественное число вплоть до бесконечности обязательно где-нибудь в этом списке да найдется, а значит, бесконечность вещественных чисел равна бесконечности соответствующих им порядковых номеров, то есть целых чисел. Но как бы ни выглядел ваш список, я могу придумать вещественное число, которого там не будет.

Для простоты сосредоточимся только на знаках после запятой.

Я могу составить число, чей первый знак после запятой будет отличаться от первого знака в первом числе списка. Второй знак в моем числе не совпадает со вторым знаком второго числа. Третий знак моего числа будет отличаться от третьего знака после запятой в третьем числе списка, и так далее.

Взяв в качестве образца приведенный выше список, я могу составить число 0,3942501… Многоточие означает, что количество знаков после запятой бесконечно, как и у большинства вещественных чисел. А теперь я могу доказать, что, каким бы правилом при расположении чисел вы ни руководствовались, моего числа в вашем списке нет. Его не может там быть из-за самого метода, каким я его создавал, ведь от каждого вещественного числа в вашем списке оно отличается хотя бы на одну цифру. Это и есть тот «черный лебедь», доказывающий, что изначальное допущение, будто вы установили взаимно-однозначное соответствие между всеми вещественными и всеми целыми числами, неверно. Эти две бесконечности — бесконечность вещественных чисел и бесконечность целых чисел — существенно разнятся, на этой разнице Кантор основал целое новое направление теории чисел. Теперь, быть может, вас не удивит, что математики полагают, будто «размеров» бесконечностей не два, а гораздо больше. В действительности их бесконечно много, и, в довершение картины, данная бесконечность больше любой из бесконечностей, входящих в это количество.

Ползай с пользой!

За последние годы я оказывал компьютерную поддержку сразу нескольким научным проектам. Среди них были поиски внеземного разума, погоня за очень большими простыми числами и тестирование алгоритмов для построения трехмерного изображения белковых молекул исходя из их линейной формулы.

Причина, по которой меня попросили помочь в столь широком спектре важных научных исследований, к сожалению, почти не связана с присущими мне способностями и талантами и объясняется главным образом наличием у меня персонального компьютера.

Ученые, которые работали над этими проектами и десятками им подобных, привлекали скрытые ресурсы, таящиеся в недостаточном использовании домашними компьютерами вычислительного времени, которое в общей сложности составляет миллионы часов и позволяет добавить мощности собственным компьютерам ученых, когда требуется производить сложнейшие математические расчеты. Большую часть времени, даже когда мы работаем с домашними компьютерами, они загружены не на полную катушку. Один из первых проектов по использованию сэкономленного вычислительного времени назывался SETI — эта аббревиатура расшифровывается как Поиск Внеземного Разума — и требовал переработки огромных массивов информации, которая ежедневно поступает с устройства, закрепленного на гигантском радиотелескопе на острове Пуэрто-Рико. Поступающие данные являют собой разновидность «белого шума» — это радиоволны, хаотично испускаемые звездами и галактиками. Однако ученые надеются, что однажды среди этого шума попадется сигнал от представителей внеземной цивилизации, который будет выделяться некоторой регулярностью на фоне общей хаотичности. Скачав и установив простенькую программу, пользователи домашних компьютеров могут подключиться к анализу этой информации, которая поступает к каждому участнику программы регулярными порциями. Присоединившись к этому проекту, вы можете наблюдать, как программа на вашем компьютере анализирует полученные данные, и мечтать о том мгновении, когда ваш компьютер заметит регулярно поступающий сигнал и поставит весь мир на уши, отправив сообщение об этом в SETI.

Это была хорошая задумка, которую тут же подхватили другие ученые: им тоже требовалась обработка больших массивов данных, которая не требует сложнейшего программного обеспечения — достаточно обычного домашнего компьютера.

Такие проекты существуют по сей день, для участия в них вам всего лишь нужно подать заявку и скачать ту или иную специальную программу. Но я наткнулся на еще один хитроумный способ использования вашего и моего компьютеров, который даже не требует от нас согласия и контроля. Блуждая по Интернету, вы наверняка сталкивались с тем, что некоторые сайты просят вас распознать и ввести код из искаженных и не сразу узнаваемых цифр или букв. Это делается для того, чтобы удостовериться: сайтом пытается воспользоваться человек, а не компьютерная программа, ищущая, как бы обдурить он-лайновые сервисы — например, скупить билеты на концерт для перепродажи и взвинтить цены. Эти слова или буквенно-цифровые коды называются CAPTCHA [25].

Новые горизонты использования CAPTCHA открылись в ходе проектов по оцифровке книг, чтобы сделать их текст доступным в сети Интернет. Раньше процесс этот был весьма трудоемким и требовал, чтобы люди считывали текст и набирали его на компьютере. Позднее возникли менее затратные методы с использованием OCR (Optical Character Recognition) — программ для оптического распознавания текста, которые на высокой скорости считывают книгу и преобразуют ее в электронный документ. Однако чем старее книга, тем сложнее компьютеру распознать текст. Викторианский роман, отпечатанный мелким шрифтом на пожелтевшей и крошащейся бумаге, — твердый орешек для компьютера, в то время как у человека при чтении такой книги никаких проблем не возникает.

И тут снова на арене появляется CAPTCHA. Чтобы получить доступ к интернет-сервисам, люди вводят подобные коды более ста миллионов раз в сутки. Ученые-компьютерщики из питтсбургского университета Карнеги-Меллон показали, как можно использовать этот пустой труд, убедив владельцев некоторых сайтов использовать в качестве CAPTCHA слова, которые компьютеру не удалось распознать при оцифровке старых книг. Так, подстраховавшись, чтобы быть уверенными в правильном распознавании и использовав для этого на разных сайтах одно и то же слово, они создали систему для обработки неразборчивых слов, которые прежде требовали распознавания специалистом и введения в текст в ручном режиме. Эта система оптического распознавания текста, получившая название reCAPTCHA, во время испытаний показала точность 99,1 % (для сравнения: точность стандартной OCR — 83,5 %). За год работы этого проекта пользователи Интернета невольно расшифровали почти 500 миллионов слов, что равноценно количеству не поддающихся расшифровке слов из 17600 книг.

вернуться

25

CAPTCHA (от англ. Completely Automated Public Turing test to tell Computers and Humans Apart) — полностью автоматизированный публичный тест Тьюринга для различения компьютеров и людей. В рунете часто транскрибируется как «капча». (Прим. перев.).