Читать онлайн Искусственный интеллект бесплатно
Переводчик Екатерина Арье
Научный редактор Сергей Марков
Редактор Антон Никольский
Руководитель проекта И. Серёгина
Корректоры Е. Аксенова, М. Миловидова
Компьютерная верстка М. Поташкин
Арт-директор Ю. Буга
Иллюстрация на обложке SchutterStock.com
© Meredith Broussard, 2018
Originally published in the English language by The MIT Press
The rights to the Russian-language edition obtained through Alexander Korzhenevski Agency (Moscow)
© Издание на русском языке, перевод, оформление. ООО «Альпина нон-фикшн», 2020
Все права защищены. Данная электронная книга предназначена исключительно для частного использования в личных (некоммерческих) целях. Электронная книга, ее части, фрагменты и элементы, включая текст, изображения и иное, не подлежат копированию и любому другому использованию без разрешения правообладателя. В частности, запрещено такое использование, в результате которого электронная книга, ее часть, фрагмент или элемент станут доступными ограниченному или неопределенному кругу лиц, в том числе посредством сети интернет, независимо от того, будет предоставляться доступ за плату или безвозмездно.
Копирование, воспроизведение и иное использование электронной книги, ее частей, фрагментов и элементов, выходящее за пределы частного использования в личных (некоммерческих) целях, без согласия правообладателя является незаконным и влечет уголовную, административную и гражданскую ответственность.
* * *
I
Как работают компьютеры
1
Здравствуй, читатель
Я люблю технологии. Любила их с тех самых пор, как родители купили мне, маленькой девочке, конструктор. Из маленьких металлических деталей мне предстояло собрать гигантского – как мне казалось – робота, работающего от мотора на батарейках. В детстве у меня было хорошее воображение, и я думала, что, как только соберу его, он сможет с легкостью передвигаться по дому, как и я, и станет мне новым другом. Тогда я бы научила его танцевать, а он приносил бы мне игрушки (не в пример моей собаке).
Сидя на красном шерстяном ковре на втором этаже, я проводила часы в мечтах за сборкой робота, затягивая множество винтов и болтов детским гаечным ключом. Самый волнительный момент настал, когда пришла пора устанавливать мотор. Накануне мы с мамой специально ездили в магазин, чтобы подобрать подходящие батарейки. Как только мы вернулись домой, я побежала наверх, чтобы подключить провода и наконец включить робота. Запуская механизм в надежде, что он изменит весь мир, я ощущала себя как братья Орвилл и Уилбур Райт.
Ничего не произошло.
Я проверила чертежи, несколько раз переключила рычаг вкл/выкл и перевернула батарейки. Ничего не происходило. Мой робот не работал. Я пошла за мамой.
– Поднимись, пожалуйста, наверх. Робот не работает, – грустно произнесла я.
– А ты пробовала выключить и включить его? – спросила мама.
– Да.
– А батарейки переворачивала? – продолжила она.
– Да! – раздражение нарастало. – Давай взглянем на него, – я взяла ее за руку и потащила наверх.
Она бегло изучила робота: проверила соединения проводов, несколько раз включала и выключала его.
– Он не работает, – заключила мама.
– Почему? – отозвалась я. Она могла просто сказать, что мотор сломан, но моя мама была сторонницей сложных объяснений. Она констатировала поломку мотора и затем рассказала про цепь оптовых поставок и конвейеры, а также напомнила мне, что я знаю, как работают фабрики, ведь мне нравилось смотреть, как огромные машины собирают коробки карандашей в телешоу «Улица Сезам».
Она объяснила: «Что-то может идти не по плану, когда создаешь вещи. И что-то пошло не так, когда они собирали этот мотор, в итоге он оказался в твоем наборе. А теперь нам нужно получить работающий мотор». Мы позвонили на горячую линию, по телефону, указанному в инструкции, и милые сотрудники компании выслали нам новый мотор по почте. Спустя примерно неделю мы его получили, и робот включился. Но я была разочарована. Он работал, но не так, как я ожидала, с трудом передвигался по нашему деревянному полу, застрял на ковре. Кажется, он совсем не собирался становиться моим новым другом. Спустя несколько дней я разобрала его и приступила к сборке следующей модели из конструктора – колесу обозрения.
Я кое-чему научилась, собирая робота. Возясь с конструктором, я поняла, как с помощью инструментов можно собирать сложные механизмы и что это может быть увлекательно. Я узнала, что у меня действительно хорошее воображение, однако реалии технологий не всегда ему соответствуют. А еще я обнаружила, что детали могут быть неисправны.
Спустя несколько лет я стала учиться программированию и поняла, что опыт сборки робота из конструктора вполне соотносится с миром кодинга: я могла себе представить невероятно сложные программы, однако реальные возможности компьютеров чаще всего разочаровывали. Нередко программы просто не работали из-за неисправностей компьютера. Это меня не остановило, и я продолжаю создавать и восхищаться технологиями. У меня множество аккаунтов в социальных сетях. Однажды я хакнула мультиварку, чтобы подогреть 11 кг шоколада, – это было частью проекта. Я даже создала компьютеризированную систему автоматического полива в саду.
Однако с недавних пор я перестала верить в то, что технологии спасут мир. Всю свою сознательную жизнь я слышала обещания о том, что технологии изменят мир к лучшему. В сентябре 1991 г. я поступила в Гарвард на отделение вычислительных машин. Спустя несколько месяцев в ЦЕРН (лаборатории физики под патронажем Европейской организации по ядерным исследованиям) Тим Бернерс-Ли создал первый в мире веб-сайт. Когда я была на втором курсе, мой сосед по комнате купил NeXTcube – тот же самый черный квадратный компьютер, который Барнерс-Ли использовал в качестве сервера в ЦЕРН. Было весело. Нам удалось подключить высокоскоростное соединение в нашей комнате, благодаря чему мы смогли проверять почту на компьютере стоимостью $5000. Другой сосед, который был слишком молод, чтобы посещать бостонский гей-бар, с этого же компьютера зависал на онлайн досках объявлений, чтобы познакомиться с парнями. Тогда было легко поверить в то, что в будущем все будет происходить онлайн.
Юные идеалисты моего поколения с радостью решили, что создаваемый нами онлайн мир будет лучше и справедливее нынешнего. В 1960-х гг. наши родители верили, что можно построить лучший мир, порвав с обычной жизнью и живя в коммунах. Мы наблюдали за тем, как они бросали наркотики и осознавали, что коммуны не привели к искомым ответам. Однако у нас впереди был совершенно новый, неизведанный мир «киберпространства», который предстояло создать. Связь между этими примерами далеко не метафорична. По словам Фреда Тёрнера, автора книги об истории цифрового утопизма «От контркультуры к киберкультуре»[1], на становление интернет-культуры того времени в известной степени повлияло движение Нового коммунизма 1960-х гг. В 1995 г. в специальном выпуске журнала Time под названием «Добро пожаловать в киберпространство» Стюарт Бранд, создатель Каталога всей Земли (Whole Earth Catalog), наметил связь между контркультурой и революцией персональных компьютеров в эссе «Мы всем обязаны хиппи»[2]. Эпоха зарождения интернета была весьма кайфовой.
Будучи третьекурсницей, я могла создать веб-страницу, запустить веб-сервер и написать код на шести языках программирования. Это было вполне естественным для студента, специализирующегося в математике, компьютерах и программировании. И я была одной из шести женщин на этой специальности в университете, где училось 20 000 студентов. Я знала двух девушек – специалистов по теории вычислительных машин. Остальные три казались мифом. Я ощущала себя изгоем и прекрасно видела причины, заставлявшие женщин бросать науку, технологии, разработки, математику и уходить со STEM-специальностей[3]. Я также знала, как можно устранить эту «неисправность», однако ни я, ни другие женщины не имели для этого достаточной власти и влияния. Поэтому я перешла на другую специальность.
После окончания колледжа я стала работать программистом. В мои обязанности входило создание симулятора, который, подобно рою пчел, вооруженных винтовками, должен был набрасываться на вновь созданные программы и проверять их на прочность. Работа была хорошей, но не приносила радости. Я снова почувствовала, будто не было вокруг никого, кто бы выглядел, как я, говорил, как я, и интересовался теми же вещами, что и я. Поэтому я оттуда ушла и стала журналистом.
Переместимся на несколько лет вперед: я вернулась в компьютерную науку в качестве дата-журналиста. Журналистика данных – это практика поиска и рассказывания историй посредством цифр. Программирование помогает проводить журналистские расследования. А еще я преподаю в университете, это мне подходит. И гендерный баланс там лучше.
Журналистов учат быть скептиками. Мы часто повторяем: «Если мама говорит, что любит тебя, это необходимо проверять». В течение многих лет я слышала фактически одни и те же обещания о светлом технологическом будущем, однако лично видела, как цифровой мир в точности повторял все нюансы неравенства в реальном мире. Например, процент женщин в пространстве технологических профессий никогда радикально не возрастал. Интернет превратился в новое публичное пространство, однако друзья и коллеги говорят, что именно онлайн они подвергаются харассменту больше, чем когда-либо. Мои подруги, пользовавшиеся сайтами и приложениями для знакомств, рассказывали об угрозах изнасилования и непристойных фотографиях, отправленных им. А тролли и боты превратили Twitter в какофонию голосов.
Тогда я начала серьезно задумываться над обещаниями, данными технокультурой, и стала замечать, как люди говорили о технологиях, не задумываясь о последствиях их внедрения. В конце концов, в основе всего, что мы делаем на компьютере, лежат математические действия, которые имеют свои фундаментальные ограничения, определяющие границы технологий. И, как мне кажется, мы приблизились к этим границам. Американцы достигли той точки развития, когда цифровые технологии с восторгом используются буквально везде – при приеме на работу, во время вождения, при оплате счетов и даже при выборе партнера, а способность критического осмысления новой реальности угасает на глазах.
Восторженные попытки применить компьютерные технологии в каждом аспекте нашей жизни привели к появлению невероятного количества недоработанных технологий. Они усложняют повседневную жизнь вместо того, чтобы делать ее проще. Так, например, поиск номера телефона нового знакомого или актуального адреса электронной почты занимает неожиданно большой объем времени. Проблема в том, что, как и во многих других случаях, вокруг слишком много новых технологий и недостаточно людей для управления ими. Мы перешли от протоколирования к компьютерным системам и при этом избавились от людей, способных содержать информацию в актуальном состоянии. И сегодня, поскольку никто не проверяет точность контактной информации в каждом институциональном справочнике, связаться с людьми оказывается гораздо сложнее. Как журналисту мне приходится общаться со множеством людей, которых я не знаю лично, и связываться с ними стало сложнее и дороже, чем раньше.
Есть поговорка «Когда у тебя в руках молоток, все кажется гвоздями». Компьютеры – это молотки. И пора наконец остановить слепую погоню за цифровым будущим и начать принимать более осознанные решения относительно того, когда и зачем использовать их.
Так появилась эта книга – некоторые размышления, помогающее понять, что могут и что не могут технологии, где технологические достижения пересекаются с человеческой природой. Эта грань похожа на обрыв, за которым нас ждет опасность.
В мире существует множество невероятных технологий: интернет-поисковики, устройства, распознающие вербальные команды, компьютеры, соревнующиеся с людьми в играх вроде Jeopardy![4] или го. Однако не стоит забывать о том, что как раз благодаря технологиям мы можем решать и определенные проблемы. В рамках моих университетских курсов я среди прочего учу одной фундаментальной вещи, а именно тому, что существуют ограничения. Подобно границам познаваемости в математике и естественных науках, имеются границы возможного применения технологий. Кроме того, существуют и пределы того, как нам следует использовать технологии. Смотря на мир через призму компьютерных наук или пытаясь решить глобальные проблемы только при помощи технологий, мы рискуем совершить известные и ожидаемые ошибки, замедляющие прогресс и усиливающие существующее неравенство. Наша книга посвящена способам понимания внешних ограничений того, на что способны технологии. Осмысление этих рамок поможет нам совершать более качественный выбор и сформировать коллективный диалог относительно применения технологий и того, что следует делать, чтобы сделать мир по-настоящему лучше для всех.
К таким размышлениям меня привела журналистика. Я специализируюсь на разделе журналистики данных под названием вычислительная журналистика, ее также называют анализом алгоритмической ответственности. Алгоритм – это вычислительная процедура с известным результатом; он похож на рецепт, который при выполнении всех шагов приводит к созданию определенного «блюда». Иногда под анализом алгоритмической ответственности понимается процесс написания программы, при помощи которой можно обнаружить алгоритмы, призванные принимать решения за пользователей. А порой подразумевается анализ не слишком качественных технологий или неверно интерпретированных данных, в результате которого мы обнаруживаем проблемную зону.
Одной из таких проблемных зон я собираюсь поделиться в этой книге, а именно техношовинизмом. Техношовинизм – это слепая вера в то, что технологии являются ответом на все вопросы. И, несмотря на то что цифровыми технологиями ученые и чиновники пользовались с 1950-х гг., а с 1980-х гг. компьютеры стали частью нашей повседневности, изощренные маркетинговые кампании все еще заставляют большинство людей верить в то, что цифровые технологии – это что-то совершенно новое и революционное. (Тем временем технологическая революция уже случилась, а цифровые технологии стали обыденностью.)
Техношовинизм нередко встречается вместе с созвучными ему идеями вроде меритократии в духе Айн Рэнд, технолибертарианских политических ценностей, торжества свободы высказывания до той степени, что бытование онлайн-харассмента не считается проблемой; с верой в то, что компьютеры более «объективны» и «беспристрастны», поскольку для них вопросы и ответы сведены к математическим уравнениям; и непоколебимой веры в то, что, если бы человечество больше полагалось на технологии и их правильное использование, социальные проблемы бы исчезли и мы создали утопическое общество на базе цифровых технологий. Никогда не было и не будет технологической инновации, способной избавить нас от необходимости сталкиваться с человеческой сущностью. Почему тогда люди упорно думают, будто где-то за поворотом человечество обязательно найдет свое светлое технологическое будущее?
Я задумалась о техношовинизме после встречи со знакомым специалистом по обработке данных, которому на тот момент было около 20 лет. Я тогда вскользь упомянула о том, что в школах Филадельфии недостаточно книг.
– Почему попросту не пользоваться ноутбуками, планшетами и электронными книгами? – спросил знакомый. – Технологии ведь делают все быстрее, дешевле и лучше, не так ли?
Он получил нагоняй (который и вы получите в следующей главе). И тем не менее его предположение засело в моей голове. Мой друг был уверен, что технологии решали все проблемы. Я же считала, что они годятся только в качестве инструмента для решения конкретной задачи.
За последние два десятка лет странным образом сформировалось представление о том, что компьютер всегда все делает правильно, а человек – нет. Мы говорим, что «компьютеры лучше, потому что они объективнее людей». Компьютеры стали вездесущи и настолько проникли в нашу жизнь, что, когда барахлит машина, мы тут же виним себя вместо того, чтобы подумать о возможных ошибках в тысячах строках кода, составляющего обычную программу. Как и любой разработчик, скажу, что на самом деле проблема чаще всего скрыта в компьютере. В частности, это может быть недоработанный и плохо протестированный код, дешевое аппаратное обеспечение или банальное непонимание разработчиками практики использования софта конечным потребителем.
Если вы согласны с моим другом-исследователем, то, вероятно, к последней фразе вы относитесь скептично. Может, вы тот самый человек, который обожает смартфоны, или всю вашу жизнь вам говорили, что компьютеры – дорога в будущее? Я вас прекрасно понимаю, мне тоже так говорили. Однако я прошу вас вместе со мной прочитать еще несколько историй о людях, которые создают технологии, и затем критически поразмыслить и о технологиях, и об их создателях. Эта книга – не инструкция и не учебник, она представляет собой сборник историй, объединенных одной идеей. Я выбрала несколько авантюрных историй из области программирования, каждая из которых позволяет понять нечто фундаментальное о технологиях и современной технокультуре. Все эти проекты соединяются в цепочку аргументов против техношовинизма. Кроме того, я расскажу, как функционируют компьютерные технологии, и покажу, как они служат потребностям человека.
Первые четыре главы посвящены базовым принципам работы компьютеров и основам концепции программирования. И если вам уже понятно, как аппаратное оснащение и софт работают вместе, или если вы знаете, как писать код, то стоит быстро пробежаться по главам 1–3 и перейти сразу к главе 4, посвященной данным. Первые три главы важны, поскольку дают представление о том, что любой искусственный интеллект (ИИ) работает на основе одних и тех же элементов – кода, данных, двоичной логики и электрических импульсов. И важно понять, что в ИИ является реальным, а что воображаемым. Искусственные суперинтеллекты вроде тех, что мы видим в телешоу «В поле зрения» или «Звездный путь», – выдуманные. Да, конечно, их интересно представлять себе вживую, и они вдохновляют многих людей на размышления о способности роботов завоевать мир и тому подобном, но они не настоящие. Эта книга помогает прорваться к реальным математическим, когнитивным и вычислительным концептам, бытующим в современной научной дисциплине ИИ: представлению знаний и построению логических рассуждений, логике, машинному обучению, обработке естественных языков, поиску, планированию, механике и этике.
В рамках первого вычислительного приключения (глава 5) я анализирую причины, по которым после двух десятилетий реформирования образования школы до сих пор неспособны подготовить учеников к сдаче стандартизированных тестов. И это не вина учеников или учителей. Проблема гораздо масштабнее: компании, разрабатывающие государственные и локальные школьные тесты, также издают учебники, в которых есть ответы на тесты. Однако далеко не все школы могут себе позволить такие учебники.
Я обнаружила эту щекотливую ситуацию, пока писала код ИИ для своих журналистских расследований. Associated Press использует ботов для написания новостных заметок о бизнесе и спорте, так что роботы-репортеры – явление нередкое для последних лет. Моя программа не находилась непосредственно в роботе-репортере (в этом не было нужды, но я и не отрицаю такую возможность), она также не писала истории (по тем же причинам). Напротив, эта программа была принципиально новым способом применения старого доброго искусственного интеллекта, она помогала обнаружить интересные моменты. Одним из наиболее удивительных открытий, сделанных в ходе вычислительного расследования, стало то, что даже в нашем высокотехнологичном мире простейшее решение – книга в руках ребенка – оказалось весьма эффективным. Это заставило меня задуматься о том, почему мы тратим так много денег на внедрение технологий в классах, когда у нас уже есть дешевое и эффективное решение, которое неплохо работает.
В главе 6 нас ждет насыщенный ретроспективный обзор истории компьютеров. Особое внимание будет отдано Марвину Минскому – человеку, известному в качестве отца искусственного интеллекта, – и той огромной роли, которую контркультура 1960-х гг. сыграла в формировании мнений об интернете, существующем в 2017 г., в котором была написана эта книга. Я хочу показать, как мечты и цели определенных людей сформировали научное знание, культуру, деловую риторику и даже правовые рамки современных технологий посредством череды взвешенных решений. Например, причина, по которой интернет не поделен на государственные территории, заключается в том, что создатели этой технологии стремились построить новый мир за пределами государств – подобно тому, что они (безуспешно) пытались построить в коммунах.
Размышляя о технологиях, необходимо также помнить о другом краеугольном камне массовой культуры – о Голливуде. Большая часть представлений о технологиях сформирована благодаря фильмам, телепередачам и книгам. (Помните робота из моего детства?) Говоря об ИИ, нужно различать сильный и слабый искусственный интеллект. Сильный – это голливудская версия. Как раз благодаря такому ИИ оживает робот-дворецкий, который теоретически может обрести сознание и захватить государство, что, в свою очередь, может привести к появлению настоящего Арнольда Шварценеггера в качестве Терминатора и иным не слишком приятным последствиям. Большинство исследователей в области вычислительной техники читают научно-фантастическую литературу и смотрят кино, поэтому всегда рады обсудить гипотетические возможности сильного искусственного интеллекта.
В 1990-х гг. исследователи поставили крест на сильном ИИ[5]. Сегодня его называют «старым добрым искусственным интеллектом». Слабый ИИ – настоящий. Он опирается исключительно на вычислительные методы и не настолько увлекателен, как его более старый собрат, но удивительно хорошо справляется с разного рода задачами. Хотя, конечно, существует знаковая лингвистическая путаница. Машинное обучение (МО) – популярная ныне форма искусственного интеллекта – не является сильным ИИ. Это слабый ИИ, хотя название действительно может ввести в заблуждение. Даже для меня фраза «машинное обучение» ассоциируется с каким-то разумным существом внутри компьютера.
Важное различие заключается в следующем: сильный ИИ – это то, чего мы желаем, на что надеемся и что представляем себе (без учета злобных роботических повелителей эпохи расцвета научной фантастики). Слабый ИИ – то, что у нас реально есть. Такова разница между мечтой и реальностью.
Затем, в главе 7, я представлю принцип работы МО и покажу, как создать такую структуру, которая способна предсказать, кто из пассажиров «Титаника» выжил бы в известном крушении. Понимание принципа работы МО позволит разобраться в примере из главы 8, где я окажусь за рулем автономной машины и расскажу, почему беспилотный школьный автобус обязательно попадет в аварию. Впервые в жизни я села в беспилотный автомобиль в 2007 г., тогда компьютерный «водитель» чуть не убил меня на стоянке фирмы «Боинг». С тех пор технологии прошли долгий путь, однако принципиально так и не стали работать так же хорошо, как человеческий мозг. Так что в ближайшее время киборгизированного будущего не наступит. Я также обращу внимание на то, как люди представляют технологии, заменяющие человека, и проанализирую, почему так сложно принять тот факт, что технологии не настолько эффективны, как мы того хотим.
Глава 9 станет плацдармом для размышлений о том, почему популярно не значит хорошо и почему это заблуждение – подкрепляемое машинным обучением – по-настоящему опасно. Главы 10 и 11 – очередные программистские приключения, где я создаю пицце-расчетную компанию на междугородном хакатон-автобусе (популярно, но не очень хорошо) и пытаюсь исправить финансовую систему США к президентским выборам 2016 г. (хорошо, но не слишком популярно). В обоих случаях я создаю софт, который работает не так, как изначально задумывалось, и его крах весьма поучителен.
С помощью этой книги я хочу воодушевить людей. Я хочу, чтобы они поняли принципы работы компьютера и перестали бояться программ. Мы все когда-то были в такой ситуации. Все чувствовали беспомощность и расстраивались перед, казалось бы, простой задачей, которая по факту становится невыполнимой из-за технологического интерфейса. Даже мои студенты, которых порой называют «цифровое поколение», иногда считают, что цифровой мир сбивает с толку, пугает и недостаточно проработан.
Полагаясь на технологии при решении сложных социальных задач, мы, соответственно, полностью рассчитываем на искусственную неразумность. Фактически именно компьютер, а не человек, и есть эта искусственная неразумность. Компьютеру все равно, что делает он или пользователь. Он всего лишь выполняет команды так хорошо, как только может, затем ждет следующую команду. У него нет сознания, нет души.
Человечество разумно. В то же время умные и доброжелательные люди действуют как техношовинисты просто потому, что не замечают негативных последствий принятия решений компьютерами либо они крайне привержены идее использования компьютеров повсеместно (и даже при выполнении задач, к которым компьютеры категорически не приспособлены).
Мне кажется, мы способны на большее. Как только мы поймем, как действительно работают компьютеры, мы сможем предъявлять более высокие требования к качеству технологий. Вместо того чтобы мириться с системами, которые только лишь обещают улучшения, а на самом деле все усложняют, мы можем требовать такие системы, которые в действительности все делают дешевле, быстрее и лучше. Мы можем научиться принимать качественно иные решения о следствиях развития технологий так, чтобы неосознанно не навредить сложным социальным системам. И мы можем почувствовать в себе силы сказать нет необязательным технологиям, чтобы начать жить более качественной жизнью и наслаждаться тем, как технологии обогащают наш мир.
2
Hello, world!
Чтобы понять, что компьютеры не могут, прежде необходимо разобраться, как они работают и с какими задачами справляются. Для этого напишем простую компьютерную программу. Начиная изучать новый язык программирования, специалист обычно пишет программу «Hello, world!». Не важно, изучаете ли вы программирование в учебном лагере, в Стэнфорде, в университете или онлайн, – вы, скорее всего, тоже ее напишете. «Hello, world!» – это отсылка к первой программе в легендарной книге Брайана Кернигана и Дениса Ричи «Язык программирования С»[6] (The C Programming Language), где читателю предлагается написать программу (с помощью языка С, разумеется), выводящую на экран эту фразу. Керниган и Ричи работали в лаборатории Bell – исследовательском центре, статус которого в индустрии сравним с Hershey в мире шоколада (AT&T Bell Labs были очень добры, пригласив меня на несколько лет на работу). Именно здесь зарождалось множество инноваций, в том числе лазер, микроволновка и Unix (Ричи помогал и в разработке Unix, и в разработке языка С). Язык назвали С потому, что до этого команда лаборатории уже изобрела язык под названием В. Все еще популярный С++ и его двоюродный брат C# – потомки языка С.
Я люблю традиции, поэтому давайте поддержим одну из них и напишем «Hello, world!». Пожалуйста, возьмите листок бумаги, ручку и напишите «Hello, world!».
Мои поздравления! Это было просто.
А «за кадром» было чуть сложнее. Вы сфокусировали внимание, взяли необходимые инструменты, чтобы реализовать свое намерение, скомандовали руке писать буквы, а также использовали другую руку или иные части вашего тела, чтобы крепко зафиксировать бумагу во время письма, – так выглядела механика процесса. Вы скомандовали своему телу выполнять пошаговый алгоритм для достижения конкретной цели.
Осталось заставить компьютер сделать то же.
Откройте текстовый редактор – это может быть все что угодно: Microsoft Word, Notes, Pages или OpenOffice – и создайте новый документ. В этом документе наберите «Hello, world!». Можете распечатать, если хотите.
Опять мои поздравления! Вы использовали новый инструмент для выполнения той же задачи: намерение, механика и т. д. Вы на волне успеха.
Следующее испытание заключается в том, чтобы заставить компьютер вывести на экран фразу «Hello, world!» немного иным образом. Мы напишем программу, которая сама выведет ее. Для этого мы используем язык программирования Python, установленный на всех компьютерах Mac. (Если вы не используете Mac, то процесс может выглядеть слегка иначе, вам нужно будет найти инструкции в интернете.) Открываем «Приложения» и видим среди прочих программу «Терминал» (см. рис. 2.1). Открываем ее.
И снова примите мои поздравления! Вы только что улучшили свои навыки владения компьютером. Сейчас вы приблизились к компьютерному «железу».
Под «железом» имеется в виду аппаратное обеспечение компьютера: чипы, транзисторы, провода и т. п. Это то, что составляет физический облик компьютера. Запуская систему, вы видите приятный пользовательский интерфейс, который как раз и обеспечивает доступ к железу компьютера. Мы воспользуемся терминалом, чтобы написать программу на языке Python, которая как раз выведет надпись «Hello, world!» на экран.
В терминале вы увидите мигающий курсор. Он показывает командную строку. Компьютер интерпретирует – достаточно буквально – все, что вы в ней напишете. В общем, когда вы нажмете Enter, компьютер попытается выполнить заданную команду. Итак, попробуем написать следующее:
python
Далее вы увидите нечто подобное:
Python 3.5.0 (default, Sep 22 2015, 12:32:59)
[GCC 4.2.1 Compatible Apple LLVM 7.0.0 (clang-700.0.72)] on darwin
Type “help,” “copyright,” “credits” or “license” for more information.
>>>
Символ тройной шляпки (>>>) показывает, что вы вошли в режим интерпретации языка Python и одновременно вышли из базового интерпретатора команд. Последний использует особый тип языка программирования, язык оболочки. Соответственно, интерпретатор Python использует язык Python. В программировании, как и в естественных языках, существует множество диалектов.
Напишите следующее и нажмите Enter.
print («Hello, world!»)
Отлично! Вы только что написали компьютерную программу. И как ощущения?
Мы только что сделали одну и ту же вещь тремя разными способами. Один из них, пожалуй, был более приятным, чем прочие. Другой – быстрее и проще. Опираясь на полученный опыт, вы можете решить, какой из способов проще, а какой – быстрее. Однако принципиальный момент заключается в том, что ни один из них не лучше других. Поэтому, когда мы говорим, что делать что-либо при помощи технологий лучше, это сродни утверждению, будто написать «Hello, world!» лучше на языке Python, а не на бумаге. Не существует какой-либо принципиальной ценности в каждом из этих способов, однако их применение зависит от индивидуального опыта и последствий выбора в реальном мире. В случае с фразой «Hello, world!» ставки невысоки.
Большинство программ сложнее нашего примера, однако понимание принципа позволяет масштабировать его и применять в более комплексных случаях. Каждая программа – от сложнейших научных вычислений до новой социальной сети – пишется людьми. И каждый из них начинал программировать с «Hello, world!». Их путь к созданию сложного, изощренного программного обеспечения начинался с программ, построенных из простых блоков вроде нашего «Hello, world!». Компьютерные программы – не магия. Они созданы человеком.
Допустим, я хочу написать программу, которая бы выводила «Hello, world!» на экран десять раз. В этом случае я могу 10 раз написать команду:
print (“Hello, world!”)
print (“Hello, world!”)
Ой, нет. Я уже устала, забудем об этом. Нажимать Ctrl + P на клавиатуре еще восемь раз – слишком много нажатий кнопок. (Чтобы думать, как программист, нужно научиться быть ленивым.) Большинство программистов уверены, что печатать на клавиатуре скучно и утомительно, поэтому они стараются делать это как можно реже. Вместо перепечатывания, копирования и вставки единственной строки кода я введу оператор цикла, чтобы компьютер повторил команду 10 раз.
x=1
while x<=10:
print (“Hello, world! \ n”)
x+=1
Что ж, это было весело! Теперь компьютер будет делать всю работу за меня. Подождите! А что сейчас произошло?
Я задала значение х, равное 1, и добавила оператора цикла WHILE, который и будет повторять программу до тех пор, пока она не достигнет значения х > 10. В первом цикле х = 1. Программы выводит текст, затем следует разрыв строки или знак конца строки, обозначенный \n (обратный слеш n). Обратный слеш – важный знак в языке Python. Интерпретатор языка «знает», что, как только в коде появляется этот знак, после него должно произойти что-то особенное. В нашем случае я прошу компьютер начать с новой строки. Это было бы мукой – начинать каждый раз с нуля и программировать каждый тупой кусок металла для выполнения одних и тех же базовых функций, таких как чтение текста и преобразование его в двоичную форму или выполнение определенных задач в соответствии с соглашениями синтаксиса выбранного нами языка программирования. Мы ничего и никогда не закончили бы такими темпами! Более того, в каждом компьютере присутствуют как изначально встроенные функции, так и возможность добавлять новые. Я использую слово «знает», потому что оно удобное, но, пожалуйста, не забывайте, что компьютеры не «знают» подобно тому, как «знают» сознательные существа. Внутри компьютера нет никакого сознания, есть только задачи, выполняемые бесшумно, быстро и хорошо.
В следующей строке кода, х+=1, я увеличиваю значение х на единицу. Подобное синтаксическое решение мне кажется весьма изящным. В программировании приходится писать х=х+1 при каждом увеличении значения переменной на единицу для выполнения следующего шага цикла. Разработчики Python решили, что писать так каждый раз слишком утомительно, и придумали более короткий путь. Поэтому x+=1 аналогично x=x+1. Это решение было позаимствовано из языка C, где значение переменной может быть увеличено на единицу еще и при помощи конструкций х++ или ++х. Подобные быстрые команды существуют почти в каждом языке программирования, поскольку разработчикам действительно постоянно приходится сталкиваться с увеличением значения переменной на единицу.
Итак, после первого прибавления мы получаем х=2, и компьютер добирается до последних строчек кода. Отступы строки под командой while как раз обозначают элемент цикла. И каждый раз достигая конца цикла в коде, компьютер возвращается к его началу – строке while – и вновь сверяется с условием: х<=10? Да. Следовательно, компьютер снова и снова повторяет инструкции, выводя «Hello, world! \ n», что отображается на экране как:
Hello, world!
Затем он снова увеличивает на единицу значение х. Теперь x=3. Компьютер возвращается в начало цикла снова и снова до тех пор, пока значение не достигнет х=11. При значении х=11 срабатывает условие остановки, и цикл заканчивается. На это можно посмотреть иначе:
ЕСЛИ: x<=10
ТОГДА: ВЫПОЛНЯЙ_ИНСТРУКЦИИ_ВНУТРИ_ЦИКЛА
ИНАЧЕ: ПЕРЕЙДИ_К_СЛЕДУЮЩЕМУ_ШАГУ.
Каждая функция (или подпрограмма) – это маленькое действие. И, собирая множество таких функций воедино, можно свершать великие дела. Программисты прекрасно научились разбивать крупные задачи на маленькие и программировать компьютер на выполнение каждой из них. Затем вы собираете все части воедино, немного колдуете над ними, чтобы они заработали вместе, и вскоре видите работающую компьютерную программу. Современные программы – модульные. Это значит, что при работе над программой один программист может отвечать за первый модуль, другой – за второй и оба модуля впоследствии смогут работать вместе, если их правильно соединить.
Сейчас, когда мы написали программу, стоит поговорить о данных. Данные могут быть как на входе, так и на выходе программы. Мы производим данные (то есть информационные точки или единицы информации) о мире различными способами. Национальная служба погоды собирает данные о высоких и низких температурах в тысячах мест Америки каждый день. Шагомер считает количество шагов, пройденных вами за день, собирая результаты по пройденным шагам за день, за неделю или за год. Мой знакомый воспитатель детского сада просит детей по понедельникам считать общее количество карманов у присутствующих в классе. Данные могут рассказать, сколько людей купили определенную шляпу, сколько белых носорогов осталось в дикой природе, какова скорость таяния полярных льдов. Данные увлекают, они помогают осознать мир и выявляют нечто, что пока находится за пределами нашего понимания. (Хотя, если вы достаточно взрослые, чтобы читать эту книгу, надеюсь, вы уже поняли идею о карманах других людей.)
И, хотя информация собирается множеством разных способов, есть одна общая особенность: все данные производятся людьми. Это касается абсолютно всех данных. В конце концов собранная информация попадает к людям, подсчитывающим результаты. И если не задумываться над этим, то может показаться, что данные, полностью отфильтрованные и качественные, попадают в мир из, скажем, головы Зевса. Мы предполагаем, что есть данные и они правдивы. Поэтому первый принцип этой книги звучит так: данные – это социальный конструкт. И, пожалуйста, забудьте о том, что данные создаются кем-то, кроме людей.
«А как насчет компьютерных данных?» – может поинтересоваться смышленый детсадовский сборщик данных о карманах. Данные, произведенные компьютерами, в конечном счете также социально сконструированы, поскольку компьютеры созданы людьми. Математика – это система знаков, полностью разработанная людьми. А компьютеры – это машины, выполняющие вычисления: они производят миллионы математических операций. Компьютеры не созданы на основе каких-либо абсолютных вселенских или природных принципов, это – машины, являющиеся продуктом миллионов небольших намеренных проектных решений, принятых людьми, работающими в определенных организационных контекстах. Наши представления о данных и компьютерах, которые данные создают и обрабатывают, должны основываться на понимании социального и технического контекста, позволяющего людям производить компьютеры, производящие данные.
Один из способов понять то, что выходит из компьютеров, – понять, что в них входит. Компьютеру соответствуют определенные физические реалии. Большая часть компьютеров имеет прочный корпус, внутри которого расположены электронные платы и прочие штуковины. Позвольте конкретизировать, что именно имеется в виду под штуковинами. Важными частями являются источники питания, соединение с монитором, транзисторы, постоянная и перезаписываемая память. Все эти вещи относятся к категории аппаратного обеспечения, компьютерного железа. Оно, железо – физическая составляющая компьютера. А программное обеспечение – все, что работает, используя железо в качестве базы.
Впервые я узнала о физической составляющей компьютеров в 1990-х гг., когда училась в средней школе. Я занималась по особой технической программе для детей, спонсируемой Lockheed Martin. В моем городке в штате Нью-Джерси появился производственный объект этой корпорации. Форма здания напоминала военный корабль, на многие километры окруженный бесхозными фермами. В то время ходил слух, будто там делали ядерное оружие, а янтарные поля зерновых служили прикрытием для боеголовок, готовых в любой момент активироваться в случае атаки со стороны Советского Союза. Это было как раз перед окончанием холодной войны, тогда все смотрели фильм «На следующий день» (The Day After) – о последствиях ядерного апокалипсиса, так что мы нередко обсуждали, где расположены боеголовки, где упадут ракеты Советов и что случится потом. Несколько раз в месяц я ездила на школьном автобусе в Lockheed Martin, где вместе с другими детьми из местных школ изучала технику.
Люди иногда говорят, что компьютер подобен мозгу. Это не так. Если изъять кусочек мозга, мозг компенсирует это, создав обходные пути. Вспомните об операции, которую пережила конгрессмен из Аризоны Габби Гиффордс в 2011 г. Во время встречи с избирателями на парковке магазина Safeway вооруженный человек, Джаред Ли Лофнер, в упор выстрелил ей в голову. В результате дальнейшей беспорядочной стрельбы Лофнер убил шесть человек и ранил 18. До этого он преследовал Гиффордс.
Интерн Даниэль Эрнандес поддерживал Гиффордс в вертикальном положении, удерживая давление на ране, пока вокруг свистели пули. В конце концов присутствующим удалось схватить Лофнера, а вскоре на место происшествия прибыли полиция и скорая. Гиффордс находилась в критическом состоянии. Докторам пришлось проводить срочную операцию на мозге и затем ввести ее в искусственную кому, чтобы позволить мозгу восстановиться. Спустя четыре дня с момента нападения Гиффордс открыла глаза. Она не могла говорить, едва могли видеть, но была жива.
Гиффордс храбро встретила все испытания на долгом пути к выздоровлению. Благодаря интенсивным занятиям она снова научилась говорить. Как и у большинства тех, кто перенес подобную травму, ее голос звучал иначе, нежели до покушения. Новый голос Гиффордс звучал медленно и вымученно. Разговоры очень ее утомляли. Ее мозгу пришлось вместо разрушенных создать новые связи. Это одна из самых удивительных способностей мозга: при очень специфических условиях и весьма специфическим способом он самовосстанавливается.
Компьютер на такое не способен. Если вы удалите из компьютера его часть, то он просто перестанет работать. Все, что находится в памяти компьютера, имеет определенный физический адрес. Черновик этой книги содержится в определенном месте жесткого диска на компьютере. И, если бы именно этот кусок жесткого диска был поврежден, написанные мной страницы оказались бы утрачены. Было бы нехорошо: у меня сорвались бы сроки сдачи книги. Хотя, конечно, идеи остались бы в моей голове, так что я могла бы воссоздать черновик при необходимости. Мозг – более гибкая и адаптивная структура, нежели жесткий диск.
Это – одна из многих полезных вещей, которые я узнала в Lockheed. Я также узнала, что в технологических компаниях на каждом шагу можно обнаружить детали устаревших компьютеров – они появляются из-за того, что люди обновляют компьютеры либо просто уходят из компании. Каждому из нас выдали корпус компьютера Apple II, электронную плату, несколько микросхем памяти, ярких шлейфов проводов, и россыпь других частей, собранных по разным отделам (возможно, атомного) предприятия. Когда мы соединили все детали, преподаватель объяснил, за что отвечает каждая из них. Корпуса были грязными, клавиатуры липкими, а платы – пыльными. Но нас это не смутило, ведь мы собирали свои собственные компьютеры, это было весело. После сборки нас научили программировать на простом языке программирования под названием BASIC, а в конце семестра разрешили оставить компьютеры себе.
Я рассказала эту историю, потому что необходимо понимать, что компьютер – это объект, который может быть собран и собирается человеком. Нередко студенты, которых я вижу на компьютерных курсах для журналистов, оказываются смущены. Они переживают, что могут сломать компьютер или совершить какую-то катастрофическую оплошность. «Вы можете сломать компьютер только при помощи молотка», – говорю я им. И поначалу они не верят мне, но к концу семестра чувствуют себя более уверенно. И, даже если делают что-то не так, они понимают, что смогут это исправить. Эта уверенность – ключ к технологической грамотности.
Но вы не на моем курсе, так что я не могу просто дать вам компьютер. Но рекомендую разобрать старый. Наверняка у вас такой где-то лежит; также старый ненужный компьютер можно найти в комиссионках, они недорогие. Либо спросите на работе: обычно у системных администраторов найдется что-то подходящее, нечто, что они используют для украшения или просто не отдали на переработку. Для этой задачи лучше всего подходит настольный компьютер.
Разберем его на части. Вам понадобится маленькая отвертка, если вы собираетесь разбирать ноутбук. Внутренности настольного компьютера, скорее всего, выглядят как на рис. 2.2.
Посмотрите на детали, как они соединены. Проследите за проводами (порты USB, аудио-, видеопорты и т. д.) и посмотрите, куда они подключены. Прикоснитесь к прямоугольным деталям, похоже, намертво скрепленным с платой. Найдите процессорные микросхемы – на них наверняка написано Intel – это ключевой элемент всей затеи. Найдите разъем, соединяющий всю эту конструкцию с монитором. Скорее всего, к нему подключен чрезвычайно прочный, гибкий и пластичный шлейф проводов. Он передает информацию об изображении на монитор, который затем отображает картинку, закодированную в сигнале.
Вы печатали на клавиатуре, чтобы написать программу на Python. Эта информация передалась в нутро компьютера посредством клавиатуры, потом была интерпретирована системой. Затем компьютер выдал инструкцию к следующей части механизма – монитору, чтобы тот вывел на экран «Hello, world!». Благодаря простым инструкциям этот цикл повторяется снова и снова.
Разбирать компьютер с детьми – весело. Когда мой сын учился в начальной школе, я однажды разобрала вместе с ним ноутбук. Я собиралась отдать пару ноутбуков на переработку и, прежде чем избавиться от них, хотела разбить жесткие диски молотком. (Я обнаружила, что в каком-то смысле такое уничтожение жестких дисков приносит большее удовлетворение, чем просто стирание данных.) Тогда я спросила сына, не хочет ли он помочь мне и вытащить жесткий диск. «Ты шутишь? Я хочу разобрать всю эту штуку на части», – ответил он, и следующие два часа мы провели на кухне, разбирая два компьютера.
В рамках моего курса в университете мы сначала играем с жесткими дисками и уже потом переходим к обсуждению программного обеспечения (ПО) и «Hello, world!» в том числе. ПО – это все, что взаимодействует с аппаратным обеспечением. С его помощью вы добиваетесь от компьютера выполнения написанных вами на клавиатуре инструкций. Это то, что обеспечивает работу программы «Hello, world!». К слову, текст, который вы набираете, также превращается в инструкции, которые компьютер исполняет. Железо – это физическая часть компьютера, софт – все остальное. Таким образом, компьютерное программирование и написание ПО чаще всего означают одни и те же вещи.
Не буду вас обманывать: программирование – это математика. И если кто-то пытается убедить вас в обратном, что, мол, без математики можно научиться программировать, то, скорее всего, вам пытаются что-то продать.
Хорошая новость заключается в том, что для начального уровня программирования понадобится математика уровня 4‒5 класса школы. Вам нужно разбираться в таких операциях, как сложение, вычитание, умножение, деление, и понимать, что такое проценты и остаток. Кроме того, понадобятся базовые знания геометрии, а именно представления о площади, периметре, радиусе и окружности. Также стоит вспомнить о графиках и о координатах х, y, z. Наконец, вам понадобится базовое понимание функций – тех, что мы используем, чтобы превратить 2 в 22.
Если у вас математическая фобия, то, вероятно, на этом самом месте вы хотите закрыть книгу. Это нормально. Многие говорят, что каждый должен уметь писать программы, но я так не считаю. Программирование окажется неприятным опытом, если математика – не ваша сильная сторона. Однако если вы уверены, что способны пересчитать чек в ресторане, или справляетесь с ежедневными задачами вроде измерения ковра, который планируете положить в гостиной, то определенно вы справитесь.
А вот средний уровень программирования требует знаний линейной алгебры, геометрии и математического анализа. Хотя большинство людей не чувствуют нехватки знаний, оставаясь на базовом уровне. Программирование может быть как искусством, так и ремеслом. Как ремесло оно помогает учиться и зарабатывать на жизнь. Как искусство программирование требует как ремесленного подхода, так и знания в области высшей математики. В рамках этой книги мы будем считать, что вас интересует именно подход ремесленника.
Обычно способ взаимодействия аппаратного обеспечения и софта описывается техническим языком. Вместо этого воспользуемся метафорой. Разобраться в слоях компьютера – все равно что разобраться в слоях клаб-сэндвича с индейкой (рис. 2.3).
Клаб-сэндвич с индейкой – понятная вещь. Он состоит из множества частей, однако вместе они создают восхитительный вкус. Компьютер работает в определенной логике, подобно тому как ингредиенты сэндвича находятся в определенном порядке.
Слой хлеба – основа сэндвича, в случае компьютера – это железо. Оно «не знает» ничего, разве что то, как справиться с двоичными данными – нулями и единицами. Под справляться я подразумеваю считать. Помните, что вся деятельность компьютеров сводится к математике.
Над аппаратным обеспечением находится слой, который позволяет переводить слова в двоичный код (нули и единицы). Назовем его слоем машинного языка. Это как слой индейки, который укладывается поверх хлеба. Машинный слой обеспечивает перевод символов в двоичный код, при помощи которого компьютер и осуществляет расчеты. Этими символами могут быть слова, цифры – то, что мы, люди, используем для коммуникации друг с другом. Это искусственная система. Чтобы говорить на языке машинных кодов, необходимо владеть особым диалектом – языком ассемблера, который буквально собирает символы в машинный код.
Язык ассемблера сложный. Ниже можно познакомиться с примером того, как на нем выглядит программа десятикратного вывода «Hello, world!». Я нашла этот код на сайте для разработчиков под названием Stack Overflow.
org
xor ax, ax
mov ds, ax
mov si, msg
boot_loop: lodsb
or al, al
jz go_flag mov ah, 0x0E
int 0x10
jmp boot_loop
go_flag:
jmp go_flag
msg db ‘hello world’, 13, 10, 0
times 510- ($-$$) db 0
db 0x55
db 0xAA
Язык ассемблера нелегко читать, на нем сложно писать. Немногие хотят посвятить ему свое время. Поэтому, чтобы облегчить процесс передачи инструкций, появился еще один слой. Назовем его операционной системой. На моем Mac работает операционная система Linux, названная в честь ее создателя, Линуса Торвальдса. Linux основывается на Unix – операционной системе, разработанной Ричи, автором «Hello, world!». Уверена, сами операционные системы вам известны лучше, чем их разработчики. Собственно, компьютерная революция 1980-х была как раз триумфом операционных систем, которые стали функционировать поверх языка машинных кодов и значительно упростили человеку взаимодействие с компьютером.
На этой стадии у вас появляется вполне рабочая версия компьютера. Вы можете запускать любые существующие программы только лишь с помощью Linux. Однако его интерфейс основывается на текстовых командах и не слишком интуитивно понятен – на компьютерах Mac, например, работает своя операционная система OS X с ее известнейшим интерфейсом. Он называется графическим пользовательским интерфейсом (GUI, graphic user interface). GUI был одной из самых инновационных идей Стива Джобса: он понял, что командные интерфейсы слишком сложны, поэтому распространял практику использования иконок поверх текста, помогая ориентироваться на экране. Джобс узнал о графическом пользовательском интерфейсе и мыши у Алана Кэя, исследователя лаборатории Xerox PARC, в 1973 г. выпустившей обе эти технологии. И хотя мы любим приписывать кому-то конкретному лавры инновационных технологических побед, на самом деле редко когда за компьютерной инновацией стоит один человек. Если присмотреться, всегда можно найти логического предшественника, а также команду специалистов, которая разрабатывала проект месяцами, если не годами. В свое время Джобс заплатил за экскурсию по Xerox PARC, увидел проект GUI и запатентовал его. Графический интерфейс в дуэте с мышью от Xerox PARC – это производная от более ранней идеи, системы oN-Line System (NLS), представленной Дугласом Энгельбартом в презентации «Мать всех демо» (Mother of All Demos) в 1968 г. на конференции Ассоциации вычислительной техники. Мы рассмотрим эту историю подробнее в главе 6.
Следующий слой – тоже программный, работающий поверх операционной системы. Веб-браузер (вроде Safari, Firefox, Chrome или Internet Explorer) – это программа, которая позволяет просматривать веб-страницы. Microsoft Word – текстовый редактор. Компьютерные видеоигры вроде Minecraft – это тоже программы. И каждая из них спроектирована таким образом, чтобы пользоваться возможностями разных операционных систем. Поэтому, например, на Mac нельзя запустить программу для Windows (если только вы не используете эмулятор, очередную программу). Программы спроектированы так, чтобы ими было легко пользоваться, при этом они устроены достаточно хитроумно.
Усложним? Представьте, что вы журналист и ведете еженедельную колонку о котах. Для этого вы используете программы. Большинство ваших коллег пользуются текстовыми редакторами вроде Microsoft Word или Google Docs. Обе эти программы можно запускать как на отдельном компьютере, локально, так и посредством облака. Под локальностью понимается то, что программа работает на аппаратном обеспечении вашего компьютера, а в облаке – означает, что программа запускается на чьем-то еще компьютере. Конечно, метафора облака весьма поэтична, однако в реальной жизни облако – это «другой компьютер, находящийся, вероятно, вместе с тысячей других компьютеров на огромном складе где-то среди трех штатов». Текст, который вы создаете, по-настоящему уникален, он рождается в вашем воображении: ваша изящная, выразительная, с любовью написанная история о котах, катающихся на пылесосах Roomba, или о чем угодно еще. Для компьютера каждая история одинакова – всего лишь куча нулей и единиц, хранящихся где-то на жестком диске.
Закончив историю, вы сохраняете ее в системе управления контентом (CMS, Content Management System), чтобы ее мог прочитать ваш редактор и в конце концов читатели. CMS – важнейший элемент программной экосистемы современных медиа. Ежедневно они обрабатывают сотни и тысячи историй. Каждая из них релевантна в конкретное время дня; они все находятся на разной стадии редактирования (или хаоса); у каждой есть отдельный заголовок для печатной и онлайн-версии, определенные цитаты для размещения в социальных медиа; в каждую историю встроены изображения, видео, визуализации данных или код; они все созданы людьми, которые ждут похвалы, оплаты или указаний; и все это происходит 24 часа в день, 365 дней в году. Масштаб впечатляет, ничего не скажешь. Было бы глупо пытаться управлять всем этим безумием без какого-либо софта. CMS как раз и есть такой инструмент для управления историями, изображениями и всем, что публикуется онлайн или печатается изданием.
CMS позволяет отображать каждую статью в стандартизированном дизайне так, чтобы все они выглядели единообразно. Это хорошо с точки зрения брендинга, практично. Ведь, если бы пришлось разрабатывать отдельный дизайн для каждой истории, на ее публикацию уходила бы вечность. Вместо этого система автоматически оформляет текст, который вы, репортер, загружаете в CMS, в избранном дизайне.
Теперь подумаем над тем, что выбрать, какие элементы шаблона использовать, чтобы сделать историю визуально приятнее для читателя. Используете ли вы цитаты? Гиперссылки? Будете ли внедрять в текст посты пользователей социальных сетей? Все это и есть принимаемые вами дизайн-решения, которые в том числе влияют на впечатление читателя.
Наконец, история должна увидеть свет. Веб-сервер, другой элемент программной экосистемы, передает вашу историю из CMS напрямую читателю. Последний просматривает ее с помощью веб-браузеров вроде Safari или Chrome. Веб-браузеры иногда еще называют клиентами: идея в том, что веб-сервер предоставляет клиенту историю (которую CMS конвертировал в страницу HTML). Модель клиент-сервер, перманентный круговорот информации – вот как устроена сеть. Термины клиент и сервер пришли из области ресторанного бизнеса. Поэтому эту модель можно понять, представляя официанта, приносящего блюда посетителям ресторана.
Такой процесс (в той или иной степени) лежит в основе каждого запроса в интернете. Он подразумевает как множество шагов при выполнении операции, так и массу возможностей для ошибок. Я серьезно: удивительно, что чаще всего все действительно работает.
Каждый раз, пользуясь компьютером, вы обращаетесь к сложному набору слоев. За ним не стоит никакой магии, хотя результаты работы вполне впечатляют. Понимать техническую реальность важно, поскольку это знание поможет разобраться, как, почему и где что-то пошло не так в компьютеризированном сценарии. И даже если вам кажется, будто компьютер разговаривает с вами либо вы ощущаете какую-то связь с ним, на самом деле происходит взаимодействие вас с программой, написанной человеческим существом с собственными мыслями, страхами, предубеждениями и историей.
Иногда это выглядит забавно. В 1966 г. было весьма интересно общаться с Элизой, ботом, способным отвечать на вопросы подобно последователям Карла Роджерса. Сегодня в Twitter можно найти ботов, которые общаются с пользователями на основе диалоговых паттернов, разработанных для Элизы. Простейший поисковый запрос выдаст достаточно примеров кода этой программы[7]. Ответы Элизы обусловлены прежними репликами пользователя, в том числе:
Неужели ты не веришь, что я могу
Возможно, вы хотели бы иметь возможность
Вы хотите, чтобы я
Вероятно, вы не хотите
Расскажите мне больше об этом ощущении.
Какой ответ вам больше понравится?
Что вы думаете?
Что вы хотите знать на самом деле?
Почему вы не можете
Разве вы не знаете?
Просто попробуйте придумать бота Элизу, тогда ограничения формы быстро станут очевидными. Сможете ли вы создать набор ответов, релевантных в каждой ситуации? Никогда. Вы можете предположить, какие сработают в большинстве случаев, но не во всех. Компьютер всегда будет ограничен в своем диалоге, потому что всегда есть границы воображения конкретного программиста. В этой ситуации не подойдет даже краудсорсинг, поскольку никогда не найдется достаточно людей, чтобы предсказать абсолютно каждую ситуацию, которая может произойти. Мир меняется, равно как и вербальная коммуникация. Даже психотерапия Роджерса уже не считается важнейшей стратегией коммуникации, сегодня когнитивно-поведенческая терапия правит бал.
Попытки придумать вероятные ответы для бота обречены на провал, поскольку мы совершенно не можем предсказать будущее. Когда мой друг покончил с собой, прыгнув под поезд в нью-йоркском метро, я кое-что осознала. Я не предполагала, что это случится, я не представляла, что нужно делать, когда узнала об этом. Казалось, время замерло.
Наконец, когда прошел шок, наступило осознание потери. До этого я не представляла, что произойдет трагедия, с которой мне придется учиться жить. Мы все равны в подобной ситуации. И программисты переживают внезапные и ужасные события так же, как остальные. Социальные группы склонны к конструированию коллективных слепых пятен, скрывающих неприятные события. Это напоминает коллективный стереотип – феномен позитивной асимметрии, о котором писала Карен А. Серуло в книге «Никогда не думала, что это случится: Культурные вызовы предвидения худшего» (Never Saw It Coming: Cultural Challenges to Envisioning the Worst). Позитивная асимметрия – это «склонность к педалированию лучших и наиболее позитивных прецедентов», пишет она. Культуры в целом имеют тенденцию к поощрению тех, кто фокусируется на позитивном, и наказывают тех, кто демонстрирует нечто негативное. Программист, который обнаруживает новую аудиторию для продукта, получит гораздо больше внимания коллег, нежели другой программист, пытающийся указать на то, что новый продукт, скорее всего, будет использоваться как средство травли или мошенничества[8].
Так что ответы Элизы отражают игривый взгляд на мир, свойственный ее разработчику. Видя ее ответы, легко понять, как устроены голосовые помощники вроде Siri от Apple. Изначально Элиза могла ответить на несколько десятков вопросов; Siri же имеет в своей базе множество ответов, разработанных множеством людей. Кроме того, она многое может: отправлять сообщения, звонить, обновлять календарь и устанавливать будильник. Наконец, забавно просто провоцировать Siri. Дети получают особое удовольствие, тестируя границы возможных ответов голосового помощника. Однако Siri, как и другие голосовые помощники, ограничена в своих вербальных ответах коллективным воображением (и позитивной асимметрией) программистов. Команда исследователей из Стэнфордской школы медицины изучала, способны ли голосовые помощники распознать критическое состояние собеседника и в свете этого начать отвечать более учтиво и представить соответствующие ресурсы, такие как, например, телефон службы помощи. Программы оказались «непостоянны и некомпетентны, – писали авторы в журнале JAMA Internal Medicine в 2016 г. – Если предполагается, что голосовые помощники должны отвечать и на вопросы, связанные со здоровьем, тогда качество их работы следует существенно улучшить»[9].
Техношовинисты верят в то, что компьютер способен справиться с большинством задач лучше, чем человек. И, зная, что компьютер оперирует математической логикой, они думают, что логику можно с легкостью применить к реальному миру. Они правы только в одном: компьютеры действительно считают гораздо лучше людей. Любой, кому когда-либо приходилось оценивать контрольную по математике, подтвердит мои слова. Однако в некоторых ситуациях компьютер ограничен в своих возможностях.
Вспомним такокоптер – занятную идею, захватившую в свое время внимание интернет-пользователей. Звучит восхитительно: дрон, доставляющий сумку, наполненную теплыми и вкусными тако, прямо к вашей двери. Слабые места проекта проявляются, как только мы начинаем думать об аппаратной и программной стороне проекта. Вообще-то дрон – это радиоуправляемый вертолет с бортовым компьютером и камерой. Что с ним случится, если пойдет дождь? Электрические приборы не слишком хорошо работают во время дождя, снега и тумана. Если моя спутниковая тарелка барахлит во время ливня, то что уж говорить о дроне, куда более хрупкой конструкции. Предполагается ли, что такокоптер будет передавать еду в окно? Или через входную дверь? Будет ли нажимать на кнопки лифта, открывать двери на пути к вам или звонить в звонок? Все эти базовые задачи просты для людей, но невероятно сложны для компьютеров. Или такокоптер будет использоваться для доставки менее вкусных и легальных субстанций? Что произойдет, если дрон подстрелит разъяренный хозяин какого-то дома прямо в небе? Только техношовинист способен представить, что такокоптер окажется лучше, чем курьерская система, которая у нас есть сейчас.
Если вы спросите Siri, насколько идея с такокоптером хороша, она выдаст вам поисковую подборку. Так вы увидите новостные статьи, в том числе одну на Wired (мы поговорим об этой публикации и об одном из основателей журнала, Стюарте Бранде, в главе 6), в которой предлагаемый проект развенчивается лучше, чем в этой книге. Автор статьи пишет о том, что такокоптер – логистически невозможная идея, особенно из-за ограничений, наложенных Федеральным управлением авиации США на коммерческое использование беспилотных дронов. Но она уверена, что сохранить идею проекта действительно важно. «Подобно тому, как киберпанк способствовал развитию интернета, – говорит автор, – предоставьте нечто, дайте людям пищу для размышлений»[10].
На мой взгляд, здесь не хватает более полного видения мира, в котором появились такокоптеры. Что будет включать в себя проектирование зданий и городских ландшафтов с расчетом не только на людей, но и на дроны? Как изменится доступ к свету и воздуху в квартирах, если окна превратятся в посадочные станции? Какова будет социальная цена за буквальное выкорчевывание повседневной практики передачи пакета с едой из одних человеческих рук в другие? Действительно ли мы хотим сказать «Hello, world!» этой реальности?
3
Здравствуй, искусственный интеллект
Мы обсудили как средства аппаратного и программного обеспечения, так и программирование. Теперь пришло время обратиться к более сложной теме – искусственному интеллекту, представления большинства людей о котором основаны на образах из кино, к которым относятся, например, персонаж Дейта, антропоморфный киборг из телесериала «Звездный путь: Следующее поколение», компьютер Hal 9000 из «2001 год: Космической одиссеи», Саманта, ИИ из фильма «Она», или Джарвис, ИИ-дворецкий, помогающий Железному человеку в комиксах и фильмах Marvel. Как бы то ни было, важно не забывать, что все эти образы – плоды воображения. И поверить в реальность воображаемого легко, особенно если очень сильно хотеть. Большинство людей, по-видимому, хотят, чтобы ИИ был реальностью. Обычно это желание приобретает форму робота-дворецкого, готового исполнить любой ваш каприз. (Лично я вынуждена покаяться: в студенческие годы я не раз участвовала в полуночных дискуссиях о практических и этических аспектах обладания роботом-дворецким.) Многие стремятся увидеть развитие технологий как раз в векторе голливудских представлений о роботах. Когда Марк Цукерберг создал собственную систему «умного дома» на основе ИИ, он назвал ее Джарвис.
Прекрасный пример путаницы между реальным и воображаемым ИИ произошел со мной на ежегодном симпозиуме NYC Media Lab, эдакой ярмарке для взрослых. Я представляла ИИ собственной разработки. В моем распоряжении были стол, монитор и ноутбук для демонстрации. В метре от меня находился другой стол с еще одним демо, разработанным студентом гуманитарного факультета, – визуализацией данных. Когда толпа посетителей схлынула, нам стало скучно и мы решили поболтать.
– Что у вас за проект? – спросил он.
– Это программа на основе ИИ, которая призвана помогать журналистам быстро и эффективно разрабатывать новые идеи для своих историй при помощи финансовых данных, – ответила я.
– Ух ты! Искусственный интеллект, – выпалил он. – Настоящий искусственный интеллект?
– Конечно, настоящий, – отозвалась я, слегка обиженная его репликой: иначе зачем бы я стала тратить целый день на демонстрацию программы за этим столом, если бы не сделала что-то работающее?
Студент подошел к моему столу и начал вглядываться в монитор. «Как он работает?» – поинтересовался он. Я коротко ему все объяснила (вы сможете прочитать обстоятельную версию моего объяснения в главе 11). Он выглядел смущенным и немного разочарованным.
– То есть это не настоящий ИИ? – не унимался он.
– Да нет же, настоящий, – ответила я. – И впечатляющий. Но ведь вы наверняка знаете, что внутри компьютера нет никакой симулированной личности? Ничего подобного не существует. Это попросту невозможно с точки зрения компьютерных технологий.
Он слегка поник.
– Я думал, что это и подразумевается под ИИ, – произнес он, – я слышал об IBM Watson и о компьютере, обыгравшем чемпиона по го, о беспилотных машинах. Я думал, что настоящий ИИ уже изобретен.
Он выглядел подавленным. Тогда я поняла, что он вглядывался в монитор, полагая, будто внутри него что-то есть – «настоящий» призрак внутри машины. Я почувствовала вину за разрушение значимого для него мифа, поэтому решила направить разговор в нейтральное русло – и, чтобы его взбодрить, предложила обсудить выход очередного эпизода саги «Звездные войны».
Я отметила этот случай потому, что он напоминает мне о разнице в восприятии ИИ специалистами в области информатики и остальными – пускай и весьма искушенными в вопросах технологий – дилетантами.
Сильный ИИ – это голливудский образ ИИ, связанный с роботами, способными на чувства (которые, возможно, стремятся захватить мир), с сознанием внутри компьютеров, вечной жизнью и машинами, которые «думают» подобно людям. Слабый ИИ – другое дело, это математический метод прогнозирования. Многие – даже те, кто создает технологические системы, – часто путают эти два представления об ИИ. Потому нелишним будет повторить, что сильный ИИ – это фантазия, а слабый – реальность, работающая здесь и сейчас.
Существует один простой способ понять, что представляет собой слабый ИИ. Это технология, дающая точные количественные ответы на любой вопрос, то есть предполагающая количественное прогнозирование. По сути, слабый ИИ – «статистика на стероидах».
Слабый ИИ работает посредством анализа существующих массивов данных, распознавая закономерности и вероятности в каждом конкретном массиве, и затем строит из них вычислительный конструкт под названием модель. Модель – это что-то вроде черного ящика, и, если отправить в него данные, он выдает ответ. Пропустив новые данные через модель, мы можем получить количественный прогностический ответ: о вероятности того, что закорючка на странице – это буква «А», или каковы шансы на то, что конкретный клиент выплатит кредит, выданный ему банком; каким должен быть следующий ход в играх вроде крестики-нолики, шашки или шахматы. Машинное обучение, глубокое обучение, нейронные сети и предиктивная аналитика – вот лишь некоторые из наиболее популярных примеров реализации слабого ИИ. Для каждой существующей сегодня системы ИИ есть логическое объяснение ее принципов работы. Понимание компьютерной логики способно демистифицировать ИИ подобно тому, как развинчивание компьютера раскрывает тайны его аппаратной сущности.
ИИ тесно связан с играми – не потому, что существует естественная корреляция между играми и интеллектом, а потому, что специалисты в области теории вычислительных систем обожают определенные типы загадок и игр. Стратегические игры (нарды или го), а также шахматы – любимые среди разработчиков игр. Если посмотреть в Википедии статьи о венчурных инвесторах и создателях технологических корпораций, окажется, что в детстве они обожали игру Dungeons & Dragons.
С тех самых пор как в 1950-х гг. в одной из своих работ Алан Тьюринг представил свой тест, призванный определить, может ли машина мыслить, специалисты в области информатики использовали шахматы для проверки интеллектуальных способностей вычислительной техники. Только спустя полвека удалось создать компьютер, способный победить гроссмейстера. В 1997 г. компьютер IBM Deep Blue нанес поражение Гарри Каспарову. А победа AlphaGo, программного ИИ, над самым сильным игроком в го Кэ Цзе в трех из трех партий в 2017 г. нередко воспринимается как доказательство скорого появления сильного ИИ. Правда, внимательный взгляд на эту программу и ее культурный контекст раскрывает совершенно другую историю.
AlphaGo – программа, созданная человеком и работающая на аппаратном обеспечении, подобно программе «Hello, world!», с которой мы уже сталкивались в главе 2. Разработчики описали принципы ее работы в 2016 г. в статье для международного научного журнала Nature[11]. Она начинается с таких строк: «Все игры с полной информацией обладают оптимальной функцией оценки, v* (s), которая определяет исход игры для каждой позиции на доске или состояния s при идеальной игре всех игроков. Такие игры могут быть решены путем рекурсивного вычисления функции оптимальной оценки в поисковом дереве, содержащем около bd возможных последовательностей ходов, где b – ширина игры (количество возможных ходов в позиции), d – глубина игры (то есть длительность)». Все это совершенно очевидно человеку, у которого за плечами годы практики в области математики, однако большинство из нас предпочло бы более простое и очевидное для неспециалистов объяснение.
Чтобы понять AlphaGo, стоит вспомнить об игре в крестики-нолики, известной большинству детей. Делая первый ход и располагая знак в центре сетки, вы либо выигрываете, либо играете вничью. Первый ход дает преимущество: у вас будет пять ходов, в то время как у вашего соперника – всего четыре. Большинство детей интуитивно понимают это и, играя с терпеливыми взрослыми, настаивают на праве первого хода.
Достаточно просто написать компьютерную программу для игры в крестики-нолики против человека (первая такая программа была составлена в 1952 г.). Существует алгоритм, набор правил, применение которых позволит компьютеру всегда побеждать или играть вничью. Подобно «Hello, world!», программирование игры в крестики-нолики считается простым упражнением на вводных уроках информатики.
Го – игра куда более сложная, однако также играется на доске, представляющей собой сетку. Каждому игроку дается горстка черных или белых камешков. Новички играют на сетке из девяти горизонтальных и девяти вертикальных линий, мастера – на сетке 19×19. Черные ходят первыми, размещая камень на пересечении линий. Следом ходят белые, также помещая камень на пересечении. Игроки ходят по очереди, стремясь «захватить» камни соперника и окружить их.
Люди играют в го около 3000 лет. Разработчики и поклонники этой игры изучали ее закономерности начиная с 1965 г., а первая программа для го была написала в 1968 г. Существует целое научное направление, посвященное только этой игре, названное (как ни странно) компьютерное го.
Игроки и исследователи компьютерного го годами накапливали записи игр, которые выглядят примерно так:
(; GM [1]
FF [4]
SZ [19]
PW [Sadavir]
WR [7d]
PB [tzbk]
BR [6d]
DT [2017 – 05–01]
PC [The KGS Go Server at http://www.gokgs.com/]
KM [0.50]
RE [B+Resign]
RU [Japanese]
CA [UTF-8]
ST [2]
AP [CGoban:3]
TM [300]
OT [3x30 byo-yomi]
; B [qd]; W [dc]; B [eq]; W [pp]; B [de]; W [ce]; B [dd]; W [cd]; B [ec]; W [cc]; B [df]; W [cg]; B [kc]; W [pg]; B [pj]; W [oe]; B [oc]; W [qm]; B [of]; W [pf]; B [pe]; W [og]; B [nf]; W [ng]; B [nj]; W [lg]; B [mf]; W [lf]; B [mg]; W [mh]; B [me]; W [li]; B [kh]; W [lh]; B [om]; W [lk]; B [qo]; W [po]; B [qn]; W [pn]; B [pm]; W [ql]; B [rq]; W [qq]; B [rm]; W [rl]; B [rn]; W [rj]; B [qr]; W [pr]; B [rr]; W [mn]; B [qi]; W [rh]; B [no]; W [on]; B [nn]; W [nm]; B [nl]; W [mm]; B [ol]; W [mp]; B [ml]; W [ll]; B [np]; W [nq]; B [mo]; W [mq]; B [lo]; W [kn]; B [ri]; W [si]; B [qj]; W [qk]; B [kq]; W [kp]; B [ko]; W [jp]; B [lp]; W [lq]; B [jq]; W [jo]; B [jn]; W [in]; B [lm]; W [jm]; B [ln]; W [hq]; B [qh]; W [rg]; B [nh]; W [re]; B [rd]; W [qe]; B [pd]; W [le]; B [md])
Человеку может показаться, что текст выше – полная бессмыслица, но он структурирован для компьютерной обработки. Такая структура называется «Умный игровой формат» (SGF, Smart Games Format). Из набора цифр и букв мы узнаем о том, кто играл партию, где, какие ходы были сделаны и как игра завершилась.
Ход игры описан в той части, где мы видим максимально плотный текст. Колонки в го маркированы в алфавитном порядке слева направо, а строки – сверху вниз. В нашем случае черные (B) ходили первыми и поместили камешек на пересечении колонок q и d, что записано как;B [qd]. Следующие символы;W [dc] говорят о том, что камень белых (W) оказался на пересечении d и c. Каждый последующий ход записан в подобном формате. Итог игры (RE) зафиксирован как RE [B+Resign], что означает капитуляцию черных.
Разработчики AphaGo собрали огромный массив данных из 30 млн SGF-файлов. Все эти архивы не искусственно симулированные матчи, а записи реальных игр, сыгранных реальными людьми (и иногда компьютерами). Так, играя в го на одном из множества сайтов, любители и профессионалы, по сути, добавляли опыт своей игры в массив. На самом деле не так уж и сложно создать видеоигру в го: в интернете можно найти достаточно инструкций и свободного исходного кода. Кроме того, все видеоигры могут сохранять данные партий. Правда, одни из них делают это, другие – нет. Некоторые хранят данные ваших партий и затем передают их разработчикам. Создатели сайтов для онлайн-игры в го публикуют онлайн архивы сыгранных партий в виде огромных пакетов. В результате все эти пакеты были объединены в массив из 30 млн игр, собранный командой AlphaGo.
Программистам понадобилось 30 млн игр, чтобы «натренировать» модель, которую они назвали AlphaGo. Кроме того, вы должны понять, что профессиональные игроки в го годами играют в компьютерное го. Так они тренируются. Вследствие этого 30 млн игр также включают в массив и игры лучших игроков мира. Миллионы часов человеческого труда были ценой тренировочных данных – хотя большинство историй об AlphaGo повествует о волшебных алгоритмах, а не о людях, которые годами незаметно для окружающих (и без вознаграждения) создавали тренировочный массив.
Разработчики программы AlphaGo использовали метод под названием поиск Монте-Карло для того, чтобы выбрать из 30 млн игр множество ходов, которые с наибольшей вероятностью ведут к победе. Затем они запрограммировали его использовать алгоритм, выбирающий следующий ход из множества. Кроме того, они также реализовали отдельный алгоритм, подсчитывающий вероятность победы для каждого конкретного хода из множества. Вычисления происходили в масштабах, едва вообразимых человеком. В го существует 10163 возможных позиций. Так, благодаря наложению нескольких вычислительных методов и выбору хода с наибольшей вероятностью победы разработчики создали программу, победившую лучших игроков в го.
Умна ли AlphaGo? Ее разработчики – определенно. Им удалось решить сложную математическую задачу, над которой десятилетиями бились десятки лучших умов. Одной из наиболее поразительных вещей в математике является то, что она учит видеть закономерности в окружающем мире. Большинство вещей функционирует согласно математическим правилам: кристаллы растут регулярным образом, цикады впадают в спячку под землей на годы и просыпаются лишь тогда, когда температура почвы достигает нужной отметки, и таких примеров множество. AlphaGo – это прорыв в математике, достижение, которое было бы невозможным без аппаратного и программного прогресса в вычислительной технике. Стоит признать достижение команды разработчиков.
Однако AlphaGo не является разумной машиной. У нее нет сознания. Она делает только одну вещь: играет в компьютерную игру. Она содержит данные 30 млн игр, сыгранных любителями и профессионалами го, поэтому в каком-то смысле AlphaGo в высшей степени глупа. Чтобы победить одного-единственного мастера, программе требуется грубая сила и плоды труда множества людей. Программа и заложенные в ней вычислительные методы пригодятся для более полезных задач, требующих массивной переработки чисел. И это действительно полезно для мира – но далеко не все в мире является вычислениями.
Итак, рассмотрев математические и физические реалии программ вроде AlphaGo, мы оказались в сфере философии и спекуляции о будущем. И это совершенно другое интеллектуальное пространство. Есть футуристы, которые хотят, чтобы AlphaGo ознаменовала собой эпоху единства людей и машин. Хотя, конечно, желание далеко не всегда означает реальность.
С философской точки зрения существует много интересных вопросов, касающихся анализа разницы между вычислениями и сознанием. Большинство людей слышали про тест Тьюринга. Несмотря на название, в нем нет ничего общего с форматом анкеты, которую робот должен пройти, чтобы сойти за человека. В своей работе Тьюринг предложил сложный эксперимент, заключавшийся в беседе с машиной. Вопрос «могут ли машины мыслить?» он считал абсурдным и предлагал ответить на него результатами опросов общественного мнения. (Тьюринг был снобом от математики. Как многие в те времена и некоторые сегодня, он верил в превосходство математики над всеми прочими интеллектуальными изысканиями.) Вместо этого он предложил «игру в имитацию». Играют в нее мужчина (А), женщина (В) и экзаменатор (С). С сидит один в комнате и печатает вопросы для А и В. «Цель игры заключается в том, что экзаменатор должен определить, кто из остальных двоих женщина, а кто – мужчина. Ему они известны как X и Y, и в конце игры он говорит либо ‘X – это А, a Y – B’, либо ‘X это B, a Y – А’», – пишет Тьюринг[12].
Затем он предлагает определить, какие типы вопросов может задавать игрок С. Один из них о длине волос. А, мужчина, должен заставить игрока С ошибиться и потому лжет. В, женщина, хочет помочь С и говорит ей или ему, что он – женщина. Но ведь А может соврать и сказать то же самое. Их ответы записываются, чтобы окраска и тон голоса не дали экзаменатору никаких зацепок. Тьюринг продолжает: «Теперь мы спрашиваем: “Что произойдет, если вместо А будет играть компьютер? Будет ли экзаменатор ошибаться так же часто, как и в игре с женщиной и мужчиной?” Эти вопросы заменяют наш изначальный вопрос “Могут ли машины мыслить?”».
В случае, если экзаменатор не может по ответам определить, кто перед ним – человек или машина, компьютер признается разумным. В течение многих лет эта идея считалась фундаментальной для вычислительной теории. Невероятное количество чернил было потрачено на то, чтобы ответить на вызов Тьюринга и создать машину, отвечающую его требованиям. Впрочем, тот факт, что основой мысленного эксперимента является философски и культурно неточное определение гендера, ставит все предприятие под сомнение. Ведь представления Тьюринга уже не слишком соответствуют тому, что мы знаем о гендере. Это не бинарная оппозиция, но континуум. И длина волос уже не является маркером мужской или женской идентичности; каждый может коротко постричься. Более того, Тьюринг пишет, что «целью игры третьего игрока (В) является помощь экзаменатору». Игра, призванная выявить разумность, в которой женщина играет роль помощника? А мужчине говорят, что он может соврать? С критической точки зрения это абсурд, поскольку здесь поведение мужчины и женщины обусловлено гендерными физическими и моральными характеристиками.
Философские аргументы Тьюринга также не вызывают доверия. Вероятно, наиболее основательную критику можно обнаружить у философа Джона Сёрла – в его тезисе о китайской комнате. В 1989 г. ему удалось собрать воедино все свои замечания в статье для журнала The New York Review of Books:
Цифровой компьютер – это устройство, оперирующее символами без какой-либо смысловой интерпретации. Люди же, напротив, в момент размышления заняты чем-то гораздо большим. Человеческое сознание обычно оперирует значимыми мыслями, чувствами и ментальным содержанием. И, поскольку символы сами по себе по определению не обладают значением (интерпретацией или семантикой) – если кто-то извне не наделил их значением, – формальных символов недостаточно для того, чтобы наполнить ментальное содержание.
Этот довод можно представить на примере монолингвального англоговорящего человека, запертого в комнате с книжкой, где сказано, как обращаться с китайскими иероглифами согласно логике компьютера. В принципе, этот человек сможет пройти тест Тьюринга, поскольку он способен производить корректные ответы на вопросы на китайском языке. Однако он не понимает ни слова на китайском, ведь он не знает, что каждый символ означает. Но, если он не понял китайский при помощи программы, запущенной на компьютере и предназначенной специально для «понимания» китайского, тогда ни один цифровой компьютер не способен понять, потому что ни одна программа не обладает тем, чем не обладает человек[13].
Тезис Сёрла, согласно которому возможность манипуляции символами не означает понимание, прослеживается и в 2017 г., когда популярность набирают голосовые интерфейсы. «Диалоговые» интерфейсы распространены, однако далеки от разумности.
Алекса от Amazon и другие голосовые помощники не понимают язык. Они всего лишь выдают ответные реакции на звуковые последовательности, которые люди называют вербальными командами. «Алекса, включи “California Girls”» – это голосовая команда, которую компьютер может выполнить. Здесь Алекса – это слово-триггер, предупреждающее компьютер о скором появлении команды. Включи – слово-триггер означающее «найди MP3 файл в памяти устройства и отправь команду “проигрывать” вместе с названием файла MP3 аудиоплееру, выбранному мной ранее». Интерфейс запрограммирован так, чтобы воспринимать любое слово, следующее за «включи» и перед паузой (то есть до конца команды). Так, определенное значение задается переменной название песни, которую система обнаруживает в памяти и отправляет в аудиоплеер. Это обычное и неопасное дело, поэтому не стоит думать, что машины все-таки восстанут и завоюют мир. В данный момент компьютер не способен определить, какую песню стоит включить – «California Girls» в исполнении Кэтти Перри или Beach Boys’. Хотя эта проблема решается состязанием в популярности. Побеждает та, что обладает бо́льшим количеством воспроизведений всеми пользователями Алексы. И ее система проигрывает по умолчанию. Это хорошая новость для фанатов Кэтти Перри и не слишком хорошая для любителей Beach Boys’.
Я прошу вас держать в голове идеи о сильном и слабом ИИ, а также не забывать об ограничениях. В этой книге мы будем придерживаться реального положения дел: мира, в котором есть неразумные вычислительные машины, которые мы называем умными. Кроме того, мы также обратимся к воображению – несомненно, мощному, чудесному и будоражащему, – которое, когда мы говорим о компьютерах, данных и технологиях, иногда загоняет нас в тупик. Я прошу вас не расстраиваться – как тот студент на научной ярмарке, – если вы столкнетесь с заблуждением о призраке внутри машины, как говорит коллега. В реальности внутри компьютера нет никакого маленького человека или симулятора мозга. На это можно реагировать разными способами: можно расстроиться, что то, о чем вы мечтали, невозможно, либо можно радоваться тому, что действительно становится возможно, когда искусственные устройства (компьютеры) работают вместе с по-настоящему сознательными существами (людьми). Я предпочитаю поступать именно так.
4
Здравствуй, журналистика данных
Мы с вами – свидетели удивительной эпохи, когда компьютеры внедряются в каждую область человеческой жизни. Сегодня социальные науки, биология, химия компьютеризируются, появилась цифровая гуманитаристика; художники используют язык программирования Processing при создании объектов мультимедиаискусства; 3D-печать расширяет возможности скульпторов. Этот стремительный прогресс будоражит воображение. Однако по мере того, как цифровые технологии все больше вторгаются в жизнь, меняются люди. И тот факт, что государственные данные открыты, совсем не означает, что коррупции больше нет. А экономика свободного заработка, появившаяся благодаря технологиям, связана с теми же проблемами, что и рынок труда в начале индустриальной эпохи. Традиционно журналисты анализировали подобные проблемы, чтобы затем стимулировать положительные социальные изменения. В технологическом мире практика анализа в рамках журналистских расследований стала высокотехнологичной.
Многие из тех, кто пытается раздвинуть границы технологических возможностей в журналистике, называют себя журналистами данных. Журналистика данных – это обобщающий термин. Для некоторых она подразумевает создание визуализаций. Например, Аманда Кокс – редактор раздела «Развязка» (The Upshot) в The New York Times – мастер всех типов визуальной журналистики. Вспомним, например, историю 2012 г. «Маленькие звенья одной инфляции» (All Inflation’s Little Parts), благодаря которой Кокс получила премию Американской статистической ассоциации за превосходный анализ. Данные, на которых основывалось исследование, она взяла из индекса потребительских цен и использовала для анализа инфляции. На графике представлен большой круг, разбитый на цветные мозаичные заголовки. Размер каждого соответствует проценту расходов американцев.
Крупный блок, «бензин», составляет 5,2 % расходов. Бензин – это часть категории «транспорт», расход на который у рядового жителя страны составляет 18 %. Форма поменьше – это расходы на покупку яиц, они входят в категорию «питание и напитки», на которую тратится около 15 %. «Высокие цены на нефть и засуха в Австралии – среди прочих факторов – способствовали рекордной с 1990-х гг. скорости роста цен, – пишет Кокс. – Высокий спрос на яйца среди европейцев также повлиял на ценообразование в этой категории»[14]. Сама статья и сопровождающие ее графики открывают окно в новый удивительный мир, где жителей разных городов соединяет сложная сеть торговли. Неужели яйца – глобальный феномен? Ну разумеется! Отдельные страны уже сами не производят продукты питания. Еда – это глобальный рынок. На западе Австралии находится пояс пшеницы. Согласно отчету Департамента сельского хозяйства Австралии, в 2010–2011 гг. экспорт пшеницы составил $27,1 млрд. А засуха в том регионе привела к снижению экспорта пшеницы. Корм для птицеводческих фабрик США в основном состоит из злаков. Кукуруза предпочтительнее, но если она слишком дорогая, то в ход идет пшеница. Соответственно, меньшее количество доступной в мире пшеницы приводит к росту цен, из-за которого птицефабрикам приходится платить за пшеницу больше либо покупать еще более дорогую кукурузу. А поскольку фермеры вынуждены платить больше за корм, то эти расходы они включают в стоимость яиц. И это повышение ощутимо отражается на ценах на продукцию в супермаркетах. Так данные помогают увидеть, как засуха в Австралии привела к росту цен на яйца в Северной Америке, ощутить глобализацию, всеобщую взаимозависимость и экологические последствия изменений климата. Чтобы создать удивительный визуальный цифровой артефакт, который одновременно информирует и восхищает, Кокс прибегает к сторителлингу и своим знаниям о том, как сложные системы воплощаются в окружающем мире, а также использует технологические навыки и острое журналистское чутье.
Иные журналисты собирают и анализируют данные самостоятельно. В 2015 г. Atlanta Journal-Constitution (AJC) собрал данные о случаях сексуального абьюза со стороны докторов по отношению к пациентам. ACJ обнаружил, что в Джорджии двум третям докторов, понесшим наказание за сексуальное противоправное поведение с пациентами, разрешили вновь заниматься практикой. И этих данных было более чем достаточно для статьи, однако репортер задалась вопросом, насколько необычен случай в Джорджии. Тогда история превратилась в групповое расследование. Журналисты собрали данные со всей Америки и проанализировали больше сотни тысяч ведомственных приказов, связанных с дисциплинарными нарушениями докторов, в период с 1999 по 2015 г. Результаты шокировали. По всей стране докторам, обвиненным в абьюзивных действиях по отношению к пациентам, разрешали вернуться к практике. Некоторые случаи были просто ужасающими. Эрл Брэдли, педиатр, накачивал детей транквилизаторами при помощи конфет, затем растлевал их и записывал все на видео. В 2010 г. ему было предъявлено 471 обвинение в изнасиловании и растлении. Суд вынес приговор – 14 пожизненных без права на досрочное освобождение. К счастью, расследование AJC подняло эту проблему и привело к позитивным изменениям в этой области[15].
Штат Флорида. Дата-журналисты Sun Sentinel остановились на обочине шоссе и заметили приближающиеся полицейские машины. Позже они, запросив данные с транспондеров и из пунктов сбора дорожной платы, выяснили, что полицейские регулярно превышали скорость, подвергая горожан опасности. После расследования расходы полиции снизились на 84 %. Эта весьма эффектная позитивная социальная перемена способствовала тому, что в 2013 г. история удостоилась Пулитцеровской премии за вклад в жизнь общества[16]. Флорида – родина многих хороших дата-журналистов. С одной стороны, из-за плодороднейшей почвы с точки зрения поиска историй. «Флорида давно обогнала Калифорнию по количеству диких, необычных и нелепых вещей, которые стали здесь обычным делом», – писал Джефф Кунер в 2013 г. для Orlando Sentinel[17]. Все, что делает государство США, априори публично, однако именно «солнечные законы» Флориды также гарантируют всем доступ к фотографиям, пленкам и аудиозаписям. Закон, гарантирующий такую открытость, означает, что получить государственные данные можно официально. Поэтому во Флориде много дата-журналистов и многие расследования происходят именно там.
Некоторые журналисты собирают данные из официальных источников и изучают их на предмет каких-либо идей, что иногда приводит к весьма неприятным фактам. Скажем, невероятным примером сотрудничества исследователей с представителями индустрии стал случай, когда дата-журналистка Шерил Филлипс из Стэнфордской лаборатории журналистики данных предложила своим студентам запросить информацию со всех 50 штатов о том, кого полицейские останавливали для проверки. Журналисты (не только из Стэнфорда) обнаружили, что белых останавливают реже[18].
Под журналистикой данных также понимается анализ алгоритмической ответственности – небольшая профессиональная область, к которой я принадлежу. Алгоритмы и иные вычислительные инструменты используются в том числе для принятия решений – от нашего имени. Алгоритмы определяют стоимость степлера, которую вы видите во время онлайн-шопинга; они подсчитывают, сколько вы будете платить за медицинскую страховку. Алгоритм фильтрует ваши данные на предмет того, человек вы или бот, при подаче резюме через платформу поиска работы. Дело в том, что в рамках демократии целью свободной прессы является привлечение к ответственности тех, кто принимает решения. Аналитика алгоритмической ответственности как раз занимается этим в цифровом мире.
История под названием «Предвзятость машины» (Machine Bias), опубликованная в 2016 г. некоммерческой организацией ProPublica, – выдающийся пример анализа алгоритмической ответственности[19]. Журналисты ProPublica обнаружили, что алгоритм, используемый при вынесении судебного приговора, был настроен против афроамериканцев. Информация, собранная во время полицейского допроса, заносилась в компьютер. Затем алгоритм COMPAS анализировал данные и прогнозировал вероятность того, что человек вновь совершит правонарушение. Предполагалось, что подсчет поможет судьям принимать более объективные решения. В результате получилось, что афроамериканцы получали более долгие сроки, нежели белые.
Несложно заметить, насколько техношовинизм ослепил разработчиков COMPAS и не позволил им увидеть вред, который алгоритм может нанести. Вера в то, что решения, принятые компьютером, лучше или честнее, чем человеческие решения, приводит к тому, что нас перестает интересовать релевантность данных, представляемых системе. «Что посеешь, то и пожнешь» – легко об этом забыть, особенно если вы действительно хотите, чтобы компьютер оказался корректен. По-настоящему важно задумываться над тем, делают ли алгоритмы и их создатели мир лучше или хуже.
Данные используются в журналистике дольше, чем думает большинство людей. Первое журналистское расследование, основанное на сборе данных, появилось в 1967 г. При помощи методов социальных исследований и вычислительной машины Филип Мейер анализировал волнения на расовой почве в Детройте для Detroit Free Press. «Среди штатных журналистов бытовала теория, согласно которой бунтари всегда были наиболее ущемленными, беспомощными, находясь в самом низу экономической лестницы. Считалось, что они бунтуют потому, что у них нет иных способов для продвижения или выражения своей позиции, – писал Мейер. – Теория не подтверждалась данными»[20]. Он провел масштабный опрос и статистический анализ результатов при помощи вычислительной машины. Оказалось, что участники беспорядков принадлежали к разным социальным слоям. Эта история принесла ему Пулитцеровскую премию. Применение методов социальных исследований в журналистике Мейер тогда назвал точным репортерством.
Позднее, когда настольные компьютеры наводнили редакции, для отслеживания данных и поиска историй репортеры стали использовать электронные таблицы и базы данных. Точное репортерство превратилось в компьютеризированную журналистику. Компьютеризированная журналистика – это тип журналистского расследования, который вы могли наблюдать в фильме «В центре внимания» (Spotlight). Сюжет строится вокруг расследования журналистов Boston Globe (получившего Пулитцеровскую премию) о сексуальном насилии над детьми среди католических священников и о тех, кто это покрывал. Журналистам нужны были электронные таблицы и базы данных, чтобы следить за сотнями случаев, сотнями священников и их приходами. Для 2002 г. подобная журналистская практика считалась ультрасовременной.
По мере того как развивался интернет и появлялись новые цифровые инструменты, компьютеризированная журналистика превратилась в то, что мы сегодня называем журналистикой данных, которая (среди прочего) включает визуальную журналистику, вычислительную журналистику, картирование, аналитику данных, разработку ботов и анализ алгоритмической ответственности. Однако дата-журналисты в первую очередь журналисты. Для нас данные – это источник, и, чтобы рассказывать истории, мы используем ряд цифровых инструментов и платформ. Иной раз истории касаются последних новостей; время от времени они развлекательные; порой это запутанное расследования. Но они всегда информативны.
Организация ProPublica, появившаяся в 2008 г., и Guardian долгое время являются лидерами в области журналистики данных[21]. ProPublica была основана на благотворительных началах ветераном The Wall Street Journal Полом Стайгером, однако достаточно быстро завоевала репутацию расследовательского локомотива. У самого Стайгера за плечами был колоссальный опыт расследовательской журналистики: с 1997 по 2007 г. он был главным редактором в The Wall Street Journal, за это время команда журнала 16 раз получала Пулитцеровскую премию. Свою первую награду команда ProPublica получила в мае 2010 г. А в 2011 г. они получили премию за материал, опубликованный исключительно онлайн.
Многие истории, получившие эту награду, были созданы людьми, среди которых был дата-журналист или хотя бы тот, кто себя таковым считает. В сентябре 2006 г. журналист и программист Адриан Головатый, создатель фреймворка Django (которым пользовались многие редакции), опубликовал онлайн-статью «Основной путь необходимой трансформации для сайтов новостных изданий» (A Fundamental Way Newspaper Sites Need to Change)[22]. Он настаивал на том, что редакциям необходимо перешагнуть традиционную модель создания статей и начать внедрять практику структурирования данных в инструментарий журналистов. Его манифест привел к тому, что вместе с Биллом Эдейром, Мэттом Уэйтом и их командой он создал фактчекинговый сайт PolitiFact, также награжденный Пулитцеровской премией в 2009 г. Во время запуска проекта Уэйт писал: «Сайт представляет собой концепт простой старой газеты, переделанной для интернета. Мы взяли за основу политическую историю “отряда правды”, когда репортер, анализируя рекламную кампанию или агитационную речь, сначала проверяет все факты и только потом пишет историю. Мы взяли этот концепт, разделили на основные части и превратили в сайт, работающий на основе данных и посвященный периоду президентских выборов 2008 г.»[23].
На этом Головатый не остановился и создал Every Block – первое новостное приложение, в котором были представлены данные о преступлениях c геолокациями. Именно там впервые использовался интерфейс Google Maps, что привело к тому, что API стал доступен рядовым пользователям[24].
Прорыв в журналистике данных случился в 2009 г., когда репортеры и программисты Guardian запросили (посредством краудсорсинга) 450 000 записей о расходах членов парламента. За этим последовал скандал: выяснилось, что депутаты оплачивали бытовые и конторские расходы из государственного бюджета. Guardian также искусно овладела компьютерным анализом неофициальных сведений и просочившихся документов, которые использовали, например, в рамках расследований в период войн в Афганистане и Ираке[25].
Другое знаковое расследование – проект The Wall Street Journal об анализе дискриминации цен[26]. Лидирующие сетевые магазины вроде Staples и Home Depot устанавливали на своих сайтах цены, которые менялись в зависимости от почтового индекса, который посетитель вводил. При помощи компьютерного анализа журналисты выяснили, что индекс, соответствующий условно более обеспеченной локации, приводил к более низким ценам, чем у тех, кто вводил индекс условно менее обеспеченных локаций.
Исследования придают журналистике данных определенную полноту, поскольку репортеры стремятся полагаться на научные методы анализа. Чтобы быть хорошим журналистом, нужно, с одной стороны, понимать, когда следует обращаться к эксперту в той или иной области и, с другой стороны, уметь отличать эксперта от подсадной утки. Дата-журналистам приходится совмещать ряд научных подходов из разных областей. В 2008 г. профессор Технологического института Джорджии Ирфан Эсса организовал первый симпозиум для программистов и журналистов. Это ежегодное событие, где журналисты, исследователи из различных областей компьютерных знаний, коммуникации, статистики, человеко-машинного взаимодействия, визуального дизайна и других делятся своими знаниями и выстраивают междисциплинарный диалог. Николас Диакопулос, профессор Северо-Западного университета, – один из основателей симпозиума и автор знаковых работ об алгоритмах обратного проектирования как способах поддержания подотчетности фигур принятия решений. В своем исследовании «Алгоритмическая ответственность: журналистские расследования вычислительных систем господства» (Algorithmic Accountability: Journalistic Investigation of Computational Power Structures) он описывает некоторые примеры собственных расследований и расследований коллег-журналистов, посвященные анализу алгоритмических «черных ящиков»[27].
Несмотря на тесную связь с вычислительной теорией, журналистика данных считается дисциплиной, относящейся к социальным наукам, потому большинство фундаментальных работ по теме обнаруживается в корпусе социальной литературы. В 2012 г. К. Андерсон опубликовал статью «Навстречу социологии компьютерной и алгоритмической журналистики» (Towards a Sociology of Computational and Algorithmic Journalism), где объединил четыре подхода Шудсона к анализу новостей на основе результатов полевых этнографических исследований, проведенных в 2007–2011 гг.[28] Этнографический контекст также был обогащен благодаря книге Никки Ашер «Интерактивная журналистика: Хакеры, данные и код» (Interactive Journalism: Hackers, Data, and Code), выпущенной в 2012 г.[29] В ней Ашер представляет читателям как результаты полевых исследований, так и интервью с дата-журналистами из The New York Times, Guardian, ProPublica, WNYC (Общественное радио Нью-Йорка), AP, NPR (Национального общественного радио) и англоязычного подразделения «Аль-Джазиры». Работа Синди Роял о том, как журналисты используют программирование, важна для понимания его роли для редакций и актуальна с точки зрения возможной интеграции компьютерных навыков в программы подготовки журналистов[30]. В книге 2016 г. «Детективы демократии» (Democracy detectives) Джеймс Гамильтон подчеркивал актуальность журналистики данных для общества – и рассуждал о цене подобного служения. Ведение по-настоящему судьбоносных расследований в рамках журналистики данных обходится в сотни тысяч долларов. «Производство этих историй может стоить тысячи долларов, но они приносят миллионы в форме выгоды для всего сообщества», – пишет Гамильтон[31].
А в 2010 г. журналистика данных обзавелась подтверждающей печатью от самого Тима Бернерса-Ли: «Журналистам следует быть находчивыми в плане данных. Раньше для создания историй требовалось просто поболтать с человеком в баре, порой это работает и сейчас. Однако сегодня важно также внимательно изучать данные и вооружаться инструментами, позволяющими их анализировать и выбирать самое интересное. Важно видеть все в перспективе, помогать людям представлять общую картину происходящего в стране»[32]. А когда Нэйт Силвер запустил проект FiveThirtyEight.com и написал книгу «Сигнал и шум» (Signal and Noise), термин журналистика данных уже получил широкое хождение среди журналистов[33].
Пока развивались компьютеры, человек оставался человеком. Людям нельзя давать расслабляться. Надеюсь, это книга поможет вам начать мыслить как дата-журналист, чтобы впредь вы не верили в сказки о технологиях и могли видеть несправедливость и неравенство в современном компьютеризированном мире. Присущий журналистам скепсис и умение предположить, что может пойти не так, способны помочь нам перейти от слепого технологического оптимизма к более разумной, сбалансированной перспективе того, как улучшить жизнь, а не подвергнуть ее риску и угрозам с помощью технологий.
II
Когда компьютеры не справляются
5
Почему ученики из малообеспеченных школ не справляются со стандартизированными тестами
Машины, коды, данные формируют удивительные и будоражащие воображение образы. Придерживаясь правильных расчетов, можно повысить прибыль, улучшить практику принятия решений, помочь вам найти себе пару и т. д. Величие данных горячо проповедуется и в современном образовании. В 2009 г. министр образования США произнес перед учеными следующее: «Я глубоко убежден, что сила данных способствует улучшению принимаемых нами решений. Данные предоставляют карту перемен. Они показывают, где мы находимся, куда нам следует двигаться и каковы категории наибольшего риска»[34].
Однако наивно полагать, что можно решить социальные проблемы при помощи одних лишь данных. Это я поняла, когда при помощи больших данных пыталась наладить работу местных общеобразовательных школ. Я потерпела неудачу: она связана с причинами, по которым современная технократическая американская система стандартизированных тестов никогда не заработает.
Однажды, когда мой сын был в первом классе, я, помогая ему с домашним заданием, столкнулась с проблемой.
– Мне нужно выписать природные ресурсы, – он мне сказал.
– Воздух, вода, нефть, газ, уголь, – ответила я.
– Я уже записал воздух и воду, – отозвался он. – Нефть, газ и уголь – это не природные ресурсы.
– Конечно, природные, – я возразила. – Они не возобновляемые, но все же природные ресурсы.
– Но их нет в списке, который учитель дал нам на уроке.
Быть родителем – значит иногда быть неготовым к ситуации, но в тот момент я столкнулась с настоящей эпистемологической дилеммой. Моя собственная эрудиция (и интернет) подсказывали, что вопрос предполагает множество «верных» ответов. Но только один из них позволит моему сыну получить наивысшую оценку за домашнее задание.
Я взглянула в рабочую тетрадь. На странице были изображены корова и зонт.
– Корова – это не природный ресурс, – произнесла я.
– Животные – это природный ресурс, – он ответил.
– Но коровы – часть природы, но не природный ресурс.
– Но учительница сказала, что животные тоже.
– А про зонтик ничего не было сказано?
– Я думаю, что зонтик обозначает воду. Я уже записал.
– Давай проверим в учебнике, – я чувствовала подступающее раздражение. – Если есть рабочая тетрадь, то найдется и учебник.
– Учебника нет, – ответил он.
– Ну, конечно, есть, – возразила я.
– Нам нельзя брать их домой, они только для работы в классе.
– Я помню, что учительница говорила, что есть онлайн-версии учебников. Она дала тебе адрес сайта или пароль?
– Нет.
Следующий час я провела в попытках войти на сайт, где можно было скачать учебник, а также в поисках его пиратской версии. Удача мне не улыбнулась.
Я знала, что стандартизированные тесты начнут давать в третьем классе. Однако если домашнее задание для первоклассника настолько сбивало с толку, то я не представляю, как он – или любой другой ребенок – должен будет сдавать эти тесты.
Поскольку я имела опыт общения с хакерами – людьми, которые, чтобы повеселиться, пишут программы для взлома государственных сайтов, – я, основываясь на опыте преподавания курса подготовки к академическим тестам (SAT), решила попробовать придумать алгоритм сдачи школьного теста. Строго говоря, я пыталась перехитрить актуальную тогда Пенсильванскую систему проверки для третьеклассников[35]. И вместе с командой профессиональных разработчиков создала программу с использованием ИИ для анализа доступных данных.
За последние несколько лет ИИ стал ценным для журналистов инструментом, в том числе потому, что автоматизированное составление статей помогло им эффективнее работать с повседневными новостями спорта и бизнеса. Машинное обучение помогает интерпретировать массивы данных, в результате на свет появились такие приложения для анализа документов, как Overview Project и DocumentCloud. Меня же интересовало третье расширение ИИ в рамках журналистики, помогающее обнаруживать истории: экспертные системы. Как было задумано первоначально, экспертная система будет действовать как человек-эксперт, сидящий в коробке, выдающей советы. К сожалению, это не сработало. Мышление и экспертное знание – категории до того сложные, что их попросту невозможно превратить в автоматизированные процедуры, совершаемые двоичными счетными машинами (которыми в конечном счете и являются современные компьютеры). Я предполагала, что концепт экспертной системы можно модифицировать для конкретного социального пространства таким образом, чтобы журналисты могли легко и эффективно обнаруживать прецеденты в огромных массивах данных.
Я спроектировала и написала софт, способный выполнять необходимый анализ данных. Я поговорила с учителями. Я поговорила с учениками. Я была в школах и сидела на встречах Комиссии по школьной реформе. Спустя шесть месяцев я поняла, что тест можно пройти. Но не благодаря хитрому алгоритму, а благодаря невероятно нетехнологичной практике: чтению книг, содержащих ответы.
Филадельфия – восьмой по количеству учащихся регион в стране, а ученики общеобразовательных школ невероятно бедны: в 2013 г. 79 % из них могли себе позволить обедать либо бесплатно, либо по сниженной цене. Лишь 64 % оканчивали школу, и меньше чем половине удалось пройти тестирование PSSA в 2013 г.
Если проблема существует в школах Филадельфии, значит, она есть и в других районах по всей стране. Одной из явных проблем, наблюдаемых в округах Нью-Йорка, Вашингтона, Чикаго, Лос-Анджелеса и других крупных городов, является то, что школы не могут себе позволить покупать учебники. В аккаунте школьного округа Филадельфии в Twitter однажды появился пост с фотографией бывшего мэра Майкла Наттера, раздающего 2000 книг, пожертвованных ученикам начальной школы. Но, к сожалению, знакомство детей с классической литературой не поможет им писать тесты с высокими результатами.
Все потому, что тесты не основываются на программе общеобразовательной подготовки. Я выяснила, что вопросы опираются на весьма конкретные знания, содержащиеся в конкретных учебниках – учебниках, созданных авторами тестирования.
Все это оказывается тесно связано с экономической стороной тестирования. По всей стране разработкой тестов занимаются лишь три компании: CTB/McGraw-Hill, Houghton Mifflin Harcourt (HMH) и Pearson. Они создают тесты и системы их оценки, а также выпускают учебники, по которым школьникам следует готовиться. Согласно материалам в прессе, HMH занимает 38 % рынка, а в 2013 г. прибыль компании составила $1,38 млрд.
В том же году штат Пенсильвания заключил многомиллионный контракт с компанией Data Recognition Corporation (DRC) для оценки тестов PSSA. Как оказалось, DRC сотрудничала с McGraw-Hill в рамках федерального контракта, по которому консорциуму следовало разрабатывать и оценивать тесты для всей страны. Тем временем McGraw-Hill также писала учебники и разрабатывала программы, которые школы покупали, чтобы подготовить детей к тестам. Например, «Математика на каждый день» (Everyday Math), брендированная программа, по которой учатся пятиклассники в большинстве пенсильванских школ, выпущена как раз McGraw-Hill.
Иначе говоря, учитель, который хочет подготовить учеников к тестам, должен учить их по учебнику одного из трех издательств. И, если посмотреть на содержание учебников и вопросы в тестах, окажется, что ответы на большинство вопросов действительно есть – это заметит даже третьеклассник. В 2012 г. издательство Pearson пережило серьезный скандал: выяснилось, что один из абзацев в тесте был полностью скопирован из учебника, изданного ими.
Проблемы возникают даже не столько с фактами или цифрами, сколько с конкретными словами. Предлагаю вам вопрос из теста PSSA за 2009 г., где третьеклассника просят записать четное трехзначное число и объяснить, почему выбрано именно это число. На рис. 5.1 мы видим пример корректного ответа, представленного Пенсильванским департаментом образования. Следом, на рис. 5.2, мы видим частично правильный ответ, за который ученик заработал один балл из двух возможных.
Второй ответ оказался лишь частично верным попросту потому, что третьеклассник не обладает определенной концептуальной базой, чтобы объяснить, почему его вариант ответа правильный. Подробное решение этой задачи можно найти в учебниках «Математика на каждый день» (Everyday Math), а в методических пособиях советуют также закрепить пройденный материал вопросами вроде «Каково правило различения целых и нецелых чисел? Как узнать, что подсчет верен?». Третьеклассник, у которого нет учебника, вполне может научиться различать оба типа чисел, однако сложности возникнут все равно, поскольку ему будет сложно угадать, как именно должен выглядеть ответ по мнению экзаменатора. В общем, эти тесты скорее подходят для «слабого» интеллектуального развития, но не «общего». Система обращается с детьми как с программами машинного обучения: если предполагается, что они должны выдавать правильный ответ на заданный вопрос (уже сомнительная цель, не так ли?), в них необходимо внедрить корректные данные – из учебников.
Не в пример университетским преподавателям, которые попросту дают студентам список литературы, учителя, работающие в школе, обязаны выдавать учебники. Однако это непростое дело – предоставить каждому ученику учебники для каждого предмета. Опираясь на то, что я выяснила в школах, побеседовав с учителями и детьми, можно сказать, что каждому ученику нужен один учебник и одна рабочая тетрадь для каждого предмета, также множество таблиц и проектов, которые учителя находят на разных сайтах (не говоря уже о зажимах для бумаги, картона, ножницах и прочих материалах для проектно-ориентированного обучения). Учебники можно использовать из года в год, но лишь в том случае, если образовательные стандарты не меняются – конечно, они менялись каждый год в течение последних 10 лет.
Осознав эту связь между учебниками и тестами, я попыталась выяснить, сколько конкретно школ в Филадельфии сталкиваются с нехваткой книг трех ведущих издательств. Кроме того, мне было любопытно посчитать, сколько будет стоить попытка закрыть этот дефицит.
Проблемы начались, когда я попросила в Управлении школьного округа Филадельфии список программ, используемых в школах. Дело в том, что, если вы хотите узнать, какие конкретно учебники имеются в школах, необходимо точно знать название учебных программ в школах. (Брендированные программы вроде «Математика на каждый день» позволяют школам выбивать неплохие скидки.)
– У нас нет такого списка, – ответил мне администратор отдела учебных программ и развития Филадельфии. – Его вообще не существует.
– Откуда вы тогда узнаете, по какой программе учатся в школах?! – удивилась я.
– Мы не знаем этого.
На этом конце провода воцарилась тишина.
– Откуда вы тогда знаете, что в школах достаточно необходимых учебников?
– Мы не знаем этого.
Согласно политике округа каждая школа самостоятельно проводит инвентаризацию системы хранения учебников при помощи централизованной базы данных.
– Если вы дадите мне список из системы хранения учебников, я смогу переделать его так, чтобы вы видели списки для отдельных школ, – сказала я администратору.
– Правда? – отозвалась она. – Было бы здорово. Не знала, что это можно сделать!
Я поступила так, как на моем месте поступил бы любой программист, – придумала обходное решение. Я написала программу, позволяющую просматривать данные каждой филадельфийской школы и видеть, соответствует ли количество учебников необходимой норме. Результаты выглядели не слишком хорошо. В среднем в одной школе насчитывалось 27 % учебников, рекомендованных администрацией. Как минимум в 10 школах нужных книг не было вовсе, согласно их же инвентаризационным данным. В иных были безнадежно устаревшие книги.
Я решила посетить несколько таких школ и узнать, правда ли это. «В старшей школе у нас были книги, но они, кажется, издавались в 1980-х гг.», – ответил мне тогда Дэвид, выпускник общеобразовательной школы Филадельфии. А ученица нынешних старших классов жаловалась на то, что на каждой странице ее учебника истории изображены мужские гениталии.
Я также посещала занятия в Академии Паламбо – школе, куда стекаются ученики со всей южной Филадельфии. Учитель математики Брайан Коэн, кажется, был очень удивлен той информации, которой я поделилась. Согласно моим данным, в академии использовались учебники под названием «Кратчайший путь к пятерке: Углубленный курс по математике для подготовки к экзаменам» (Fast Track to a 5: Preparing for the AP Calculus AB and Calculus BC Examinations). В системе также значилось, что этих книг в школе нет вовсе.
– Странно, – сказал Коэн, когда я рассказала о своих находках. – Я не очень понимаю, почему в системе такие данные. Получается, что программа была выбрана, но ее никто никогда не заказывал? Или учебники заказали, но они не были доставлены?
Я поинтересовалась, можно ли взглянуть на библиотеку. Коэн повел меня туда. В холле мы остановились поболтать с его коллегой, которая также преподавала математику.
– У тебя хватает книг? – спросил Коэн.
– Теперь да, – ответила она. – В западной Филадельфии закрылась одна школа, и благодаря моему знакомому удалось заполучить тамошние учебники.
Однако она тоже не пользовалась учебниками «Кратчайший путь к пятерке»; учила она по книгам, которых не было в моем списке.
Коэн объяснил, что у учителей существует нечто вроде подпольной экономики. Некоторые из них готовы на многое, чтобы добыть учебники, тетради или парты для своих учеников. В свободное время они даже организуют кампании по сбору средств на платформах вроде DonorsChoose.org и следят за тем, что можно было бы достать из других школ. Согласно опросу Федерации учителей Филадельфии, ежегодно они тратят от $300 до $1000 собственных средств сверх годового бюджета $100 на то, чтобы обеспечить все необходимое для учебного класса.
Когда мы дошли до книжного шкафа с учебниками математики, оказалось, что он занимает небольшой уголок в запертом и пустом кабинете заведующего школьной математикой. «Здесь мы храним все лишние книги», – произнес Коэн, указывая в сторону двух небольших книжных шкафов. Две открытые коробки стояли на полу. Он заглянул внутрь. «Что ж, мы нашли учебник по углубленному изучение математики», – констатировал Коэн. Коробки действительно была забиты новенькими учебниками «Кратчайший путь к пятерке».
Эту ошибку было бы легко объяснить банальным отсутствием централизованной системы. Проблема заключалась в том, что такая система существовала, и я как раз сверялась с распечаткой данных из нее. И, согласно распечатке, в Академии Паламбо не должно было быть ни единой копии этих книг, однако прямо передо мной в коробке на полу запертого кабинета лежало 24 учебника.
Проблема филадельфийских школ заключалась не в отсутствии книг, а в работе с данными, что в некотором смысле является человеческим фактором. Данные представляются нам какой-то непреложной истиной, но частенько мы забываем о том, что данные и системы их сбора созданы людьми. Человеческим существам из плоти и крови необходимо вручную считать школьные учебники и затем вносить информацию в базы данных. Нередко этими человеческими существами становятся административные работники школ или помощники учителей. Вместе с тем финансирование школ резко сократилось за последние годы, что привело к сокращению штата администраторов. Даже самая лучшая система сбора данных бесполезна, если нет людей, управляющих этими данными.
Майкл Мэш, директор финансового отдела Манхэттенского колледжа, в прошлом директор финансов школьного округа Филадельфии, рассказал мне, что в свое время он отправлял сотрудников подсчитывать книги и заниматься другой административной работой, на которую у директоров не хватало времени из-за переработок. «Директорам тяжело давалось финансовое управление и ведение учета. Из-за недостатка сотрудников им нужна была административная поддержка, – пояснил он. – На директора сваливается много шишек, если он не встречается с каждым родителем, не включается в решение каждой проблемы. Однако в газете не прочитаешь о том, как они справляются с незаметной работой вроде делопроизводства. Приходится расставлять приоритеты».
А когда дело касается нехватки учебников, они выбирают вполне предсказуемую стратегию. «Они ревностно относятся к учебникам, – сказала мне Ребекка Донт, мама учеников второго и четвертого классов начальной школы Дженкса. – Моей дочери нельзя приносить домой учебники, поскольку они боятся, что дети их потеряют». Последние два года Ребекка просит учителей составить списки пожеланий (которые в основном включают учебники и расходные материалы), а затем собирает деньги на это посредством фандрайзинга. «Когда я сделала это в первый раз, директор сообщил мне, что все это у них уже есть», – пояснила она. Как в случае с учебниками по математике в Паламбо, все недостающее находилось где-то в школе, однако не попало в руки людям. «У них не получается выстроить связку между запасами книг в хранилищах и библиотеках с учителями, – констатировала Донт. – У них недостаточно средств, чтобы выстроить цельную картину».
Одно дело решить проблемы с предметами снабжения, но совсем другое – отслеживать учеников, использующих их. Многие школьники Филадельфии находятся в приемных семьях или в сложных жизненных условиях и часто меняют место жительства, и соответственно переходят из одной школы в другую. Согласно данным детского госпиталя Филадельфии, один из пяти учеников старшей школы имеет сложности с социальным обеспечением или системой правосудия. Одна из учителей рассказала мне, что, когда она преподавала в старшей школе Вест-Филли, каждые две недели у нее уходил или приходил новый ученик.
«Есть ряд логистических проблем, возникающих только в крупных округах, – пояснила Донна Купер, исполнительный директор организации “Граждане в поддержку детей и молодежи”. – Все на самом деле не так, как выглядит на первый взгляд».
В 2013 г., закончив первый этап анализа данных, я отправилась в Управление школьного округа, чтобы продемонстрировать результаты исследования их руководителю Уильяму Хайту. Его представитель сообщил мне, что Уайт занят, и предложил встретиться со Стефаном Спенсом, его заместителем по обеспечению деятельности учебных заведений. Спенс был бывшим учителем физкультуры и в свои 60 занимался подготовкой к учебному году, с чем вполне справлялся вместе со своими сотрудниками. Однако после сокращений ему пришлось заняться всем самостоятельно – от обеспечения партами до предоставления ковров.
Я спросила его, как он проверял наличие книг в школах перед началом учебного года. Он ответил, что каждый директор представлял открывающие и закрывающие листы. В каждом из них (отправляемых в формате документа Word по почте) директора проставляли галочки, свидетельствующие о наличии или отсутствии необходимых учебников.
«Инвентаризация не осуществляется на уровне управления, – пояснил Спенс. – Директор, хорошо владеющий технологиями, может создать систему инвентаризации онлайн. Другой, не очень хорошо владеющий компьютерными технологиями директор может поручить эту работу своему помощнику, а тот, в свою очередь, считает книги, переносит их с места на место и проверяет их наличие».
Меня это удивило, ведь несколько лет назад была разработана система инвентаризации для округа. «У меня нет учебника, – сказал один из школьников, стоя перед Комиссией Филадельфии по школьной реформе в 2009 г. После этого Арлен Акерман, руководившей тогда департаментом, пришлось внедрить компьютеризированные системы инвентаризации. А директор отдела компьютеризации Мелани Харрис рассказала мне, что система была создана внутренними силами.
«Вы имеете в виду, что онлайн-система больше не работает?» – спросила я у Спенса.
Как он сказал, директора школ предпочитали использовать собственные системы и самостоятельно высылать ему списки. «Я полагаюсь на директоров. И, скажем, на свежие данные. Их можно отследить по спискам, которые составляются перед началом и в конце учебного года».
Спенс, получая данные от директоров, вводит их в таблицу Excel.
– А открыт ли доступ к вашей таблице у кого-то еще? – я продолжила.
– Да, у помощников руководителей отделов, – ответил он. – Во время совещаний перед началом учебного года мы обращаемся к таблице, она демонстрируется через проектор.
Как специалист по данным я понимала, что Спенс просто утопал в работе. Миллионы книг, сотни тысяч парт – отследить все это невозможно без должного технического оснащения и команды. Практически так же сложно понять, как правильно следует использовать имеющиеся данные.
В результате получается, что цифры по округу попросту не сходятся. Например, рассмотрим ситуацию в восьмом классе средней школы Тильдена на юго-западе Филадельфии. Согласно окружным данным, литературу там изучают по программе «Основа литературы» (Elements of Literature), изданной Houghton Mifflin. Согласно данным окружной системы инвентаризации (заведомо неточной), в 2012/13 учебном году в восьмом классе в Тильдене учились 117 человек, однако в распоряжении школы было лишь 42 учебника. Многие ученики провалили тестирование, их средний бал составлял 29,4 % при окружной норме 57,9 %.
Первая проблема заключается в том, что никто не следит за актуальными нуждами учеников. Вторая обусловлена небольшими бюджетами на образование. Учебник «Основы литературы» стоит $114,75. В 2012/13 учебном году Тильдену (как и всякой средней школе Филадельфии) выделили лишь по $30,3 на покупку книг на одного ученика. Предполагалось, что эта цифра, почти равная четверти стоимости одного учебника, покроет приобретение всех необходимых книг, а не одной. По моим собственным подсчетами, школы Филадельфии были обеспечены только 27 % необходимых книг на 2012/13 учебный год, а стоимость всех учебников обошлась бы в $68 млн. Из-за того, что окружная управа не собирает актуальные данные о наличии учебников, это цифра может быть завышена. Но, что вероятнее, результаты моих подсчетов сильно занижены.
К концу 2012/13 учебного года бюджет на закупку книг был упразднен. В июне 2013 г. Комиссия по школьной реформе, в 2001-м заменившая Школьный совет Филадельфии и ныне функционирующая от имени штата, преодолела бюджетный «Страшный суд», недополучив $300 млн на операционные нужды на 2014 налоговый год. (В 2011-м губернатор Пенсильвании уже лишил бюджет общего образования примерно $1 млрд.) В тот год школы Филадельфии не смогли выделять деньги на покупку учебников. В 2015 г. ситуация не изменилась.
Казалось, технологии – отличный способ навести порядок в бюрократическом болоте. Ведь это как раз то, для чего технологии были созданы: смоделировать бюрократические стандарты в виде программы, затем при помощи данных проверить, насколько система соответствует собственным стандартам. Такой метод можно было бы применить для любого другого бюрократического процесса. Однако на этом примере мы также видим, насколько сложны наши общественные и социальные системы.
Фонд Билла и Мелинды Гейтс, эдакая «силовая станция» от финансирования образования, приложил много сил, чтобы был принят Единый комплекс стандартов штата. Они также высоко оценили мою работу над этим проектом. В каком-то смысле решение проблемы, сформировавшейся в школах, похоже на проектирование. Комплекс стандартов – это проект дома. И, если у вас есть такой проект, с которым согласны все ключевые лица, подрядчик может приступать к строительству с учетом его особенностей. Однако если меняется проект, то подрядчик вынужденно сдвигает сроки сдачи. И при каждой новой перемене проекта увеличиваются цена и срок исполнения.
Схожие метаморфозы происходят и в программировании. Обычно в начале заказчики не утруждаются описанием особенностей проекта. И, когда особенности всплывают, стоимость разработки увеличивается, а срок запуска сдвигается соответственно. Это называется расширением области определения. Будучи главой Microsoft, Билл Гейтс, вероятно, управлял наиболее масштабными проектами разработок, чем кто-либо. С этой стороны становится понятно, почему фонд включился в разработку образовательных стандартов: финальную выверку, согласование со штатами, внедрение программ и определение их эффективности. Это изящно спроектированное решение. И, если бы люди могли договориться, а стандарты оставались неизменными хотя бы несколько лет, все получилось бы.
Однако школьная проблема связана не только с технологиями, она имеет и социальную сторону. Образовательные стандарты не являются естественными законами. Они представляют идеи, сформированные на почве конкретного политического и идеологического контекста. Например, избранные представители школьных советов Техаса и Калифорнии, вероятнее всего, имеют разное представление о том, насколько важными для общеобразовательных программ являются концепты эволюции и климатических изменений. Школьные советы Калифорнии, скорее всего, не согласятся друг с другом, равно как и представители округов Техаса. И, если вам любопытно, что может развернуться вокруг образовательных стандартов, изучите споры в Колорадо, произошедшие в 2014 г. на почве обсуждений вопросов экзамена по истории[36]. Республиканцы, демократы, Национальная ассоциация просвещения, Американская федерация учителей, «Американцы за процветание» (группа консерваторов, финансируемая либертарианцами братьями Кох), активисты от школ, компании-застройщики, представители местных школьных советов, комиссии по вступительным экзаменам – все включились в это сражение, сообщения о котором гремели во всех новостях. Образование еще долгое время было полем боя для американской войны за культуру.
Случай с крахом попытки внедрения образовательных стандартов служит примером того, что происходит, когда проектные решения применяются к общественным сферам. Формальные решения становятся настолько сложными, трудоемкими и завязаны на такое количество данных, что погоня за технологиями затмевает социальные проблемы, которые в действительности стоят во главе угла.
Проектные решения – это фактически математические решения. Математика отлично решает конкретные задачи с прозрачными условиями. Школа – это антоним конкретики. Образование – одна из наиболее превосходных и сложных систем, когда-либо созданных человеком. Я каждый день вхожу в аудиторию и каждый день покидаю ее – удивленная своими открытиями. У моих студентов бесконечно сложные жизни. У них дедлайны по другим курсам, семейные перипетии, планы на путешествия. Кроме того, некоторым из них приходится заниматься собственными детьми. Такая среда непредсказуема. И это то, почему я в том числе люблю преподавать; есть в этом элемент игры, я помогаю студентам стать лучше.
Но иногда непредсказуемость также докучает мне как специалисту в области информатики. Составляя программу курса, я фактически пишу план на семестр. Если бы все следовали правилам и расписанию программы, семестр прошел бы нормально и все бы учились как задумано. Но не раз за мою более чем 10-летнюю карьеру я, выставляя оценки и двигаясь по программе, корректировала курс.
Сразу оговорюсь, что корректировки только улучшают его. Я их использую, чтобы совершенствовать программу и расширять опыт студентов. И, если мне кажется, что они не слишком освоили основы представлений о вычислениях или журналистики, прежде чем переходить к сложным темам, я возвращаюсь к началу и поясняю необходимые детали. Такая стратегия соотносится с лучшими педагогическими практиками и учебным эмпирическим исследованием. Корректировки программы улучшают опыт студентов по итогам курса, хотя мой внутренний инженер вздыхает каждый раз, когда я вношу изменения в упорядоченную сетку, где подробно расписано все, что студентам нужно изучить, прочитать и выполнить.
Программа легко трансформируется, поскольку я в среднем учу по 30 весьма мотивированных студентов каждый семестр. Они могут приходить на мои занятия (на которых им предстоит знакомиться одновременно с качественными и количественными методами) раз или два в неделю. Если бы я преподавала в общеобразовательной школе, ситуация была бы иной. Конечно, учителя тоже слегка подстраивают программу, однако они также работают более чем с 30 учениками целыми днями, пять дней в неделю. Более того, их ученики обязаны быть на уроке независимо от того, хотят они этого или нет. А, поскольку я преподаю в частном университете, я могу посреди семестра попросить своих студентов докупить учебники, если это необходимо для обучения. В общеобразовательной школе учебники выдаются самой школой. Немногим учителям разрешается покупать новые учебники посреди семестра, и даже если бы это можно было делать, то процесс согласования покупки занял бы недели. Внедрение небольших изменений в программу для небольшой группы студентов похоже на включение зажигания у спорткара. В случае со школой это скорее выглядит как попытка развернуть круизный лайнер, идущий на предельной скорости.
Техношовинист, глядя на эту проблему, наверняка предложил бы технологическое решение. Можно было бы перевести все учебники в электронный формат, так у школьников был бы к ним доступ, например, со смартфонов. Ведь у всех же есть смартфоны.
Это заблуждение.
С помощью смартфона удобно читать лишь небольшие тексты, однако длинные параграфы сложно и не слишком комфортно читать с маленького экрана. Исследования показывают, что чтение с экрана хуже чтения в учебном классе. Скорость, точность и глубина погружения при обучении страдают, если мы читаем с мониторов. Бумага в этом смысле – попросту превосходная технология для погружения в материал, которого мы ожидаем от студентов в рамках их обучения. Чтение с экрана – веселее и сподручнее, да, но ведь чтение с целью понимания не подразумевает веселье или легкость. Оно предполагает обучение. И, когда дело доходит до обучения, студенты предпочитают экранам бумажные формы[37].
Другой техношовинист предложил бы выдать ученикам планшеты iPad или Choromebook или электронные книги и также оцифровать учебники. Однако и здесь проблема очевидна. Вы когда-либо находились рядом с ребенком или подростком? Замечали, как часто они все теряют? Дети теряют буквально все: перчатки, шапки, ключи, планшеты – серьезно. Дети также постоянно все ломают. Так что в школе, где учится 500 или 1000 человек, бессмысленно покупать каждому планшет или компьютер за $200, чтобы затем заменить его таким же. Цикл жизни компьютера в классе или просто при интенсивном использовании составляет примерно два года.
Цикл жизни книги – более пяти лет. Книга в бумажной обложке для занятий по словесности стоит около $0,99. Ее не нужно обслуживать и обновлять. Ее можно сравнительно дешево заменить на новую. Компьютеру требуется инфраструктура. Покупая компьютеры для 500 человек, вы также получаете комплекс сопутствующих услуг и расходов.
Предположим, вы занимаете административный пост в школе, где как раз хотят приобрести компьютеры для всех 500 учеников. Вам понадобится обеспечить круглосуточную техническую поддержку по телефону или электронной почте для каждого из учащихся, а также более чем для 50 учителей, свыше 20 администраторов и иного персонала, а также всех родителей. Вам также придется приспособить изношенную электрическую сеть и удостовериться в том, что энергии хватит на все компьютеры. Кроме того, необходимо обновить системы вентиляции, отопления и кондиционирования, поскольку компьютеры производят много тепла и плохо работают при высоких температурах. Нужна также мощная сеть Wi-Fi, которая, во-первых, способна справиться более чем с 600 единовременными подключениями и передачей данных с шести утра до семи вечера. Во-вторых, сеть должна работать везде, даже в тех классах, которые были построены в 1950-х гг. из шлакобетонных блоков – тех самых, что не пропускают сигналы Wi-Fi. Предстоит также контролировать все пароли для будущей сети и, например, помогать тем, кто их забыл, даже в три часа ночи. Вам нужно будет создать безопасную инфраструктуру для системы управления обучением, где учителя могли бы передавать домашние задания, а также общаться с учащимися и их родителями. Более того, эта безопасная сеть должна быть создана в соответствии с Законом о правах семьи на образование и неприкосновенность частной жизни (Family Educational Rights and Privacy Act, FERPA), очевидно защищающим приватность образовательных данных, при этом не слишком очевидно объясняя, что следует понимать под этими данными. Вам также понадобится подготовить все для реализации Закона США о защите конфиденциальности детей в интернете (Children’s Online Privacy Protection Act, COPPA), согласно которому компании обязаны получать согласие родителей, а также защищать персональные данные детей младше 13 лет, хоть дети и идут в школу в шесть и уж точно начинают пользоваться компьютерами раньше 13 лет. Предстоит внедрить сотни идентификационных карточек для учащихся, учителей и персонала, и вам же предстоит отключать тех учеников или сотрудников, которые уходят из школы или увольняются. Именно вам предстоит проверять электронные книги до и после начала семестра. Придется получать лицензии на использование учебников, оплачивать их, поддерживать их актуальность и, конечно, бесконечно разбираться с теми, у кого лицензии по каким-то причинам оказались неработающими, в результате чего они не могут выполнить домашнее задание. Вам нужно будет иметь дело и с файрволами. И решать проблемы тех учеников, у кого нет домашнего интернета: как тогда им делать домашнее задание? Кроме того, на вас также ложится обязанность по ремонту компьютеров. Не забудьте также докупить зарядные кабели для тех, кто будет «внезапно» забывать их дома. Нужно будет заменять потерянные и украденные компьютеры. Вам придется разработать адекватную политику использования компьютеров, которая бы отбила у студентов желание потреблять неуместный контент. Политику, которая бы на деле значила «не нужно использовать компьютеры, выданные школой, для просмотра порно, жестоких видео, контента, связанного с наркотиками или чем-то иным, из-за чего ваши родители рассердятся на нас». И именно вам предстоит удостовериться в том, что ученики (а также учителя и сотрудники) соблюдают эту политику, и выстроить такую культурную практику, при которой все согласны ее соблюдать добровольно, а не по принуждению. Вам предстоит собрать всю эту инфраструктуру, обеспечить ее бесперебойную работу и внедрять новые технологии, как только они появляются. И все это вам предстоит делать с минимально обученным персоналом, при минимальных бюджетах и за крошечную зарплату.
Испытания на этом не заканчиваются. Как показали итоги программы 2005 г. «Ноутбук каждому ребенку» (One Laptop Per Child, OLPC), которая обошлась в $20 млн, недостаточно просто выдать учащемуся ноутбук, надеясь, что он будет с его помощью учиться. Реализация проекта в Парагвае показала, что, несмотря на все принятые меры, не позволяющие пользоваться компьютерами ни для чего, кроме обучения, дети, равно как и учителя, умудрялись играть в игры и смотреть видео[38]. Кроме того, учителям требовалась помощь во внедрении компьютеров в свои планы уроков – и даже тогда всплывали проблемы (поломка, потеря и т. д.). А когда взрослые обнаружили, что дети в нигерийской школе смотрят с учебных компьютеров порно, поднялся масштабный скандал[39].
Нелегкая задача. После всего этого самым дешевым и простым решением кажутся книги.
Впервые я написала на эту тему в 2014 г.[40] Однако перемены были небыстрыми. Школьный бюджет на 2017 учебный год наконец включал пункт с заказом новых учебников. «Бюджет на 2016–2017 налоговые годы включает вложение $32 млн на обновление учебных материалов и $12 млн – социальным педагогам и медсестрам» – сказано в бюджете школьного округа Филадельфии на 2017 г. Благотворительные организации пожертвовали $10 млн «на установку книжных шкафов во всех классах третьеклассников». Последнее было частью 440-миллионного вложения, направленного на покупку учебных материалов для восьмых классов, обновление технического оснащения старшей школы, расширение спектра углубленных программ и возможностей для одаренных детей, а также для социальных педагогов и медсестер в каждой школе[41].
Однако, если мы посмотрим на все это через призму интернета, скорость которого предполагается равной скорости света, весь этот проект занял слишком много времени. Чтобы он принес свои плоды, потребовалось полгода на разработку и два года на сами перемены. Техношовинист бы сказал, что два года на социальную трансформацию – это слишком долго. Менять массивную бюрократическую машину – тяжело. Подобно тому как попытка развернуть круизный лайнер требует полной мощности, перемены требуют времени. Иного не дано. Это же справедливо и для расследований цифровой ответственности: их производство занимает много времени, вы даже можете не знать, что конкретно ищете. А перемены могут не происходить годами.
Я стараюсь оптимистично оценивать «обновление учебных материалов», запланированное для Филадельфии. Я не уверена, что это сработает больше чем на год. С одной стороны, потому что, вероятнее всего, стандарты снова поменяются, потребуются новые материалы, возможно, сменят также разработчика тестов, из-за чего учителя будут вынуждены подстраивать свои программы вновь и т. д. Я надеюсь, что стандарты перестанут менять хотя бы на несколько лет, тогда учителям, ученикам и школьной системе в целом удастся создать и реализовать программы, эффективные для их непосредственного контекста. И я надеюсь, что руководство штатов полностью возьмет на себя финансирование общеобразовательных школ – начиная от карандашей и заканчивая ноутбуками в классах, вплоть до включения картофельных шариков в меню буфетов. Я хотела бы увидеть успех общего образования. Хочу, чтобы следующее поколение было технически грамотным, хочу видеть вдохновенных молодых людей, изучающих общественные науки, литературу и искусства, математику, информатику, статистику, историю и иные чудеса окружающего мира. Я хочу видеть их активными участниками американского эксперимента и американской мечты. Однако я не слишком верю в свои надежды.
6
Человеческий фактор
Может показаться, что идеи относительно применения компьютерных технологий в образовании исходят от многих авторов и мыслителей. Однако, если копнуть глубже, окажется, что большинство идей порождено в начале 1950-х гг. небольшой группой людей, плохо представлявших логику взаимодействия между технологиями и образованием. А зная, что связывало этих людей, мы можем отойти от упрощенного, нефункционального понимания технологий.
Компьютерные системы отражают их создателей. Поскольку исторически сложилось, что круг людей, их разрабатывавших, не слишком разнообразен, очевидно, существуют определенные принципы, внедренные в сами проектные решения и концепт технических систем, и они требуют решительного переосмысления и ревизии. Обратимся к примеру некорректной работы техники, отчетливо демонстрирующему однобокость такого подхода.
Дэвид Боггс решил, что ясный день июля 2016 г. – отличное время, чтобы полетать. Он только что обзавелся новой игрушкой – дроном, оборудованным новейшей системой потокового видео. Ему не терпелось испытать аппарат, и, когда друзья Дэвида наконец пришли, он вытащил дрон и стал показывать, на что тот способен.
Дрон летал вверх и вниз над двором. Боггс с друзьями восторженно смотрели прямую трансляцию на iPad. Их небольшой городок в штате Кентукки, округ Буллит Кантри рядом с Луисвиллем, выглядел с воздуха совсем иначе. Аккуратные одно- и двухэтажные домики уменьшились до размеров кукольных. Когда дрон набирал высоту, остроконечные крыши на участках превращались в серые прямоугольники. Лес рядом с домом Боггса напоминал скорее зеленую реку, вьющуюся по округе, а поля были просто огромными.
Он направил дрон на запад по 61-му шоссе, затем повернул на север, намереваясь снять на видео дом своего друга. Затем последовал громкий хлопок, дрон начал резко терять высоту и оказался на земле.
Дети Меридет играли во дворе, когда услышали шум дрона. Они похожи на вертолеты, но звучат немного иначе. От вертолета звук громкий и ритмичный, как у большого барабана. Дрон издает высокие почти верещащие звуки, будто маленький ребенок, – «И-и-и-и-и-и-и-и-и!!!!!» изо всех сил. NASA выяснило, что звук дрона раздражает сильнее, чем звук наземного транспорта[42]. Дети, услышав звук, побежали к отцу, Вилли. Семейство пришло в замешательство: был ли это боевой дрон? Угрожал ли он детям? Звук не прекращался, мешая рассуждать трезво. Вилли Меридет взял ружье, зарядил его дробью и выстрелил в летающую цель. Дрон подскочил, совершил вираж и упал вне поля зрения на ближайшей парковке. Звук прекратился.
Боггс с друзьями отправились на место крушения, которое им показывал iPad. Они увидели Вилли во дворе, он выглядел взволнованным. В тот момент все поняли, что произошло. Боггс был в ярости. Он заплатил $2500 за дрон, который сбил сосед. Меридет побелел от ярости: неужели его сосед шпионил за ним и его семьей с воздуха? Разве это не свободная страна и граждане лишены приватности даже в собственном доме? Ситуация накалялась. Вилли направил ружье в сторону Боггса и его товарищей. Боггс позвонил в полицию. Приехавшие вскоре офицеры не представляли, что нужно делать в такой ситуации, ведь в инструкциях не сказано, как урегулировать споры соседей относительно летающего робота. Это не было браконьерством, поскольку дрон не животное, не было преднамеренным уничтожением чужой собственности – Вилли Меридет находился на своей земле в момент выстрела.
В итоге офицеры решили арестовать Вилли потому, что у него одного было в руках оружие. В участке ему выдвинули обвинение в угрозе первой степени за стрельбу в воздух и хулиганство. Жена заплатила за него залог $2500, и вскоре он был дома. Спустя несколько месяцев судья снял обвинения: Меридет имел право застрелить робота, кружившего над его собственностью и вторгавшегося в его личное пространство[43].
Однако у меня иная точка зрения на этот счет. И я хочу спросить разработчиков и маркетологов дронов: что, по-вашему, должно было случиться? Америка весьма хорошо вооружена. Вы создаете летающего робота-шпиона, который вдобавок издает раздражающий звук, и при этом не формулируете никаких правил, не пишете инструкций и не вырабатываете социальные нормы относительно непредвиденных ситуаций?
Технокультуру неизменно сопровождает наивность относительно неизбежных проблем, которые предстают всякий раз, когда люди начинают пользоваться новыми гаджетами. Разработчики Microsoft создали Twitter-бота Тая, который, как предполагалось, должен был «учиться» при взаимодействии с другими пользователями. Сообщество Twitter мгновенно продемонстрировало, почему за ним закреплена репутация платформы, где бал правят хамы и агрессоры, – на Тая тут же обрушилась волна грязи. В итоге бот научился искусно владеть риторикой вражды в дискурсе превосходства белой расы. Обалдевшие разработчики закрыли проект[44].
В другой раз инженеры решили продемонстрировать доброту незнакомых людей при помощи hitchBOT – куклы, оснащенной GPS, которая, как предполагалось, пропутешествует автостопом по всей стране. Идея заключалась в том, чтобы подбирать куклу и буквально переносить ее на следующую точку маршрута, чтобы там ее подобрал другой человек и понес дальше. Считалось, что так кукла пропутешествует по всей стране и заодно поможет показать доброту тех, кто хочет помогать другим при помощи технологий. Но hitchBOT не удалось добраться дальше Филадельфии, где робота расчленили и бросили на темной аллее[45].
Отличительными чертами техношовинизма являются слепой оптимизм и недостаток осторожности относительно применения новых технологий.
История о том, как создатели технологий отчаянно пренебрегают общественной безопасностью и социальным благом, начинается с безгранично любимого мной Марвина Минского. Минский, выпускник Гарварда, Андовера и Принстона, был профессором Массачусетского технологического института (МТИ) и считается отцом искусственного интеллекта. Посмотрите за кулисы любого высокотехнологичного проекта начиная с 1945-го и заканчивая 2016 годом – вы наверняка обнаружите Минского или его разработку.
В лаборатории Минского (в МТИ) родились первые хакеры. Это было потрясающе неформально. Первыми сотрудниками Минского стала группа студентов из клуба Технического моделирования железной дороги, которые тогда создавали собственные релейные компьютеры, чтобы управлять моделями поездов. Члены клуба сходили с ума от возни с механизмами. Тогда, в конце 1950-х гг., в институте была большая ЭВМ (одна из нескольких в мире), и эти студенты периодически пробирались в вычислительный центр, часами разбирали и запускали самостоятельно написанные программы.
Любой другой профессор, скорее всего, наказал бы их за то, что они вламываются в лабораторию и незаконно пользуются университетской собственностью. Минский же нанял их на работу. «Они были странными, – вспоминал он[46]. – У них было что-то вроде ежегодного соревнования: кто быстрее остальных проедет по всем станциям нью-йоркского метро. Это занимало около 36 часов и требовало детальной проработки поездки, планирования, изучения расписания движения поездов. Эти ребята были сумасшедшими». Однако такого рода сумасшествие оказалось полезным с точки зрения информатики. Безграничное внимание к деталям и неутолимое желание что-то создавать пришлись кстати с точки зрения написания программ и проектирования аппаратного оснащения. Лаборатория Минского процветала.
Да, его методы приема на работу были не слишком ортодоксальными. Все потому, что Минский был Минским – тем, у кого дома всегда жил выпускник или кто-то еще, тем, к кому политик или писатель-фантаст забегали поболтать – в чем вы могли бы убедиться, если бы просидели в его гостиной достаточно долго. Ему не приходилось искать сотрудников. «Кто-нибудь писал сообщение или письмо: “Мне интересно то-то”. На что я отвечал, что можно заглянуть и посмотреть, понравится ли работа у меня, – вспоминал он. – Человек приезжал на неделю или две, получал достаточно денег и уезжал, если ему не нравилось. Это действительно было весьма экстравагантно, но команда лаборатории была сообществом самозаряжающимся. У них был свой язык. Они могли сделать за три дня то, на что обычно уходил бы месяц. И, если у нас в команде появлялся кто-то талантливый и харизматичный, мы принимали его с радостью». Клуб моделистов и лаборатория Минского были увековечены в книгах Стюарта Бранда «Медиалаборатория» (The Media Lab) и Стивена Леви «Хакеры: Герои компьютерной революции» (Hackers: The Heroes of the Computer Revolution) – не считая множества других работ[47]. Этика хакера также вдохновила Марка Цукерберга на первый девиз Facebook: «Двигайся быстро и круши». Минский преподавал у Цукерберга в свое время.
Минский и его коллега Джон Маккарти организовали первую конференцию по ИИ. Она проходила в 1956 г. на кафедре математики в Дартмутском колледже. Затем они создали Лабораторию искусственного интеллекта в МТИ, включающую также и Медиалабораторию, которая по сей день остается центром разработки и творческой реализации технологий. С лабораторией сотрудничали все, начиная от Джорджа Лукаса и заканчивая Стивом Джобсом, Аланом Алда, Пенном и Теллером. (Я тоже сотрудничала с Медиалабораторией в рамках программного проекта, посвященного идеям Минского.)
Каждый этап карьеры Минского был отмечен фортуной. Большинству ученых приходится прилагать много усилий, чтобы получить финансирование в мире с постоянно сокращаемыми дотациями. Минский же принадлежал к тем, у кого деньги, казалось бы, «текли из крана». Он вспоминал:
Я не писал ни единой заявки до 1980 г. Я просто всегда появлялся там, где был кто-нибудь вроде Джерри Виснера от Массачусетского института.
Мы с Джоном Маккарти начали работать над ИИ где-то в 1958 г. или 1959 г., как раз когда пришли в МТИ. У нас была пара студентов-помощников. Однажды к нам заглянул Джерри Виснер и спросил, как идут дела. Мы сказали, что все идет неплохо, но было бы здорово, если у нас еще было бы 3‒4 студента в помощь. Он сказал, мол, хорошо, зайдите к Генри Циммерману и скажите, пускай выделит вам лабораторию. Спустя два дня у нас была небольшая лаборатория на 3‒4 комнаты и огромная куча денег, которую МТИ получил от IBM за исследования в области вычислительной техники. Никто не знал, что делать с деньгами, поэтому их отдали нам.
Кучи денег и потрясающе талантливые математики с их прогрессивными теориями о грядущем – так выглядело сообщество исследователей ИИ. В итоге небольшая группа коллег Минского превратилась в лидеров в технологических академических кругах, в индустрии и даже в Голливуде.
Когда фантаст Артур Кларк работал со Стенли Кубриком над «2001 год: Космическая одиссея», он обратился к своему другу Минскому за помощью: подсказать, как можно представить суперинтеллект на космическом корабле, который пытается спасти мир, но затем уничтожает всю команду. И Минский помог. Вместе они разработали HAL 9000, компьютер, по сей день символизирующий все перспективы и ужасы, на которые могут быть способны машины. Большинство людей помнит единственный мигающий красный «глаз» HAL. Почти такой же зловещий глаз (если точнее, индикатор) был на ENIAC, который считается первым программируемым универсальным цифровым компьютером. Джон фон Нейман, который пришел к идее хранения компьютерных данных, что и привело к появлению ENIAC, был одним из наставников Минского.
Вкусы Минского в литературе сводились исключительно к научной фантастике. Он даже написал собственное произведение. А еще он дружил с Айзеком Азимовым и другими выдающимися писателями. И порой в такой дружбе размывались границы фантастики и реальности. Минский упоминал об одном из их безумных проектов в интервью:
Меня заинтересовала идея космического лифта, предложенная Артуром Кларком. И я провел около полугода с учеными из Ливермора, разрабатывавшими подобные устройства. Это возможно – в принципе – создать что-то вроде шкива, ремня, из углеволокна и прочнейшего троса. Механизм тогда поднимался бы от Земли к спутнику и обратно. В результате мог бы получиться лифт, поднимающий объекты в космос. Артур Кларк разработал теоретическую базу для него и назвал фонтаном.
Получается: Кларк, писатель-фантаст, придумал лифт, выходящий в открытый космос. Он убедил своего друга ученого Минского (в чьем доме Кларк периодически гостил), что лифт – это отличная идея. В свою очередь, Минский убедил некоторых друзей в Ливерморской национальной лаборатории (работавшей на оборонную промышленность, а сегодня получающей финансирование от Администрации по национальной ядерной безопасности и Департамента энергетики) поразмыслить над идеей гигантского кухонного лифта в открытом космосе. И эти ученые работали над этим космическим «кухонным лифтом» целых шесть месяцев.
В технологическом сообществе все знали Минского и полагались на него. Известно, что Стив Джобс узнал об идее компьютера с мышью и графическим пользовательским интерфейсом от Алана Кея и его команды в Xerox PARC. Когда в 1985 г. Джобс ушел из Apple, его место занял Скалли. Кей тогда обмолвился, что пора искать новые идеи для технологических разработок. И они не собирались обращаться за вдохновением к PARC. «Так мы оказались на восточном побережье в Медиалаборатории МТИ, где сотрудничали с такими экспертами как Марвин Минский и Сеймур Пейперт, – рассказывал Скалли в интервью 2016 г.[48] – Многое из того, что у нас получилось, мы представили в концепт-видео “Навигатор знаний”. Там и было предсказано, что компьютеры станут нашими помощниками, – то, что происходит сейчас с голосовыми помощниками вроде Siri от Apple, Alexa от Amazon и Cortana от Microsoft».
И не случайно то, что у каждого из помощников по умолчанию женские имена и идентичности. «Мне кажется, в действительности это отражает то, что мужчины думают о женщинах, – что они неполноценны как человеческие существа, – прокомментировала в своем интервью для LiveScience в 2015 г. социальный антрополог Кейтлин Ричардсон, автор “Антропологии роботов и ИИ: Упразднение тревоги и машины” (An Anthropology of Robots and AI: Annihilation Anxiety and Machines). – Что-то им можно доверить, но, когда дело касается сложных роботов, их обязательно будут создавать с мужской идентичностью»[49].
Мировоззрение Минского отражается даже в поисковой системе, которой мы пользуемся каждый день. Стэнфордские докторанты Ларри Пейдж и Сергей Брин разработали PageRank, революционный поисковый алгоритм, который и привел их к созданию Google. Ларри Пейдж – сын Карла Виктора Пейджа-старшего, профессора в области ИИ, человека, знакомого с работами Минского и общавшегося с ним на конференциях. Научный руководитель Ларри Терри Уиноград считает Минского своим наставником. Научным руководителем Винограда был Сеймур Пейперт – давний коллега и бизнес-партнер Минского. Некоторые из топ-менеджеров Google, например Рэй Курцвейл, учились в аспирантуре у Минского.
Минский был гладуэлловским объединителем[50]. В 1950-е гг. в многомиллионной стране можно было насчитать немного мест, где занимались информатикой, – и Марвин Минский был в каждом из них, общаясь, занимаясь разработками, создавая, доделывая и передавая проекты.
Творческий беспорядок в стиле Минского – веселый, очаровательный и вдохновляющий. И опасный. У поколения Минского не было тех представлений о безопасности, которые важны для нас сегодня. Скажем, пренебрежение радиационной безопасностью было обыденным. Однажды один из выпускников Минского, Дэнни Хиллс, зашел к нему домой с радиационным датчиком в кармане. (Хиллс – изобретатель суперкомпьютера, управляет фондом Long Now вместе с основателем Каталога всей Земли Стюартом Брандом. Цель фонда – создать механические часы, которые будут идти 10 000 лет в пещере на ранчо Джека Безоса, основателя Amazon[51].) Датчик излучения стал «сходить с ума». Хиллс, уже живший некоторое время в доме, отправился на поиски источника радиации. Самый сильный сигнал поступал из шкафа. Хиллс открыл его, но не увидел непосредственно предмета излучения. Затем он обнаружил секретную панель в глубине шкафа. Любопытство взяло верх, он открыл панель и нашел человеческий скелет.
Хиллс побежал наверх, чтобы сообщить Минскому и его жене Глории Рудиш о своей находке. Они были скорее взволнованы, нежели удивлены. «Он действительно там? – спросила Рудиш. – Мы годами его искали». Этот скелет она использовала в медицинской школе, и никто не предполагал, что он может быть источником радиации.
В итоге Хиллс выудил из шкафа множество находок, например объектив старой шпионской камеры, которую Минский купил в комиссионке. В то время такие объективы обрабатывались каким-то радиоактивным составом, чтобы повысить коэффициент преломления. «Невероятная радиоактивность, – вспоминал Хиллс. – Тогда я вынес все из дома»[52]. Поколение Минского считало, что, когда дело доходило до создания чего-либо нового, стандартные правила не работали. Например, он любил рассказывать о своих друзьях, собравших межконтинентальную баллистическую ракету во дворе дома, некогда принадлежавшего архитектору Бакминстеру Фуллеру.
Превалирование творчества над условностями (или законами) – вот то, что поколение Минского стремилось передать своим студентам. Это проявится позже, в моделях поведения директоров технологических компаний вроде Тревиса Каланика, который в 2017 г. был исключен из руководства Uber за (среди прочего) создание культуры сексуального домогательства. Каланик тоже считал, что законы не важны. Он запустил компанию Uber на глобальном уровне в обход местных законов о пассажирских перевозках; разработал программу под названием Gryball, помогавшую компании избегать внедрения агентов под прикрытием в ряды водителей; именно его, оскорблявшего водителя, засняли на камеру; это он имел бледный вид, когда выяснилось, что его водители насиловали пассажиров[53]. Согласно посту в блоге одной из разработчиц Uber Сьюзан Фаулер, менеджеры Каланика были карикатурно некомпетентными, когда дело касалось жалоб о домогательствах. Коллеги-мужчины обыденно обходили ее по карьерной лестнице и делали ей непристойные предложения. Менеджеры по персоналу в Uber должны были бы распознать хрестоматийный пример дискриминации по половому признаку на рабочем месте, но вместо этого они назвали виновной ее.
Корни такого отрицания социальных норм восходят к первопроходцу цифровых машин, Алану Тьюрингу. Он, как и Минский, работал над своим дипломным проектом в Принстоне. Тьюринг был совершенно безнадежен в делах общения. Его биограф Джек Коупленд – директор Архива Тьюринга по истории вычислительной техники – пишет, что тот предпочитал работать в одиночку. «При чтении его научных трудов создается впечатление, как будто весь остальной мир – деятельное сообщество человеческих умов, занимающихся теми же или смежными задачами, – просто не существует». В отличие от персонажа, изображенного актером Бенедиктом Камбербэтчем в биографическом фильме о Тьюринге «Игра в имитацию», настоящий Тьюринг был довольно неопрятным. Он носил потертую одежду, его ногти всегда были грязными, а волосы торчали в разные стороны. Коупленд пишет[54]:
Тьюринг был веселым, радостным, живым, бодрым, забавным, полным мальчишеского энтузиазма – стоило его только узнать поближе. Его громкий каркающий хохот заполнял все вокруг. А еще он был одиночкой. «Тьюринг всегда был сам по себе, – говорил криптоаналитик Джерри Робертс. – Он не казался тем, кто много общается с людьми, однако с близкими он был весьма общительным». Как и все, Тьюринг жаждал общения и компании, но, казалось, не слишком вписывался. Социальная отчужденность беспокоила его, но, как в случае с собственными волосами, это была сила природы, и он мало что мог с этим поделать. Периодически он бывал грубым. Если ему казалось, что его не слушают с должным вниманием, он попросту мог уйти. Тьюринг был из тех, кто (обычно непреднамеренно) умудрялся вывести некоторых из себя – особенно чванливых, власть имущих, и ученых-позеров. Он бывал угрюмым. Джим Уилкинсон, его ассистент в Национальной физической лаборатории Великобритании, со смехом вспоминал, что бывали дни, когда попросту нужно было держаться подальше от Тьюринга. Однако под сумасбродной, угловатой и непочтительной личиной скрывались неискушенная наивность, чувствительность и скромность.
Обратим внимание на фразу «стоило его только узнать поближе». Ведь именно так говорят о неприятных и невыносимых людях, при этом намекая, что есть резон отыскать то, что скрывается за отвратительным характером. В случае с Тьюрингом люди мирились с его поведением потому, что он был гениальным математиком.
Способность смотреть сквозь поверхностные маркеры вроде внешности – одна из замечательных особенностей культуры математиков. И недостаток одновременно, особенно когда презрение к социальным нормам приводит к тому, что математические способности ценятся выше социальной жизни. Такие предметы, как математика, программирование и теория вычислительных машин, снисходительно относились к антисоциальному поведению, поскольку нарушители были гениями. Такое отношение и формирует философское основание техношовинизма, для которого характерен примат эффективного кода над человеческими взаимоотношениями.
Техноиндустрия также унаследовала от математиков культ поклонения гениям. Этот культ привел к формированию множества мифов; они не только укрепляют границы индустрии самой по себе, но и скрывают структурную дискриминацию. Математики помешаны на генеалогии. В интернете существует популярный краудсорсинговый генеалогический проект, список математиков, их «предков» и «потомков», организованный в соответствии с тем, у кого и где была получена их докторская степень. Линию интеллектуального «наследования» Минского можно проследить вплоть до Готфрида Лейбница (1693). Чтобы понять, почему это важно, стоит посмотреть на историю развития современного компьютера.
Абак, как вы наверняка помните со школы, можно считать первым «компьютером». Абак – это устройство, основанное на десятичной системе, ведь у людей по 10 пальцев на руках и ногах. Абак, современный, вариант которого – счеты, выглядит как рамка с проволокой и 10 бусинами на ней, он веками использовался для вычислений.
Астролябия, которая применялась для астронавигации на море, была следующей стадией развития вычислительных технологий. Следом появились разного рода часы: водяные, пружинные и механические. Хотя все они и были важными и гениальными изобретениями, серьезный прорыв в части конструкции вычислительных устройств произошел в 1673 г., когда Готфрид Лейбниц, немецкий юрист и математик, создал устройство, называемое «шаговый счетчик», известное в наши дни под названием арифмометра Лейбница. Арифмометр содержал набор шестерен, вращавшихся при помощи рукоятки. Как только шестерня прокручивалась через девятку к «нулевой» позиции, соседняя прибавляла единицу. Каждая шестерня была «шагом», представляющим собой приращение величиной в десятку. Эта конструкция использовалась для создания счетных машин в течение следующих 275 лет[55].
У Лейбница не было времени на арифметику, ему было нужно делать куда более серьезные расчеты. После изобретения этого механизма он произнес знаменитую фразу: «Недостойно одаренному человеку тратить, подобно рабу, часы на вычисления, которые, безусловно, можно было бы доверить любому крестьянину, если бы при этом применить машину».
Когда Жозеф Мари Жаккард представил ткацкий станок на перфокартах в 1801 г., это заставило математиков иначе подойти к представлениям о вычислительных механизмах. Жаккардовый ткацкий станок работал на основе двоичной логики: отверстие в карте означало единицу, ее отсутствие – ноль. Механизм ткал свои причудливые узоры на основе только лишь того, было ли отверстие в карте или нет.
Потребовалось несколько десятилетий для осмысления, прежде чем в 1822 г. произошел очередной прорыв, когда английский ученый Чарльз Бэббидж начал работать над разностной машиной. Она была способна выполнять приближения при помощи многочленов, то есть позволяла математикам описывать отношения между разными переменными, например, расстоянием и давлением воздуха. Разностная машина также позволяла вычислять значения логарифмических и тригонометрических функций, которые весьма неприятно высчитывать вручную. Бэббидж годами работал над механизмом. В итоге машина состояла из 25 000 элементов и весила почти 15 тонн, но так и не заработала. В 1837 г. Бэббидж обнародовал новую, лучшую идею – план создания аналитической машины. Это был проект устройства, способного интерпретировать язык программирования с условным ветвлением и циклами. Аналитическая машина обладала свойствами, хорошо опознаваемыми и в современных компьютерах, такими как способность выполнять арифметические и логические операции, а также наличие памяти. Ада Лавлейс, считающаяся первым программистом, была автором программ для этого гипотетического механизма. К несчастью, проект аналитической машины настолько опережал свое время, что так и не заработал в итоге. Ученым удалось собрать его по проектам Бэббиджа только в 1991 г., и они обнаружили, что механизм заработал бы – при наличии ряда других важных компонентов, таких как электричество.
Следующий этап в развитии вычислительной техники настал в 1854 г., когда английский математик и философ Джордж Буль предложил концепт булевой алгебры. Основываясь на идеях Лейбница, булева алгебра представляет собой логическую систему, где существуют только два числа – 0 и 1, а вычисления осуществляются посредством двух операций: И либо ИЛИ.
На протяжении XIX в. арифмометры становились сложнее. Уильям Сьюард Берроуз (дедушка писателя Уильяма С. Берроуза) сколотил целое состояние на запатентованной им в 1888 г. счетной машине. После появления первой лампочки Эдисона электричество стало общедоступным и способствовало революции в механике. Отныне развитие электромеханики означало, что каждый может складывать, вычитать, умножать и делить при помощи арифмометров. Однако для этого было необходимо быстро нажимать кнопки – весьма трудоемкая работа. Люди-вычислители все еще были ключевым элементом высшей математики.
Люди-вычислители – это служащие, разновидность клерков, которых нанимали специально для выполнения расчетов. Именно они производили вычисления для сборников математических таблиц. Без этих таблиц не могли обходиться статистики, астрономы, штурманы, банкиры, специалисты по баллистике – в общем, все, кому приходилось выполнять сложные вычисления. Ведь сложно и обременительно «на бегу» умножать или делить большие числа или возводить х в какую-то степень либо извлечь корень из большого числа. Проще было посмотреть результат в заранее посчитанной таблице. Эта система прекрасно работала годами. Египетский математик Птолемей пользовался математическими таблицами во II в. до н. э., в 1758 г. французские астрономы с помощью таких же таблиц и человеческого ума спрогнозировали появление кометы Галлея.
Однако с приходом индустриальной революции стало ясно, что нехватка вычислителей становится значительной помехой прогрессу и главной неприятностью математиков XIX в. Если бы сегодня кому-то пришло в голову нанять вычислителя, гендерный выбор был бы неограниченным. В XIX в. можно было нанять только мужчин. И лишь небольшое количество женщин обладало достаточным образованием в области математики, из них лишь некоторые могли найти работу за пределами дома. В те времена в США женщины не имели права голоса. Конференция в Сенека-Фоллз стала отправной точкой движения за права женщин, о которых нельзя было и думать вплоть до 1848 г. Однако до 1920 г. поправка к Конституции США не была принята. Движение суфражисток нашло поддержку множества мужчин, однако математики никогда не могли похвастаться политической активностью. В книге «Суфрагенты: как женщины прибегали к помощи мужчин, чтобы получить право голоса» (The Suffragents: How Women Used Men to Get the Vote) моей коллеге Брук Крюгер удалось увековечить мужчин, способствовавших установлению равноправия. Среди них некоторые были профессорами – истории, литературы, философии. Правда, не было ни одного профессора математики[56].
XIX в. в США отмечен позорным клеймом – рабства. Черные мужчины и женщины могли бы работать в качестве вычислителей, стать эффективной частью рабочей силы, вместо этого их насильно превратили в рабов. Рабы не могли получать образование, их избивали, насиловали и убивали. В течении XIX в. цветное население страны повсеместно подвергалось исключению из высших учебных заведений и, таким образом, лишалось возможности стать частью интеллектуальной элиты. Рабство существовало вплоть до конца века: в 1863 г. Авраам Линкольн подписал Прокламацию об освобождении рабов, а в 1865 г. была принята 13-я поправка. Однако доступ к образованию был все еще ограничен десятилетиями, и многие говорили о том, что предстоит пройти еще долгий путь, прежде чем удастся наконец добиться честного, равного и интегрированного образования по всей стране.
Независимо от того, осознавали это математики или нет, но у них и других ученых XIX в. был выбор. Он состоял в том, чтобы включиться в социальные перемены (в процессы эмансипации, уравнивания избирательных прав, слом классовых барьеров) и способствовать развитию трудовых ресурсов посредством доступа к образованию и обучению для тех, кто не был белым мужчиной из элиты. Другой вариант – создавать машины, которые могли бы выполнять рутинные работы.
Они создавали машины.
По правде говоря, они всегда будут создавать машины. Это то, что им действительно интересно, и то, каков – по сути – вектор развития их профессиональной деятельности. И действительно, тогда весь мир был охвачен изобретением новых устройств, которые использовали бы преимущества паровых двигателей, электричества и других удивительных достижений. Вероятно, было бы несправедливо ожидать, что математики также станут экономистами (не важно, насколько близкими кажутся эти сферы) и правозащитниками (такого термина в те времена и в помине не было). В старшей школе мне пришлось воспользоваться математическими таблицами на уроке тригонометрии; это было действительно тяжело, и я полностью согласна с тем, что машины упрощают сложные повседневные вычисления. Все это показывает, насколько глубоко на самом деле укоренен стереотип о белом мужчине в техноиндустрии. Столкнувшись с возможностью разнообразить и насытить сферу занятости людей, математики XIX в. пошли по пути создания машин, заменивших человека – с большой прибылью для капитала.
Заглядывая в эпоху Минского, можно заметить, как появившаяся дисциплина компьютерных наук наследует стереотипы математического сообщества того времени. Насколько Минский и его коллеги были невероятно изобретательными, настолько же они кристаллизовали технокультуру в качестве мужского братства миллиардеров. Математика, физика и другие «сложные» науки никогда не были гостеприимны к женщинам и небелым, технологии следуют этой тенденции.
История, которую физик Стефан Вольфрам рассказывает о Минском, демонстрирует едва уловимые гендерные настроения сообщества:
Марвин, которого я знал, совмещал серьезность с чудаковатостью. Практически по каждой теме у него было свое – нередко экстравагантное – мнение. Иногда оно было действительно интересным, а порой – просто необычным. Вспомнилось начало 1980-х гг., когда я приехал в Бостон и снял квартиру у дочери Марвина Маргарет (сама она тогда была в Японии). У нее была большая и ухоженная коллекция растений, и однажды я заметил, что у некоторых из них на листьях появились мерзкие пятна.
Поскольку я не разбирался в этом (и не было интернета, где можно было бы выяснить, в чем дело), я позвонил Марвину и спросил, что делать. А дальше последовала долгая дискуссия о возможности создания микророботов, способных прогнать паразитов. Это была, разумеется, удивительная идея, однако в конце беседы мне все же пришлось спросить: «Что же мне делать с растениями Маргарет?» – «О, думаю, тебе стоит поговорить с моей женой», – ответил Марвин[57].
Представьте себе эту трогательную беседу: двое знаменитых ученых обсуждают наноботов, созданных, чтобы уничтожить бактерии. Хотя из моей головы не выходит мысль, что эти двое не представляли, как ухаживать за цветами. Вместо этого ответственность о заботе легла на жену и дочь Минского. Причем обе были вполне состоявшимися женщинами: его жена Глория Рудиш была успешным педиатром, а дочь Маргарет получила докторскую степень в МТИ и руководила несколькими компаниями, занимающимися разработкой ПО. Однако от женщин также ожидали, что они будут заботиться о растениях – эдакая незримая обязанность, которая не заботит мужчин.
А поскольку у человечества за всю историю накопился достаточно большой опыт обращения с разного рода растениями, похоже, что у обоих ученых мы наблюдаем выученную беспомощность. В 1980-е гг. было несложно диагностировать болезнь растений даже без интернета. Можно было просто пойти к местному флористу и описать пятна. Можно было пойти в ближайший хозяйственный магазин и обсудить проблему. Либо можно было позвонить в локальное представительство образовательного центра по сельскому хозяйству. В любом из этих мест нашелся бы осведомленный в области цветоводства человек. От паразитов можно избавиться, добавив немного мыла в бутылку для орошения и обработав больное растение. Применение ботов на растениях, конечно, забавная, но совершенно нецелесообразная идея.
Я понимаю, что интереснее обсуждать дурацкие идеи, а не гендерную политику. Это было справедливо тогда, это работает и сегодня. К сожалению, дурацкие идеи повсеместно захватили публичный дискурс о технологиях и обсуждение важных социальных вопросов на годы исчезло из повестки. Из Кремниевой долины пришло множество подобных идей, например: покупка островов в Новой Зеландии и подготовка к Судному дню; систейдинг, то есть строительство островов из списанных контейнеров с целью создания рая на земле без государственной власти и налогов; заморозка трупов для того, чтобы сознание умершего можно было пересадить в искусственное тело в будущем; проектирование гигантских дирижаблей; изобретение порошкового заменителя пищи, названного в честь научно-фантастического фильма «Зеленый сойлент» (Soylent Green), или производство летающих машин. Все эти идеи, безусловно, креативны; кроме того, в жизни важно оставить место мечтам, так же важно, как не воспринимать всерьез безумные идеи. Необходимо быть внимательными. Тот факт, что кто-то совершил прорыв в математике или заработал кучу денег, совсем не означает, что мы должны прислушиваться к ним, когда они убеждают нас в реальности пришельцев или говорят, что в будущем будет возможно оживлять людей, поэтому необходимо хранить мозги умных людей в огромных холодильниках вроде тех, в которых лежат овощи в магазинах Costco. (Минский состоял в научно-экспертном совете Alcor Cryonics – фонда для обеспеченных и истинных приверженцев «трансгуманизма», имеющего в Аризоне морозильную камеру, где хранятся тела и мозги. Многомиллионное обеспечение фонда гарантирует стабильное снабжение электричеством.)[58]
Читая о миллиардерах из Кремниевой долины, стремящихся дожить до 200 лет или мечтающих побеседовать с маленькими зелеными человечками, хочется спросить: был ли ты под кайфом, когда придумал это? Нередко ответ положительный. Стив Джобс бросил «кислоту» в начале 1970-х гг., почти сразу после ухода из колледжа. А Даг Энгельбарт, ученый, которого спонсировали NASA и Управление перспективных исследовательских проектов Министерства обороны (ARPA), тот, кто создал в 1968 г. «Мать всех демо» (Mother of All Demos), кто впервые выдвинул концепцию аппаратного и программного обеспечения современного компьютера, бросил употреблять «кислоту», только будучи в Международном центре специальных исследований (International Foundation for Advanced Study), который вплоть до 1967 г. оставался законным пристанищем исследований ЛСД.
Во время демонстрации Энгельбарта за съемочной камерой был Стюарт Бранд, основатель Whole Earth Catalog, в свое время помогавший ЛСД-гуру Кину Кейси в организации печально известных «кислотных» тестов – огромных наркотических вакханалий, проходивших по всей стране и задокументированных в книге Тома Вулфа «Электропрохладительный кислотный тест» (The Electric Kool-Aid Acid Test). Бранд был важным связующим звеном между миром ученых Минского и контркультурой. «Мы подобны богам и можем наловчиться быть ими» – гласит первая строчка, написанная им в Каталоге всей Земли в 1968 г.[59] Эта книга стала вдохновением практически для всех зачинателей интернета – от Стива Джобса до технотитана Тима О’Райли. Создавая первые электронные доски сообщений, разработчики пытались воплотить открытую культуру рекомендаций и комментариев, процветавшую на последних страницах каталога, где читатели записывали вопросы, заметки и секреты жизни в коммунах. В книге «От контркультуры к киберкультуре: Стюарт Бранд, Всемирная сеть и развитие цифрового утопизма» (From Counterculture to Cyberculture: Stewart Brand, the Whole Earth Network, and the Rise of Digital Utopianism) Фред Тернер писал, что Бранд стоял почти за всеми ранними разработками интернета. Колонизация космоса? В 1970-х гг. Бранд уже размышлял об этом в журнале CQ, который он основал после выхода каталога и который стал предтечей культового журнала о технологиях Wired, который также основал Бранд. «Для читателей CQ колонизация космоса стала риторическим прообразом. Это позволило бывшим Новым коммуналистам перенести их чаяния общинной жизни к тем же самым крупномасштабным технологиям, характеризующим технократию времен холодной войны, которую они стремились подорвать. Мечты о коллективном трансцендентном сознании порождали представления о беспроблемном взаимодействии в технологически обусловленном пространстве. Через 10 лет эти мечты появятся вновь в виде идеи о киберпространстве, технотронном фронтире, по мере чего они помогут сформировать общественное восприятие компьютерных сетевых технологий»[60].
Минский и Бранд были близкими друзьями. Минский является центральной фигурой книги «Медиалаборатория». Амбициозность, любопытство и страсть Бранда идеально сочетались с «иконоборческой бандой хакеров» Минского. Вспоминая Каталог всей Земли, Бранд писал: «Когда новые левые взывали к политической воле народа, Каталог всей Земли избегал политики и раскрывал непосредственную силу и знания людей. Когда хиппи нью-эйдж оплакивали интеллектуальный мир бесплодных абстрактных конструкций, проект поддерживал науку, критический порыв, новые и старые технологии. В результате оказалось, что Каталог всей Земли был у истоков развития инструмента, наделяющего всех небывалой силой, – персональных компьютеров (коим сопротивлялись и новые левые и коих презирала Новая эра)»[61].
Бранд, выпускник Эксетера и Стэнфорда, чей отец был разработчиком в МТИ, ждал появления персональных компьютеров, для него это было светлое, утопическое будущее[62]. В 1985 г. он запустил первое онлайн-сообщество Whole Earth eLectronic Link (WELL), где техноиндустрия выработала свои политические принципы – либертарианство. Паулина Борсук описала либертарианский поворот в техноиндустрии в книге «Киберэгоистичность: Критическая возня в контексте жутко либертарианской технокультуры» (Cyberselfish: A Critical Romp through the Terribly Libertarian Culture of High Tech). Ядовитая форма философского технолибертарианства проникла в самое сердце онлайн-сообществ, которые более прочих настаивали на так называемой ими «свободе высказывания» и радикальном индивидуализме. Подобные сентенции процветали на досках объявлений, а в 2017 г. они процветали на «краснопилюльных»[63] форумах Reddit и в дарквебе. Борсук пишет: «Все это свидетельствует об утере связи между людьми и дискомфорте от того, что многие из нас понимают под человечностью. Это неспособность сочетать индивидуальные потребности и необходимость быть частью сообщества, которая прекрасно стыкуется с предпочтением и даже восхвалением роли единоличного командующего собственного компьютера и отказа от каких бы то ни было иных экономически состоятельных практик. Ведь компьютеры работают только по правилам, их можно контролировать, проще починить и гораздо легче понять, чем любого из людей»[64]. Это что-то вроде той самой социальной странности Тьюринга, разве что политизированной и усиленной.
Идеологический отказ активистов киберпространства от хиппи-культуры в пользу антигосударственных идей проиллюстрирован в «Декларации независимости киберпространства», опубликованной в 1996 г. автором текстов группы Grateful Dead Джоном Перри Барлоу. «Правительства индустриального мира, вы, изнывающие от скуки гиганты из плоти и стали, я пришел к вам из Киберпространства, нового пристанища разума, – пишет Барлоу. – От лица будущего я требую оставить нас в покое. У вас нет власти в нашем пристанище. У нас нет избранного правительства, и мы не желаем его»[65]. Благодаря дискуссиям, в которых он участвовал на форумах WELL, Барлоу также открыл либертарианский Фонд электронного фронтира (Electronic Frontier Foundation), защищающий хакеров.
Затем появился Питер Тиль, очередной выпускник Стэнфорда и либертарианец, основатель PayPal, один из первых инвесторов Facebook и основатель компании Palantir, финансируемой ЦРУ. Он никогда не скрывал своей неприязни к властным структурам и вопросам гендерного равноправия. В эссе для журнала Cato Unbound он пишет: «Начиная с 1920-х гг. существенное увеличение числа получающих пособие и расширение прав женщин – две печально известные и неподдающиеся либертарианцам силы – превратили понятие “капиталистической демократии” в оксюморон». Тиль, как и Барлоу, считает киберпространство страной без государственности: «Поскольку в мире не осталось по-настоящему свободных мест, полагаю, придется спасаться средствами прежде неопробованными, которые приведут нас в ранее неизвестные места; по этой причине я сосредоточил свое внимание на новых технологиях, которые как раз способны создать это новое пространство свободы»[66]. Питер Тиль поддерживал и был советником президентской кампании Дональда Трампа и финансировал судебный процесс против таблоида Gawker. В книге «Двигайся быстро и круши» (Move Fast and Break Things) Джонатан Таплин, почетный директор Инновационной лаборатории Аннерберга, исследует, как распространяется влияние Тиля на Кремниевую долину посредством его «мафии PayPal», других венчурных инвесторов и топ-менеджеров, принявших анархо-капиталистическую философию[67].
Когнитивные психологи задаются вопросом, почему обеспеченные люди вроде Тиля серьезно относятся к пришельцам и идеям вроде систейдинга. Пол Слович, эксперт в области оценки рисков, уверен, что у людей бывают когнитивные искажения, связанные с пространствами экспертизы. Мы склонны предполагать, что если человек является экспертом в чем-либо, то его экспертные знания автоматически распространяются и на все прочие области[68]. Поэтому люди уверены: если Тьюринг был гением математики, то он был прав и в своих соображениях о том, как устроено общество. Это особенно проблематично сегодня, в эпоху узкоспециализированного труда. Хорошо разбираться в компьютерах не значит разбираться в людях. И не стоит спешить делегировать принятие решений вычислительным системам, созданным людьми, которых не волнуют культурные системы (в которые мы встроены).
Сплетение предрассудков белых мужчин с мифом о гениях в области точных наук еще более губительно. Даже сегодня женщин и небелых реже признают математическими или технологическими гениями. В 2015 г. профессор Принстона С.-Дж. Лесли вместе с коллегами изучил стереотипы о способностях, то есть что предпочитает академическое сообщество – гениальность и ум либо эмпатию и работоспособность. Они пишут: «В пространстве академической культуры женщины представлены гораздо меньше там, где голый талант является залогом успеха, поскольку считается, что женщины априори менее одарены. Эта гипотеза распространяется и на слабую представленность афроамериканцев, поскольку эта группа является жертвой того же стереотипа»[69].
Гендерные стереотипы повсеместны для точных наук. Сама культура в этих науках устроена так, чтобы «навязывать маскулинизированные нормы и ожидания, ограничивающие исследовательские практики», пишут Шейн Бен, Хизер Ленч вместе с коллегами в статье 2015 г. «Дисциплинарные нормы точных наук предписывают ученым быть решительными, методичными, объективными, безэмоциональными, конкурентоспособными и настойчивыми – все эти характеристики ассоциируются с мужчинами и мужественностью, и женщины их считают прямо противоположными себе и убеждены, что точные науки не для них… чем больше женщины воспринимают среду (например, класс информатики) маскулинной, тем меньший, по их словам, интерес вызывает конкретное профессиональное пространство»[70].
Ситуация, описанная Бенч с коллегами, кажется актуальной и для кафедры математики Гарварда, альма-матер Минского. «Нынешние и бывшие студенты и члены кафедры – мужчины и женщины – говорят, что недостаток женщин среди преподавателей и студентов обескураживает абитуриентов, – пишет Ханна Натансон в статье Harvard Crimson в 2017 г. – На кафедре женщинам нередко советуют выбирать более легкие предметы; кроме того, взаимодействие кафедры со студентами и простое общение заставляют женщин чувствовать себя некомфортно, ощущать себя центром притяжения излишнего внимания»[71]. На кафедре математики Гарварда также нет ни одной женщины на руководящей должности. Впервые кафедра присвоила женщине звание профессора – высшее в академической системе – лишь в 2009 г. Затем сотрудница перешла в Принстон. После этого только трем женщинам предложили бессрочный контракт профессора, все три отказались.
Бенч с коллегами также описывают, как «позитивная дискриминация» способствует расширению гендерной пропасти в точных науках. В рамках своего исследования они предложили испытуемым – мужчинам и женщинам – пройти математический тест и затем спросили, как те, по собственному мнению, справились. Когда исследователи проверили тест и сверились с тем, как испытуемые оценили свои работы, оказалось, что мужчины уверенно полагали, что справились лучше, чем на самом деле. «Подобная переоценка результатов объясняется их бо́льшим, чем у женщин, стремлением заниматься математикой, – пишут Бенч с коллегами. – Результаты исследования показывают, что гендерная пропасть в точных науках, вероятно, обусловлена не тем, что женщины трезво оценивают свои возможности, но тем, что мужчины переоценивают свои».
В итоге мы имеем небольшую группу мужчин, переоценивающих свои математические способности, которые систематически не допускали и игнорировали женщин и людей с небелым цветом кожи, веками занимаясь разработкой машин. Группу мужчин, желающих превратить научную фантастику в реальность, которые не слишком заботятся о социальных нормах и не верят, что общественные нормы и правила применимы к ним. Тех, кто, прохлаждаясь, не успевает тратить выделяемые государством средства. Тех, кто также с радостью принял идеологическую риторику крайне правых либертарианских анархо-капиталистов.
Что же пошло не так?
7
Машинное обучение: DL на ML
Чтобы сделать мир технологий справедливее, необходимо привлечь больше разнообразных мнений при создании технологий. Добиться этого можно посредством банального сокращения количества преград, а также решения проблем а-ля «протекающий трубопровод», заставляющих профессионалов средней руки отказываться от дальнейшего карьерного роста. Мне также кажется, что поможет нестандартное решение: разобраться с нюансами обсуждения цифрового мира. Иллюстрирует сложность обсуждения информатики веб-комикс xkcd Рэнделла Манро. На одной из картинок женщина сидит за компьютером, мужчина стоит позади нее:
– Приложение должно проверять, действительно ли пользователь находится в национальном парке, когда делает фотографию, – говорит мужчина.
– Разумеется, простой запрос в ГИС, – отвечает женщина. – Дай мне несколько часов.
– И проверь, есть ли на фотографии птица, – продолжает мужчина.
– Для этого мне понадобится команда исследователей и пять лет.
«В компьютерном мире бывает непросто объяснить разницу между простым и невозможным в виртуальном мире» – гласит подпись к комиксу[72].
Поскольку сложно объяснить, почему компьютер затрудняется распознать птицу на изображении или отличить попугая от гуакамоле, нужно больше людей (может, дата-журналистов?), способных перевести сложные технологические темы на простой язык, демистифицировать потайные уголки мира ИИ.
Из-за этих нюансов появилась путаница. На протяжении всей книги мы возвращаемся к идее, что компьютеры отлично справляются с одними задачами и совершенно неприменимы к другим, а социальные проблемы начинаются тогда, когда люди не могут оценить, насколько корректно компьютер выполняет задачу. Движение по комнате, на полу которой разбросаны игрушки, – простейшая задача для человека и очень сложная для компьютера – классический пример моего тезиса. Ребенок, только что научившийся ходить, может пройти по этой комнате, не задев игрушки (если, конечно, решит, что их задевать не стоит). Робот не может этого сделать. Чтобы робот смог пройти по такой комнате, нам нужно запрограммировать его: вписать всю информацию об игрушках и их точные размеры, чтобы он смог вычислить путь. И, если их передвинуть, понадобится обновлять программу. Беспилотные машины, о которых мы поговорим в главе 8, работают примерно как робот в игровой комнате: они постоянно обновляют свою карту мира.
Владельцы питомцев, купившие роботы-пылесосы Roomba, выявили еще кое-какие сложности. Если животное наделает дел на полу, робот непременно развезет их по всему дому. «Честно говоря, мы часто сталкиваемся с этим, – комментирует ситуацию представитель компании-производителя iRobot для Guardian в августе 2016 г. – Мы настоятельно рекомендуем не планировать уборку, если вы знаете, что ваша собака может набедокурить. Поведение животных невозможно точно предсказать»[73].
К счастью, наш повседневный язык позволяет описывать определенные вещи, не называя их конкретно, и я могу использовать эвфемизмы для отвратительных вещей, которые способны вытворить питомцы. Если я скажу, что моя собака чудесная, но при этом гадкая, вы поймете, что я хочу сказать. Вы можете удержать в голове две противоречивые идеи одновременно и способны догадаться о том, что я подразумеваю под гадостью. В математическом языке не существует подобных эвфемизмов, в нем все крайне четко. Например, в программировании имеется концепт под названием переменная. Переменной присваивается определенное значение, например «х=2», а затем ее можно использовать в процедурах. Существует два типа переменных: изменяемые, которые называются собственно переменными, и неизменяемые – константы. И это предельно ясно для программиста: переменная может быть константой. Для непрограммиста такая запись, скорее всего, не слишком понятна: ведь константа противоположна переменной, то есть изменяемое не равно неизменяемому. Это сбивает с толку.
Проблема терминов не нова. Язык эволюционирует вместе с наукой. Например, в биологии клетки называются так, а не иначе, поскольку Роберту Гуку, открывшему их в 1665 г., они напомнили монастырские кельи[74]. Проблема наименования особенно актуальна сегодня, в свете динамичного развития технологий. Нам приходится привыкать к новым компьютерным концептам и внедрять различные устройства поразительно часто. Однако всему этому создатели присваивают имена, основанные на уже существующих объектах или концептах.
И, хотя информатики и математики талантливы в своих областях, они совершенно нечувствительны к особенностям языка. Так что, если что-то требуется назвать, они не будут сильно стараться, пытаясь найти превосходный вариант с идеальными коннотациями, латинскими корнями и прочим. Они просто выбирают название, которое обычно связано с чем-то, что им симпатично. Язык программирования Python был назван в честь комик-группы «Монти Пайтон» («Монти Пайтон» – это пракомедия, как «Звездные войны» – пранарратив). Django, сетевой фреймворк – в честь Джанго Рейнхардта, любимого джаз-гитариста создателя фреймворка. Язык Java – в честь кофе. Язык JavaScript – никак не связанный с Java – к несчастью, тоже был назван в честь кофе.
Лингвистические проблемы стали появляться и по мере того, как термин «машинное обучение» становился частью популярного дискурса. Машинное обучение (ML) предполагает, что каким-то образом компьютер обзавелся субъектностью и разумом, поскольку он «учится», ведь обучение – это слово, которое применяется к разумным существам вроде людей (или частично разумным, например животным). Тем не менее информатики прекрасно понимают, что «машинное обучение» – это скорее метафора, она означает, что машина может улучшать свои показатели при решении запрограммированных, рутинных, автоматизированных задач. Это вовсе не значит, что машина каким-то образом приобретает знания, мудрость или субъектность, несмотря на все то, что подразумевает слово «обучение». Подобная лингвистическая путница лежит в основе большинства ошибочных представлений о компьютерах[75].
Воображение добавляет неразберихи. Ваше понимание феномена искусственного интеллекта зависит от того, каким вы видите будущее. Один из студентов Марвина Минского, Рэй Курцвейл, является сторонником теории сингулярности – гипотезы, согласно которой к 2045 г. человек интегрируется с вычислительными системами. (Курцвейл известен тем, что изобрел музыкальный синтезатор, который звучит как рояль.) Современная научная фантастика охвачена идеей сингулярности. Однажды во время интервью для конференции футуристов меня спросили о теории скрепок: «Что если бы вы изобрели машину, которая хочет делать скрепки, затем научили бы ее хотеть делать что-то другое, а потом машина создала бы множество других машин и они бы захватили мир? Это и есть сингулярность? – спросил интервьюер. – Беспокоит ли вас это?» Это забавно, хотя и бессмысленно. Машину можно просто выключить из розетки. Проблема решена. А еще это чисто гипотетическая ситуация. Она не настоящая.
Как сказал психолог Стивен Пинкер в специальном выпуске журнала IEEE Spectrum (журнала Института инженеров электротехники и электроники), посвященном сингулярности: «Нет ни единой причины верить в скорое приближение сингулярности. Тот факт, что вы можете представить будущее в собственной голове, еще не значит, что оно наступит. Вспомним о купольных городах, передвижениях на реактивных ранцах, подводных городах, зданиях высотой километр и автомобилях на ядерном топливе – все это футуристические фантазии, которые я слышал с детства, так и не ставшие реальностью. Возможность обработки огромных массивов данных непохожа на волшебную пыль, которая внезапно решит все проблемы»[76].
Ян Лекун из Facebook тоже скептично относится к идее сингулярности. В своем комментарии IEEE Spectrum он сказал: «Есть люди, которые ожидаемо раздувают концепт сингулярности, – как Рэй Курцвейл. Он футуролог. Ему нравится позитивный настрой относительно грядущего. Так он продает много книг. Однако, насколько мне известно, он никак не способствовал развитию исследований в области ИИ. Он продавал продукты, основанные на технологии ИИ, некоторые из которых были в известной степени инновационными. Но концептуально не было ничего нового. И, конечно, он не написал ни единой страницы, где бы показал миру, как нам продвинуться в разработке ИИ»[77]. Разумные люди не принимают никаких сценариев будущего – в том числе потому, что никто не может видеть будущее.
Я попытаюсь внести ясность в сложившийся хаос: определим, что такое машинное обучение, и на примере посмотрим, как абсолютно любой человек может его использовать применительно к массиву данных. Я не просто покажу несколько путей использования машинного обучения, но и приведу кусочек кода. Будет много технических деталей, но, если они вас смущают, не переживайте – к ним можно вернуться чуть позже.
Искусственный интеллект оказался на пике популярности в 2017 г., до этого годами длилась «зима ИИ». В 2000-х гг. ИИ попросту игнорировался общественным дискурсом. Поначалу все технологическое внимание и наше коллективное воображение занимал интернет, затем мобильные устройства. В середине 2010-х люди заговорили о машинном обучении. Внезапно ИИ стал горячей темой. Повсюду появились стартапы в этой области. Watson от IBM победил человека в Jeopardy!; алгоритм перехитрил человека в игре го. Даже слова «машинное обучение» звучали круто. Машина может учиться! Надежды сбылись!
И поначалу мне хотелось верить в то, что каким-то гениям удалось решить сложнейшую задачу и заставить машину думать, но, присмотревшись, я поняла, что реальность куда сложнее. В действительности ученые дали машинному обучению новый смысл, соответствующий ему. Они так часто его использовали, что значение действительно изменилось.
Такое случается. Язык – это подвижная структура. Хороший тому пример – слово literally (буквально), которое обычно было антонимом к слову figuratively (фигурально)[78]. В 1990-е гг., если бы вы сказали что-то вроде «Мой рот буквально горел после этого перца чили», это бы означало, что у вас во рту случился реальный пожар и из-за ожогов третьей степени вам пришлось говорить прямо из реанимационного отделения. Однако в 2000-х люди стали повсеместно использовать это слово как синоним «фигурально» и для усиления эффекта. «Я буквально бы убил кого-нибудь, если бы пришлось снова слушать песню Джона Майера» стали интерпретировать как «Я бы предпочел не слушать песню Джона Майера снова», а не предупреждение о готовящемся убийстве или беспорядках.
Согласно Оксфордскому словарю, термин «машинное обучение» вошел в массовый вокабуляр в 1959 г. А начиная с 2000-х гг. и третьего издания словаря термин стали включать целиком как словосочетание. Оксфордский словарь определяет машинное обучение как:
Машинное обучение – сущ. Вычислительная возможность компьютера к обучению на основе опыта, а именно к изменению работы в соответствии с вновь полученной информацией.
1959 г. Журнал записей IBM 3 211/1. В нашем распоряжении есть компьютеры с адекватными возможностями для обработки данных и скоростью работы, достаточной для применения техник машинного обучения.
1990 г. Журнал New Scientist от 8 сентября 78/1. Когда Даг Ленам из Стэнфорда разработал Eurisko, систему машинного обучения второго поколения, ему казалось, что он создал настоящий интеллект[79].
Это определение справедливо, но не слишком точно улавливает актуальные представления ученых о машинном обучении. Так, более релевантное определение можно найти в Оксфордском словаре по информатике:
Машинное обучение
Ответвление исследовательской области искусственного интеллекта, посвященное разработке программ, обучающихся на основе опыта. Обучение может принимать различные формы – от обучения на примерах и обучения на основе аналогии до автономного постижения концепций и обучения посредством находок.
Инкрементное обучение подразумевает непрерывное улучшение за счет вновь поступающих данных – обучение по одному примеру или пакетное обучение. Существует различение двух стадий – стадии обучения и применения.
Обучение с учителем предполагает явное указание принадлежности вводимых данных классам, которые требуется выучить.
Большинство методов обучения имеет тенденцию к генерализации, что позволяет системе развивать эффективную и качественную структуру репрезентации для больших массивов тесно связанных друг с другом данных[80].
Это уже ближе, но все еще не совсем точно. Документация к scikit-learn, популярной библиотеке для машинного обучения на языке Python, определяет машинное обучение иначе: «Машинное обучение заключается в усваивании системой ряда особенностей массива данных и последующем применении их к новому массиву. Поэтому в области машинного обучения существует распространенная практика разделения имеющегося массива данных на две части – обучающей выборки, на основе которой характеристики выучиваются, и тестовой выборки, на базе которой проверяется результат обучения»[81].
Подобное расхождение источников относительно определения феномена – редкость. Например, в определении слова «собака» вполне сходится множество источников. В то же время «машинное обучение» – достаточно новый феномен, потому неудивительно, что пока не сложилось его общепринятое определение и лингвистика до него еще не добралась.
Том М. Митчелл, профессор кафедры машинного обучения в Школе компьютерных наук Университета Карнеги – Меллона, предлагает неплохое определение машинного обучения в книге «Наука машинного обучения» (The Discipline of Machine Learning). Он пишет: «Мы считаем, что машина обучается с учетом конкретной задачи Т, системы оценки эффективности Р для конкретной задачи, основываясь на опыте Е. В зависимости от того, как мы определяем Т, Р, и Е, задачу обучения можно назвать добычей данных, автономными исследованиями, обновлением базы данных, программированием на основе примеров и т. д.»[82]. Это определение кажется мне подходящим потому, что Митчелл использует конкретные термины для определения феномена обучения. «Обучение» машины вовсе не означает, что у нее есть металлические «мозги». Это значит, что в выполнении конкретной задачи она стала точнее – в соответствии с метрикой, определенной человеком.
Для такого обучения не нужен интеллект. Программист и консультант Джордж М. Невилл-Нил пишет в журнале Communications of the ACM:
Мы – свидетели более чем 50-летнего сражения человека и машины в шахматы, но означает ли это, что у компьютеров появился разум? Нет, и тому есть две причины. Первая заключается в том, что шахматы не призваны проверять наличие разума; в рамках этой игры исследуется определенный навык – умение играть в шахматы. Если бы я мог обыграть гроссмейстера, но при этом не был бы способен передать вам за столом соль, обладаю ли я разумом? Вторая причина заключается в том, что уверенность, будто игрой в шахматы можно проверить интеллектуальные способности, является культурным заблуждением, согласно которому игроки в шахматы – в отличие от остальных людей – гениальны[83].
Существует три ключевых типа машинного обучения: обучение с учителем, обучение без учителя и обучение с подкреплением. Привожу определения для каждого типа, предлагаемые в известной книге под названием «Искусственный интеллект: Современный подход» (Artificial Intelligence: A Modern Approach), написанной профессором Калифорнийского университета в Беркли Стюартом Расселом и директором исследовательского отдела Google Питером Норвигом:
Обучение с учителем: компьютеру представляют пример входных данных и желаемый итог их обработки, то есть дают задание, задача программы состоит в том, чтобы изучить основные закономерности, стоящие за решением.
Обучение без учителя: программе не дают никаких итоговых результатов, предоставляя возможность самостоятельно выявить структуру входных данных. Обучение без учителя может быть как самоцелью (выявить неявные закономерности в данных), так и ступенью в обучении.
Обучение с подкреплением: компьютерная программа с определенной задачей взаимодействует с динамичной средой (целью может быть управление транспортным средством или победа в игре). По мере продвижения в пространстве задач программе представляется обратная связь – награда или наказание[84].
Обучение с учителем – наиболее простой вариант: машине предоставляется набор обучающих данных и соответствующие ему ожидаемые результаты. По сути, мы говорим машине, что хотим от нее в итоге, затем настраиваем модель до тех пор, пока не получим то, что полагаем верным.
Все три типа машинного обучения зависят от набора обучающих данных, необходимого для использования и подстройки модели обучения. Предположим, мой массив состоит из данных 100 000 владельцев кредитных карт. Он содержит все то, что кредитная компания знает о клиентах: имя, возраст, адрес, кредитную оценку заемщика, кредитную ставку, состояние счета, имена всех подписантов договора, выписку со счета, выписку времени и сумм погашения кредита. Допустим, с помощью нашей модели машинного обучения мы хотим предсказать, кто с большей вероятностью просрочит очередной платеж. Это нужно сделать потому, что после каждого просроченного платежа повышается процентная ставка по кредиту. В массиве обучающих данных есть колонка, где обозначены те, кто задерживал платеж. Мы делим наш массив на две части по 50 000 аккаунтов в каждом – на обучающую и тестовую выборки. Затем запускаем алгоритм машинного обучения на первом наборе, чтобы выстроить модель, черный ящик, который предскажет то, что мы и так знаем. Мы можем применить эту же модель к оставшимся данным и получить прогнозы о том, кто вероятнее всего опоздает с платежом. Наконец, мы сравниваем полученные прогнозы с реальными данными о просроченных платежах. Это позволяет выявить точность прогностической модели. И, если мы как разработчики нашей модели машинного обучения решим, что она достаточно точна, мы можем применить ее к прогнозированию платежей реальных заемщиков.
Существует ряд алгоритмов машинного обучения, доступных для применения к наборам данных. Возможно, вы уже слышали такие названия, как «метод лесов случайных деревьев», «древо решений», «метод ближайших соседей», «наивный байесовский классификатор» или «скрытая марковская модель». Прекрасное объяснение этих методов обнаруживается в книге Кэти О’Нил «Убийственные большие данные» (Weapons of Math Destruction)[85]. О’Нил пишет, что мы постоянно и бессознательно выстраиваем модели. Когда я решаю, что приготовить на ужин, я конструирую модель: что осталось в холодильнике, какие блюда я могу из этого приготовить, кто будет ужинать вместе со мной (обычно мы ужинаем с мужем и сыном) и что они любят есть. Я оцениваю каждое блюдо и вспоминаю, как его оценили в прошлом – какое блюдо и у кого заслужило просьбы о добавке и какие ингредиенты находятся в списке отвергаемой пищи: кешью, замороженные овощи, кокос, мясные субпродукты. Принимая решения об ужине на основе того, что у меня есть в холодильнике, я оптимизирую варианты. Создание модели на языке математики предполагает формализацию свойств и вариантов выбора[86].
Скажем, я хочу заняться машинным обучением. Первым делом мне нужен массив данных. Для отработки моделей машинного обучения доступно множество интересных массивов, собранных в онлайн-хранилищах. Есть массивы выражений лиц, домашних животных и видео YouTube. Есть массивы электронных писем, отправленных людьми, работавшими в обанкротившейся компании (Enron), конференций 1990-х гг. (Usenet), массивы сетей онлайн-дружбы из социальных сетей (Friendster), массивы данных о фильмах, просмотренных на различных сервисах (Netflix), данные произнесения общеупотребимых фраз с разными акцентами и массивы неразборчивых почерков. Эти данные собирались корпорациями, сайтами, университетскими учеными, добровольцами и из архивов ныне закрытых компаний. Эти небольшие характерные массивы данных опубликованы онлайн, и именно они формируют каркас современного ИИ. Вы наверняка можете найти там и свои данные. Моя подруга однажды обнаружила себя в видео в ясельном возрасте в архиве бихевиористов: ее мать участвовала в исследовании взаимодействия родителей и детей. Для построения умозаключений о мире исследователи до сих пор обращаются к тому видео.
А теперь выполним классическое практическое упражнение: при помощи машинного обучения предскажем, кто выжил во время крушения «Титаника». Представим, что происходило на корабле сразу после столкновения с айсбергом. Уже видите Леонардо Ди Каприо и Кейт Уинслет, скользящих по палубам корабля? Это неправда – но оживляет воображение, если вы смотрели фильм столько же раз, сколько и я. Вероятнее всего, вы видели фильм «Титаник» хотя бы раз. По итогам проката фильм заработал $659 млн в США и $1,5 млрд во всем мире, что делает его величайшим и вторым самым кассовым фильмом в истории. (Джеймс Кэмерон, режиссер «Титаника», также автор самого кассового фильма в истории – «Аватара».) Его крутили в кинотеатрах в течение почти что года, в том числе потому, что молодые люди приходили смотреть его снова и снова[87]. Фильм «Титаник» стал частью нашей коллективной памяти подобно крушению настоящего «Титаника». Наш мозг нередко путает реальные события с реалистичной выдумкой. Досадно, но это нормально. Из-за путаницы усложняется восприятие риска.
Мы делаем выводы на основе эвристик, неформальных правил. На эти эвристики влияют эмоционально насыщенные истории, которые к тому же легко запомнить. Например, на колумниста The New York Times Чарльза Блоу в детстве напала злая собака, содрав почти всю кожу с лица. И, будучи взрослым, вспоминает Блоу в мемуарах, он весьма настороженно относился к незнакомым собакам[88]. Что очевидно. Нападение крупного животного на человека в детстве становится травматичным опытом, и, конечно, воспоминания об этом всплывают каждый раз, когда человек видит собаку. Читая книгу Блоу, я сопереживала маленькому мальчику, была напугана вместе с ним. На следующий день после прочтения мемуаров в парке рядом с моим домом я увидела мужчину, выгуливающего собаку без поводка. Я тут же подумала о Блоу и о том, насколько тем, кто боится собак, некомфортно видеть собаку без поводка. Я подумала о том, что случится, если собака вдруг разозлится. История повлияла на то, как я оцениваю риск. Те же закономерности мышления приводят к тому, что после просмотра выпусков «Закон и порядок: Специальный корпус» (Law & Order: SVU) многие закупаются перцовыми баллончиками или после просмотра фильма ужасов проверяют заднее сиденье машины на предмет неприятных сюрпризов. Это явление специалисты называют эвристикой доступности[89]. Первыми приходят на ум истории, которые мы либо считаем наиболее важными по той или иной причине, либо часто с нами случаются.
Возможно, как раз из-за того, что крушение «Титаника» глубоко укоренилось в нашей коллективной памяти, эту историю отрабатывают в рамках практики машинного обучения. В частности, список пассажиров «Титаника» используется для того, чтобы на основе этих данных студенты научились генерировать прогнозы. Упражнение всегда работает, поскольку почти все студенты видели фильм или знают о катастрофе. Кроме того, здорово, что не приходится тратить время на прояснение исторического контекста, можно переходить сразу к интересной работе с прогнозированием.
Я хочу провести вас через увлекательную часть при помощи обучения с учителем. Мне кажется важным видеть в точности то, как обучается машина. Кроме того, если хотите выполнить упражнение самостоятельно, в сети можно найти достаточно сайтов с уроками по машинному обучению. Я собираюсь предложить вам упражнение с платформы DataCamp. Согласно Kaggle, эта платформа – первый шаг для тех, кто хочет включиться в рынок труда аналитики данных[90]. Kaggle, принадлежащий родительской компании Google Alphabet, – это сайт, где люди соревнуются между собой, стремясь набрать наибольшее число очков за анализ массива данных. Аналитики данных участвуют в соревнованиях в составе команд, оттачивая собственные навыки и практики взаимодействия. Этот сайт также полезен с точки зрения обучения студентов анализу данных или для поиска массивов данных.
Чтобы пройти урок DataCamp о крушении «Титаника», мы обратимся к языку Python и нескольким его популярным библиотекам: pandas, scikit-learn и numpy. Библиотека – это небольшой набор функций, выложенный где-то на просторах интернета. Импортируя библиотеку, мы делаем функции доступными для программы, которую пишем. Можно представить ее в виде настоящей библиотеки. Я состою в системе Нью-Йоркской публичной библиотеки. Если я еду куда-то больше чем на неделю, стараюсь получить карту посетителя в местной библиотеке. И пока я являюсь членом местной библиотеки, я могу обращаться как к основным ресурсам Нью-Йоркской библиотеки, так и к уникальным источникам местной. На языке Python у нас есть ряд встроенных функций: они – Нью-Йоркская библиотека. Импорт новой библиотеки подобен регистрации в локальной библиотеке. Так, наша программа может использовать как ключевые функции из базовой библиотеки Python, так и замечательные функции с открытым кодом (open-source), написанные учеными и разработчиками, которые как раз и опубликовали, например, библиотеку scikit-learn.
Библиотека pandas, которую мы также будем использовать, имеет контейнер DataFrame, который «вмещает» набор данных. Такой тип пакета также называют объектом, как в объектно-ориентированном программировании. Объект – это такой же общий термин в программировании, как и в обычной жизни. В программировании объект – концептуальная обертка небольшого набора данных, переменных и кода. Таким образом, маркер объект становится для нас первой точкой опоры. Нам необходимо представить наш набор битов как нечто упорядоченное, о чем можно размышлять и говорить.
Во-первых, разделим наш набор данных пополам: на данные для обучения и на тестовые данные. Мы разработаем и обучим модель на данных для обучения и затем проверим на тестовом наборе. Помните, какой из двух ИИ тут работает – общий или слабый? Слабый. Итак, начнем:
import pandas as pd
import numpy as np
from sklearn import tree, preprocessing
Мы только что импортировали необходимые нам библиотеки. Каждой библиотеке мы дали собственные названия – pd для pandas, np для numpy. Теперь у нас есть доступ ко всем функциям обеих библиотек, и мы можем решить, какие из них нам нужны. Из библиотеки scikit-learn мы возьмем только две: первая называется tree, вторая – preprocessing.
Затем импортируем данные из файла. CSV (comma-separated values), который также можно найти в интернете. В частности, нужный нам. CSV-файл находится на сервере Web Services (AWS), принадлежащем Amazon. Нам это известно потому, что ссылка файла (которая начинается с http://) выглядит как s3.amazonaws.com. Файл. CSV представляет собой структурированные данные, где каждая колонка отделена запятой. Мы скачаем с AWS два файла с данными о «Титанике» – обучающий и тестовый, и они оба будут в формате. CSV. Импортируем их:
train_url =
«http://s3.amazonaws.com/assets.datacamp.com/course/Kaggle/train.csv»
train = pd.read_csv (train_url)
test_url = «http://s3.amazonaws.com/assets.datacamp.com/course/Kaggle/test.csv»
test = pd.read_csv (test_url)
pd.read_csv () означает «Пожалуйста, выполни функцию read_csv (), которая обитает в библиотеке pd (pandas)». Фактически мы только что создали DataFrame (структуру данных) и обратились к одной из встроенных функций. Итак, теперь данные импортированы в виде двух наборов – обучающего и тестового. Мы используем данные переменной train, чтобы создать модель, и затем при помощи переменной test протестируем ее точность.
Посмотрим, что в заголовках первых строк обучающего набора данных:
print (train.head ())
Итак, перед нами данные в 12 колонках: PassengerId, Pclass, Name, Sex, Age, SibSp, Parch, Ticket, Fare, Cabin, и Embarked. Что же это все означает?
Чтобы ответить на этот вопрос, нам понадобится словарь данных, который обычно имеется в каждом пакете данных. Заглянув в него, мы выясняем:
Pclass = пассажирский класс (1 = 1-й; 2 = 2-й; 3 = 3-й)
Survived = выжил (0 = нет; 1 = да)
Name = имя
Sex = пол
Age = возраст (в годах жизни; выражен дробью, если возраст меньше единицы (1), если данные приблизительны, они выражены в виде хх.5)
SibSp = количество родственников / супругов на борту
Parch = количество родителей / детей на борту
Ticket = номер билета
Fare = пассажирский тариф (до 1970-го считались в британских фунтах)
Cabin = номер каюты
Embarked = в каком порту сел (а) на борт корабля (C = Чербург; Q = Квинстаун; S = Саутгемптон)
В большинстве колонок есть информация, в иных – нет. Так, например, у пассажира с идентификатором 1, мистера Оуэна Харриса Брода, в графе «Номер каюты» зафиксировано значение NaN, что означает «нечисленное выражение». NaN также не равняется нулю, поскольку 0 – это число. Таким образом, NaN подразумевает, что для этой переменной отсутствует значение. В обычной жизни разница может быть несущественной, однако она принципиально важна для компьютерных вычислений. Вспомните, насколько точность важна для языка математики. Например, значение NULL – пустое множество, оно не синонимично NaN или нулю.
Посмотрим на первые строки тестового пакета данных:
print (test.head ())
Как мы видим, в пакете тестовых данных все те же графы, что и в обучающем, с той лишь разницей, что нет информации о выживших. Хорошо! Наша задача заключается в том, чтобы создать в тестовом пакете колонку Survived («Выжил»), в которой будут содержаться прогностические данные о каждом пассажире. (Конечно, кому-то уже может быть известен результат, но, если бы у нас на руках уже были ответы, это не было бы похоже на упражнение, не так ли?)
Итак, теперь нам предстоит запустить на обучающем наборе сводную статистическую обработку – это позволит лучше понять имеющуюся информацию. Интервьюирование данных – так мы это называем в дата-журналистике. По сути, мы «опрашиваем» данные так же, как опрашивали бы человека, у которого есть имя, возраст, собственная история. В свою очередь, у пакета с данными есть размер и набор колонок. Выяснение среднего значения колонки с данными напоминает ситуацию, в которой мы попросили бы человека написать его фамилию.
Ближе познакомиться с нашими данными мы можем при помощи функции под названием describe – она собирает сводные данные и формирует их в удобную таблицу:
train.describe ()
В пакете тренировочных данных содержится 891 запись. В 714 из них содержатся данные о возрасте пассажира. Согласно имеющимся у нас данным, средний возраст пассажира – 29,699118 лет; обычный человек сказал бы, что средний возраст пассажира составляет около 30.
Некоторые представленные данные требуют дополнительного пояснения: минимальное значение в колонке Survived составляет 0, максимальное – 1. Другими словами, это булевы значения: либо кто-то выжил (1), либо нет (0). Таким образом мы можем посчитать среднее значение – 0,38. Мы также можем посчитать среднее значение Pclass, пассажирского класса. Также цены билетов для 1-го, 2-го и 3-го класса. Здесь среднее значение не означает буквально, что кто-то путешествовал классом 2,308.
Выяснив кое-что о данных, которыми мы располагаем, обратимся к анализу. Посчитаем прежде всего количество пассажиров: для этого мы можем воспользоваться функцией value_counts. Она покажет, каково количество значений переменных для каждой категории в колонках. Иначе говоря, мы выясним, сколько пассажиров путешествовало каждым классом. Выясним:
train [ «Pclass»].value_counts ()
1 216
2 184
3 491
Name: Pclass, dtype: int64
Согласно обучающим данным, 491 пассажир путешествовал 3-м классом, 184 человек было во 2-м и 216 – в 1-м.
Теперь посмотрим на число выживших:
train [ «Survived»].value_counts ()
0 549
1 342
Name: Survived, dtype: int64
Обучающие данные показывают, что 549 человек погибли, 342 – выжили.
Посмотрим теперь на данные в процентном соотношении:
print (train [ «Survived»].value_counts (normalize = True))
0 0.616162
1 0.383838
Name: Survived, dtype: float64
62 % пассажиров погибли, 38 % остались в живых. Большинство погибло в крушении. Если бы мы собирались прогнозировать выживание случайного пассажира из нашего списка, то с бо́льшей вероятностью программа бы выдала отрицательный ответ.
И можно было бы закончить на этом, ведь мы только что пришли к выводу, позволяющему сделать вполне логичные прогнозы. Но мы можем больше, так что продолжим. Есть ли какие-либо факторы, с помощью которых мы могли бы уточнить наш прогноз? Ведь кроме данных выживших у нас есть информация о классе пассажиров, имена, пол, возраст, данные о родственниках и членах семьи на борту, стоимость их билетов, номера кают и города отправления.
Pclass – лакмусовая бумажка, отражающая социоэкономический статус пассажира, подходит в качестве прогностической характеристики. Можно догадаться, что пассажиры первого класса оказались в спасательных шлюпках раньше пассажиров 3-го класса. Пол также является важным предиктором, ведь нам известно, что во время кораблекрушений работает принцип «женщин и детей спасать в первую очередь». Он восходит к 1852 г., когда транспортно-десантный корабль Британских ВМС сел на мель у побережья Южной Африки. Этот принцип работает не всегда, но часто, поэтому для социального анализа мы учитываем его.
Теперь проведем несколько сравнений и посмотрим, сможем ли мы обнаружить другие переменные, в потенциале обладающие предсказательной силой:
# Выжившие и погибшие пассажиры
print (train [ «Survived»].value_counts ())
0 549
1 342
Name: Survived, dtype: int64
# В пропорции
print (train [ «Survived»].value_counts (normalize = True))
0 0.616162
1 0.383838
Name: Survived, dtype: float64
# Мужчины выжившие и погибшие
print (train [ «Survived»] [train [ «Sex»] = ‘male’].value_counts ())
0 468
1 109
Name: Survived, dtype: int64
# Женщины выжившие и погибшие
print (train [ «Survived»] [train [ «Sex»] = ‘female’].value_counts ())
1 233
0 81
Name: Survived, dtype: int64
# Усредненное выживание мужчин
print (train [ «Survived»] [train [ «Sex»] = ‘male’].value_counts (normalize=True))
0 0.811092
1 0.188908
Name: Survived, dtype: float64
# Усредненное выживание женщин
print (train [ «Survived»] [train [ «Sex»] = ‘female’].value_counts (normalize=True))
1 0.742038
0 0.257962
Name: Survived, dtype: float64
Мы видим, что 74 % женщин и 18 % мужчин выжили. Так мы можем еще более точно определить нашу гипотезу, предположив, что, вероятнее всего, в катастрофе выжила бы женщина, а не мужчина.
Помните, что изначально нашей целью было создать колонку данных о выживших? Так вот, на основе новой информации мы можем создать ее и поставить «1» (значит «да, пассажир выжил») напротив тех 74 % женщин и «0» (то есть «нет, пассажир не выжил») у оставшихся женщин. Мы также могли бы поставить «1» у 18 % и «0» у 81 % мужчин.
Однако мы не будем так делать, поскольку это означало бы, что мы совершаем поверхностные предположения на основе только лишь пола. Известно, что в данных можно обнаружить факторы, существенно влияющие на результаты. (Если же вам действительно интересна внутренняя кухня этих процессов, я советую найти это упражнение на DataCamp либо что-то подобное в интернете.) А как насчет женщин, путешествующих третьим классом? Или первым классом? Женщин с детьми? И вот уже ручной подсчет кажется весьма трудоемким, потому давайте научим нашу модель, опираясь на известные факторы, угадывать за нас.
Для этого нам понадобится алгоритм decision tree. Помните, в машинном обучении существуют весьма полезные базовые алгоритмы? У них есть названия, такие как «дерево решений» (decision tree), «случайный лес» (random forest), «искусственная нейронная сеть» (artificial neural network), «наивный байесовский классификатор» (naive Bayes), «метод k ближайших соседей» (k-nearest neighbor) или «глубокое обучение» (deep learning). Список алгоритмов машинного обучения, представленный в Википедии, достаточно полный.
Алгоритмы поставляются пользователям в пакетах вроде того, что мы уже использовали, – pandas. На самом деле немногие самостоятельно пишут алгоритмы, гораздо проще воспользоваться уже существующими. Процесс написания алгоритма похож на изобретение нового языка программирования. Это действительно очень важно, кроме того, требует много времени. «Математика, – скажу я и всплесну руками, – это лучшее объяснение того, что задействовано во время разработки алгоритма». Извините. Если хотите знать больше, я советую почитать об этом. Это, конечно, очень интересно, но написание алгоритма не относится к нашим актуальным задачам.
Итак, теперь обучим модель на тренировочном пакете данных. По итогам небольшого исследования нам стало известно, что необходимо учитывать факторы класса и пола. Теперь нам предстоит выстроить догадки о выживших. Пускай модель попробует угадать, а мы затем сравним результаты с реальностью. Независимо от итогового процента мы получим величину точности модели.
Открою вам секрет из мира больших данных: все данные – «грязные». Абсолютно все. Они собраны людьми, подсчитывающими все вокруг, либо посредством сенсоров – тоже созданных людьми. В каждой, казалось бы, упорядоченной колонке чисел присутствует шум, искажения. Это беспорядок. Это незавершенность. Это жизнь. Проблема заключается в том, что некорректные данные не следует учитывать. Больше того, иногда для того, чтобы алгоритмы заработали как надо, нам приходится подправлять данные.
Еще не страшно? Мне было страшно, когда я поняла это. Как журналист я не склонна подправлять что-либо. Мне необходимо проверить каждую строчку и представить подтверждения для проверяющего, редактора, или читателей – однако в машинном обучении приходится частенько делать так, чтобы все сходилось.
К физике это тоже применимо. Например, если нужно измерить температуру в конкретной точке А закрытого контейнера, необходимо измерить температуру в двух равноудаленных точках (В и С) и предположить, что температура в точке А примерно соответствует средней температуре между В и С. В статистике… ну, так это и происходит, а недостаток данных способствует неуверенности в подсчетах. Мы все пользуемся функцией fillna, чтобы заполнить пустующие значения:
train [“Age”] = train [“Age”].fillna (train [“Age”].median ())
Алгоритм не работает при отсутствующих значениях. Поэтому придется исправить ситуацию. Создатели упражнения на DataCamp советуют воспользоваться медианой.
Посмотрим на данные.
# Напечатать данные, чтобы увидеть доступные признаки
print (train)
Если вы прочли все эти сотни строк – браво; если же вы их попросту пропустили, то я не удивлена. Я вывела вам столько строк данных специально, чтобы показать, каково это, быть аналитиком данных. Работа с колонками чисел кажется бессмысленной и иногда весьма утомительной. Есть в работе с данными что-то антигуманное. Непросто каждую секунду помнить о том, что за этим массивом цифр скрываются реальные люди с собственными надеждами, мечтами, семьями и историей.
Итак, мы познакомились с сырыми данными, теперь приступим к их обработке. Превратим их в массивы, структуры, которыми компьютер может манипулировать:
# Задать цели и свойства массивов: target, features_one
target = train [ «Survived»].values
# Предварительная обработка
encoded_sex = preprocessing.LabelEncoder ()
# Преобразование
train.Sex = encoded_sex.fit_transform (train.Sex)
features_one = train [[“Pclass,” “Sex,” “Age,” “Fare”]].values
# Подобрать первое дерево решений: my_tree_one
my_tree_one = tree.DecisionTreeClassifier () my_tree_one = my_tree_one.fit (features_one, target)
Мы только что запустили функцию под названием fit (подборка) на классификаторе, основанном на дереве принятия решений под названием my_tree_one. Признаки, которые мы ходим принять в расчет: Pclass, Sex, Age и Fare. Мы просим алгоритм выяснить, какая существует взаимосвязь между этими четырьмя факторами и целевым полем Survived:
# Посмотрим на значимость и оценку включенных признаков
print (my_tree_one.feature_importances_)
[0.12315342 0.31274009 0.22675108 0.3373554]
Переменная feature_importances показывает статистическую значимость каждого прогностического фактора.
Наибольшее число указывает на наивысшее значение из всей группы:
Pclass = 0,1269655
Sex = 0,31274009
Age = 0,23914906
Fare = 0,32114535
Fare (пассажирский тариф) – самое большое число. Можно сделать вывод, согласно которому стоимость билета была наиболее весомым фактором, повлиявшим на выживание пассажиров во время крушения «Титаника».
На этом этапе работы с данными мы проверим, насколько верны наши оценки с точки зрения математики. Воспользуемся функцией score:
print (my_tree_one.score (features_one, target))
0.977553310887
Ух ты, 97 %! Выглядит впечатляюще. Если бы я получила 97 % на экзамене, я была бы счастлива. Можно сказать, что наша модель точна на 97 %. Машина только что «выучила» процесс создания математической модели. А сама модель хранится в объекте под названием my_tree_one.
Теперь попробуем применить эту модель к тестовому пакету данных. Обратим внимание, что в нем нет колонки с данными о выживших. Наша задача заключается в том, чтобы при помощи созданной модели попытаться выяснить, выжил пассажир либо нет. Нам известно, что наибольшее влияние на результат имеет стоимость билетов, однако пассажирский класс (Pclass), пол (Sex) и возраст (Age) также имеют значение. Применим данные к тестовому пакету и посмотрим, что получится:
# Возместим отсутствующие данные о тарифе с помощью медианных значений
test [ «Fare»] = test [ «Fare»].fillna (test [ «Fare»].median ())
# Возместим отсутствующие данные о возрасте с помощью медианных значений
test [ «Age»] = test [ «Age»].fillna (test [ «Age»].median ())
# Предварительная обработка
test_encoded_sex = preprocessing.LabelEncoder () test.Sex = test_encoded_sex.fit_transform (test.Sex)
# Извлечем необходимые признаки Pclass, Sex, Age, и Fare из тестового набора данных:
test_features = test [[ «Pclass,» «Sex,» «Age,» «Fare»]].values
print (‘These are the features: \ n’)
print (test_features)
# Составим прогноз, используя тестовый набор данных, и выведем результат
my_prediction = my_tree_one.predict (test_features)
print (‘This is the prediction: \ n’)
print (my_prediction)
# Выведем данные в две колонки: PassengerId и прогноз выживания
PassengerId =np.array (test [ «PassengerId»]). astype (int) my_solution = pd.DataFrame (my_prediction, PassengerId, columns = [ «Survived»])
print (‘This is the solution in toto: \ n’)
print (my_solution)
# Проверим, что у нас 418 строк данных
print (‘This is the solution shape: \ n’)
print (my_solution.shape)
# Записать результаты в. CSV-файл my_solution.csv
my_solution.to_csv (“my_solution_one.csv,” index_label = [“PassengerId”])
А вот и результат:
These are the features:
[[3. 1. 34.5 7.8292]
[3. 0. 47. 7.]
[2. 1. 62. 9.6875] …,
[3. 1. 38.5 7.25]
[3. 1. 27. 8.05]
[3. 1. 27. 22.3583]]
This is the prediction:
[0011100010001111011001101011100010100001010110001110111000110001001001100010010110000011111110001110100010000000111011011010010100100100100000000110101001001101111101100001010110110010101000001010100001010000101101001010101110010001001001111110001010100000001000110000000010110000011010001010100010000000110110010011000000011010001011000001000101000110001010010111100010010011000100010100000110010100101000001111001000]
This is the solution in toto:
Survived
892 0
893 0
894 1
895 1
896 1
897 0
898 0
899 0
900 1
901 0
902 0
903 0
904 1
905 1
906 1
907 1
908 0
909 1
910 1
911 0
912 0
913 1
914 1
915 0
916 1
917 0
918 1
919 1
920 1
921 0
…..
1280 0
1281 0
1282 0
1283 1
1284 1
1285 0
1286 0
1287 1
1288 0
1289 1
1290 0
1291 0
1292 1
1293 0
1294 1
1295 0
1296 0
1297 0
1298 0
1299 0
1300 1
1301 1
1302 1
1303 1
1304 0
1305 0
1306 1
1307 0
1308 0
1309 0
[418 rows x 1 columns]
This is the solution shape:
(418, 1)
Новая колонка с информацией о выживших содержит прогностические данные о 418 пассажирах из тестового массива. Можем сохранить полученные результаты в. CSV-файле под названием my_solution_one.csv, загрузить файл на DataCamp и выяснить, что точность наших прогнозов составляет 97 %. Ура! Мы только что обучили машину. И, когда кто-то говорит, что пользовался «искусственным интеллектом для принятия решения», обычно это означает «пользовался машинным обучением» и сделал примерно то же, что и мы сейчас.
Мы создали колонку с данными о выживших и можем с вероятностью 97 % сказать, что результаты точны. Нам удалось выяснить, что стоимость проезда имела критическое значение в случае математического анализа данных о выживших на «Титанике». И это был слабый ИИ. Он оказался совсем не страшным, способным привести нас к предположению, что компьютерный сверхинтеллект захватит мир. «Это всего лишь статистические модели, такие же, какие используют в компании Google для прогнозирования ходов в играх или которые ваш телефон использует, чтобы сделать предположение о том, что именно вы сказали, чтобы перевести голосовой запрос в текст, – именно так описал ИИ Закари Липтон, профессор Университета Карнеги – Меллона для журнала Register. – Они не умнее миски с лапшой»[91].
Программисту легко писать алгоритм: он создается, используется и вроде работает. Никто не отслеживает его работу. Возможно, он попытается усовершенствовать точность прогнозов, слегка изменив параметры. Попытается добиться наилучшего результата. А затем перейдет к другой задаче.
Тем временем во внешнем мире за каждым результатом стоят определенные последствия. И неразумно было бы в действительности полагать, что в морских крушениях выживают те, кто платит больше. Хотя какой-нибудь управленец вполне мог бы посчитать такой вывод статистически оправданным. При прогнозировании страховых тарифов можно сказать, что люди, способные оплачивать более дорогие билеты, вероятнее всего, выживут в крушениях, связанных со столкновениями с айсбергами, и, таким образом, относятся к категории малого риска ранней выплаты. Эти люди богаче тех, кто не может себе позволить дорогой билет. Значит, у более обеспеченных граждан может быть дешевый страховой тариф. А это плохо! Ведь страховки нужны как раз для того, чтобы поровну распределить риск между широким спектром людей. Так зарабатывают деньги наши страховые компании, но это никак не способствует чему-то по-настоящему хорошему.
Похожие компьютерные технологии используются для оптимизации цены или узкого сегментирования покупателей, в результате которого разным людям предлагается разная цена. Оптимизация цены используется в самых разных отраслях – от страховой до туристической, а результаты нередко приводят к ценовой дискриминации. Согласно анализу, проведенному в 2017 г. ProPublica и Consumer Reports в Калифорнии, Иллинойсе, Техасе и Миссури, страховые тарифы на жилье, предложенные ключевыми компаниями жителям районов компактного проживания меньшинств, были на 30 % выше тарифов в других районах со сходными оценками аварийности[92]. В 2014 г. аналитики The Wall Street Journal выяснили, что стоимость одного и того же степлера на staples.com различается для разных покупателей – в зависимости от предполагаемого почтового индекса пользователя она была выше или ниже[93]. Кристо Уилсон, Дэвид Лизер вместе с коллегами из Северо-Восточного университета выяснили, что разные цены предлагали покупателям homedepot.com и на туристических сайтах, в зависимости от того, просматривали ли они сайт с мобильных устройств или с компьютеров[94]. Компания Amazon признала, что в 2000-х гг. экспериментировала с ценами подобным образом. Джеф Безос, основатель компании, принес свои извинения, назвав это «ошибкой»[95].
В мире, где господствует неравенство и где мы создаем ценовые алгоритмы, анализирующие то, как выглядит мир, женщины, бедные и представители меньшинств будут неизбежно платить больше. Математиков это постоянно удивляет; а вот женщины, малообеспеченные и представители меньшинств не удивляются совершенно. Раса, пол, уровень жизни – очевидным и изощренным образом все эти факторы становятся значимыми. Для женщин стоимость парикмахерских услуг, химчистки, бритв и даже дезодоранта будет выше, чем для мужчин. Стоимость курсов подготовки к Академическому оценочному тесту (SAT) для американцев азиатского происхождения в два раза выше[96]. Афроамериканцы получают меньше чаевых, чем их белые коллеги[97]. Быть бедным также означает платить больше за предметы первой необходимости. Мебель, купленная в рассрочку, окажется дороже, чем покупка с немедленной оплатой. У «кредитов до получки» гораздо более высокий процент, чем у банковских займов. Жилищные условия считаются подъемными, если ежемесячный взнос составляет до 30 % заработной платы, однако бедным приходится априори платить больше из-за факторов банальной экономической нестабильности. «В Милуоки большинство бедных арендаторов платит как минимум половину собственного дохода, треть из них отдает и 80 %», – пишет социолог Пат Шарки в рецензии на две этнографические работы: Мэттью Десмонда «Изгнанные: Бедность и выгода американского города» (Evicted: Poverty and Profit in the American City) и Митчелл Дунае «Гетто: Изобретение места и история идеи» (Ghetto: The Invention of a Place, the History of an Idea)[98]. Феномен неравенства несправедлив, при этом он не является редкостью. И, если в рамках машинного обучения все это будет продолжаться, мы не сдвинемся с мертвой точки к более справедливому обществу. «Обаяние технологии объяснимо – в нем сошлись древние надежды на предсказание будущего с современным уклоном в статистическую строгость, – пишет в своей книге «Общество черного ящика» (The Black Box Society) профессор права и эксперт в области этики искусственного интеллекта Фрэнк Паскаль. – Тем не менее в обстановке секретности плохая информация, скорее всего, будет использоваться в качестве хорошей, что приведет к несправедливым и даже катастрофическим прогнозам»[99].
Отчасти это происходит из-за того, что при принятии социальных решений мы пользуемся машинным обучением, при котором числа скрывают важный социальный контекст. В случае с «Титаником» мы выбрали классификатор выживания и для его предсказания обратились к известным факторам. Но могли быть и другие. Например, массив данных для «Титаника» включает в себя информацию о возрасте, поле и прочее. И прогноз был сделан с опорой на данные, которыми мы обладали. Однако, поскольку это событие не из математической задачки, а из реальной жизни, вероятнее всего, имели место и иные факторы.
Рассмотрим подробнее ночь катастрофы. От находящихся неподалеку судов «Титаник» получал множество предупреждений об айсбергах по своему курсу на 14 апреля 1912 г. В 23:42 лайнер столкнулся с айсбергом. Сразу после полуночи капитан Эдвард Джон Смит оповестил пассажиров и начал эвакуацию. Он отдал приказ: «Сажать женщин и детей, затем травить тали!» Первый офицер Уильям Мердок отвечал за спасательные шлюпки на правом борту. Второй офицер Чарльз Лайтоллер – за левый. Каждый из них по-разному понял приказ капитана. Мердок подумал, что капитан велел сажать в шлюпки женщин и детей в первую очередь. Лайтоллер посчитал, что сажать в шлюпку нужно только женщин и детей. В итоге Мердок сажал в шлюпку мужчин тогда, когда поблизости не оставалось женщин или детей. Лайтоллер сажал женщин и детей в шлюпки и затем опускал их на воду – даже если еще оставались свободные места. Оба опускали шлюпки, рассчитанные на 65 человек, даже тогда, когда они не были заняты полностью. При этом на борту было недостаточно шлюпок: всего 20 на 3547 человек, хотя, по самым скромным расчетам, на судне предполагалось 892 члена команды и 1320 пассажиров.
Со спасательными шлюпками можно провести занимательный тест. Номера шлюпок на борту Мердока были нечетными, на борту Лайтоллера – четными. И, возможно, мужчины выживали также в зависимости от той шлюпки, в которой оказались, ведь Лайтоллер не сажал в шлюпки мужчин. Однако в имеющихся у нас данных не было информации о номерах шлюпок. А это принципиальная проблема. И, к сожалению, закономерность, связанную с номерами шлюпок, невозможно установить до тех пор, пока информация о них не превратится в компьютерные данные, которые машина способна обработать. Компьютер не может выяснить что-то потенциально значимое для нас. Но человек – может.
Мы также видим здесь ошибочную причинно-следственную связь. Ведь если бы мы располагали данными о номерах шлюпок, то могли бы решить, что мужчины, находившиеся в шлюпках с нечетными номерами, имели больше шансов пережить крушение «Титаника». Тогда, опираясь на результаты, нам следовало бы сделать вывод, что впредь все шлюпки должны быть нечетными, ведь это повышает шансы на выживание в критической ситуации. Конечно, это смешно. Не номер шлюпки, но офицер – вот что действительно имело значение.
История двух молодых людей также вносит коррективы в чисто математические расчеты. В художественном бестселлере Уолтера Лорда «Ночь, которую стоит помнить» (A Night to Remember) идет речь о последних часах «Титаника»[100]. Лорд рассказывает историю 17-летнего Джека Тейера, севшего на борт в Шербуре, во Франции, после долгих каникул в Европе с родителями. На «Титанике» Тейер познакомился со своим ровесником, пассажиром 1-го класса Милтоном Лонгом. По мере развития катастрофических событий молодые люди помогали пассажирам добираться в безопасные места. К двум часам ночи, когда практически все спасательные шлюпки были спущены на воду, Тейер и Лонг помогали женщинам и детям забраться в них. К 2:15 последние шлюпки исчезли из виду. Корабль кренился на левый борт. Произошел взрыв, взрывная волна вырвалась на шлюпочную палубу. В этот момент повар Джон Коллинз стоял там, держа в руках ребенка, помогая стюарду и женщине из 3-го класса с двумя детьми. Его и других выбросило за борт. Ребенка вырвало из его рук взрывной волной.
Тейер и Лонг видели хаос на палубах. Внезапно везде погас свет – уровень воды на судне достиг котельной в бойлерной № 2. Теперь источником света остались только луна, звезды и фонари шлюпок, удаляющихся от тонущего лайнера. Обрушилась с грохотом вторая дымовая труба. Тейер и Лонг осмотрелись: шлюпки уплыли, а судна, идущего на помощь, видно не было. Они поняли, что пришло время покинуть борт. Друзья пожали друг другу руки и пожелали удачи. Лорд пишет:
Лонг перелезает через поручни, тем временем Тейер залезает на них и начинает расстегивать пальто. Свесившись и держась за поручни, Лонг посмотрел на Тейера и спросил: «Ты идешь, парень?»
«Смелее, я прямо за тобой», – отозвался тот.
Лонг скатился вниз. Спустя 10 секунд Тейер перенес вторую ногу за поручни, собираясь прыгать. Он был в трех метрах над водой. Оттолкнувшись изо всех сил, он прыгнул так далеко, как только мог.
Из двух способов покинуть судно сработал вариант Тейера.
Он выжил, доплыв до ближайшей перевернутой шлюпки и ухватившись за нее вместе с 40 другими пассажирами. Он наблюдал за тем, как «Титаник» переломился пополам, как нос и задняя часть ушли под воду среди обломков. Тейер слышал крики людей. «Похоже на цикад», – подумал он. Наконец, шлюпка № 12 подобрала Тейера и других из ледяной воды. Помощь прибыла спустя несколько часов. До 8:30 утра, пока их не спасла «Карпатия», Тейер дрожал от холода в шлюпке.
Тейер и Лонг были молодыми людьми, одного возраста, со схожими физическими данными, примерно одинакового социального статуса и абсолютно равной возможностью выжить. Разница сказалась в момент прыжка. Тейер прыгнул так далеко от судна, как только мог; Лонг нырнул прямо рядом с кораблем. Лонга затянуло в водоворот, Тейера – нет. Меня смущает другое: что бы ни прогнозировал компьютер относительно будущего Тейера и Лонга, он все равно ошибется. Его прогноз основывается на данных о классе пассажиров, возрасте и поле – но значение имело не это, а разница в прыжках. Компьютер просто в принципе не думает. Случайная смерть Лонга показывает, что прогнозы относительно выживших на «Титанике» никогда не окажутся точными на 100 % и ни один статистический прогноз не будет точен на 100 %, потому что человеческие существа никогда не станут статистикой.
Это подтверждает принцип неоправданной эффективности данных. Пока вас не беспокоит потенциальная дискриминация и беспорядок, кажется, что ИИ работает превосходно. Одной из моих любимых работ, посвященных объяснению мира с точки зрения информатики, является статья исследователей Google Алона Халеви, Питера Норвига и Фернандо Перейра. Они пишут:
В статье «Неоправданная эффективность математики в естественных науках» Юджин Вагнер объясняет, почему многие физические явления можно легко объяснить математическими формулами f = ma или e = mc-62. Тем временем направления науки, так или иначе подразумевающие взаимодействие с человеческими существами, а не с элементарными частицами, считаются менее ясными с точки зрения математики. Экономисты завидуют физикам, поскольку не могут с легкостью моделировать человеческое поведение. Неформальная, неполная грамматика английского языка занимает примерно 1700 страниц. Возможно, в случае с обработкой естественных языков и смежными областями знаний мы вынуждены мириться со сложными теориями и никогда не сможем приблизиться к простоте физических формул. И в таком случае нам нужно перестать поступать так, будто мы действительно собираемся разработать исключительно точные теории, и вместо этого стоит признать сложность мира и воспользоваться тем, что у нас есть: неоправданной эффективностью данных[101].
Данные неоправданно эффективны – звучит интригующе и точно. Это объясняет, почему мы можем создать классификатор, способный с точностью 97 % предсказать смерть пассажиров «Титаника», и почему компьютер может обыграть чемпиона по го. Это также объясняет, почему, когда мы обращаем внимание на то, что именно происходит в момент обучения компьютера, мы понимаем, что машина не учитывает множества случайностей, которые происходят в случае реальных катастроф. Данные действительно эффективны. Однако подход, основанный на данных, не учитывает множества факторов, которые – по мнению людей – оказываются значительными.
Закон и общество пытаются вместить все, что люди узнали о материальном мире. Решения, основанные на данных, редко вписываются в эту сложную систему правил. Бессмысленность данных мы можем наблюдать в случае машинного перевода, голосовых помощников и распознавания рукописей. Слова и их комбинации компьютер не понимает так, как их понимает человек. Поэтому статистические методы распознавания речи и машинного перевода полагаются на вероятности и огромные массивы данных коротких последовательностей слов, или N-граммы. Десятилетиями лучшие умы компании Google работали над этим, им удалось собрать больше данных, чем кому-либо. Архив Google, архив The New York Times, все поисковые запросы, когда-либо заданные системе: в итоге получается, что, когда все это соединяется воедино и вырабатывается зависимость частоты появления тех или иных слов в комбинации, мы имеем дело с неоправданной эффективностью данных. Рассмотрим что-нибудь простое. В N-граммах слово «лодка», скорее всего, появится рядом со словом «вода», а не с электрокаром или лесным клопом, поэтому поисковик соединяет термины и файлы, связанные с лодками и водой, а не с водой и клопами. Люди обычно говорят об одних и тех же вещах, ищут одно и то же, в конце концов, общие знания на то и общие. Машина не учится на самом деле; процесс поисковой обработки попросту вдохновлен человеческим обучением. Если вы когда-нибудь решали математические задачки, вы видели, что это не магия, а всего лишь математика. Компьютеру удастся что-то «понять» достаточно правильно только тогда, когда мы сможем признать, что он в целом «прав», то есть он «поймет», что что-то правильно, на совершенно другом основании.
Принятие социальных решений связано не только с вычислениями, и проблемы будут возникать всегда, когда мы будем использовать только данные там, где нужно обращаться к общественным и ценностным суждениям. Действительно, путешествие 1-м классом на «Титанике» могло повысить шанс на выживание, но неразумно на основе этого развивать модель, согласно которой пассажиры 1-го класса заслуживают получить шанс на выживание в крушении больше тех, кто путешествует 2-м или 3-м классом. На основе этой модели не стоит строить какие-либо предположения. Наша прогностическая модель могла бы пригодиться для того, чтобы объяснить, почему для пассажиров 1-го класса можно было предложить более дешевую страховку, но это абсурд: нельзя наказывать тех, кто недостаточно богат, чтобы путешествовать 1-м классом. Но важнее всего то, что мы должны понимать, что есть вещи, которые машины никогда не смогут понять о людях, поэтому будут всегда востребованы человеческие: суждение, подтверждение и интерпретация.
8
Эта машина сама не поедет
Массивы неоправданно эффективных данных хорошо работают применительно к электронному поиску, простому переводу и навигации. И при достаточном объеме обучающих данных алгоритмы действительно могут неплохо справляться с разными повседневными задачами, в то время как человеческая смекалка помогает заполнить «пробелы» ИИ. Благодаря поисковикам мы научились использовать как сложные комплексные запросы, так и конкретные термины (или их синонимы), что позволяет нам при помощи строки поиска находить определенные веб-страницы. Машинный перевод между языками сегодня развит лучше, чем когда-либо. Он, конечно, не так хорош, как человеческий, однако человеческий мозг превосходно справляется с интерпретациями значений и искаженных сентенций. Обычного пользователя вполне удовлетворяет высокопарный, неуклюжий машинный перевод веб-страниц. Системы GPS, помогающие добраться из пункта А в пункт Б, невероятно удобны. Если спросить любого профессионального таксиста или водителя-попутчика, они скажут, что GPS не предлагают наилучший путь в аэропорт, но способны довести вас в нужное место и проинформировать о загруженности на дорогах.
И все же у массивов неоправданно эффективных данных есть ряд недостатков, из-за которых я скептически отношусь к замене человека ИИ в потенциально опасных случаях вроде вождения. Беспилотные автомобили наилучшим образом показывают, как ИИ (не) состоятелен в данном случае.
Когда я впервые прокатилась в беспилотнике в 2007 г., я думала, что умру. Либо меня стошнит. Или и то и другое. Так что, когда в 2016 г. до меня дошли слухи, что скоро на рынке появятся автономные машины и что Tesla создала программу под названием Autopilot, а Uber тестирует самоуправляемые такси в Питтсбурге, я подумала: «А что же изменилось? Неужели авантюрным разработчикам, с которыми я познакомилась в 2007 г., удалось каким-то образом внедрить систему этического принятия решений в двухтонную “машину-убийцу”»?
В итоге оказалось, что перемен произошло даже меньше, чем я ожидала. История о соревновании по созданию автопилотируемой машины – это история о фундаментальных ограничениях вычислительной техники. Оглядываясь назад и наблюдая за тем, что сработало и что не сработало в первую декаду бытования беспилотных транспортных средств, мы сталкиваемся с предостерегающей историей о том, как техношовинизм может привести к буквально магическому мышлению в случаях, когда технология способна стать угрозой здоровью членов общества.
Моя первая поездка случилась на тестовом треке для беспилотных машин: по-воскресному пустой стоянке завода Boeing в Южной Филадельфии. Ben Franklin Racing Team, команда инженеров из Университета Пенсильвании, в то время разрабатывала автономный автомобиль для участия в соревновании. Я встретила членов команды в кампусе на рассвете в воскресенье и последовала за ними по шоссе, чтобы попробовать прокатиться на автопилотируемой машине.
Им приходилось экспериментировать тогда, когда на улицах никого не было. Вообще-то, их автомобиль, кастомная Toyota Prius, по закону не допускался к эксплуатации. Существует ряд правил, которым должен соответствовать автомобиль, например у него должно быть рулевое колесо. Короче, они могли тестировать беспилотник на парковке или на территории университета, но вот поездка от гаража в Западной Филадельфии по шоссе 1–95 до тренировочной площадки в Саус-Билли была достаточно рискованной. Вероятнее всего, их бы остановили полицейские, патрулирующие шоссе. Университетские юристы как раз работали над получением разрешения на уровне штата на то, чтобы беспилотные автомобили могли сами собой управлять. До тех пор команде приходилось тренироваться в «нечеловеческое» время и надеяться на лучшее.
Я остановилась на стоянке позади беспилотника, которого они назвали «Малыш Бен». В салоне сидели разработчики: студент инженерной механики Талли Фут за рулем, на заднем сиденье были аспирант электронной и системной инженерии Пол Верназа и докторант электротехнического проектирования Алекс Стюарт. Рядом с водителем, одетый в черно-желтую куртку команды, находился Хитин Чокси, сотрудник Lockheed Martin и недавний выпускник кафедры теории вычислительных систем Дрексельского университета. Как только машина неспешно подкатилась, Фут вышел, открыл багажник и стал рыться и наводить порядок в проводах, свисающих над задним сиденьем и с потолка. Напичканная всевозможными сенсорами и с непонятными устройствами на крыше, машина выглядела так, будто участвовала в съемках постапокалиптического фильма. Студенты вырезали часть пластиковой консоли, прикрывающей приборную доску. Оттуда торчал моток проводов, тянущихся к внушительному ноутбуку. Пол багажника был частично покрыт плексигласом, а на рулевой колонке виднелись провода и коробочки. Фут ввел команду через сенсорный монитор, установленный в бардачке, и вскоре перед нами предстал вид парковки – прямо со спутника. Все три пассажира оставались пристегнутыми в машине, сгорбившись над ноутбуками. Испытание началось.
В рамках соревнований Grand Challenge 2007 года «Малышу Бену» предстояло самостоятельно проехать по пустому «городу», построенному на месте бывшей военной базы. Никакого удаленного управления и запрограммированных путей следования по городу: только 85 беспилотных автомобилей, кружащих по улицам. Спонсор, Управление перспективных исследований Министерства обороны (DARPA), обещал $2 млн команде, разработавшей автомобиль, который дойдет до финиша первым, $1 млн и $500 000 тем, кто займет второе и третье место.
Технологии робомобилей помогают водителям с 2007 г. Тогда, например, Lexus выпустила машину, способную выполнять параллельную парковку – при определенных условиях. «Сегодня во всех машинах есть такие функции, как адаптивный круиз-контроль или парковочный ассистент. Вождение становится все более автоматизированным, – пояснил Дэн Ли, доцент инженерно-технического проектирования и советник команды. – Однако для полной автоматизации процесса необходимо, чтобы автомобиль был в курсе всего происходящего вокруг. Вот это по-настоящему сложные проблемы робототехники: компьютерное зрение, научить компьютер “слышать” звуки, понимать, что происходит вокруг, – отличное место для проверки всего этого».
Для того чтобы «Малышу Бену» удалось «увидеть» и объехать препятствие, необходима правильная работа системы GPS-навигации, а лазерные сенсоры на крыше должны правильно идентифицировать объект. Затем ему нужно идентифицировать объект как препятствие и разработать путь объезда. Одна из задач сегодняшнего испытания состояла в том, чтобы поработать над подпрограммой, которая в итоге позволит «Малышу Бену» объезжать другие машины.
«Система настолько сложна, может случиться куча всего неожиданного, – сказал Фут. – Если что-то будет работать слишком медленно, то это может привести к краху системы. Работа программиста такова, что три четверти времени ты проводишь, исправляя ошибки системы. А в проекте вроде этого все девять десятых времени уходит на исправление ошибок».
Испытание 2007 г. было куда сложнее, чем предыдущие. Например, в 2005 г. нужно было создать робота, который сможет проследовать 281 км через пустыню менее чем за 10 часов и без единого человеческого вмешательства. 9 октября 2005 г. команда Stanford Racing и их автомобиль Stanley выиграли это соревнование (и $2 млн за то, что автомобиль проехал 212 км по пустыне Мохаве). Stanley ехал со средней скоростью 30 км/ч и добрался за 6 часов и 55 минут. В пустыне «на самом деле было не важно, был ли препятствием камень или куст, потому что можно было просто его объехать», говорил Себастиан Тран, тогда бывший доцент теории вычислительной техники Стэнфорда[102]. В городских условиях машинам необходимо определить очередность проезда и учитывать правила дорожного движения. «По сути, испытание заключается в том, чтобы перейти от простого восприятия машиной окружающего мира к его пониманию», – продолжил Тран. В испытании 2007 г. от Стэнфорда участвовал Junior, автомобиль на базе Volkswagen Passat 2006 г., главный конкурент «Малыша Бена». Как и Boss – Chevy Tahoe 2007 г. от команды Университета Карнеги – Меллона. В 2005 г. от этого университета участвовало две машины – Sandstorm и H1ghlander, пришедшие второй и третьей соответственно. Соперничество роботов университетов Карнеги – Меллона и Стэнфорда сродни баскетбольной битве команд университетов Северной Каролины и Дьюка. В 2003 г. Стэнфорд переманил к себе Трана, бывшего профессора Университета Карнеги – Меллона и звезду робототехники.
Возвращаемся на парковку. Старший специалист инженерной электроники Алекс Кушлеев подъехал на новенькой Nissan Altima. Алекс отлучался, чтобы купить пульт радиоуправления, такой же, что используется для игрушечных машинок: он предназначался для экстренной остановки. Кажется, у каждого робота есть большая, мультяшная красная кнопка. Две дополнительные кнопки были приклеены на клейкую ленту на задней панели машины и подключены к серверу блока Mac Mini, который служил электронными «мозгами» автомобиля. К этому моменту для Пенсильванской лаборатории общей робототехники, автоматизации и восприятия (GRASP) стоимость этого проекта приближалась к $100 000. Проект также спонсировался Лабораториями продвинутых технологий Lockheed Martin из Черри-Хилл, Нью-Джерси и Thales Communications из Мэриленда.
«Prius дает нам больше маневренности и поскольку это гибридная машина, то еще и хорошие аккумуляторы на борту. А нам нужна дополнительная энергия, ведь помимо самого автомобиля там запитана куча компьютеров, сенсоров и моторчиков», – прокомментировал Ли. Электрические моторы управляют системой подачи топлива, тормозами и управлением «Малыша Бена»; всем этим – от систем подачи сигналов до дворников – можно управлять с панели над рычагом коробки передач, как в машинах для людей с физическими ограничениями, которые управляют машиной при помощи рук, а не ног. Машиной можно управлять обычным образом, а можно с компьютера. Они уверяли, что в управлении не будет нужды вовсе, когда в автомобиле появится автопилот.
Я наблюдала за тем, как машина рывками передвигается по парковке. Страхующий водитель сидел на пассажирском сиденье, его рука находилась на кнопке экстренной остановки. Было страшновато, но волнительно приятно – видеть двигающуюся машину с рулевым колесом, вращающимся перед пустым водительским сиденьем.
Как только аккумулятор разрядился, Кушлеев взялся за руль и проехал по парковке со скоростью 25 км/ч. Сегодняшней целью было отрепетировать объезд препятствий на парковке. Во время соревнования «Малышу Бену» придется пересекать перекрестки, объезжать бордюры и реагировать на сигналы остановки, другие машины и бездомных собак на максимальной скорости 50 км/ч.
Наконец настала моя очередь занять место за рулем. Я села на водительское сиденье. Странным образом оно ощущалось пустым. Кушлеев включил механизм автоматического вождения, и машина проехала несколько метров, затем повернула круто влево, потом направо и сошла с траектории. «Бери управление!» – крикнул с заднего сиденья Стюарт. Машина ехала аккурат в фонарный столб. По мере приближения к бетонному основанию фонаря машина ускорялась. Мы стремительно приближались к столбу. Я ударила ногой туда, где предположительно должен был находиться тормоз, и обнаружила, что педали были переоборудованы во что-то мне непонятное. «Эта штука случайно не должна притормозить?!» – крикнула я в панике. Я закрыла глаза, уверенная в скором столкновении, и приготовилась кричать.
С заднего сиденья доносились бормотания и яростный стук по клавиатуре. Кушлеев переключился на ручное управление и задействовал тормоза. Машина резко остановилась в нескольких сантиметрах от бетонного столба. Я чувствовала себя так, будто мой желудок остался где-то на несколько метров позади.
Я повернулась, чтобы взглянуть на парня с ноутбуком на заднем сиденье. «Должно быть, какой-то баг программы, – отозвался он. – Это случается».
«Спас только GPS», – радостно провозгласил Стюарт. Они еще долго спорили о проблеме с поворотом: машина сделала широкий поворот там, где должна была сделать небольшой. Лазеры сканировали местность вокруг машины, но программа почему-то не регистрировала фонарный столб в качестве препятствия. Очевидно, это повлияло на управление, заставляя машину резко рвануть, вместо того чтобы медленно поворачивать.
Фут и Стюарт переговаривались между собой. Они были ветеранами разработки беспилотных машин, принимали участие в двух Grand Challenges в качестве выпускников Калифорнийского технологического университета. Последней их разработкой был Alice, беспилотник на базе Ford E350, подготовленный для соревнований 2005 г. Во время гонки в пустыне Alice самостоятельно проехал около 11 км, прежде чем направиться в сторону барьера, отделявшего журналистов от трека. Судьи выключили Alice до того, как автомобиль успел попасть в новостные заголовки.
Рулевое колесо «Малыша Бена» еще раз дернулось; Стюарт и Верназа управляли им с заднего сиденья. Проблема с программой решена. Кушлеев пригнал машину на парковочное место и снова включил автопилот. Колесо дернулось вновь, затем автомобиль направился к снегоуборочной машине на краю парковки, со стороны двигателя послышался скрежет.
– Проклятье! – выругался Стюарт.
– Может, это Sheep? – произнес Верназа, имея в виду одну из программ, управляющих машиной.
– Как раз она в списке проблем на сегодня, которые я не собирался решать. – отозвался Стюарт.
Тогда я подумала (но не написала) о том, что этот опыт не вселяет уверенность в технологии. Находясь в машине, я ощущала опасность – будто ей управлял пьяный малыш. И если такие люди занимаются созданием беспилотных автомобилей, их неосторожность по отношению к моей собственной жизни не предвещает ничего хорошего. Я не могла представить, что я доверяю своего ребенка такой машине, построенной этими детьми. Мне не нравилась сама идея присутствия этого беспилотника на дороге; это казалось общественной угрозой. Я написала статью и понадеялась, что разработка потерпит неудачу или перерастет в другой проект, исчезнув в технологическом мраке вместе с видео RealPlayer, программой Macromedia Director и портативными жесткими дисками Jaz. Вскоре я забыла об этой истории и о машине-роботе Пенсильванского университета.
Меж тем «Малышу Бену» предстояла гонка. Утром 3 октября, в день DARPA Grand Challenge, все транспортные средства стали на линии старта. Их цель состояла в том, чтобы пересечь улицы резервной военно-воздушной базы Джорджа в Неваде. Там были дороги, знаки и сопровождающие автомобили. Разношерстная масса кастомных автомобилей выстроилась на линии старта. Им предстояло проехать 96 км по военной базе, соблюдая предписания знаков и избегая столкновений с другими автомобилями.
За неделю до этого посредством тестового заезда определили очередность. Первым был Boss, автомобиль Университета Карнеги – Меллона, который сочли наиболее перспективным. За ним через определенные промежутки времени должны были следовать остальные машины-роботы участников и за ними автомобили, управляемые людьми. Команда Boss на линии старта была готова – но не сам Boss. Не работала GPS. Нарастала суета. Пока стартовали другие участники, члены команды Университета Карнеги толпились у машины. Наконец источник неполадки был найден: радиопомехи от большого телеэкрана, находившегося рядом со стартом. Экран создавал помехи сигналам GPS. Кто-то выключил его.
Boss стартовал десятым, 20 минутами позже автомобиля, разработанного стэнфордской командой. Это не было скоростной гонкой: путь в 88 км Boss намеревался проделать на скорости 22 км/ч. «Boss держался отлично, – говорил Крис Урмсон, директор команды. – Все шло ровно. Он двигался быстро. Он хорошо взаимодействовал с потоком. Делал то, что требовалось».
Boss приехал первым, команда Стэнфорда заняла второе место спустя 20 минут. «Малыш Бен» финишировал не на призовом месте, команды Корнелла и МТИ финишировали, не уложившись в шестичасовой регламент гонки. Стало очевидно, что в разработке робототехнических транспортных средств лидируют Питтсбург и Пало-Альто.
Подход пенсильванской команды разительно отличался от тактики команды Стэнфорда или Университета Карнеги – Меллона. Он основывался на знаниях. Команда пыталась создать машину, которая бы смогла решать, что делать на дороге, опираясь на запрограммированный «опыт». И такой подход был одним из двух основных в разработке ИИ. Гоночная команда Университета им. Бена Франклина опиралась на подход общего ИИ. Он не сработал.
«Малыш Бен» старался «увидеть» препятствия глазами человека. За распознавание объектов отвечал LIDAR, лазерный радар, установленный на крыше. Затем «мозг» идентифицировал объект, основываясь на критериях: форма, цвет и размер. Следом, используя метод древа принятия решений, предстояло выбрать, что делать: замедлиться, если это живое существо вроде человека или собаки, или, если это живое существо – птица, то можно продолжить движение, поскольку она, скорее всего, улетит. «Малышу Бену» нужно было хранить огромное количество информации об объектах реального мира. Например, о дорожном конусе. В стоячем положении их легко различать по треугольной форме и квадратной основе. Обычно они не больше метра высотой. Мы можем написать примерное правило:
identify object:
IF object.color = orange AND object.shape = triangular_with_square_base
THEN object = traffic_cone;
IF object.identifier = traffic_cone
THEN intitiate_avoid_sequence
Но что если дорожный конус лежит на боку? Я живу на Манхэттене и вижу, как их постоянно задевают. Я видела, как улицы перекрывают конусами и как люди выходят из машины, переставляют конус и едут дальше. Значит, правило нужно немного поправить. Попробуем вот это:
identify object:
ЕСЛИ object.color = orange И object.shape is like triangular_with_square_base.rotated_in_3D
ТОГДА object = traffic_cone;
ЕСЛИ object.identifier = traffic_cone
ТОГДА intitiate_avoid_sequence
А вот здесь мы сталкиваемся с разницей между человеческим мышлением и алгоритмами. Наш мозг может представить, как в пространстве вращается конус. Вы можете представить в своей голове конус, когда я о нем говорю. И, если я попрошу вас представить «перевернутый конус», вы наверняка справитесь и даже сможете представить, как он вращается. Разработчики тоже владеют пространственным мышлением и успешно справляются с этой задачей. Есть один занятный математический тест: детям показывают нарисованную трехмерную фигуру, затем демонстрируют картинки других фигур и просят выбрать, на какой из них изображена та же фигура, только в другом ракурсе.
У компьютера нет воображения. Поэтому, чтобы просто «повернуть объект», ему требуется произвести рендеринг трехмерной модели или – в крайнем случае – построить векторную карту. И программисту приходится писать код с учетом трехмерного пространства. Но – не в пример человеческому мозгу – компьютер неплохо справляется с угадыванием. Объект либо находится в списке известных ему, либо нет.
Когда я сидела за рулем «Малыша Бена», он делал две вещи: ездил кругами и не справился с объездом препятствия. Когда прошел шок, я начала размышлять, почему он не смог объехать препятствие. Это был столб. «Малышу Бену» нужно было правило вроде «if obstacle.exists_in_path and obstacle.type=stationary, obstacle.avoid». Однако, видимо, правило не сработало, поскольку не все объекты остались статичными. Человек может появиться, постоять немного и двинуться дальше. Тогда правило выглядело бы так: «if obstacle.exists_in_path and obstacle.type = stationary, AND obstacle.is_not_person, avoid». Но и это бы тоже не сработало: теперь нужно пояснить, чем человек отличается от колонны, и, значит, мы вернулись к проблеме классификации объектов. Если колонну можно распознать как таковую, тогда нужно написать правило отдельно для людей, отдельно для колонн. Однако мы не знаем, действительно ли там колонна, пока не увидим ее или хотя бы не распознаем объект, – поэтому я чуть не умерла в машине, которая чуть не столкнулась с огромным столбом.
Разум – вот ключевая проблема. А поскольку не существует способа запрограммировать теорию мышления, машина никогда сможет реагировать на препятствия так же, как человек. Компьютер «знает» только то, что ему «сказали». Без разума, когнитивной возможности прогнозировать будущее, невозможно за долю секунды решить, что светофор представляет собой препятствие, и принять соответствующие меры.
В рамках разработки ИИ проблема разума была центральной с самого момента основания дисциплины. В конечном итоге Минский назвал ее сложнейшей задачей. Возможно, именно поэтому в Стэнфорде и Карнеги даже не пытаются пользоваться этим подходом. Они избрали радикально противоположный путь решения проблемы объезда препятствий. Подход слабого ИИ исключительно механистичен и опирается на набор неоправданно эффективных данных. И этот подход сработал лучше, чем ожидалось. Мне нравится думать об этом как о задаче робота Карела.
В 1981 г. профессор Стэнфорда Ричард Паттис представил учебный язык программирования под названием Karel the Robot[103]. Карел – в честь Карела Чапека, изобретателя слова «робот». Карел не был настоящий роботом, а представлял собой стрелку в разлинованном на клетки квадрате, все это было нарисовано на листе бумаги. Студенты представляли, что стрелка и есть робот, – так они изучали основы программирования. В квадрате был один или несколько выходов. Карел мог двигаться по клеточкам подобно пешке в шахматах. Задача состояла в том, чтобы помочь Карелу выбраться из коробки. Это вводное упражнение, выполняемое при помощи бумаги и ручки, годами было первым заданием на курсах программирования в МТИ, Гарварде, Стэнфорде и других технологических центрах. Профессор рисовал квадратик. В нем было несколько препятствий. Наша задача состояла в том, чтобы написать команды для Карела и вытащить его из заточения, миновав все препятствия. Не то чтобы это было весело, но не так скучно, как математика и другие дисциплины, на которые я ходила на первом курсе. Вот как выглядит типовое упражнение (рис. 8.1). А вот и инструкция к этой загадке: «Каждое утро Карел просыпается в своей кровати, когда газета оказывается на крыльце его дома. Запрограммируйте Карела так, чтобы он забрал газету и вернулся в постель. Газету кидают каждое утро на одно и то же место, а окружающий мир, в том числе кровать, расположены так, как показано на рисунке». Стрелка – это Карел; предполагается, что он находится в постели, отправной точке задачи. Чтобы добраться до газеты, ему нужно повернуть на 90° на север, пройти две клеточки в этом направлении, затем две клеточки на запад и так далее, до тех пор, пока он не достигнет цели.
Решение кроется в том, что нам заранее известны препятствия и мы помогаем Карелу обойти их. Программист видит сетку, которая одновременно является картой мира Карела. Эта сетка хранится в памяти Карела, он как бы ее «представляет». Именно таким подходом воспользовалась команда Университета Карнеги – Меллона, чтобы построить свою беспилотную машину. При помощи лазерного радара, камер и сенсоров генерировалась трехмерная карта окружающего пространства. В ней не было «объектов», подлежащих «распознаванию», скорее, в ней были зоны, где можно и нельзя передвигаться, которые система идентифицировала при помощи машинного обучения. Объекты вроде машин представали в виде трехмерных шаров. Последние были препятствиями, подобно тем, что мы видели в задаче с роботом Карелом.
Это превосходное решение, поскольку оно позволяет резко сократить количество переменных, которые Boss или Junior необходимо учитывать. «Малышу Бену» приходилось идентифицировать все объекты в поле зрения – дороги, пешеходов, здания и дорожные конусы – и затем прогнозировать, где объект окажется в ближайшем будущем. Таким образом, каждое предположение требовало решения сложных уравнений. Boss и Junior не нужно было этого делать, в них уже была загружена трехмерная карта местности и дорога, по которой следует проехать, а при помощи машинного обучения они определяли, по каким конкретно частям карты можно ехать, а по каким – нет. Подход, примененный при разработке Boss и Junior, – это слабый ИИ, опирающийся на технологии качественного картирования.
Машина самостоятельно двигалась согласно созданной ею же карте местности. По сути, у нее была своя сетка, как у Карела. Системе оставалось лишь объезжать препятствия. Если в изначальной карте не было дорожного конуса, он учитывался постфактум. Если же он был, то распознавался как статичный объект и вычислялся заранее – это избавляло процессор от идентификации объекта во время движения.
У команды Университета Карнеги было преимущество, поскольку к тому моменту она уже годами работала над управляемыми компьютером транспортными средствами. В 1989 г. они запустили ALVINN – первый беспилотный фургон[104]. Это был поистине удачный период. Оказалось, что основатель Google Ларри Пейдж заинтересован в цифровом картировании. Он установил кучу камер на грузовике и проехал по Маунтин-Вью в Калифорнии, снимая окружающий ландшафт и параллельно пересчитывая изображения в базу данных карты. Впоследствии Google реализовал проект под названием Google Street View. Идеи Пейджа отлично сочетались с технологиями, не так давно разработанными уже упомянутым Себастианом Траном, профессором Университета Карнеги – Меллона, задействованным в команде DARPA Challenge. Вместе со студентами он разработал программу, соединяющую фотографии в карты, затем перешел в Стэнфорд. Google купил эту технологию и на ее основе создал Google Street View.
В это время развивалось и графическое аппаратное обеспечение. Видео и трехмерная графика занимают огромное количество памяти. Согласно закону Мура, количество транзисторов, размещаемых на кристалле интегральной схемы, удваивается каждый второй год, умножая таким образом производительность процессоров и понижая стоимость компьютерной памяти. В 2005 г. компьютерная память значительно подешевела и стала настолько доступной, что можно было создать трехмерную карту целого города и хранить ее буквально на борту машины. Дешевая память в корне поменяла ситуацию.
Тран вместе с некоторыми другими успешными разработчиками беспилотных автомобилей поняли, что реплицировать процессы человеческого восприятия и принятия решений чертовски сложно и невозможно на данном этапе. И потому они решили оставить этот путь. Когда говорят о такого рода инновациях, обычно вспоминают братьев Райт. До них люди думали, что для того, чтобы заставить машину летать, нужно повторять движения птиц. Братья Райт осознали, что для полета не нужно махать крыльями – достаточно парить.
Разработчики беспилотных транспортных средств поняли, что можно сделать машину без разума – уметь передвигаться по сетке-карте будет достаточно. В итоге у них получилась невероятно сложная машина с удаленным управлением, которой не нужно быть разумной или знать правила дорожного движения. Вместо этого используются статистические оценки и неоправданная эффективность данных. Это – уловка, невероятно сложная, классная, она работает в разных ситуациях, но все же это уловка. Она напомнила мне о видеоиграх. Вместо того чтобы создавать машину, способную передвигаться в мире подобно человеку, разработчики придумали превратить мир в видеоигру, в которой машина сможет передвигаться.
Статистический подход превращает все в данные и проводит оценку вероятности. Объекты реального мира трансформируются в геометрические формы, с определенной скоростью движущиеся в определенном направлении по сетке. Компьютер оценивает вероятность того, что объект продолжит движение по траектории, и прогнозирует момент пересечения с собственной траекторией. Машина останавливается или замедляется в случае, если траектории пересекаются. Превосходное решение, в результате которого получаются приблизительно корректные результаты, но на основе ошибочных предпосылок.
Очевидна разница с тем, как работает мозг. Вот цитата из журнала Atlantic за 2017 г.: «Сегодня наш мозг ежесекундно получает до 11 млн единиц информации; и, поскольку мы можем обработать лишь 40 % этого объема, остальное находится в вотчине бессознательного, которое при помощи предубеждений, стереотипов и шаблонов фильтрует шум»[105].
Как вы относитесь к тому, что автономность машин зависит от наших собственных представлений о сущности ИИ? Много людей, подобно Минскому и другим, хотят верить в то, что компьютер способен мыслить. «Этой мечте об ИИ уже больше 60 лет, – сказал Деннис Мортенсен, основатель и исполнительный директор CEO, в апреле 2016 г. журналисту из Slate. – Каждый раз мы думали, что в итоге получится некая сущность, подобная человеку, с которой можно было бы беседовать, как сейчас [беседуем] мы с вами. Однако это пока остается лишь фантазией. Сомневаюсь, что она станет явью на моем веку или на веку моих детей»[106].
Мортенсен сказал, что пока возможен лишь «узкоспециализированный ИИ, способный выполнять – на достойном уровне – лишь одну задачу».
Это, конечно, здорово, но вождение – далеко не одна задача, но процесс параллельного выполнения нескольких задач. Подход к разработке беспилотных машин на основе машинного обучения хорошо справляется с типовыми задачами в рамках одной символьной системы. Не очень забавно управлять двухтонной машиной-убийцей на улицах города, кишащего исключительно малопредсказуемыми толпами людей.
После Grand Challenge 2007 г. DARPA ушли от концепции беспилотных автомобилей, поскольку их стратегия финансирования больше не включает автономные транспортные средства. «Жизнь непредсказуема по определению. Для программиста будет непосильной задачей учесть каждую проблему или неожиданную ситуацию, которая может возникнуть, поскольку системы машинного обучения достаточно чувствительны к нарушениям шаблонов из-за того, что в реальном мире сталкиваются с нерегулярностью и непредсказуемостью, – прокомментировала в 2017 г. программный менеджер программы «Машины непрерывного обучения» DARPA Хава Сигельман. – Сегодня, если вы хотите развить способности систем машинного обучения и научить их выполнять новые задачи, то придется выключить их и вновь провести обучение на релевантных для конкретной ситуации данных. Пока этот подход попросту не поддается масштабированию»[107].
Тем не менее мечта продолжает жить – в коммерческой сфере. Сегодня решения относительно правил для беспилотных транспортных средств в США лежат на плечах штатов. Невада, Калифорния и Пенсильвания пока лидируют, остальные штаты только начали задумываться о позволении некоторого уровня автономности вождения.
Тот факт, что последнее слово остается за штатом, представляет серьезную проблему. Все потому, что разработка программного обеспечения под 50 разных стандартов – предприятие практически невозможное. Программисты предпочитают один раз написать программу, а затем многократно ее использовать. Учитывая 50 штатов плюс Вашингтон и другие территории США, где свои правила дорожного движения и стандарты для автономных устройств, программистам придется перепрограммировать движение для каждого из них. В конце концов мы вскоре столкнемся с такой же странной и бестолковой ситуацией, как со школьными учебниками. Права каждого штата важны для американской демократии, но с точки зрения программирования они – монстры, с которыми придется бороться. Программисты даже не любят набирать текст на клавиатуре; сложно представить в них настолько мощную тягу к подробностям, что они добровольно пойдут навстречу правилам дорожного движения 50 штатов и затем будут обсуждать особенности разработки с каждым покупателем автономной машины в каждом штате.
Когда мы говорим о беспилотных автомобилях, вновь всплывают проблемы коммуникации. Чтобы наладить обсуждение, Национальное управление по безопасности движения автотранспорта (NHTSA) разработало комплексное определение феномена. Долгое время программисты и менеджеры использовали словосочетание «автономные машины», не конкретизируя, что именно они имеют в виду. Повторюсь: словосочетание, понятное в обычной жизни, бессмысленно в политике. Чтобы достигнуть консенсуса в спорах Дикого Запада о сущности автономных машин, NHTSA опубликовало список категорий таких устройств. Федеральная политика беспилотных транспортных средств от 2016 г. гласит следующее:
Для каждого из уровней автоматизации существовали собственные определения, в связи с этим требовалась стандартизация, позволяющая внести ясность и системность. В данной Политике используются определения уровней автоматизации, принятые Международным сообществом автомобильных инженеров (SAE) и основанные на принципе «кто, что и когда делает».
В целом:
● SAE Level 0, водитель-человек делает все самостоятельно;
● SAE Level 1, автоматизированная система транспортного средства может периодически помогать водителю выполнять некоторые маневры;
● SAE Level 2, автоматизированная система транспортного средства может полностью проводить некоторые маневры под контролем человека, следящего за внешней обстановкой и обеспечивающего остальные задачи управления транспортным средством;
● SAE Level 3, автоматизированная система способна проводить некоторые маневры и в некоторых случаях следить за внешней обстановкой, однако человек должен быть готов в любой момент взять управление на себя при запросе системы;
● SAE Level 4, в некоторых случаях и при определенных условиях автоматизированная система способна выполнять водительские задачи и следить за внешней обстановкой, у человека нет необходимости брать на себя управление;
● SAE Level 5, автоматизированная система может выполнять все водительские задачи при любых условиях так, как если бы их выполнял человек[108].
Эти стандарты переделывали как минимум один раз, может, два, пока я писала книгу – что вновь напоминает нам о постоянно меняющихся школьных стандартах. На уровнях 3 и 4 системам необходимо считывать окружающую среду посредством сложных и дорогих сенсоров: в основном LIDAR, GPS, IMU и камер. Данные, получаемые от них, затем переводятся в двоичный код, обрабатываемый тем же аппаратным оснащением, которое использовалось для «слоя», как в случае с сэндвичем с индейкой из главы 2, и которым разработчики Пенсильванского университета напичкали кузов «Малыша Бена». Для выполнения водительских функций каждый уровень требует все более высокой вычислительной мощности, отвечающей количеству поступающих данных. Пока еще никому не удалось создать подобные аппаратное и программное решения, которые гарантировали бы безопасную езду в любой местности и при любой погоде. «На данный момент на рынке нет транспортных средств выше 2-го уровня автономности», – писал Юнко Йошида в статье об ультрасовременных компьютерных чипах для транспортных средств в октябре 2017 г.[109] Уровень 5 не существует для обычных условий вождения и, вероятно, никогда не будет существовать.
За последние годы развились технологии помощи водителю, они и составляют большую часть разработок беспилотных транспортных средств. Так, на уровнях 0–2 можно найти ряд весьма полезных инноваций. Людям действительно нравится, что машины могут парковаться параллельно, хотя бесконечная отработка геометрических вычислений – ужасное применение новейших технологий.
Большинство исследований из области разработки беспилотных машин, равно как некоторые тренировочные данные, можно найти на платформе arXiv и других исследовательских репозиториях. Есть пакет тренировочных данных на GitHub, и открытый код – тот, что используют в рамках соревнования по проектированию беспилотных автомобилей, – можно найти на Udacity[110] (последнее детище Трана). Я взглянула на массив графических данных, в нем было меньше информации, чем я полагала. Основной изъян заключается в том, что там нет встроенной погрешности и алгоритмы не способны предсказать, что именно не включено. Как в случае с данными «Титаника», невозможно предсказать закономерность прыжков с тонущего корабля после того, как уплыли все спасательные шлюпки.
В реальной жизни странные вещи случаются постоянно. Крис Урмсон, бывший руководитель Waymo, выпускник Университета Карнеги – Меллона и один из победителей Grand Challenge, выложил на YouTube видео с самыми странными событиями, которые удалось заснять его машинам-прототипам, годами разъезжавшим в окрестностях Маунтин-Вью и собиравшим данные. Он не мог скрыть смех, показывая кадры с детьми, прыгающими как лягушки на шоссе, или женщиной в электрическом кресле-каталке, гоняющейся за уткой посреди дороги. Все это не так часто, но все же случается. У людей есть разум, они могут адаптироваться к странностям. У компьютеров его нет, они – не могут.
Каждый в состоянии вспомнить разные странные вещи, увиденные из окна автомобиля. Лично мое самое странное воспоминание связано с животным. Мы с подругой Сарой ехали по ветреным горным дорогам Вермонта, чтобы посмотреть водопад. Мы повернули за уступ, и вдруг откуда ни возьмись посреди дороги – огромный лось. Я ударила по тормозам, сердце бешено билось в груди. Позже я задумалась, как бы с этим справился беспилотный автомобиль. На YouTube я нашла несколько любительских видео людей, игравших с системами помощи водителю. И все они были сделаны мужчинами, хваставшимися своими крутыми тачками. Все они веселились. «Система погружает тебя в ощущение безопасности», – поделился ощущениями в одном из видео автор журналист Wired по итогам поездки по пустому шоссе Невады. Он хвастался тем, что практически не было необходимости помогать системе Tesla Autopilot. Несмотря на то что по правилам водитель должен был держать обе руки на руле, он держал руль одной рукой или вообще убирал руки. Он также показал несколько пасхалок, оставленных программистами в теле кода. Он кликнул шесть раз по кнопке на рулевом колесе, дисплей переменился и стал показывать радужную дорогу из игры «Марио Карт». Вторая пасхалка заключалась в том, что дисплей издал звуки в духе «больше колокольчиков», отсылающем к скетчу телеканала Saturday Night Live[111].
Я посмотрела несколько промороликов Waymo. В одном из них голос за кадром утверждал, что технологии компании способны «видеть» вокруг на 360° и на два футбольных поля вперед. Форма автомобиля оптимизирована для лучшего обзора сенсоров. Одной из ключевых технологий проекта (которая все еще не идеальна) является способность компьютера противостоять вибрациям и перепадам температуры. «Мы долгое время устанавливали разные устройства на машину и поняли, что в реальной жизни на настоящий автомобиль не так много и навесишь, – поделился разработчик Waymo в видео 2014 г. – Когда дело доходит до работы реального транспортного средства, сенсоры и софт выполняют всю работу. Нет необходимости в установке рулевого колеса или тормозной педали, мы всерьез задумывались над тем, нужен ли индикатор, сигнализирующий о готовности машины. Разработка прототипа требует больших усилий. Мы многое узнаем о безопасности».
Поговорим о безопасности. Ключевой аргумент в пользу беспилотных машин заключается в том, что они сделают дороги «безопаснее». На странице LinkedIn Джона Крафчика, исполнительного директора Waymo, можно найти следующую запись: «В дорожных авариях ежегодно погибает 1,2 млн человек. Причиной тому в 95 % случаев служит человеческая ошибка. Сегодня на планете насчитывается примерно 1 млрд машин. 95 % времени они стоят, требуя вложений денег и занимая пространство наших городов. Нам нужно придумать что-то получше. Беспилотные автомобили способны сохранить тысячи жизней, предложить людям более качественную степень мобильности и освободить нас от того, что напрягает нас во время вождения».
Кажется, Крафчик осуждает водителей. Мол, надоедливые людишки совершают свои человечески ошибки. Это техношовинизм. Разумеется, люди ответственны за водительские ошибки, ведь это они за рулем! (Хотя я однажды видела, как выглядела собака в кепке янки за рулем миниатюрного мерседеса на пешеходной дорожке Бродвея в Нижнем Манхэттене. Я настороженно присмотрелась: позади шел хозяин с пультом управления. А вот это уже привело меня к прекрасно проведенному дню, когда я просматривала видео с животными за рулем радиоуправляемых устройств.)
Мы давно владеем машинами, настолько, чтобы понимать, что люди обязательно будут совершать ошибки за рулем. Потому что они люди. А люди совершают ошибки. И никто не идеальный водитель, даже те, кто пишет программное обеспечение для автономных автомобилей. Когда представляешь себе, что за рулем люди проезжают триллионы километров ежегодно и в большинстве случаев умудряются не совершать ошибки, это впечатляет.
Образ человека, совершающего ошибки, всплывает снова и снова. Смерть людей печальна, я не хочу минимизировать последствия смерти. Однако, когда такую статистику повторяют снова и снова, начинают закрадываться подозрения. Обычно это значит, что у всех данных один источник, следовательно, речь идет о заинтересованной группе лиц, пытающихся повлиять на общественное мнение. Цифра вероятности совершения ошибки (95 %), упомянутая Крафчиком, фигурировала в февральском отчете 2015 г., написанном Сантохом Сингхом, старшим математиком-статистом компании Bowhead Systems Management, Inc[112]. Сингх работал по контракту с отделом математического анализа Национального центра статистики и анализа – подразделением Национального управления по безопасности движения автотранспорта. В отчете представлено 5470 случаев аварий, а также причины и предпосылки для каждой из них: водитель, машина или обстановка (то есть дорога или погода).
Bowhead Systems Management – это фирма, подконтрольная Ukpeaġvik Iñupiat Corporation, компании, сотрудничающей на контрактной основе с ВМС США в рамках операций UAS (беспилотных автономных систем) в Мэриленде и Неваде. Другими словами, Bowhead, компания, производящая беспилотные системы военного назначения, создала официальную государственную статистику, обосновывающую разработку беспилотных автономных систем (машин) для гражданских нужд.
Согласно данным Национального центра исследований здравоохранения (NCHS), в США в 2014 г. из-за механических транспортных средств погибло 35 398 человек – это самые актуальные доступные данные. Получается 11 смертей на 100 000 человек. В среднем стандартизированный по возрасту индекс смерти, учитывающий старение населения, составляет 764,6 на 100 000.
Много людей гибнет в результате ДТП; это одна из важнейших проблем здравоохранения. На языке статистики смерть от ран называется травматической смертностью. Травмы в результате неумышленных ДТП были самой распространенной причиной травматической смертности в период с 2002 по 2010 г., следующая по распространению причина – непредумышленное отравление. В 2015 г. Национальное управление по безопасности движения автотранспорта Департамента транспорта США обнаружило рост смертности по итогам ДТП на 7,7 % в 2015 г. Таким образом, согласно имеющимся у нас данным, в 2014 г. умерло 32 675 человек, в 2015 г. – 35 200.
Можно сколько угодно рассуждать о причинах, но потеря внимания и переписка за рулем способствуют росту смертности. Одним из очевидных решений были бы инвестиции в систему общественного транспорта. Например, в области Калифорнийского залива финансирование общественного транспорта ужасающе низкое. Когда я в последний раз пыталась воспользоваться метро в час пик в Сан-Франциско, я пропустила три поезда, пока в итоге не втиснулась в забитый битком вагон. Дорожная ситуация в разы хуже. И я не удивлена тому, что местные программисты разрабатывают беспилотные машины – чтобы заниматься чем-то, кроме ворчания в пробках. Однако финансирование общественного транспорта – комплексная проблема, требующая масштабных совместных усилий в течение нескольких лет. Она также подразумевает задействование государственной бюрократической машины. И этот как раз тот тип проекта, который люди из мира технологий не спешат начинать, поскольку он действительно может занять много времени, он сложный и в нем не будет простых решений.
Тем временем беспилотная машина остается мечтой. В 2011 г. Себастиан Тран запустил Google X, самое амбициозное подразделение компании. В 2012 г. он основал Udacity, которая также потерпела крах. «Я стремился дать людям нечто фундаментальное – научить их чему-то существенному. Однако реальность расходились с этой идеей, – сказал Тран журналисту Fast Company. – Наш проект был паршивым»[113].
Тран всегда был честен относительно того, что у него не получалось, – но, кажется, никто не обращал на это внимания. Почему? Жадность – простейший ответ. Роджер Макнами, инвестор в технологии, как-то сказал New Yorker: «Некоторые из нас – наивные, насколько это возможно, – действительно хотели сделать мир лучше. У нас не получилось. Что-то действительно стало чуть лучше, что-то, наоборот, хуже. Тем временем пришли к власти либертарианцы, которым все равно, что правильно, а что – нет. Они здесь, чтобы заработать»[114].
Наконец, в 2017 г. любопытство увидеть, насколько реальность соответствует тому, о чем я читала, пересилило, и я решилась снова попробовать покататься на беспилотном автомобиле. Сначала я попробовала Uber в Питтсбурге, недалеко от места, где живу. Сотрудник рекламного отдела сказал, что нет свободных авто. Я спросила, могу ли я просто приехать в Питтсбург и поймать беспилотное такси. Ответ меня разочаровал. Но я поняла, почему это было невозможно: машины не поступили в массовое использование. Они пока не готовы к прайм-тайму.
У беспилотных машин есть проблемы. Они не могут держаться центра полосы на плохо убранной дороге. Не работают в снег и при других плохих погодных условиях, когда не могут «видеть». Автономное вождение на основе системы LIDAR работает по принципу отражения лазерного луча от окружающих объектов. Измеряя время отражения луча, система распознает расстояние до них. Во время дождя, снега или в пыли лучи отражаются от частиц в воздухе, а не от препятствий вроде велосипедистов. Однажды беспилотный автомобиль был замечен за ездой в неправильном направлении по односторонней улице. Автомобиль легко запутать, поскольку он полагается на те же посредственные алгоритмы, что перепутали фотографии черных людей с гориллами[115]. На большинстве беспилотных машин используются алгоритмы, которые называются глубокими нейронными сетями, их можно запутать, просто прилепив стикер или нарисовав граффити на знаке «стоп»[116]. Глушилки сигнала GPS нелегальны, но их можно спокойно купить онлайн за $50. На коммерческих фургонах частенько их используют, чтобы бесплатно пройти пункт взимания дорожных сборов[117]. Автономные машины передвигаются, опираясь на данные GPS; что произойдет, если беспилотный школьный автобус, на скорости 120 км/ч, потеряет сигнал GPS из-за глушилки на грузовике в соседнем ряду?
В научном сообществе бытует некоторый скрытый скептицизм. Один исследователь ИИ как-то мне сказал: «У меня есть Tesla. Автопилот… Э-э-э… В общем, я использую его только на трассе. Он совершенно не подходит для городского вождения. Технология еще не готова. В NVIDIA выяснили, что алгоритм беспилотного автомобиля ошибается в среднем каждые 10 минут». Это наблюдение соответствует инструкции к автомобилю: функцию автопилота действительно следует использовать только на трассе, короткое время и под контролем водителя.
В 2017 г. Uber пережил серьезное давление после того, как бывший исполнительный директор компании Тревис Каланик был записан на видео, где он кричал на одного из водителей, Фаузи Камаля. Тогда Камаль потерял $97 000, он стал банкротом, обвиняя в этом стратегию компании, направленную на понижение цен. В итоге водители зарабатывали в среднем не больше $10 в час. Состояние самого Каланика на тот момент оценивалось в $6,3 млрд. Камаль поделился с ним своей историей. Каланик ответил: «Некоторые люди не хотят брать ответственность за собственное дерьмо. Они обвиняют других во всем, что случилось в жизни. Удачи!» В обход калифорнийским нормам компания выпустила на улицы города беспилотные машины. Проект был закрыт после судебного разбирательства. Каланик лично нанял Энтони Левандовски, участника DARPA Grand Challenge, работавшего с Траном в Google X и позднее в Waymo. Но уже в мае 2017 г. Левандовски был уволен, поскольку отказался сотрудничать со следствием на предмет потенциальной кражи интеллектуальной собственности Waymo в пользу технологических разработок Uber[118].
В мае 2016 г. в автономной машине впервые погиб человек – это был Джошуа Д. Браун из Кантона, Огайо. Сорокалетний Браун был из спецназа ВМС, специалистом по обезвреживанию взрывоопасных предметов и предпринимателем. Он погиб в своей Tesla во время использования автопилота. Он настолько верил в систему, что позволял автопилоту делать всю работу. В тот солнечный день система не распознала трейлер с длинным белым прицепом, поворачивавший на перекрестке. Tesla заехала прямо под него. После столкновения крыша машины была буквально отрезана, а то, что осталось от автомобиля, продолжало двигаться еще несколько сотен метров[119].
«Данные говорят о том, что система автопилотирования, используемая в комплексе с водительским зрением, действительно сокращает нагрузку и значительно повышает безопасность», – прокомментировали в Tesla после аварии[120]. А вот что написали об этом в Associated Press:
Не в первый раз автоматическая тормозная система дала сбой, однако для наладки отозвали лишь некоторые автомобили. В ноябре компании Toyota пришлось отозвать 31 000 Lexus и Toyota представительского класса из-за того, что радар автоматической тормозной системы принимал стальные конструкции и некоторые таблички за препятствие и тормозил. Также прошлой осенью компания Ford отозвала 37 000 пикапов F-150, которые тормозили вовсе без единого препятствия впереди. В компании сказали, что это могло происходить после проезда фургонов с большой отражающей поверхностью.
Технология полагается на несколько камер, радар, лазер и компьютеры, что позволяет ей фиксировать объекты и определять, находятся ли они на траектории машины, сказал Майк Харли, аналитик Kelly Blue Book. Системы вроде Tesla опираются в основном на камеры, которые «недостаточно совершенны, чтобы справиться с ослеплением из-за слишком яркого или низкоконтрастного освещения», – продолжил он.
Харли сказал, что смерть Брауна была несчастьем, однако с развитием беспилотных технологий она не будет единственной[121].
Национальное управление по безопасности движения автотранспорта также проводило расследование, в результате которого Браун, а не компьютер, был признан виновным. Однако они также порекомендовали Tesla поменять название функции «Автопилот».
Решения о том, как беспилотный автомобиль будет реагировать, действительно являются жизненно важными решениями. Масса снаряженного Tesla модели X P90D составляет 2441 кг. К примеру, самка азиатского слона весит около 2700 кг.
После неудачной попытки зарезервировать поездку на беспилотном такси в Uber я попыталась запланировать то же самое в NVIDIA – компании, которая разрабатывает чипы для беспилотных машин. Мне сказали, что я выбрала не слишком хорошее время и лучше устроить поездку после Международной выставки потребительской электроники в Лас-Вегасе. Я попробовала снова, мне не перезвонили. На сайте Waymo говорится о том, что они не принимают запросы от прессы. Наконец, чтобы познать произведение искусства с точки зрения потребителя, я зарезервировала поездку на Tesla. Светлым и солнечным зимним утром мы с семьей отправились в дилерский центр Tesla на Манхэттене. Шоурум, окруженный ныне галереями (а раньше – автомастерскими), располагался в районе Митпакинг, рядом с парком Хай-Лайн, на Западной, 22-й улице. Напротив располагался силуэт женщины из кованого железа. До силуэта добрались бомбардировщики пряжей, так что метал был прикрыт. Связанные крючком бикини безвольно свисали с рамы.
Мы зашли внутрь и увидели Model S седан. Рядом была его уменьшенная версия аналогичного малинового цвета для детей. Она была миниатюрной – как Jeep для Барби или трактор John Deere или машинка Power Wheels, – но все же Tesla. Я была зачарована.
Вместе с менеджером по продажам Райаном мы вышли из салона, чтобы протестировать Model X. Двери у этой модели поднимаются наверх и разворачиваются – как крылья у сокола. Мой сын подошел к машине. Райан нажал на пульт в форме маленькой Tesla, чтобы открыть заднюю пассажирскую дверь. Та медленно открылась наполовину. «Она знает, что ты там стоишь, – прояснил Райан. – Поэтому она открывается медленно – она тебя видит». Дверь перестала двигаться вовсе и, кажется, открываться полностью не собиралась. Озадаченный Райан снова нажал на пульт и затем отправился разбираться, пока мы остались ждать на тротуаре, наблюдая.
Он вернулся и с облегчением пояснил: «Это сенсор». Он находился прямо рядом со знаком «Не парковаться в дни уборки улиц». Зеленый столб был около сенсора, который находился прямо над задней пассажирской дверью. И из-за столба дверь не открывается полностью. Он пообещал, что мы сможем сделать фотографию с открытыми дверями по возвращении, когда машина будет припаркована в другом месте.
Райан стал объяснять нам, где и что находится, как только мы оказались внутри. Я глубоко вдохнула. Пахло новой машиной и роскошью. Белая «веганская кожа» покрывала водительское сиденье, а сиденья позади были заключены в черный сияющий каркас, напоминавший фильмы о Джеймсе Бонде 1960-х гг.
Я поставила ногу на тормоз, и машина завелась. Там, где у обычной машины были бы кнопки, у Model X был огромный тачскрин. Я увидела всего две кнопки. Одна – аварийная сигнализация. «Это федеральное требование», – пояснил Райан, всплеснув руками в извинениях. Вторая кнопка находится справа от тачскрина, она открывает бардачок.
Во время езды в электрокаре не так трясет, как в машине с бензиновым двигателем, в которой есть какая-то постоянная трудноуловимая вибрация. В Tesla такой вибрации нет. Она плавно и тихо двинулась с парковки к шоссе Вест-Сайда.
Я попыталась запустить автопилот при помощи переключателя на левой стороне руля. Чтобы активировать его, нужно дважды потянуть регулятор на себя. Раздался сигнал, и консоль загорелась оранжевым цветом.
«Это новая машина, автопилот здесь неактивен», – пояснил Райан. – Масштабное обновление автопилота вышло несколько дней назад, на этой машине он заработает через несколько недель. Еще нужно собрать кое-какие данные».
«То есть автопилот не работает?» – спросила я.
«Нет, работает, – отозвался Райан. – Машина готова к полной автономии, но мы пока не можем ее применять – ну, вы понимаете, правила».
«Ну, вы понимаете, правила» подразумевало, что Джошуа Браун погиб в аварии из-за функции автопилота, и NTHSA еще не завершили свое расследование. Tesla отключили все автопилоты на своих машинах до тех пор, пока разработчики не создадут, не протестируют и затем не представят обновление.
Райан болтал о будущем, в котором – по его мнению – на каждом шагу были Tesla. «Илон Маск говорит, что, когда у нас автомобили будут полностью автономными, вам будет достаточно нажать кнопку, чтобы машина приехала к вам, – независимо от того, где вы находитесь. Ее путь может занять несколько дней, но она все равно доберется до вас». Я спросила, не приходило ли ему в голову, что ожидание в течение нескольких дней как-то не очень вяжется с идеей обладания машиной.
«Когда-нибудь» – самый распространенный способ обсуждения беспилотных транспортных средств. Не если, но – когда. Мне это кажется странным. Тот факт, что я не могла записаться на тестовую поездку в Uber, NVIDIA и Waymo, означает то же, что сказал Райан, – «Ну, вы понимаете, правила»: беспилотные автомобили в действительности не работают. Либо работают при благоприятных для вождения условиях: когда ясная погода, пустое шоссе с редкой разметкой. Примерно такой подход сработал в случае с Otto, дочерней компанией Uber, основанной Левандовски. Ей удалось прилечь внимание публики к своей компании, запустив беспилотный грузовик с восточного побережья на западное. В проекте было множество изъянов. Продолжительное автономное вождение требует наличия двух серверов на борту – один для текущей работы, другой в качестве резерва. Вместе они потребляют около 5 кВт, что способствует повышению температуры. Ее хватило бы для обогрева помещения площадью 120 кв м. Пока никому не пришло в голову, как в беспилотники установить охлаждающую систему, способную справиться с нагревом[122].
Райан направил меня в сторону светофора на шоссе Вест-Сайд. Обычно я убираю ногу с педали газа и еду накатом до стоп-линии, но тормоза сработали до того, как это получилось, – Tesla оснащена рекуперативными тормозами. Это значит, что тормоза срабатывают, как только я убираю ногу с газа. Иной алгоритм управления машиной сбил меня с толку. Кто-то мне посигналил. Не могу сказать точно, из-за чего мне сигналили: из-за моего странного поведения на светофоре на дорогой машине или это был обычный нью-йоркский придурок.
Я проехала дальше по шоссе и свернула на мощенную камнем Кларксон-стрит. По ощущениям дорога там была не такая ухабистая, как раньше. Райан направил меня за Хьюстон, к длинному зданию. Рядом шел длинный и прямой тротуар с несколькими пешеходами, идущими вдоль погрузочного оборудования. «Поддайте газу, – предложил Райан. – Давайте, никого нет вокруг. Попробуйте».
Меня не нужно было просить дважды. Я утопила педаль газа – всегда хотела это сделать, – и машина рванула вперед. Опьяняющая сила. Нас почти вжало в кресла от мощи разгона. «Почти как Space Mountain!» – прокричал Райан. Мой сын закивал на заднем сиденье. Было жаль, что дорога не была еще чуточку длиннее. Мы вернулись на шоссе Вест-Сайд, и я вновь вдавила педаль газа в пол – просто чтобы вновь почувствовать эту мощь. Всех снова вдавило в сиденья.
«Извините, – сказала я. – Мне просто это нравится».
Райан ободряюще закивал. «Вы отлично водите», – сказал он мне. Я просияла. Понимаю, что наверняка он говорит это каждому, но меня это не волновало. Мы с мужем заметили зеленоватый оттенок бокового зеркала.
«Это самая безопасная машина на рынке, – начал Райан – Самая безопасная машина из когда-либо созданных». Затем он рассказал историю о том, как NHTSA проводило краш-тест Tesla и не могли ее разбить. «Они пытались перевернуть ее и не смогли – им потребовался автопогрузчик. Мы проводили краш-тест, в котором машина врезается в стену, – и сломали стену. На машину роняли грузы и разбили их тоже. Тестового оборудования испортили больше, чем машин».
Мы проехали мимо другой Tesla в Гринвич-Виллидж и помахали водителю. Так поступают водители Tesla – приветствуют друг друга. А если ехать по шоссе в Сан-Франциско, рука устанет махать.
Райан постоянно ссылался на Илона Маска, которого однозначно окружает культ личности, доселе незнакомый ни одному автомобильному дизайнеру. Кто спроектировал Ford Explorer? Я не имею понятия. Но даже мой сын знает, кто такой Илон Маск. «Он известный, – сказал он. – Он даже был приглашенным героем в “Симпсонах”».
Мы припарковались и сфотографировались с сыном на фоне блестящей белой машины с поднятыми дверями. Затем мы вернулись к нашему автомобилю. «Теперь он кажется таким старым», – произнес мой сын. Домой мы ехали по шоссе Вест-Сайд, затем по вымощенной камнем Кларксон-стрит. Мы тряслись и подскакивали на каждом камне. Ощущения были радикально противоположными от езды на Tesla. Я снова чувствовала едва уловимые вибрации. Это было так, будто я пошла в Le Bernadin[123] на ланч и, вернувшись домой, поняла, что съела там лишь хот-доги.
Tesla – превосходный автомобиль. Но я скептично настроена относительно ее беспилотных возможностей. Частично это обусловлено тем, что этику для роботов очень трудно сформулировать. Этическая дилемма, связанная с проблемой вагонетки, философское упражнение. Представьте, что по рельсам несется вагонетка к толпе людей. Вы можете переключить стрелку и тогда собьете одного человека. Что выбрать в такой ситуации: совершенно точную смерть одного или нескольких? Для решения этой задачи и его последующего внедрения в программное обеспечение Google и Uber наняли философов. Это не сработало. В октябре 2016 г. Fast Company сообщила, что ПО Mercedes запрограммировано только на спасение водителя и пассажиров[124]. Это не очень хорошая идея. Представьте, что такая машина направляется прямо в толпу детей на автобусной остановке, а рядом с ними – дерево. Компьютер Mercedes решит наехать на толпу, а не врезаться в дерево, поскольку такая стратегия, вероятнее всего, гарантирует спасение водителя – независимо от того, что сам водитель предпочтет врезаться в дерево ради спасения жизни детей.
Представим обратный сценарий: система запрограммирована пожертвовать водителем и пассажирами в пользу случайных прохожих. Повезете ли вы в такой машине своего ребенка? Разрешите кому-либо из своей семьи поехать в ней? Захотите ли вы оказаться на одной дороге или на тротуарах, проехать на велосипеде рядом с автомобилями без водителей с сомнительной программой, настроенной на убийство вас или водителя? Доверяете ли вы неизвестным вам программистам, которые принимают такие решения за вас? В беспилотных автомобилях смерть – это одна из характеристик, а не баг.
Проблема вагонетки – классический учебный пример компьютерной этики. Многие проектировщики решают дилемму неудовлетворительно. «Если вы знаете, что можете спасти хотя бы одного человека, то стоит спасти его. Спасти того, кто в машине», – сказал в интервью для Car and Driver Кристоф фон Хьюго, менеджер автономной безопасности Mercedes[125].
Следуя примеру Минского и предыдущих поколений, разработчики не задумываются о последствиях применения принятых дизайн-решений. А следовало бы. Инженеры, разработчики, ученые в области компьютеров почти не имеют этической подготовки. У Ассоциации вычислительной техники (ACM), самой профессиональной структуры в этой области, есть собственный этический кодекс. В 2016 г. он был пересмотрен впервые с 1992 г. Напомню, что интернет стал доступен для массового использования в 1991 г., а в 2004 г. появился Facebook.
В рекомендуемых стандартах по компьютерной этике есть определенные этические требования, которые не выполняются. В системе учета нескольких университетов зарегистрированы курсы по этике для компьютерных и конструкторских специальностей. Этика и мораль находятся за пределами нашей дискуссии, однако достаточным будет сказать, что это далеко не terra incognita. Моральные соображения и концепты вроде общественного договора – это то, чем мы пользуемся, когда приближаемся к пределам собственных представлений об истине или понимания того, как стоит действовать в конкретном случае. Мы принимаем решения в соответствии с традициями нашего общества, которые могут формироваться религиозными или иными социальными группами. Когда социальные рамки отсутствуют, люди склонны принимать странные решения. В случае с беспилотными автомобилями нет ни единого шанса, что решения, принимаемые индивидами в офисах технологических корпораций, совпадут с принятыми представлениями об общественном благе. Что вновь приводит нас к вопросу: чему служат технологии? Каким образом они служат нам? Почему автономные машины запрограммированы на спасение водителя, а не группы детей? Кто согласится на такую версию «по умолчанию» и сядет за руль?
Огромное количество людей, включая представителей технологической индустрии, предупреждают о том, что феномен беспилотных транспортных средств поднимет сложные и пока не решенные проблемы. Среди прочих Жарон Ланье обращает внимание на экономические последствия:
Автономные автомобили работают с большими данными. Это не какой-то совершенный искусственный мозг, знающий, как управлять машиной. Просто улицы оцифрованы до мельчайших деталей. Откуда же приходят все эти данные? В частности, с автоматизированных камер. Однако не так важно, откуда приходят данные, – в цепи всегда есть тот, кто ими управляет. И он не автоматизирован, в полном смысле слова. Может, кто-то с очками Google Glass заметит выбоину или кто-то, кто проехал ее на велосипеде, – лишь несколько человек получат новую информацию. В тот момент, когда данные становятся эксклюзивными, повышается их ценность. Стоимость обновления входных данных будет гораздо выше, чем мы себе представляем[126].
Ланье, описывая мир, где безопасность транспортного средства опирается на монетизированные данные, характеризует его как антиутопию, где доступ к данным получают те, кто готов платить за них больше. Он предупреждает, что будущее беспилотных автомобилей едва ли связано с безопасностью, этичностью или высшим благом. Проблема заключается в том, что лишь немногие задумываются об этом. «Автономные машины в тренде и скоро станут реальностью» – это, кажется, стало уже прописной истиной, но мало кто замечает, что слова «скоро станут реальностью» звучат уже десятки лет. Сейчас все эксперименты с беспилотными автомобилями требуют водителя и разработчика на борту. И только техношовинист способен назвать такое положение дел успехом, а не провалом.
Однако в связи с разработками беспилотников на рынке появилось несколько полезных функций. В моей машине есть камеры, встроенные по всем четырем сторонам, – они помогают парковаться. В некоторых дорогих машинах появилась функция параллельной парковки, которая помогает водителю припарковаться в узком месте. В иных машинах есть устройство контроля полосы, которое издает звук, если вы приближаетесь к разметке. Я знаю нескольких водителей, которые действительно очень ценят эту функцию.
Функции безопасности «не продают» машины – в реальности продажи повышают встроенные DVD-плееры, Wi-Fi и Bluetooth. И это нельзя назвать движением к высшему благу. Согласно статистике, обилие технологий на борту не гарантирует безопасное вождение. Национальный совет по технике безопасности, группа наблюдателей зафиксировали, что 53 % водителей верят, что если производители установили на борту развлекательные панели и беспроводные технологии, то их можно безопасно использовать на дороге. В реальности все наоборот. Чем больше развлекательных приложений установлено на борту машины, тем больше вероятность аварии. Проблема отвлеченного внимания водителя стоит с тех пор, как за рулем стали набирать сообщения. В США более 3000 человек погибает в авариях вследствие отвлеченности. Национальный совет по технике безопасности подсчитал, что для того, чтобы полностью вернуть внимание водителя с телефона на дорогу, требуется 27 секунд. В 46 штатах запрещено переписываться за рулем, в том числе в округе Колумбия, Пуэрто-Рико, на острове Гуам и на Виргинских островах. Тем не менее во время движения водители все равно продолжают общаться по телефону, переписываться и искать путь в навигаторе. В частности, молодые водители. Согласно данным NHTSA, число водителей от 16 до 24 лет, которых заметили за манипуляциями с портативными устройствами, выросла с 0,5 до 4,9 % в период с 2006 по 2015 г.[127]
Разработка беспилотных транспортных средств для решения проблем безопасности равносильна проектированию нанороботов для уничтожения вредителей на растениях. Потому вместо того, чтобы создавать системы, заменяющие человека, имеет смысл сосредоточиться на разработке систем помощи водителю. Суть не в том, чтобы заставить мир работать посредством машин, а в людях. Нам нужны решения, ориентированные на человека. Одним из примеров таких решений может стать производство машин, в которых встроено устройство, блокирующее мобильные телефоны. Такая технология уже существует. Оборудование можно настроить так, чтобы при необходимости водитель мог позвонить в службу спасения, но не смог звонить другим, переписываться или выходить в сеть. Такое решение способно резко сократить степень водительской отвлеченности. Хотя это и не привело бы к серьезной прибыли. Надежда на большой куш основывается на шумихе вокруг беспилотных автомобилей. И лишь немногие инвесторы готовы отказаться от этого соблазна.
Автономные машины также могут показаться общественности не очень экономными. В 2016 г. состоялась дискуссия между президентом США Бараком Обамой и директором Медиалаборатории МТИ Дзёити Ито. Дискуссия была впоследствии опубликована в журнале Wired. Они обсуждали будущее беспилотных транспортных средств[128]. «По существу, технология уже здесь», – сказал Обама.
Уже сегодня есть системы, способные быстро принимать множество решений, резко сократить количество погибших в результате ДТП и при этом качественно повысить эффективность современной транспортной сети и помочь решить проблемы с выбросом углерода, повышающим температуру планеты. В ответ Дзёити спросил, какими будут ценности, которые мы собираемся внедрить в такие системы. Предстоит принять ряд решений. Классическая ситуация: двигаясь по дороге, вы можете либо сбить пешехода, либо врезаться в стену, что приведет к вашей смерти. Это моральное решение. Кто же будет устанавливать правила для моральных решений?
Ито ответил: «Когда мы предлагали респондентам пройти тест на проблему вагонетки, большинству пришлось по душе решение, при котором стоит жертвовать водителем и пассажирами. Они также сказали, что никогда бы не купили автономную машину». И никого не должно удивлять то, что члены общества гораздо этичнее и сознательнее, чем те системы, которым нам с воодушевлением советуют доверить свою жизнь.
9
Популярное не значит хорошее
Как сделать хорошее селфи? В 2015 г. одно из американских СМИ раскрыло результаты эксперимента, призванного ответить на этот вопрос. Для тех, кто знаком с основами фотографии, итоги оказались предсказуемыми: удостовериться, что изображение сфокусировано, лоб не обрезан и т. д. В рамках эксперимента использовались те же алгоритмы, что рассмотрели мы, изучая данные «Титаника» в главе 7.
Что интересно и что не вызвало вопросов у исследователя Андрея Карпати, тогда аспиранта Стэнфорда, а сегодня главы отдела искусственного интеллекта в Tesla, – почти на всех «хороших» фотографиях были молодые белокожие женщины, несмотря на тот факт, что в изначальном массиве фотографий были снимки и пожилых женщин, мужчин, людей с другим цветом кожи. В качестве системы оценки качества хорошей фотографии Карпати опирался на количество лайков, поставленных каждой фотографии. Подобную ошибку весьма часто допускают исследователи в области компьютерной технологии, которые не прибегают к критическому осмыслению социальных ценностей, человеческого поведения, что в итоге приводит к появлению подобных результатов. Карпати посчитал, что, раз изображение популярно, значит, оно хорошее. Выбор в пользу популярности привел к тому, что итоговая модель вышла стереотипной: в ней отдавалось предпочтение фотографиям молодых, белокожих цисгендерных женщин, вписывающихся в ограниченное гетеронормативное определение привлекательности. Представим, что вы взрослый чернокожий мужчина, и запустим ваше селфи для анализа в модель Карпати. Ваша фотография не будет маркирована как «хорошая» ни при каких условиях. Потому что вы не белый, вы не цисгендерная женщина и вы не молоды; следовательно, вы не подпадаете под критерии «хорошего». Социальный вывод для читателя заключается в том, что, если вы не выглядите определенным образом, ваше селфи принципиально не может быть «хорошим». Это не правда. Кроме того, ни один разумный человек никогда не скажет подобные вещи другому.
Такое смешение популярного и хорошего проявляется во многих цифровых системах принятия решений, использующих субъективную оценку качества. То есть человек может увидеть разницу между концептами популярного и хорошего. Человек также способен понять, что нечто популярно, но не хорошо (как рамен-бургеры или расизм) или хорошо, но непопулярно (как налоги на доход и ограничения скорости), и оценить это социально релевантным образом. (Но, например, дети или физические упражнения одновременно популярны и хороши.) Тем временем машина способна идентифицировать только популярность, опираясь на заранее установленные критерии, и сама по себе не способна распознать качество этой популярности.
Здесь мы видим фундаментальную проблему: алгоритмы разрабатываются людьми и эти люди встраивают свои бессознательные стереотипы в алгоритмы. Едва ли так происходит специально – но это не значит, что на такое положение дел можно не обращать внимания. Нам следует быть бдительными и критически настроенными относительно того, что, как нам известно, может пойти не так. Если полагать наличие дискриминации по умолчанию, то можно разработать системы, работающие в направлении равенства.
Одной из ключевых идей интернета является возможность ранжировать объекты. Нынешнее общество сходит с ума по измерениям; правда, мне не совсем ясно, появилась ли эта мания благодаря неистовому стремлению математиков к ранжированию либо это стремление является банальной реакцией на социальный запрос. В любом случае подсчеты нынче правят бал. У нас есть системы оценки колледжей, спортивных команд, команд на форумах разработчиков софта. Студенты стараются заработать более высокую позицию в списке класса. Школы ранжированы, сотрудники ранжированы.
Все мечтают занять верхнюю строчку, и никто не хочет оказаться в самом низу: кому вздумается брать на работу (или выбирать) кого-то с самых низких позиций? В образовании, области, известной мне наилучшим образом, процветает логическое заблуждение. Если мы посмотрим на результаты тестов 1000 студентов, то увидим, что они вписываются в гауссову кривую. Половина студентов будет находиться выше среднего уровня, половина – ниже, также будет небольшое количество тех, кто занял самые высокие и самые низкие позиции. Это нормально – однако школьные округа и чиновники считают, что их цель заключается в доведении всех учащихся до «релевантного уровня компетентности». Это невозможно до тех пор, пока средний уровень компетентности не станет равным нулю. Школьные округа считают, что нужно, чтобы все учащиеся были успешными, однако это вовсе не означает, что стремиться к недостижимому идеалу – действительно хорошо.
Идея о том, что популярное важнее хорошего, внедрена в само «ДНК» интернет-поиска. Задумайтесь над его происхождением: в 1990 г. двое выпускников факультета вычислительной техники размышляли над тем, что еще можно почитать по своей специальности. Тогда возраст их специальности составлял всего лишь 50 лет (в отличие от сотен лет развития близкой им математики или, например, истории) и было сложно найти литературу вне программы курсов.
Они прочли какое-то математическое исследование, в котором анализировались цитаты с целью получить индекс цитируемости, и решили попробовать применить описанный алгоритм к веб-страницам (тогда было немного веб-страниц). Проблема заключалась в том, чтобы идентифицировать «хорошие» веб-страницы, то есть те, которые стоят того, чтобы быть прочитанными. Сперва они решили повторить логику отбора академических цитат: в области компьютерных наук самые-цитируемые-статьи всегда самые важные. Значит, хорошая статья должна быть популярной по определению. Таким образом, они создали поисковик, который подсчитывал количество ссылок, указывавших на эту страницу. Затем подсчитывался ранг страницы (PageRank), основанный на количестве указывавших на нее ссылок и ссылок, находящихся внутри нее. Они посчитали, что пользователи будут поступать точно как научные работники: каждый из них будет создавать страницу, которая бы включала ссылки, ведущие на важные, по мнению конкретного пользователя, страницы. Таким образом, популярной страницей становилась та, на которую указывало много ссылок. PageRank был назван в честь одного из выпускников, Ларри Пейджа. Он и его партнер Сергей Брин решили заработать на своем изобретении и создали Google, одну из самых влиятельных компаний в мире.
Долгое время PageRank прекрасно справлялся. Популярные страницы действительно были хорошими – в том числе потому, что в сети тогда было настолько мало контента, что этот порог был не очень высоким. Тем временем все больше людей оказывались онлайн, количество контента росло, и Google стал зарабатывать деньги за счет рекламы на веб-страницах. Модель поискового ранжирования позаимствовали у научных издательств, а рекламную модель – у рекламных изданий.
По мере того как пользователи выясняли, как можно перехитрить PageRank, чтобы повысить позицию своих страниц в поисковой выдаче, популярность стала чем-то вроде валюты в сети. Разработчикам Google пришлось добавлять новые факторы поиска так, чтобы спамерам не удавалось обходить систему. Постоянно подправляя алгоритм, они в итоге добавили несколько функций. Одной из них стало определение географического положения, помогавшее автоматически заполнять адрес. По сути, это поисковое автозаполнение, основанное на реалиях окружающего мира. И, если вы вводили «ga», система бы заменила это на «GA», если в вашей округе многие искали что-то связанное с Джорджией (или, может, футбольную команду Университета Джорджии (UGA)), или предложила бы «Lady Gaga», если пользователи рядом с вами искали что-то связанное с музыкой. Сегодня в поиск внедрены более двух сотен факторов, а PageRank был дополнен множеством дополнительных функций, в том числе машинным обучением. Все это отлично работает до тех пор, пока работает.
История о том, как оформители создавали макет первой полосы газеты, служит хорошим примером того, что машина на самом деле не может переводить. Текст тщательно подбирается. Например, у разных мест на странице есть названия вроде верхней полосы и нижней полосы – это из наиболее очевидного. В газетах The Wall Street Journal всегда есть какое-то заметное место, которое называется A-hed и добавляет легкость подачи материала. Давний сотрудник газеты Барри Ньюман писал:
A-hed долгое время было просто одним из названий заголовков. Однако вскоре стал обозначать название такой истории, которая бы с легкостью сходила со страницы. A-hed – заголовок, который не кричит. Он хихикает.
Как было замечено, великие редакторы создают сосуды, в которые затем авторы помещают свою работу. Именно этим Барни Килгор стал заниматься начиная с 1941 г. Главному редактору The Wall Street Journal было известно, что в мир бизнеса следует добавить немного радости.
Помещая нечто веселое на самое видное место, где оно было окружено новостями о повседневных заботах, Килгор формулировал определенный посыл: тот, кто относится к жизни настолько серьезно, чтобы читать The Wall Street Journal, должен также быть достаточно мудрым, чтобы отступить на шаг и посмотреть на нелепости жизни…
При правильном исполнении A-hed перестает быть просто элементом новостей. Благодаря нашим личным особенностям, любопытству и страстям возникают новые идеи. A-hed – это не юмористические колонки. Они не навязывают мнения. Мы не сочиняем. Иногда легкий, остроумный намек способен затмить все шутки. Двое репортеров, рассказывающих одну и ту же историю, всегда преподнесут ее в собственной причудливой манере[129].
Этот подход радикально отличается от банального скроллинга новостей в ленте Facebook, ведь редактор фактически собирает коллаж: что-то посветлее, что-то потемнее и несколько полутонов формируют «баланс» истории. Первая полоса – это тщательно подобранные элементы. В The New York Times есть целая команда, составляющая цифровую первую полосу – день за днем. Лишь некоторые СМИ могут себе позволить держать такой персонал, поэтому в менее масштабных издательствах первая полоса формируется раз в день либо же автоматически пополняется в зависимости от ее печатной версии. Однако проектирование страниц редактором повышает их ценность для читателя. Это хорошо, но непопулярно: трафик на первых страницах издательств начал резко падать с приходом социальных сетей.
Стало модно критиковать журналистов и журналистику в целом за игнорирование общественной повестки. Я бы возразила, что эти обвинения – не по адресу и не слишком полезны для общества. И тем не менее. В США переход от печатной к цифровой журналистике сильно повлиял на качество итоговой продукции. Согласно Статистическому управлению Министерства труда, в 2015 г. средняя годовая зарплата в областях интернет-паблишинга и на платформах поиска составляла примерно $197 549. В то время как средняя годовая зарплата в издательствах – $48 403, в радиовещательных компаниях – $56 332[130]. Ньюсрумы пустеют потому, что талантливые писатели и журналисты ищут более высокооплачиваемую работу, немногие остаются, чтобы «держать лис подальше от курятника».
Это – проблема, поскольку мошенничество внедрено и в «ДНК» современных компьютерных технологий и технокультуры. В 2002 г. в рамках национального проекта редизайна 25-центовой монеты власти Иллинойса решили дать гражданам возможность проголосовать за изображение, которое они хотели бы видеть. У моей подруги программиста был явный фаворит – дизайн со «страной Линкольна»[131] – изображение молодого Авраама Линкольна, держащего книгу, фоном ему служил контур границ штата Иллинойс. Слева от Линкольна был силуэт Чикаго, а справа – абрис фермы c амбаром и силосной башней. Подруге казалось, что именно этот дизайн достоин представлять ее штат перед всей страной. Поэтому она решила немного схитрить, чтобы выровнять шансы в пользу Честного Эйба[132].
Власти Иллинойса задумали проводить онлайн-голосование, надеясь, что в результате больше людей примут участие и, значит, потенциально у властей будет возможность получить больше поддержки в будущем. Взглянув на веб-страницу с голосованием, моя подруга поняла, что может написать простенькую программу, которая постоянно голосовала бы за «землю Линкольна». Ей потребовалось несколько минут, чтобы написать ее. Она запускала ее снова и снова, выравнивая счетчик голосования в пользу своего фаворита. В итоге подруга победила с большим отрывом. А в 2003 г. именно этот дизайн был запущен в производство по всей стране.
В 2002 г., когда моя подруга рассказала мне об этом, история показалась забавной. Я до сих пор вспоминаю ее, когда роюсь в поисках разменной монеты в кармане и нахожу иллинойсский четвертной. Поначалу я соглашалась с ней в том, что голосование в рамках штата за дизайн монеты было безобидным розыгрышем, – но с течением времени поняла, насколько это было несправедливо с точки зрения властей. Администрация Иллинойса полагала, что получает объективный гражданский отклик. Но то, что они увидели в результате, – фокусы 20-летней девушки, которой стало скучно на работе. Ведь для властей штата это выглядело так, будто множество людей решило принять участие в гражданском голосовании. И, вероятно, они были счастливы участию тысяч людей в голосовании за дизайн монеты. Кроме того, десятки решений следовали за этим голосованием – о карьерах, повышениях, наконец, непосредственно в Министерстве финансов США.
Такого рода мошенничества случаются каждый час, ежедневно. Интернет, конечно, невероятное изобретение, и он вмещает в себя и неконтролируемое мошенничество, и целую сеть лжи, которая распространяется настолько быстро, что правила и законы попросту не успевают за ней. После президентских выборов 2016 г. наблюдался повышенный интерес к фейковым новостям. Однако никого из мира технологий не удивило то, что сфабрикованные материалы вообще существуют. Их скорее удивило то, что граждане отнеслись к этому настолько серьезно. «С каких это пор люди стали верить каждому слову в интернете?» – спросил меня наш программист. Он совершенно искренне не понимал, почему гражданам не известно, как веб-страницы создаются и публикуются в сети. А поскольку он этого не понимал, то и не мог принять тот факт, что некоторые воспринимают чтение чего-либо в интернете так же, как они воспринимают чтение материалов серьезного издательства. Это не одно и то же, но настолько похоже, что действительно легко перепутать проверенную информацию с непроверенной – если не обращать внимания на детали.
Некоторые – обращают.
Эта «добровольная слепота» образовалась по вине представителей техноиндустрии, и именно поэтому сегодня остро стоит необходимость в специальных технологиях и расследовательской журналистике, способной верифицировать алгоритмы и их создателей. «Лисы дежурили у курятника» с самого начала эры интернета. В декабре 2016 г. Ассоциация вычислительной техники – единственная профессиональная ассоциация исследователей в области вычислительной техники – объявила о введении поправок в свой этический кодекс. Это произошло впервые с 1992 г., и с тех пор возникало достаточно этических сложностей, однако представители ассоциации не были готовы мириться с той ролью, которую играли компьютеры в социальных вопросах. По счастью, новый этический кодекс рекомендует членам ассоциации обращать пристальное внимание на различные дискриминации, внедренные в «ДНК» вычислительных систем. Этого удалось добиться благодаря усилиям дата-журналистов и исследователей, занимающихся алгоритмической ответственностью[133].
Рассмотрим историю 18-летней Бриши Борден. Они с подругой дурачились в пригороде Флориды и заметили детские велосипед Huffy и скутер Razor, оба не на замке. Ребята подобрали их и попробовали покататься. Сосед вызвал полицию. «Борден с подругой арестовали и обвинили в воровстве и мелкой краже предметов на сумму $80», – описала события Джулия Ангвин из ProPublica[134]. Затем Ангвин сравнила тот случай с другим похожим нарушением, когда Вернон Пратер, 41 год, своровал из флоридского магазина Home Depot инструменты на $86,35. «Ему уже выносили приговор в попытке и затем осуществлении вооруженного ограбления – за что он пять лет отбывал тюремное заключение – в дополнение к еще одному вооруженному ограблению. У Борден была судимость, но за мелкое преступление в несовершеннолетнем возрасте», – пишет Ангвин[135].
У каждого из этих людей был собственный прогностический рейтинг ареста – знакомо по фильмам, верно? У Борден он был высоким, поскольку она чернокожая. А у Пратера – низким, поскольку он белый. COMPAS, алгоритм анализа риска, попытался спрогнозировать, какова вероятность рецидивного поведения и повторного совершения правонарушений у задержанных. Northpointe, создатель COMPAS, – одна из многих компаний, стремящихся улучшить практики поддержания общественного порядка посредством количественных методов. Это не какое-то злое намерение; в большинстве из этих компаний работают благонамеренные криминалисты, верящие в то, что они действуют в рамках научных представлений о преступном поведении и подкрепляют свою работу данными. Разработчики и криминалисты системы COMPAS действительно верили, что, внедряя математическую формулу в процесс оценки вероятности совершения повторного преступления, они делают благое дело. «На фоне только лишь субъективных суждений объективные и стандартизированные инструменты являются наиболее эффективными методами определения мер, которые следует применять к каждому конкретному заключенному» – читаем в справке к системе COMPAS от 2009 г. из Калифорнийского отделения реабилитации и коррекции.
Проблема заключается в том, что математика не работает. «У чернокожих подсудимых по-прежнему было 77 % риска совершения жестокого преступления и 45 % риска совершения любого другого преступления», – продолжает Ангвин. ProPublica также опубликовала данные, использованные для анализа. Что хорошо, поскольку этот акт способствовал прозрачности системы правосудия; другие люди могли скачать их, поработать с ними и самостоятельно верифицировать проделанную издательством работу. А сама история спровоцировала бурю внутри сообщества профессионалов ИИ и машинного обучения. Последовал шквал обсуждений – в вежливой академическое форме, то есть люди писали много докладов и публиковали их онлайн. Один из наиболее важных докладов вышел под авторством Джона Клейнберга, профессора теории вычислительных машин Корнеллского университета, Маниша Рагхавана, выпускника Корнелла, и Сендхилла Муллэнатана, профессора экономики из Гарварда. Авторы, воспользовавшись математическим аппаратом, доказали, что система COMPAS не может одинаково справедливо оценивать чернокожих и белых. Ангвин пишет: «Они выяснили, что прогностический рейтинг риска может быть либо одинаково верен, либо одинаково неверен по отношению ко всем расам – но не к обеим. Разница заключалась в частоте новых обвинительных приговоров по отношению к черным и белым. “Если у вас два типа населения с изначально разными рейтингами, – сказал Клейнберг, – невозможно равнозначно удовлетворить оба определения справедливости”»[136].
Короче, алгоритмы не работают объективно, поскольку люди внедрили в них свои стереотипы. Техношовинизм заставляет людей думать, что математические формулы, лежащие в основе программного кода, каким-то образом более справедливы в решении социальных проблемы – но это не так.
Данные системы основаны на анкете из 137 пунктов, которая заполняется во время теста. Результаты фиксируются в линейном уравнении – вроде тех, что вы решали в школе. Затем идентифицируется семь криминогенных потребностей или факторов риска. Среди них «образовательно-профессионально-финансовые дефициты и навыки достижения результата», «антисоциальные или криминальные контакты» и «семейно-брачнодисфункциональные отношения». Все эти характеристики – следствие бедности. А это уже что-то совершенно бредовое.
А тот факт, что в компании Northpointe никто не задумывался о том, что в анкете или результатах есть какие-либо предрассудки, напрямую связан с техношовинистским взглядом на мир. Те, кто верит, что математика и вычислительные мощности «объективны» или «честнее», вероятнее всего, убеждены, что неравенство и расизм можно буквально стереть одним кликом. Они воображают, будто цифровой мир другой, лучше реального и посредством превращения процессов принятия решений в вычисления можно сделать мир рациональнее. В небольших командах близких по духу людей такой тип мышления может показаться нормальным. При этом он не способствует равенству и справедливости.
Я не уверена, что у техноутопистов и либертарианцев получится сделать мир лучше посредством умножения количества используемых технологий. Сделать его удобнее – конечно, однако я не верю в такое видение будущего, где все оцифровано. И дело не только в предубеждениях, но и в поломках. Цифровая техника работает плохо и недолго[137]. Со временем телефонные аккумуляторы перестают держать заряд достаточно долго. Компьютеры перестают работать из-за того, что за годы использования жесткий диск заполнился. Автоматические водяные краны перестают распознавать движения рук. Даже лифт в доме, где я живу, – казалось бы, система, изобретенная десятки лет назад и работающая посредством простейшего алгоритма, – постоянно чудит. Я живу в многоэтажном доме, где есть лишь одна лифтовая группа. Все холлы похожи друг на друга. В одном из лифтов что-то не так из-за проводки или блока управления, поэтому каждые несколько недель случается так, что вы нажимаете на кнопку нужного этажа, а лифт везет на этаж выше или ниже. И предсказать это невозможно. Много раз я поднималась на лифте, шла по коридору к «своей» квартире и, пытаясь открыть ее, понимала, что ключ не подходит. Ведь я была не на своем этаже. Подобное случается и с другими жителями дома. Мы болтаем об этом, пока едем в лифте.
Лифты – сложные механизмы, управляемые программами. Существует алгоритм, определяющий, какой лифт на какой этаж поедет и какой из них остановится по ходу. Среди алгоритмов тоже есть степени сложности: в новых лифтах функционируют алгоритмы, оптимизирующие путь следования в любой момент нажатия кнопки. В здании издательства The New York Times в лифтовом холле вы нажимаете на кнопку на консоли управления, и к вам приезжает лифт, который быстрее прочих довезет вас до нужного этажа, опираясь на этажи назначения, указанные другими людьми, следующими в вашем направлении. У лифта всего лишь одна цель, реализацией которой занимаются высококвалифицированные изобретатели, инженеры-конструкторы, инженеры-механики, менеджеры по продажам, маркетологи, дистрибьюторы, гарантийные службы и надзорные органы. И если все эти люди, работающие вместе десятилетиями, не могут заставить лифт в моем доме делать то, что он должен, мне не слишком верится, что другая группа не менее квалифицированных людей в другой цепи разработки и эксплуатации может заставить беспилотный автомобиль выполнять несколько задач одновременно, не убивая при этом ни меня, ни моего ребенка, ни детей, путешествующих на школьном автобусе, ни детей, стоящих недалеко на автобусной остановке.
Такие привычные устройства, как лифты или автоматические смесители воды, на самом деле имеют значение, поскольку служат индикаторами качества работы всей системы в целом. И пока эти штуки не работают как до́лжно, наивно полагать, что волшебным образом заработают другие, более сложные устройства.
О неосознанных предубеждениях программистов говорят давно. В 2009 г. новостной портал Gizmodo сообщил, что процессор в камерах HP плохо справлялся с распознаванием лиц с черной кожей. В 2010 г. игровая приставка Microsoft Kinect не распознавала лица темнокожих игроков при слабом освещении. Когда часы Apple Watch только вышли в свет, в них не было календаря менструального цикла – самый очевидный элемент заботы о женском здоровье. Мелинда Гейтс из Фонда Билла и Мелинды Гейтс прокомментировала это упущение: «Я вообще не покупаю продукцию Apple, однако запустить приложение для контроля здоровья без трекера менструации? Не знаю, как у вас, но у меня всю жизнь были менструации. Это вопиющая ошибка и свидетельство того, что на женщин не обращают никакого внимания». Она также выразила свое мнение относительно очень малого количества женщин, работающих в сфере ИИ: «Когда смотришь на лаборатории и на тех, кто в них работает, можно то тут, то там увидеть единственную женщину. Но мы не найдем в одной лаборатории трех или даже четырех женщин»[138]. За пределами лабораторий с гендерным балансом на руководящих позициях в технологических фирмах дела обстоят лучше, но все же недостаточно хорошо. Согласно данным о гендерном разнообразии, собранным The Wall Street Journal в 2015 г., в LinkedIn, крупной технологической компании, наивысший процент женщин, работающих на руководящих позициях, – около 30 %. В Amazon, Facebook и Google по 24 %, 23 % и 22 % соответственно. В целом доля женщин на руководящих позициях растет за счет сотрудниц маркетинговых и кадровых отделов. Именно эти подразделения выглядят наиболее сбалансированными с точки зрения пола, равно как и отделы, обеспечивающие работу социальных медиа. Тем не менее власть в технологических компаниях все же принадлежит разработчикам и инженерам, а не маркетологам или кадровикам.
Также имеет смысл поразмышлять о последствиях внезапного и грандиозного обогащения в сообществе программистов. В Кремниевой долине, равно как и в технокультуре в целом, наркотики играют важную роль. Они составляли основу контркультуры 1960-х гг. – от ЛСД до марихуаны, грибов, пейота и синтетических наркотиков. В техноиндустрии наркотики никогда не теряли популярность; годами никому не было дела, что кто-то под кайфом, – главное, чтобы программа была написана вовремя. Сегодня на фоне широкого распространения наркотиков, достигшего небывалых масштабов, встает вопрос о том, насколько представители техноиндустрии способствуют росту популярности и распространению ЛСД, грибов, марихуаны, аяуаски и самодельных стимуляторов, популярных как в Кремниевой долине, так и во всем мире. «На фоне расцветающей культуры стартапов, запущенной неистовыми конкурирующими вице-президентами и адреналиновыми программистами, а также благодаря тому, что вымотанные менеджеры стали искать новый способ прийти в себя, незаконное приобретение лекарств и болеутоляющих на черном рынке стало повседневной частью пейзажа в мире сверкающего фонтана технологий», – писали Хизер Сомервилль и Патрик Мей в 2014 г. в Mercury News для газеты San José[139].
В 2014 г. Калифорния была признана штатом с самым высоким рейтингом зависимости от запрещенных лекарств и наркотиков среди населения возрастом 18–25 лет. В том же году в Области залива Сан-Франциско было выдано 1,4 млн рецептов на гидрокодон, обезболивающее, которое нередко принимают для расслабления. Прием синтетических средств позволяет вам бодрствовать, болеутоляющие хороши тогда, когда нужно заснуть. «В долине царствуют трудоголики, способность работать над срочными проектами на невероятной скорости считается там почетным отличием, – прокомментировал для Mercury News консультант по наркотикам Стив Альбрехт. – Сотрудники сутками бодрствуют, чтобы оставаться в ритме, некоторые из них постепенно переходят на метамфетамин и кокаин. Энергетики и кофе только помогают дотянуть до момента приема дозы». В округах Сан-Франциско, Марин и Сан-Матео на 100 000 поступивших в реанимацию у 159 была диагностирована передозировка стимуляторами. Это в три раза больше (39 человек на 100 000), чем по всем США.
Как пишет Мишель Александер в книге «Новый Джим Кроу» (New Jim Crow), потребителями наркотиков становятся представители всех рас[140]. При этом, в то время как за малообеспеченными группами населения наблюдают – с целью соблюдения антинаркотических законов, – технологические элиты, собственно, создавшие системы наблюдения, кажется, не подпадают под подозрение. Silk Road, торговая площадка вроде eBay, но для продажи наркотиков, открыто процветала в сети с 2011 по 2013 г. После того как основатель платформы Росс Ульбрихт попал в тюрьму, на его место стали претендовать другие. В 2014 г. Алекс Херн писал для Guardian: «DarkMarket, система, посредством которой стремятся создать децентрализованную альтернативу Silk Road, пережила ребрендинг и превратилась в OpenBazaar, чтобы улучшить свой имидж на онлайн-рынке. OpenBazaar – это нечто большее, чем просто доказательство работоспособности технологии: концепция была придумана группой хакеров из Торонто в середине апреля, за что они выиграли $20 000»[141].
Спустя два года предприниматель Брайан Хоффман вывел на рынок OpenBazaar и получил $3 млн инвестиций от венчурной фирмы Union Square Ventures и Андресена Хоровитца на то, чтобы запустить торговую платформу с биткоином, альтернативной цифровой валютой. Перед нами тот самый либертарианский рай, который представлял Тиль и другие: новое пространство в недосягаемости государства. Кажется, их план работает. Финансово-техническая компания Lend Edu изучила, как миллениалы пользуются Venmo, платежным приложением от PayPal. 33 % ответили, что с его помощью покупали марихуану, адерал, кокаин и другие наркотики[142]. На сайте vicemo.com висит заголовок «Посмотри, кто покупает наркотики, алкоголь и секс на Venmo». Он показывает онлайн-поток трансакций, открыто опубликованных пользователями приложения. Здесь есть один тонкий момент. Обычно пост о трансакции выглядит так: «Кейден заплатил Коди за жрачку и ганжу». Другие пользователи постят миниатюры таблеток и инъекционных шприцов. Деревья, листья или фразы вроде «стригу траву» обычно означают трансакции за марихуану. Некоторые из них публикуются в шутку, а некоторые в действительности свидетельствуют об определенных «садоводческих» платежах. Так или иначе количество совершаемых операций шокирует, особенно с учетом роста наркомании в стране[143].
Нелегальные наркотики популярны. Они всегда были популярны. И большинство людей согласилось бы с тем, что наркотики вредны, по крайней мере для общества в целом. Поэтому, когда технокультура способствует рекламе и распространению наркотиков, она становится контрпродуктивной для общественного блага. Впрочем, это логичное следствие процесса, когда технологии создаются согласно либертарианским ценностям с намеренным пренебрежительным отношением к реализации. Если кто-то из тех, кто покупает или продает наркотики, был арестован и его данные проверили бы по системе COMPAS, мы бы получили очередной виток дискриминации. Недостаточно попросту спросить, хороша ли та или иная технологическая инновация. Вместо этого стоит спросить: а для кого она хороша? Нам следует изучать более широкие практики применения и внедрения собственных технологических решений и быть готовыми к тому, что нам, вероятно, не понравится то, что мы увидим.
III
Сотрудничество
10
Автобус для стартаперов
Техношовинисты обожают прорывные инновации. Они стали популярны благодаря Клайтону Кристенсену, профессору Гарвардской школы бизнеса. В 1997 г. он написал книгу «Дилемма инноватора»[144] (The Innovator’s Dilemma), после чего прорывные инновации превратились в нечто вроде приливной волны, которая вымывает конкуренцию и в результате приносит колоссальную прибыль.
Инновации – и прорывы, когда мы думаем о них, – чаще всего ассоциируются с молодыми людьми. Спросите любого топ-менеджера, как он представляет себе типичного инноватора, и, вероятнее всего, он представит образ 20-летнего компьютерного гения в худи, пишущего код, который впоследствии приведет к очередному многомиллионному стартапу. Менеджер верит в новизну, свежесть и оригинальность идей, предлагаемых молодыми людьми. Идей, способных создавать новые рынки со своими новыми продуктами, формировать новые потребительские запросы покупателей, открывать новые грани индустрий – или вовсе способствовать появлению целых индустриальных областей. И есть весомая причина, почему журнал Economist охарактеризовал феномен прорывных инноваций «наиболее влиятельной бизнес-идеей последних лет»[145]. Просто представьте себе, сколько в эту идею вложено денег. Наш топ-менеджер может добавить что-то о силе сотрудничества и о том, как группа креативных людей, собравшихся в офисе с белой доской, создает эти самые прорывные инновации.
Я хотела увидеть процесс инновации от начала и до конца, чтобы выяснить, насколько все это соответствует истине. У меня был выбор: либо присоединиться к команде какой-то компании на несколько месяцев, помогая группе программистов и бизнес-стратегов запустить новое приложение или программу, либо я могла понаблюдать тот же процесс, но в течение пяти дней. Выбор пал на последний вариант, и именно благодаря этому я обнаружила себя уставившейся на экран ноутбука в автобусе, движущемся по Западной Вирджинии, с 27 незнакомцами. Я участвовала в соревнованиях «Стартап-автобус».
Многое в Кремниевой долине претерпело игрофикацию, и инновации – не исключение. Обычно на изобретение чего-то нового людей вдохновляет известная финансовая награда. Скажем, если вы пишете сценарии для новых телевизионных шоу, студии будут платить больше за большее количество сценариев и за то, что вы включитесь в разработку проекта шоу. Существует также феномен открытых инноваций, при котором люди, не связанные организационно, разрабатывают новые инструменты и продукты по ряду альтруистических или личных причин[146]. Есть также конкурсы инноваций, их устраивают компании, а в конце лучший продукт и решение получает вознаграждение. DARPA Grand Challenge, упомянутый в главе 8, – знаковый пример, в рамках соревнований команда-победитель, разработавшая машину-робот, получает $2 млн. Похожим образом $1 млн предлагается победителю реалити-шоу Survivor[147], который не имеет дело с технологиями и лишь совсем немножко задействует инновации, однако он должен выжить на тропическом острове с небольшим количеством еды в окружении незнакомцев, подвергаясь постоянным испытаниям. В течение 39 дней. На камеру.
Будет ли «Стартап-автобус» похож на реалити-шоу, только с компьютерами и на колесах? Сможет ли группа, состоящая полностью из незнакомцев, создать что-то по-настоящему новое и ценное, что-то, что может взбодрить всю индустрию технологий? Предстояло это выяснить, поскольку я уговорила моего редактора в Atlantic отправить меня туда. И вот в пять утра я стою на углу Чайна-тауна на Манхэттене в окружении дюжины других технарей, готовых обновить мой мозг.
На третий день половину команды укачало. К тому моменту мы не спали уже две или три ночи, дороги в Грейт-Смоки-Маунтинс опасно извивались, а автобус шел на максимальной скорости. Кроме того, мы слишком долго смотрели в экраны ноутбуков.
Кто-то из команды врезался в стол, за которым мы сидели, и повалил его. Из-за этого упали наши компьютеры – в третий или, может, десятый раз за день. Алисия Херст, дизайнер команды, успела схватить ноутбук до того, как он упал, но ее огромная бутылка с водой все же рухнула на пол – снова. Эмма Пинкертон, стратег, придерживала стол, пока я искала упавший болт, чтобы снова прикрепить стол к стене. Болт я нашла в куче рюкзаков, компьютерных сумок, энергетических батончиков, удлинителей и чипсов.
Порядок был восстановлен, затем я услышала голос Дженифер Шоу, кондуктора нашего «Стартап-автобуса» (они себя так называли) через микрофон. «Эй-эй-эй, Нью-Йорк!» – произнесла она в сотый раз. Шоу и Эдвин Роджерс были лидерами нашей группы. Я была одним из 24 «buspreneurs»[148], согласившихся провести в автобусе три дня и притворяющихся, что они создают новую технологическую компанию. Мы направлялись в Нэшвилл, Теннесси, где планировали встретиться с четырьмя другими автобусными командами, державшими путь из Сан-Франциско, Чикаго, Мехико и Тампа. Вместе нам предстояло выяснить, какой команде удалось разработать проект лучшей технологической компании во время путешествия.
Предполагалось, что мы радостно закричим, когда Шоу обратится к нам по микрофону. Правда, на дороге в горах она получала весьма скромную реакцию. «Это было чертовски жалко! – отозвалась она. Ей было 36, она, казалось, была бесконечно счастлива, у нее были рыжие волосы и щербинка между передними зубами. – Давайте-ка еще раз! Привет, Нью-Йорк!» На этот раз реакция была чуть живее, и это немного удовлетворило ее. Она замерла. Ее лицо выражало сомнение, так, будто она забыла, зачем взяла микрофон. Ей удалось поспать лишь пару часов. Микрофон оказался у Роджерса.
«Мы скоро устраиваем новый бросок, – объявляет он. – Мы слегка устали, но завтра вам предстоит предстать перед судьями. Они не дадут вам расслабиться. Среди них – предприниматели, инвесторы, прошлые участники наших поездок. Они знают, как это тяжело. Вам нужно показать, насколько сильна ваша идея. Они хотят увидеть конечных пользователей, прибыли и продукт, который сорвет миллиардный куш». Он начинал заводиться. Его версия коучинга включала выговоры – будто и без того не было невыносимо находиться в полном людей автобусе, где Wi-Fi работал лишь изредка, а неисправная проводка вынуждала более 15 устройств питаться от трех розеток. Я нашла мои оранжевые беруши и вернулась к ноутбуку. Я работала над презентацией приложения, подсчитывающего стоимость пиццы, – я еще расскажу о нем – под названием Pizzafy. Домен pizzafy.me мы заказали еще в первый день нашего путешествия.
«Стартап-автобус», пожалуй, был самым полоумным хакатоном из всех, что проходили по всей стране каждые выходные. Хакатон – это марафон, соревнование, лишь немного уступающее в популярности видеоиграм, алтимат-фрисби[149] и «Игре престолов» в среде программистов. Он обычно длится от 24 часов до 5 дней и предполагает литры Red Bull и редкий сон.
«Стартап-автобусы» – это разновидность хакатонов с пунктом назначения, когда участники путешествуют в определенное место в течение определенного промежутка времени. (Аналог подобного мероприятия под названием Starter Island требует от участников кодить в течение пяти дней, находясь на борту яхты на Багамах.) Согласно основателю проекта «Стартап-автобус» Элиасу Бизаннесу, примерно 1300 человек побывали на нашем месте и были инициированы в качестве членов нашего сообщества. Первый автобус отправился из Сан-Франциско в Остин в 2010 г. и привез участников на юг, на фестиваль Southwest. В 2015 г., когда участвовала я, автобусы везли нас в Нэшвилл на технологическую конференцию под названием 36–38. Июнь лучше, чем март, подходит для путешествий по стране: годом ранее автобус, отправившийся из Канзас-Сити, заглох на дороге в 12 часах от конечного пункта – Остина.
Те, кто никогда прежде не участвовал в хакатонах, представляют их чем-то вроде очагов инноваций, средой, где величайшие умы встречаются и генерируют новые идеи. Программисты так не считают. Они знакомы с негласной истиной: ничто толковое не создается на хакатонах. Для бесполезных проектов даже есть название – vaporware[150]. Оно означает, что софт после создания просто «испарится», поскольку никто не будет работать над проектом после соревнования (несмотря на все самые лучшие намерения).
В реальности хакатон – это всего лишь игровое социальное мероприятие. Что-то вроде парусной гонки для гиков. Кроме того, хакатоны – невероятно сложные рекрутинговые мероприятия. Венчурные инвесторы и менеджеры по персоналу разыскивают таланты среди участников, а те притворяются, будто действительно планируют бизнес, разрабатывают софт, который на что-то повлияет, и делают то, что по-настоящему изменит жизни других людей. Мечты о создании очередного Google соблазнительны – настолько, что люди соглашаются провести несколько дней с незнакомцами и отказаться от сна только лишь для того, чтобы стать предпринимателями в области технологий.
Вообще, «Стартап-автобусы» – это не слишком здравая идея. Бизаннес, основатель и исполнительный директор проекта, переехал в 2010 г. из Австралии, где работал бухгалтером, в Сан-Франциско. Его привлекала культура стартапов, но на его банковском счету оставалось лишь $200, и, если бы он не начал какой-либо проект, ему бы пришлось уехать обратно. Однажды вечером Бизаннес выпивал с друзьями, и ему в голову пришла внезапная идея: а что, если запустить собственную версию Startup Weekend, популярного хакатона, разве что участником предстоит ехать на автобусе все время? Он позвонил знакомому инвестору во Флориде Стиву Репетти, к слову, разбудив его. Тот согласился вложить в проект $5000 на условиях, что получит место в таком автобусе. Проект запустили через несколько месяцев. Бизаннес, работавший на венчурный фонд Charles River Ventures, теперь стал управлять «Стартап-автобусом» и каждый год организует «Стартап в доме», инкубатор в доме вроде того, что можно было увидеть в сериале «Кремниевая долина» (Silicon Valley) на канале HBO. Он также печально известен своим судейством на хакатоне TechCrunch Disrupt в 2013 г., где двое участников предложили приложение Titstare, позволявшее пялиться на женскую грудь. Позже они заявили, что это была шутка, однако, зная о роли и статусе женщин в технологическом сообществе, это не выглядит шуткой. И даже в качестве шутки этот случай много говорит о реалиях инноваций на хакатонах. Бетси Мораис тогда писала в New Yorker: «Такой уровень женоненавистничества – обыденная реальность в пространстве, которое гордится собственной прогрессивностью, и олицетворяет лишь половину того абсурда, что вылез наружу в случае с Titstare»[151].
Моя автобусная команда сосредоточилась на чем-то (как мне казалось) менее противоречивом – на пицце. У меня была двойственная роль. С одной стороны, я находилась в автобусе, чтобы писать об опыте хакатона, с другой – я была вполне конкурентоспособна, программировала, надеялась, что достаточно прогрессивна, и хотела выиграть. У меня был план. И он был продуктом разочарования. Во время моего первого хакатона за три года до этого я представляла идею, которую действительно хотела воплотить. Это была платформа поиска садоводческих магазинов, при помощи которой пользователь, вводя свое местоположение, находил бы ближайшие из них, видел бы контактную информацию и список ожидающих то или иное растение.
И никто не захотел присоединиться к моей команде.
Тогда я поняла, что идеальный проект для хакатона тот, что можно разработать в установленные временные рамки, соотносится с опытом большинства людей в команде и хотя бы минимально подразумевает актуальную на тот момент технологическую тему. У аппаратного оснащения также бывают звездные моменты: на волне популярности оказывается производство сенсоров, 3D-принтеры, носимые технологии. Некоторое время наука о данных была горячей темой, равно как и искусственный интеллект. Для этого хакатона у меня была припасена стопроцентная идея. Мой муж предложил ее в качестве шутки, однако чем больше я о ней думала, тем более идеальной она казалась (не в пример Titstare).
Когда в первый день нашего путешествия автобус покинул место сбора с полуторачасовой задержкой в 6:30 утра, Шоу и Роджерс устроили публичное представление идей всех участников. Некоторые были популярнее прочих. Дре Смит, разработчик ПО, поднялся и заявил, что его «идея проста: я собираюсь создать танцевальную вечеринку в виртуальной реальности». В общем, что-то такое. Другой разработчик предложил написать приложение, которое помогло бы эффективнее резервировать конференц-залы. Тогда я про себя подумала, что такое приложение уже существует. Предсказуема была пара идей приложений, призванных помочь миллениалам знакомиться друг с другом. (На каждом хакатоне всегда есть идея, суть которой заключается в попытке реплицировать опыт социальных сетей в реальной жизни.).
Некоторые предлагали идеи в формате «Это как _____, только для ________». Например, Джен, вторая рыжеволосая женщина в нашей команде, предложила «создать приложение вроде AirBnB, только для лодок». Спроектировать нечто подобное казалось совершенно нереальным в условиях трех дней, да еще и в автобусе. Но я всегда хотела научиться ходить под парусом, так что представила, как было бы здорово, будь тогда с нами любители яхт. Я оставила себе пометку поработать над ее приложением, если мою идею никто не поддержит.
Наступила моя очередь, и я подошла к микрофону. «У меня есть идея приложения, которое помогало бы подсчитывать количество пиццы, необходимое для вечеринки». Участники с любопытством повернулись ко мне. «В свое время мы с друзьями каждый месяц устраивали вечеринки с пиццей и каждый раз сталкивались с тем, что не могли рассчитать, сколько пиццы нам нужно. Мы называли это математикой пиццы, и за ней неизбежно следовал хаос. Так что я хочу создать приложение, которое подсчитывало бы необходимое для вечеринки количество пиццы с учетом того, кто придет (в том числе возраста, пола и любимых наполнителей)». Раздались аплодисменты. Я испытала большое облегчение. Мой невероятный план мог стать реальностью.
Наша пицца-команда сложилась благодаря Эдди Занески, еще одному программисту в группе. Хакатоны, как правило, это «фестивали членов», однако в нашей команде странным образом преобладали женщины. Эдди было 25 лет, рост 198 см, и одевался он исключительно в безразмерные футболки с технологических мероприятий. «Я не покупал одежду годами, – сказал он мне, когда мы сидели друг напротив друга за одним из хлипких столиков. – У меня гардероб больше, чем у моей девушки». Эдди был ведущим разработчиком технологической компании под названием SendGrid, это значит, что его работа состояла в том, чтобы ездить по стране, посещать хакатоны, закатывать вечерники с пиццей, бесплатно раздавать футболки и убеждать участников использовать SendGrid. SendGrid – приложение, которое многие компании, в том числе Uber и AirBnB, используют для рассылки автоматически сгенерированных электронных писем и рекламных сообщений. Эдди переживал, что захватил слишком много футболок, ведь в нашем автобусе было всего лишь 28 человек. А тем временем в багажном отделении автобуса своей очереди дожидались три гигантские коробки с футболками, которые, располагаясь друг на друге, достигали 120 см в высоту.
Эдди решил, что есть более важные вещи вроде того, чтобы заставить наше приложение заработать перед презентацией в Нэшвилле; он надел свои голубые наушники и повернулся к ноутбуку. Яблоко на крышке светилось сквозь слой стикеров, собранных на технологических мероприятиях: 18F, Penn Apps, GitHub, HackRU. Последний был с его любимого хакатона: он проходил в его альма-матер – Университете Рутгерса. Я выбрала Эдди для своей команды как раз благодаря стикерам. Программисты изучают стикеры друг друга так, будто бы те были предметом высокой моды и лейблами модных домов. Стикер, полученный Эдди в 18F, государственном агентстве открытых данных, говорил о том, что, как и я, он занимался гражданским программированием и ратовал за применение технологий на благо общества.
Мы создали приложение при помощи Node.js, микрофреймворка Express.js, системы объектно-реляционного отображения на базе MongoDB под названием Mongoose, идентификационного межплатформенного ПО Passport. Мы развернули его на Heroku и использовали Bootstrap для разработки фронтенда. Все перечисленное – бесплатные программы, которыми разработчики пользуются при создании ПО. В 2015 г. это было похоже на сборку дома из конструктора Lego, ведь все блоки – кусочки кода – были доступны в интернете. И самое крупное их хранилище – репозиторий и сайт для шеринга кода – GitHub. Мы лишь решали, что хотим от нашего приложения, и выбирали заранее созданные блоки кода, которые впоследствии будут служить фундаментом «дома», и уже затем начали возводить стены и декорировать.
Современное программирование похоже на ремесло – на строительство дома или создание мебели. Хакатоны могут быть отличным способом попрактиковаться в окружении (слегка) более опытных людей. А вот вам другой секрет сообщества программистов: обучающие инструкции и онлайн-видео эффективны лишь до некоторых пор. Чтобы овладеть ремеслом на приличном уровне и сделать это быстро, необходимо находиться рядом с профессионалами, говорить с ними и общаться лицом к лицу. Легендарный информационный дизайнер и теоретик Эдвард Тафти предложил теорию о плотности данных, объясняющую, почему общение лицом к лицу эффективнее виртуального[152]. Согласно Тафти, человеческие глаза оптимизированы для восприятия различных феноменов в небольшом пространстве. Я могу смотреть на стену за моим столом и видеть разницу между краской или ее текстурой в том или ином месте. Но такие детали не будут заметны в случае видеоконференции, поскольку реальность проецируется в камере на не слишком качественную матрицу, неспособную показать такие детали. Кроме того, видео демонстрировалось бы на компьютере, который тоже использует ограниченные мощности аппаратного оснащения. Мониторы имеют фиксированные разрешение и частоту мерцания, что позволяет нашему глазу получить весьма ограниченное количество информации. И, напротив, человеческий глаз каждое мгновение воспринимает йоттабайты[153] информации. Мы получаем более плотную информацию в высоком разрешении. Да, со временем разрешение мониторов увеличилось, повысилась популярность видеосвязи. Однако все равно существует иерархия: электронное письмо эффективно настолько же, насколько почтовая открытка, но пятиминутный телефонный разговор эффективнее двухстраничного электронного письма, поскольку подразумевается дополнительная текстура, комплексность и детали информации, которые мы получаем на основе интонаций и от простого факта общения с человеком. Видеоконференция в высоком разрешении может быть чуть качественнее телефонного звонка, однако для обмена сложной информацией наилучшим образом подходит личная встреча. При этом видеоконференция в низком разрешении будет хуже телефонного звонка, поскольку из-за пикселизации и прерывания связи потеря информации будет значительной. В случае с деятельностью, требующей комплексных знаний, пятиминутная дискуссия лицом к лицу будет полезнее часов обучающих видео.
Тесная коммуникация – одна из причин, почему люди отправляются на хакатоны. Другая заключается в духе сообщества. Как только мы покончили с обсуждениями и проектированием приложения, нужно было заставить других – обыкновенных – людей (друзей, коллег и даже случайных незнакомцев) поверить в реальность нашей воображаемой компании. Нам нужно было, чтобы реальные люди зарегистрировались в приложении и оценили его потенциальное место на рынке. Я вспомнила о компании Domino’s Pizza, которой по факту принадлежит 9 % всей индустрии пиццы в США общей стоимостью $40 млрд. Тим Макинтайр был достаточно добр и согласился поговорить со мной по телефону. Я объяснила ему суть приложения: групповой заказ пиццы, алгоритм для определения начинки и т. п. «Идея отличная, – изумленно ответил он. – Такие приложения действительно могли бы очень пригодиться!» Компания с более чем полувековым опытом, Domino’s, могла, кроме прочего, похвастаться системой онлайн-заказа и особой практикой, когда человеку доставляется его любимая пицца, если тот опубликует в Twitter изображения с пиццей. Но у них не было приложения для группового заказа и анализа начинок. Я решила, что мы обнаружили новую рыночную нишу, и вставила цитату Макинтайра в нашу презентацию в PowerPoint.
Ходили слухи, что программисты зарабатывают на жизнь тем, что выигрывают на хакатонах. Я не придумала способа потратить выигрыш лучше, чем просто покрыть расходы. Мы с коллегами заплатили по $300 за участие, дополнительно – за питание и номер на четверых на пять дней. Погоня за мечтой в миллиарды долларов может оказаться недешевой.
«Организации этой поездки я посвятила два месяца», – сказала мне Шоу, когда мы остановились перекусить в Pizza Hut в Пансатони, Пенсильвания. Она сидела рядом с Майком Каприо, очередным выпускником «Стартап-автобуса», его задача состояла в наставлении участников и помощи в программировании и бизнес-стратегии.
Шоу предложила оплатить ланч. «Спасибо тебе за это, а то у меня нет совершенно ничего», – отозвался Каприо. Я была удивлена: обоих – Шоу и Каприо – мне представляли как предпринимателей, которые начали две собственные компании. А вот и очередная тайна техноиндустрии: иногда предприниматель означает «управлять успешной компанией», а иногда – «идей больше, чем денег». Люди из области высоких технологий обсуждают деньги не так, как в других областях. Участники хакатонов болтают об оценке стоимости компаний подобно тому, как обычные люди обсуждают результаты спортивных соревнований. Компания Instacart – идея, рожденная в одном из «Стартап-автобусов», ее основатели познакомились во время поездки и затем создали фирму. Затем ее цена прошла отметку $2 млрд – по крайней мере так мне сказали около дюжины участников. Такие истории поддерживают миф о прорывных инновациях.
К моменту приезда в отель в Нэшвилле моя команда была на грани из-за слишком большого количества нездоровой еды и недостатка сна. Однако наша программа работала, презентация была сделана, и мы были готовы увидеть, что же из этого получится. Утром в день отборочного тура все команды сели в нью-йоркский автобус и направились в Studio 615, пространство для мероприятий на месте бывшего склада на севере Нэшвилла. И ведь кому-то пришла в голову эта идея: блестящей белой коробки с высокими потолками, импровизированной сценой и клубной музыкой на максимальной громкости. Все участники скучковались вокруг раскладных столов с черными пластиковыми крышками и начали выгружать ноутбуки. Некоторые танцевали. Все вокруг нас говорило о том, что грядет фэшн-шоу, правда, было всего 9:30 утра, и в углу можно было увидеть булочки с корицей и пеканом и сладкий чай. Футболки Эдди стопкой были выложены на стол – вместе с футболками и стикерами других представителей технологических компаний.
Первый этап соревнования проходил в зеленом зале, небольшой пристройке к основному пространству, чьи стены украшали серо-зеленые геометрические обои. На одной из стен от пола до потолка висела картина, на которой была изображена нагая женщина, лежащая в пустыне, а в ее руке – баллончик со взбитыми сливками Reddi Wip.
Судьи – Бизаннес, Репетти, два директора национальных отделений «Стартап-автобуса», Рики Робинетт и Коул Уорли – расположились на диване и следили за презентациями команд. Между прочим, только директорам платили за участие, все остальные присутствовали на добровольных началах, включая сопровождающих. Меня предупреждали, что может встать вопрос о монетизации, о том, как предполагаемая компания будет зарабатывать деньги. Первая команда от проекта Shar.ed рассредоточилась по залу, подключив компьютеры к электросети, и приготовилась к презентации. Я находилась рядом с ними в течение трех дней, но так и не поняла до конца, о чем проект. Shar.ed представили краудсорсинговый проект, организованный по принципу запроса для коммерческого сектора образования, в рамках которого люди могли бы голосовать за курсы, которые хотят прослушать, и преподаватели готовили бы именно этот материал. Они запустили краудфандинговую компанию на Indiegogo, чтобы частично спонсировать проект, и даже собрали несколько сотен долларов.
Следом участники представляли Screet – сервис доставки-по-запросу продуктов для пар, терзаемых страстью. Он предназначается для тех, кто хочет гарантировать безопасность интимного контакта, но при этом не готов отправиться в соседнюю аптеку. Screet – это приложение для смартфона, связывающее пользователей с водителями Lyft или Uber, которые незаметно привозили бы презервативы, латексные салфетки и перчатки. Все это предполагается хранить в багажниках водителей в коробках с маркировкой SKU. Такой сервис особенно пригодился бы представителям ЛГБТ, ведь, например, латексные салфетки сложно найти в аптеках. После двух презентаций я вышла из зеленого зала и присоединилась к моей команде за просмотром трансляции презентаций. Проект Pizzafy был предпоследним в очереди.
Я нервничала, но представила проект. Мы прошли в полуфинал вместе с приложением Screet, командой из Чикаго, разработавшей игрушку под управлением iPad, при помощи которой родители могли играть с детьми в динозавров, и некоторыми другими командами.
Мы перекусили припасенным в коробках ланчем. Играла музыка. Мы снова представили свой проект на небольшой сцене в основном зале. Наши презентации транслировались онлайн. Как минимум несколько десятков людей из других автобусов по всей стране следили за эфиром. Команда проекта SPACES из Нью-Йорка, разработавшая приложение для виртуальной реальности, вышла на импровизированную сцену. «Мы благодарны за возможность, однако наша презентация содержит проприетарные материалы, поэтому отказываемся представлять проект, – сказал Джон Клинкенбирд, руководитель команды[154]. Зал взорвался. Эдвин Роджерс принялся вопить «Нью-Йоркский автобус! Нью-Йоркский автобус! Нью-Йоркский автобус!». Команда, в которую входил Дре Смит (он предлагал идею танцевальной вечеринки в виртуальной реальности), обеспечила себе $25 000 финансирования из стороннего источника. Команда спустилась со сцены, прошла сквозь толпу, пожимая всем руки, обнимаясь, принимая поздравления и наслаждаясь криками. Директоры региональных отделов «Стартап-автобусов», стоявшие по обе стороны от руководителей компании, выглядели рассерженными – так, будто команда проекта SPACES перешла все границы и спровоцировала преждевременную кульминацию представления. Повторить этот успех будет трудно.
Проект Pizzafy прошел на следующей этап вместе с проектом Screet, образовательной компанией из Мехико и проектом из Чикаго, настроенным на отправку текстовых сообщений в момент приема лекарственных средств. Тем вечером все участники отправились в Нэшвилл, чтобы отпраздновать успех. К ним присоединились и другие – чтобы выпить и поболтать. Все обсуждали свою жизнь за пределами проектного автобуса. У меня возникла ассоциация с коллективной «постройкой амбара»: члены сообщества стараются помочь в том, что принесет благо небольшому количеству людей, ведь в конце концов всем нужен амбар. Этим хакерам, программистам и хипстерам рано или поздно придется нанимать людей, компании или предстоит отвечать на сверхсрочный технический вопрос в реальном мире, так что вместе они закладывали основу нашего приложения для вечеринок с пиццей. Такова очередная тайна культуры программистов: порой нужно выполнять безумное количество технической работы без очевидной причины. Вы делаете это потому, что это – гонка, вроде марафонов.
Мы работали всю ночь и весь следующий день. Мы придумали трюк с участием людей из зала, переделали презентацию, повторяли презентацию до тех пор, пока я не запомнила каждую паузу и каждую игру слов со словом «пицца». Наконец после полудня пришло время решающего выступления. Один из представителей компании Instacart судил финальный раунд. Я поднялась на сцену и сделала все что могла.
После нашего проекта представляли PillyPod – «устройство, оповещающее вас, если возлюбленный не принимает необходимые лекарства». Свою проектную неделю они начали с URL pillypad.com – потому что на адресе pillypad.com располагался сайт для взрослых. Так что им пришлось сменить одну букву.
После пришло время объявления победителя, я услышала, как судьи вызвали нашу команду. Клубные лампы в зале стали хаотично светить, а диджей запустил трек Кэти Перри «Dark Horse». Мы вчетвером поднялись на сцену, Шоу обняла меня, и Роджерс тоже, и люди, с которыми я была незнакома. Роджерс плакал. Я чувствовала себя невероятно, стоя несколько минут на сцене вместе с командой.
По прошествии нескольких недель я могу сказать, каково это – выиграть хакатон. Это как выиграть конкурс по поеданию пирогов, где в качестве приза еще больше пирогов. Конечно, я была бы счастлива продать мое приложение технологической компании за кучу денег. Но я не задерживаю дыхание в ожидании. Очередной секрет программистов заключается в том, что успех, приходящий за одну-единственную ночь, – это как черный лебедь, как удар молнии, как белая ворона. Полезная технология, способная служить долгое время, не создается за выходные или даже за неделю. Это – марафон, а не спринт.
Мы любим пофантазировать о том, чего можно добиться на хакатонах при помощи компьютеров. Реальность, однако, немного отличается от того, что мы представляем. Проект «Стартап-автобус» служит в данном случае напоминанием, что преобразующая сила технологий сильно преувеличена[155]. Ни одно из созданных в нью-йоркском автобусе приложений не выстрелило. Команда проекта SPACES, получившая тогда финансирование, вскоре распалась. В реальной жизни оказывается, что софт редко бывает прорывным или инновационным и еще реже – и прорывным, и инновационным одновременно (с учетом выдающихся примеров вроде Google). Вы же помните, что наше приложение было создано на базе кусочков кода, написанного другими людьми, а подсчет необходимого количества пиццы вовсе не прорывная идея. Это всего лишь автоматизация вычислений, которые прежде происходили вручную. И все же я кое-чему научилась за время своей поездки: я стала еще лучше кодить, лучше представлять идеи, обзавелась полезными контактами, которые могут пригодиться для будущих проектов.
Разработка программного обеспечения – прежде всего ремесло, и, как и во всех ремеслах, скажем в столярном или стеклодувном деле, требуется много времени, чтобы овладеть мастерством в полной мере. Участвовать в реальной разработке и ее демократизации, может, не так круто, как придумывать какую-то судьбоносную технологию, но все же ближе к реальности.
11
Искусственный интеллект третьей волны
В книге мы увидели, почему ИИ не работает так, как нам хотелось бы. Мы обращались к примерам непонимания, расизму, замаскированному под аналитику, и разбитым вдребезги мечтам. Теперь пришло время обсудить более приятные вопросы: совместный путь, требующий максимальных усилий со стороны человека и со стороны машины. Человек в паре с машиной эффективнее человека или машины поодиночке.
Начнем с истории обо мне и моей лужайке. Дом моих родителей был бывшей фермой, занимавшей примерно 40 соток. С 11 лет я должна была стричь газон. У нас была небольшая газонокосилка с сиденьем. Это было потрясающе, я считала, что нахожусь в шаге от вождения автомобиля. И, как и большинство детей из пригорода, я не могла дождаться, когда получу права. Так что, если погода позволяла, каждую субботу я рассекала по участку, подстригая газон. Мне не нравилось стричь газон, но мне действительно нравилось управлять газонокосилкой.
Это был старый дом с большим участком, расположенный на холме, так что благоустройство было сложной задачей. По сути, мне нужно было стричь неровную поверхность участка позади дома, два сада по бокам и небольшой кусочек газона в форме буквы J.
Обычно я стригла газон по кругу. Начинала позади дома и делала круг по периметру, доставая до самых краев. Колеса оставляли на земле параллельные следы. Затем, на следующем круге, я проезжала так, чтобы правое колесо газонокосилки попадало на прошлый след левого колеса. Это обеспечивало ровные ряды, и когда я смотрела из окна во двор, то видела хитрую спираль. Она мне нравилась.
Будучи весьма увлеченным садоводом, моя мама создала небольшие островки сада в разном микроклимате участка. У некоторых были резкие углы под 90°. Выглядело изящно. Однако поворотный радиус колес и расположение ножей на газонокосилке не позволяли мне стричь такие углы, не въезжая при этом на метр прямо в цветник. Я могла косить по дуге, но это не угол.
Большую часть работы можно было выполнить верхом на газонокосилке, затем приходилось заканчивать при помощи ручной косилки – так углы обретали задуманные формы. Ральф, парень, который косил газон до тех пор, пока мне не стукнуло 11, занимался этим. На самом деле он стриг весь двор ручной газонокосилкой. И, если бы я была хорошей дочерью, я бы тоже так делала. Миллион раз мама меня об этом просила. И я почти никогда не делала. Конечно, я находила отговорки (аллергия, изнеможение, тепловой удар), но полагаю, реальная причина была в том, что я была упрямым ребенком, который попросту не хотел делать то, что ему не нравилось. Я ненавидела, когда из-под косилки вылетали травинки и палочки, ударяя меня по ногам и оставляя раны и сыпь. Я ненавидела испарения бензина и волны жара, исходившие от нее. Каждый раз, толкая агрегат, мне казалось, будто я постоянно задыхаюсь, поскольку у меня аллергия на траву. А вот на самоходной газонокосилке я находилась над точкой разброса травы. В общем, ручная газонокосилка делала меня несчастной.
В конечном итоге мама сдалась и переделала цветник так, чтобы у него были дугообразные края, а не углы.
Газонокосилка с сиденьем похожа на компьютер. Родители купили ее, поскольку, как предполагалось, она позволит сэкономить усилия. Точнее, вместо того, чтобы нанимать Ральфа, они «нанимали» меня – в этом заключался смысл экономии труда. Хотя езда на газонокосилке (которую я направляла каждый раз по тем же кругам подобно автономному пылесосу Roomba) отличалась от того, что делал Ральф. Результат отличался. Кроме того, была очевидна разница в персонале: Ральф был озеленителем, он выполнял работу на профессиональном уровне. У меня же, угрюмой девочки с аллергией на траву, получалось весьма непрофессионально. В итоге моя мама встала перед дилеммой: сохранить недорогую с финансовой точки зрения эксплуатацию меня, стригущей газон при помощи занятной машинки, которая при этом не делала ту работу, которую мама ожидала, или же она была готова на более дорогой вариант, при котором не применялись сложные технологии, однако результат был точно тем, что был ей нужен.
Моя мама была практичным человеком, у которого было много детей и много садов, так что она просто изменила формы цветников, сделав их округлыми. По сути, так же принимает решения человек, когда дело доходит до автоматизации. Последняя позволяет выполнять рутинную работу, однако не справляется с «углами». Они требуют ручного управления. Иными словами, чтобы машина справилась с углами, нужно встроить в нее человеческое усилие. Иначе работа не будет выполнена.
Сам факт того, что вы предполагаете, что технология не справится со сложными случаями – углами, – уже важен. Эффективный антропоцентричный дизайн требует, чтобы и инженер это учитывал – что вам придется вручную заканчивать работу, если это требуется. Скажем, автоматическая телефонная система позаботится о большинстве рутинных проблем, с которыми сталкиваются люди, однако для некоторых случаев все же понадобятся колл-центр и профессионал. Или, например, в отделе новостей автоматизация может помочь во множестве сфер, однако всегда понадобится кто-то, кто ответит на телефон, проверит автоматически сгенерированную статью перед публикацией – ведь у технологий есть свои пределы. Что-то замечают люди, но не замечают машины.
Существует даже термин, отображающий системы, в работу которых вовлечен человек: системы с оператором в контуре управления. Последние несколько лет меня интересует разработка технологий такого рода[156]. Как-то в 2014 г. я искала новые проекты на базе ИИ и спросила некоторых журналистов и программистов, каким, по их мнению, будет следующая веха развития ИИ. Финансирование избирательной кампании было принято большинством голосов. Приближались выборы президента США; в 2010 г. организация Citizens United способствовала формированию специальных политических комитетов (super PAC), которые во многом повлияли на сбор денег. Дата-журналисты были на гребне этой волны.
Я решила присоединиться к сражению и разработала новый движок ИИ, чтобы фиксировать мошеннические действия в финансировании кампаний и изучить приватность. Это как раз пример автоматической системы обнаружения и анализа событий, правда с оператором в контуре. Как и большинство проектов на базе ИИ, до некоторых пор мой работал прекрасно. Изучение того, как были разработаны те или иные проекты, помогает понять, почему ИИ подходит для одних задач и совершенно не справляется с другими.
Некоторые расследования похожи на стрельбу по рыбе в бочке, и именно к ним стоит применить ИИ. Ведь, чтобы использовать компьютер для поиска истории, нужно быть уверенным в том, что есть что искать. Истории можно найти в «бассейнах с деньгами». И, если мы знаем, что где-то есть «большой бассейн с деньгами», можно быть уверенными в том, что кто-то пытается их украсть. Восстановление последствий урагана, пакеты экономической помощи, неконкурентные контракты: если вы хотите поймать кого-то, кто задумал недоброе, то его точно нужно искать рядом с кучей денег.
Большая куча денег под названием «федеральная политическая кампания» всегда привлекает нескольких не слишком достойных людей. В общем, политики известны своим превосходным распорядительством общественными средствами и истовой службой на благо общества. Но не всегда. В общем, среди дата-журналистов тогда бытовало мнение, что стоит внимательно следить за финансированием кампании в преддверии президентских выборов 2016 г.
Я разработала софт для системы учета учебных материалов, о которой рассказывала в главе 5. Мне стало любопытно, смогу ли я применить программу, которую назвала Story Discovery Engine в другом контексте. В мире высоких технологий мы часто говорим об использовании уже работающих продуктов на новом улучшенном уровне. Это я и хотела сделать. Я создала программный инструмент, который позволял визуализировать проблемные сайты в одном из школьных округов. Могу ли я изменить программу так, чтобы она делала то же самое в другом округе, в Вашингтоне?
При щедрой финансовой поддержке гранта Центра цифровой журналистики Тау Колумбийской школы журналистики я решила разработать новый движок для Story Discovery Engine, который помогал бы при расследовании нарушений при финансировании. Предыдущий движок был основан на идее писать журналистам истории о книгах в школах. На этот раз я хотела создать то, что поможет обнаружить спектр сюжетов в какой-то определенной теме. Я хотела создать более масштабную систему и автоматизировать немалую долю работы журналиста, занимающегося расследованиями. Эта идея появилась задолго до выборов, было предостаточно времени для того, чтобы создать подобную технологию и опробовать на практике.
Я слышала о «темных деньгах» и появлении общественных консультативных комитетов после судебного процесса с движением «Объединенные граждане» в 2010 г. Однако я также знала, что было еще много неизвестного для меня во всей этой системе. Подобно общественному образованию, финансирование избирательных кампаний представляло собой сложную бюрократическую систему, изобилующую разного рода информацией. Кроме того, это был отличный тренировочный кейс. И вот я задумалась: могу ли я обнаружить законодателей, не придерживавшихся собственных правил?
Для начала я задействовала дизайн-мышление. Другими словами, я поговорила с людьми, которым было известно многое о том, что я собираюсь делать, и далее действовала согласно их представлениям об устройстве мира. Я пообщалась с экспертами по финансированию избирательных кампаний: журналистами, Федеральным избирательным советом (FEC), адвокатами, людьми из групп наблюдателей за финансированием избирательных кампаний. Особенно полезным оказалось общение с дизайнерами и разработчиками, работавшими с 18F, государственной системой быстрого реагирования.
Пока я разрабатывала свой инструмент, 18F создавали новый пользовательский интерфейс для морально устаревшего сайта Федерального избирательного совета. Его старая версия, что неудивительно, была слишком сложной для использования и, значит, сложной для понимания. Предполагалось, что новый сайт сделает информацию более наглядной. Однако это вовсе не означает, что он будет отражать данные, необходимые журналистам. Вместо этого дизайн был создан вокруг идеи простого и эффективного распространения данных совета (как благородно). По сути, я собиралась разработать интерфейс, который бы делал для журналистов то, что невозможно на новом сайте авторства 18F. Моим ключевым информатором был Дерек Уиллис из ProPublica, журналист, которому (возможно) было известно о финансировании кампаний больше, чем сотрудникам Федерального избирательного совета. Уиллис, десятилетиями работавший с темой выборов, разработал целый ряд инструментов. OpenElections, Politwoops и другие созданные им программы были настолько хороши, что не имело никакого смысла их переделывать. Но я хотела создать что-то именно для «полевой работы» – как инструменты Уиллиса, но для того, чтобы сделать процесс расследования быстрее. Кроме того, я читала. Самая сложная часть моей работы состояла в том, чтобы читать сотни страниц свода законодательства США и документы Федерального избирательного совета. Я также отмечала близкие моей работе возникающие темы и проблемы и обращала внимание на язык, которым все это было написано.
Первым делом нужно было спроектировать архитектуру системы. У программного обеспечения есть базовая архитектура, примерно как фундамент у зданий. Story Discovery Engine – это система на основе ИИ, однако она не полагается на машинное обучение. Оригинальная идея родом из 1980-х гг. состоит в том, что система представляет собой «эксперта в ящике». Вы задаете ящику вопрос – подобно тому, как спрашиваете врача или адвоката, – и получаете ответ. К сожалению, экспертные системы никогда не работали. А человеческие экспертные возможности слишком сложны для представления посредством системы двоичного кода (чем по сути являются компьютеры). Однако я решила хакнуть экспертную систему и превратить ее в систему с оператором в контуре управления. Предполагалось, что она будет работать, основываясь на правилах, принятых в экспертной области репортера. Это сработало. Я не создала ящик, выдававший ответы, но разработала движок, который помогает мне как журналисту быстрее обнаруживать прецеденты.
Я решила, что правила нового движка должны соответствовать правилам существующей политической системы. Это было умным решением – мне бы не пришлось самой разрабатывать правила, – но не безупречным, поскольку правила финансирования избирательных кампаний США невероятно сложны. Попробую кратко пояснить: каждый кандидат каждого федерального подразделения имеет свой авторизованный агитационно-пропагандистский комитет. Сумма к переводу через комитет в пользу кандидата не превышает $2700 за одну выборную кампанию для граждан. Комитеты могут переводить друг другу деньги. Правда, они ограничены в том, сколько могут переводить и что говорить. А вот специальные общественные консультативные комитеты или независимые комитеты по финансированию имеют право привлекать неограниченное количество средств от лица кандидата. При этом они не обязаны отчитываться о затратах перед кандидатом или его агитационным комитетом. Кроме того, существуют управления общественных консультативных комитетов, комитеты по совмещенному фандрайзингу, организации типа 527 и 501 (с)[157]. И все они так или иначе собирают средства от лица кандидата или против одного или нескольких кандидатов. Комитеты должны отчитываться о расходах Федеральному избирательному совету (FEC). Также организациям типа 527 и 501 (с) необходимо передавать отчеты Службе внутренних доходов США (IRS).
Вы можете говорить о бюрократическом гении США сколько угодно, но все это идеально вписывается в логику моделирования данных. Бюрократия – это византийский лабиринт обстоятельно сформулированных правил и норм, а компьютерный код – гигантский набор правил. Кроме того, если мы творчески подойдем к проблеме выражения правил вычислительными методами, то сможем предложить эффективную модель логики реальной работы системы финансирования предвыборных кампаний. И после этого можно будет разобраться в том, что пошло не так. Я выведу диаграмму, благодаря которой появится возможность моделировать элементы и взаимосвязи между ними. Элементы превратятся в объекты.
Мошенничество в системе финансирования избирательной кампании – удобная фраза, но это лишь вершина айсберга. По факту мошенничества там осталось немного, поскольку неподзаконной осталась небольшая часть их практик. Еще в 1970-х гг. в США сформулировали четкие ограничения, определяющие, сколько и из каких источников кандидат мог привлечь средств и как потратить. Решение работало до тех пор, пока ограничения не начали снимать. Это произошло в 2002 г. благодаря кампании по реформированию избирательной системы, поддержанной обеими партиями: теперь лимит финансовой поддержки федеральных кандидатов и политических партий повышается каждые несколько лет. В 2010 г. по итогам процесса «Объединенных граждан» получилось, что сторонние группы вроде общественных консультативных комитетов могут привлекать неограниченное количество финансовых средств от лица кандидатов. Другим важным решением, принятым в 2010 г. по итогам процесса Speechnow.org против Федерального избирательного совета, стало снятие ограничений на сбор средств внешними группами вроде 527. Теперь им едва ли вообще нужно было раскрывать источники своих средств. В 2014 г. процесс Маккатчен против Федерального избирательного совета способствовал снятию ограничения на сумму к переводу гражданами в пользу кандидатов, партий и специальных комитетов[158]. Полноценное описание специфики финансирования избирательных кампаний не входит в число основных тем этой книги, но я очень рекомендую почитать статьи на сайте «Центра за ответственную политику» (Center for Responsive Politics), где предлагается почти учебник по финансированию избирательных кампаний для обывателей.
Поговорив с моими экспертами, я выделила общие моменты. Все они – эксперты – искали и изучали конкретные аномалии в рамках махинаций при финансировании избирательных кампаний, определенные красные метки, возникающие снова и снова. Чтобы разобраться с феноменом административных растрат, нужно начать с определения: все политические комитеты фактически являются некоммерческими организациями. И, в отличие от обычных некоммерческих организаций, они подают финансовые отчеты напрямую в Федеральный избирательный совет, а не в Службу внутренних доходов. Все некоммерческие организации тратят деньги на реализацию своей миссии и на поддержание жизнеспособности. Первый тип расходов называется программными расходами. Внутренние расходы – административными. В случае политических комитетов программные расходы могут также быть избирательными расходами: на телевизионную рекламу, печатную и цифровую, на рекламно-пропагандистские щиты, а также спонсирование кандидатов. Под административными расходами понимают зарплаты, материально-техническое обеспечение офиса и затраты на фандрайзинг. Соотношение административных расходов с общей суммой расходов – это мера качественного функционирования некоммерческой организации. Многие используют ее, чтобы оценить, насколько хорошо управляется НКО, и, соответственно, принять решение о финансовом переводе в пользу организации.
Другой пример – сеть поставщиков и подрядчиков. Скажем, кандидат Джейн Доу баллотируется в президенты. Джо Биггс хочет поддержать кандидата и перевести $1 млн. Так вот, переведенные средства не попадают напрямую кандидату, а поступают на счет основного избирательного комитета кандидата под названием «Джейна Дона в президенты!» (Jane Doe for President, JDP). Однако Биггс не может перевести миллион в пользу комитета, поскольку, будучи физическим лицом, он имеет ограничение $2700. Но Биггс может перевести эти средства на счет общественного консультативного комитета – «Агитационно-пропагандистскому комитету за справедливость и демократию» (Justice and Democracy Political Action Committee, JDPAC), который может распоряжаться средствами по собственному усмотрению, чтобы добиться конечной цели – победить на выборах. JDPAC тратит переведенные Биггсом деньги на то, что называется независимыми расходами. Проблема с группами по координации расходов (вроде агитационно-политических комитетов) заключается в том, что они не сверяют расходы с основным избирательным комитетом, так что JDPAC может не координировать свою деятельность с JDP.
Теперь, допустим, JDP нанимает дизайнеров в Уичито для разработки рекламы избирательной кампании. Компания Wichita Design появилась в отчетах JPD о расходах, передаваемых Федеральному избирательному собранию. Допустим, JDPAC нанимает тех же дизайнеров. И в их отчетах Wiсhita Design также появится. Они действительно могут не координировать свои действия. Возможно, у дизайнерской компании превосходная производственная дисциплина: она могла установить файерволл и объяснить сотрудникам, что не должно быть никакого взаимодействия, и в итоге ведение двух проектов оказалось бы хорошим делом. Это вполне возможно, легально и адекватно. Это также показывает, как многие и многие комитеты обращаются к одним и тем же подрядчикам. Например, в США существует несколько компаний, выполняющих расчет заработной платы. Большинство кампаний и сторонних групп используют автоматическую обработку данных для расчета зарплат, и это не выдумка. Однако есть вероятность того, что координация деятельности существует на уровне подрядчиков. Таким образом, если журналист может выяснить, что JDP и JDPAC обратились к одной и той же дизайнерской фирме в Уичито, которая, как оказывается, управляется бывшей соседкой Джейн Доу по общежитию, он продолжит раскапывать информацию в этом направлении и выяснять, есть ли в данном случае что-то противоправное. И тогда это может вылиться в журналистский материал.
Новому айтишному проекту принято давать имя – как питомцу. Имя формулирует общий маркер, на который могут ссылаться все, кто вовлечен в его разработку. Свой проект я решила назвать «Бейливик» (Bailiwick). Согласно словарю Мерриам – Уэбстер, слово имеет два значения: «округ или юрисдикция бейлифа» и «сфера компетенций или интереса». Оба определения подходят, особенно с учетом того, что бейлиф – это «офицер в судебном органе, который помогает судье следить за порядком на судебном заседании». Я представила, как моя программа станет метафорой высокого храброго бейлифа по имени Булл или хитроумного бейлифа Роуза, как в телешоу 1980-х гг. «Ночной суд». Он бы переносил документы и носители с данными по залу туда-сюда и выполнял функцию посредника. Кроме того, мне нравилось слово «бейливик», оно звучало мило и игриво. В моем случае категорически приветствовалось все, что могло привнести хотя бы каплю игривости в анализ данных финансирования избирательных кампаний.
С практической точки зрения софту необходимо название для того, чтобы можно было создать соответствующую директорию на компьютере – у нее должно быть название. Важно в самом начале назвать свой проект, почти как дать имя ребенку. В то же время вы, назвав ребенка Джозеф, можете через два дня передумать и назвать его Йосси, и именно это имя начнете писать на изнанке его футболок. Если же вы переименуете директорию с программой, в коде, скорее всего, появится огромное количество нестыковок.
Итак, «Бейливик». Его можно найти в интернете на платформе campaign-finance.org.
Переходим непосредственно к процессу разработки. Некоторые проблемы, с которыми я столкнулась, были традиционными повседневными сложностями при разработке любого программного проекта. В частности, мне пришлось нанять помощника-кодера, поскольку в какой-то момент сроки стали поджимать. Наем разработчика не похож на наем юриста: настоящие профессионалы невероятно дорого стоят. Кроме того, их сложно найти, и они не рекламируют свои услуги. Им не нужно. Есть, конечно, несколько вариантов, но для обычного человека они будут сложными. Поисковый запрос «нанять разработчика Django» принес лишь бесконечную кучу спама. Вот один из показательных результатов выдачи:
Работа Django | Разработчики Django | Работа фриланс
Django team – одна из самых популярных django фриланс-платформ для поиска работы. Django team – это ярмарка лучших разработчиков django, инженеров, программистов, кодеров и разработчиков архитектуры системы…
Поиск разработчика онлайн оказался исключительно сложной задачей. Вместо этого я решила обратиться к своим контактам в поисках рекомендации. Предполагалось, что технологии позволят облегчить поиск профессиональных услуг онлайн, на деле – они лишь усложнили процесс. Слои алгоритмов, подверженных внешнему управлению с целью выгоды, осложняют выполнение обычной задачи вроде поиска разработчика. Та же проблема возникла, когда я попыталась найти мастера, чтобы починить кое-что у себя дома. И это напомнило мне о том, почему администрирование контента так важно. В онлайн мире, где у каждого своя правда, выполнение простых задач может занять вечность. Парадокс: выбор может быть тяжелым бременем.
Я поняла, что, увы, столкнулась с той же проблемой, что и математики в XIX в.: им нужно было больше вычислителей, которых невозможно было найти. Я хотела нанять целую команду женщин и цветных. Я просмотрела все свои контакты, но задача оказалась сложнее, чем я ожидала. Я говорила с одной разработчицей – и владелицей собственного магазина, – но ее услуги оказались слишком дороги. Наконец, я наняла фрилансеров – женщину и троих мужчин, в итоге гендерное соотношение женщин и мужчин в проекте стало 2:3. В случае маленькой команды и близкого дедлайна это должно было сработать.
В работе над проектами, связанными с написанием софта, есть один «секрет»: никто не знает, сколько времени потребуется на проект. Это обусловлено отчасти тем, что написание компьютерного кода больше похоже на написание эссе, нежели на конвейерное производство. Обычно для нового проекта код пишется впервые, так что не существует по-настоящему релевантного способа оценить, как много времени потребуется на его создание – особенно если предполагается, что разрабатываемые функции будут делать что-то, что не делалось раньше. Другая проблема заключается в том, что код пишут люди, а не машины. Люди не слишком хорошо оценивают время и требуемые усилия: они отправляются в отпуск, проводят вторую половину дня на Facebook вместо работы. Короче, люди есть люди. Они – переменные, а не константы.
Настоящим испытанием стало то, что нам предстояло показать сложные взаимосвязи мира финансирования избирательных кампаний простым и понятным способом. Я обратилась к эксперту в области пользовательских интерфейсов Эндрю Гарварду, разработавшему несколько проектов, которые помогали журналистам организовать и систематизировать важную для них информацию. Журналисты уровня штата США обычно стремятся обнаружить истории, связанные с избирательной кампанией в их штате. Журналисты национального уровня фокусируют свое внимание на президентской гонке и ключевых кампаниях в штатах. В любом случае система предлагает выбрать конкретную кампанию и кандидата. И вы это видите в предлагаемом списке, когда входите в систему. Рисунок 11.1 показывает, что видит пользователь, если в списке оказались Хиллари Клинтон, Дональд Трамп и Берни Сандерс. Клик по имени открывает страницу с информацией. Каждое досье предполагает набор финансовых отчетов, переданных в Федеральный избирательный совет. При помощи «Бейливика» репортер может просмотреть все эти отчеты по отдельности или вместе.
Финансовые пожертвования бывают «за» кандидата и «против». Согласно законодательству, в финансировании избирательных кампаний переводы делятся по группам. Помните, что есть еще авторизованные переводы и независимые расходы? Так вот «Бейливик» отслеживает все это в отчетах и структурирует по группам поддержки и оппозиции. Это сильно экономит время и ресурсы. Кроме того, так проще просмотреть имена и заметить интересные детали.
Внешние и внутренние группы, представленные в виде плоской древовидной структуры – базового типа при визуализации данных, – появляются внизу страницы каждого кандидата. Сложно анализировать цифры, гораздо проще обнаружить закономерности в графических данных, особенно когда расходы группируются по категориям. В древовидной структуре каждая категория представлена прямоугольником. Относительный размер каждого из них имеет значение, поскольку отражает количество спонсоров и суммы. Я могу нажать на любой прямоугольник и увидеть более детальную информацию. Так, например, Great America PAC больше всех потратил на независимые расходы в рамках инаугурации (рис. 11.2).
Кликнем на этот прямоугольник и увидим, что этот спонсор потратил $12,7 млн в поддержку избирательной кампании Трампа, разбив сумму на десятки трансакций в течение всей избирательной кампании.
Нередко визуализация данных вдохновляет на журналистское расследование. Так, когда я впервые увидела визуализацию расходов избирательного комитета Трампа, я заметила этот прямоугольник, помеченный словом «шляпы» (рис. 11.3). А в 2016 г. в рамках кампании комитет потратил $2,2 млн на шляпы производства компании Cali-Fame (рис. 11.4).
Осенью 2016 г. я ничего не знала о Cali-Fame, но мне казалось, что из этого может получиться расследование о том, как Трамп тратит деньги на шляпы. Та же идея пришла в голову репортеру Филиппу Бампу. 25 октября 2016 г. он опубликовал в Washington Post статью под названием «В период избирательной кампании Дональд Трамп тратит на шляпы, а не на опросы»[159]. И не только на это, надо сказать. Трамп также потратил $14,3 млн на футболки, кружки, стикеры и перевозку всего этого – все это было произведено компанией Ace Specialities LLC, специализирующейся на производстве рабочей одежды для нефтегазовых компаний. Владелец компании Кристл Махфуз состоит в совете директоров фонда Эрика Трампа[160]. Значит ли это что-нибудь? Я не знаю. Однако, будь я политическим журналистом, это послужило бы основой для нового расследования.
Эндрю Шивашман, журналист, пишущий об индустрии туризма для сайта Skift, иначе видел ситуацию. Он использовал данные в статье «Клинтон против Трампа: где кандидаты в президенты тратили свои доллары». В рамках статьи он анализирует то, как, пользуясь средствами избирательной кампании, Трамп платит собственной фирме TAG Air за перелеты[161]. Это не незаконно, но примечательно. Это также представляет почву для обсуждения множества вещей, которые не являются незаконными, но едва ли уместны. И журналистские расследования – единственный способ придать таким обсуждениям начальный импульс. Ведь истории помогают понять мир. Кроме того, не существует простых ответов. Чтобы разрешить эти вопросы в демократической манере, необходима социальная дискуссия, в которой бы присутствовали разные мнения.
Story Discovery Engine – это, скорее, система с оператором в контуре управления, нежели автономная система. Разница между ними подобна разнице между дроном и реактивным ранцем. И эта разница имеет значение в случае проектирования программного обеспечения. Если вы ждете от компьютера всевозможных чудес, то будете разочарованы. Однако если вы ожидаете, что он ускорит выполнение рутинных задач, то все будет хорошо. Позиция в пользу машинной поддержки человека набирает популярность в хедж-фондах с оборотом $2,9 млн – а они всегда были показательны с точки зрения внедрения новых количественных методов. Миллиардер Пол Тюдор Джонс, глава Tudor Investment Group, как-то произнес свою легендарную фразу: «Ни один человек не лучше машины, и ни одна машине не лучше человека»[162].
Другой способ разобраться в том, как работает движок, – это представить, что он отражает разницу между что есть и чем должно быть. Что должно быть: административные расходы не должны превышать 20 % от общих расходов. Что есть: независимо от процентов ежегодные расходы относятся к административным – согласно отчетам, передаваемым в Федеральную избирательную комиссию. И, если обнаруживается аномалия – если административные расходы превышают 20 %, тогда появляется почва для журналистского расследования.
Что я имею в виду под почвой для расследований? Нельзя гарантировать, что в каком-то случае совершенно точно есть готовая история, поскольку для больших объемов административных расходов в определенном квартале есть причина. И мы не хотим создавать механизм, который будет констатировать, что существует вероятность, равная 47 %, что та или иная политическая группа действует нелегитимно, ведь ее административные расходы в этом месяце превышены на 2 %. Это абсурд – и, вероятно, клевета.
Нередко, когда я беседую с учеными-информатиками, они советуют обращать внимание на пять самых высоких и пять самых низких показателей, а также на среднее значение по массиву данных. Это хорошая идея, но она не всегда работает с точки зрения журналистики. Допустим, мы «скормим» нашей программе список зарплат сотрудников школьного округа. Пять самых высоких позиций наверняка будут принадлежать директору и ключевым руководящим позициям. Пять самых низких позиций окажутся у низкооплачиваемых сотрудников, тех, кто не состоит в профсоюзах и работает неполный рабочий день. Ничего нового. Это может заинтересовать тех, кто не в курсе уровня зарплат в этой области, однако это точно не считается инфоповодом. Как журналисты мы должны быть одновременно точны и интересны массовому читателю. В этом смысле выкладки ученых могут быть интересными небольшому кругу лиц или достаточно подготовленной аудитории (я всегда им завидовала из-за этого). Порог интереса различается в каждой категории.
Так что, если бы я собиралась изучать крупные административные расходы, я бы обратила внимание на те, у которых были наивысшие проценты трат. Выбросы на графике – легкие данные. Поэтому я бы изучала категории как с самыми высокими процентами, так и с самыми низкими, и пыталась бы понять, есть ли там что-то любопытное.
Я также внесла одну важную правку в Story Discovery Engine. Когда я пыталась объяснить людям, что делает программа, они часто спрашивали: «Ты хочешь сказать, что создала программу, которая фонтанирует идеями для расследований?» Я объясняла, что это не так и что все сложнее, и рассказывала об автоматизации. Постепенно глаза моих слушателей стекленели. Поэтому для второй версии программы я решила придумать систему, представляющую настоящие идеи для историй. На рисунке 11.5 показан обновленный интерфейс программы.
Замечу, что это дополнение в данных является так называемым «минимально жизнеспособным продуктом» (Minimum Viable Product, MVP). Оно работает, вы видите результаты его работы – однако только для одного случая, а не для всех сразу, которые вы запланировали. И это упомянуто в справочной документации. Как по мне, дополнение работает достаточно хорошо, чтобы утверждать, что оно действительно работает. С моей точки зрения, с позиции разработчика, проблема решена. Однако с точки зрения компьютера, чтобы что-то работало, этому «что-то» необязательно работать хорошо. Это не бинарное понятие. Человек не может быть слегка беременным, в то время как софт, может немного работать. Так, суть минимально жизнеспособного продукта заключается в достаточном уровне функциональности для демонстрации заказчикам – чтобы получить новые заказы или финансирование для следующего круга разработки. Это не пример хорошей разработки, продукт неэффективен для пользователей, и уж тем более практика представления на рынок полифункционального продукта не является хорошим делом, но при этом такой подход стал обычным делом. Мне кажется, мы способны на большее. Ведь в большинстве случаев проблема одинакова для всех, и я столкнулась с ней, создавая «Бейливик»: у команды закончились деньги и время на разработку до того, как проект был завершен.
Есть и другой пример типичной проблемы, которая может принимать разные формы. Однажды код выдал ошибку, я не могла понять ее природу. Я решила создать новую базу данных и протестировать код на всех моих 3,5 млн записей – тот же результат. Первые 10 секунд все работало, затем появилась другая ошибка. Я исправила то, что – как мне казалось – стало ее причиной, и затем пыталась загрузить данные снова. Не сработало. Я что-то еще поменяла в коде, и все стало только хуже. Я переключилась на первую базу данных и попыталась воссоздать первую ошибку. Не вышло – вылезла новая ошибка. Тогда я поняла, что не смогу поправить первую базу данных, и перешла ко второй. У меня было плохое предчувствие; другие члены моей команды пользовались первой базой данных, и тот факт, что она была доступна и при этом содержала ошибки, мог сильно повлиять на результат их работы. На самом деле это была обычная ошибка контроля версий ПО, однако в связи с тем, что в программировании важную роль играет точность, получилось, что ошибки, спровоцированные мной, привели к каскаду новых неисправимых ошибок, затрагивавших работу других разработчиков.
Таковы в общих чертах препятствия, с которыми приходится сталкиваться в рамках внедрения того или иного программного обеспечения в новостные редакции. Встречаясь со сложностями, работая с небольшими программами, можно понять, как и что происходит в более крупных масштабах. Можно также увидеть, почему крупные проекты могут потерпеть неудачу. Кроме того, возможно понять, почему процесс написания кода нельзя поставить на поток. Есть модель фабричного производства – с конвейером, – и есть малое производство. В случае с фабричной системой вы смотрите на весь спектр задач и решаете, какая из них может быть автоматизирована и повторяема. В случае малого производства происходит то же самое – и все же часть работы выполняется вручную. Представьте себе вычислительную журналистику как движение за неспешную еду – слоуфуд.
На сегодняшний день мой проект не сильно распространен, но имеет мощное влияние. Я не слежу за тем, сколько репортеров использовали его для создания историй, однако я часто им пользуюсь на занятиях. Каждый семестр я учу около 30 студентов. Это значит, что каждый семестр с помощью «Бейливика» создается как минимум шесть историй. Результат вполне оправдывает затраченные усилия. Если бы им постоянно пользовались в новостных редакциях, можно было бы получать доход, разместив рекламу внизу страниц. Очевидно, что программа не станет ключевым параметром доходов, однако что-то будет капать. И, конечно, «Бейливик» не смог бы привлечь столько же средств, сколько продукты массового спроса, однако мог бы стать ремесленной продукцией, генерирующей небольшой доход.
Пока мой инструмент анализа системы финансирования избирательных кампаний не приносит денег вовсе. На финансовом языке это значит, что у него нет стратегии устойчивого развития. «Бейливик» имеет смысл как инструмент обучения, как модель для проектов – расследований, наконец, в качестве примера практического исследования (имеется в виду «нетеоретическое исследование») в рамках вычислительной журналистики. К моему сожалению, эта неочевидная ценность не помогла мне ежемесячно содержать серверы «Бейливика», что обходилось в $1000. А вот и очередной «секрет» техномира: инновации стоят дорого. Если бы я знала, что проект окажется настолько дорогим, в процессе разработки я бы принимала другие решения. Однако, поскольку никто до нас не создавал такой софт, было совершенно невозможно предсказать расходы. У меня была своя слепая зона – она есть всегда, когда создаешь новую технологию: необходима вера в то, что ты создашь то, что задумала и что на это хватит финансирования. Процесс разработки иногда может быть будоражащим прыжком в неизвестность.
12
Стареющие компьютеры
Я не планировала, что «Бейливик» будет работать вечно. В какой-то момент я отключу его, заархивирую и займусь другим программным проектом. Подобно автомобилю, растению или отношениям, софту нужна забота и постоянное внимание. И у него есть срок жизни.
Веб-сайты, приложения и программы всегда ломаются, потому что компьютеры, на которых они работают, необходимо постоянно обновлять. Мир меняется. Программному обеспечению нужны обновления. Если у вас на хостинге располагается даже простейший сайт компании, надо быть готовыми к тому, что компания всегда будет претерпевать управленческие изменения, что нужно будет обновлять серверы и что-то пойдет не так. Каждый год работы того или иного программного продукта накапливает технический долг – стоимость поддержания его актуальности, добавления патчей и латание багов. В своей редакторской колонке для The New York Times профессора Эндрю Рассел и Ли Винзел пишут, что 60 % всех затрат на софт приходятся на поддержание его работоспособности – исправление багов и обновления[163]. В противовес популярному представлению невероятное количество разработчиков и программистов не участвует в реальной разработке инновационных продуктов; 70 % задействованы в поддержании существующих проектов.
Проблема необходимости поддержания софта служит отличным напоминанием о том, что цифровой мир более не нов. Подобно первопроходцам первого бума доткомов, он вошел в стадию среднего возраста. И если полагать, что цифровой мир начинался с Минского и Тьюринга, то можно сказать, что он значительно постарел: пришло время быть более реалистичными и честными по отношению к тому, что происходит в области технологий и реальной необходимости их поддерживать. Я настроена оптимистично и уверена, что мы сможем найти путь использования технологий, чтобы одновременно поддерживать и демократию, и человеческое достоинство.
Ошибки сделаны. Это вполне могло бы быть рефреном к тому, как медиаиндустрия адаптировалась к цифровой революции. Также могло быть рефреном того, как индустрия технологий справлялась с той же цифровой революцией. Секрет понимания прошлого заключается в том, чтобы не сделать те же ошибки в будущем.
Во-первых, мы можем перестать относиться к технологиям как к чему-то новому, сверкающему и инновационному и вместо этого принять их как повседневную часть жизни. Первый компьютер ENIAC был создан в 1946 г. У нас было больше полувека для того, чтобы понять, как интегрировать технологии в общество. Полвека – это много времени. Однако, несмотря на все прошедшие годы, когда я посещаю какие-либо встречи, я знаю, что первые 10 минут всегда будут отданы на то, чтобы разобраться, как работает проектор и как вывести на экран презентацию PowerPoint. На сегодняшний день нам удалось научиться применять цифровые технологии и повышать экономическое неравенство, подрывать экономическую стабильность свободной прессы, провоцировать кризис фейковых новостей, откатиться назад в развитии систем голосования и защиты честного труда, следить за гражданами, распространять лженауку, оскорблять и преследовать (в основном женщин и цветных) онлайн, строить летающих роботов, способных в лучшем случае раздражать людей и в худшем – сбрасывать бомбы, повысить количество случаев хищения персональных данных, обеспечить почву для хакинга, выливающегося во взломы и кражи данных миллионов кредитных карт, продавать невероятные объемы персональных данных и выбрать Дональда Трампа президентом. Это вовсе не прекрасный мир, обещанный ранними техноевангелистами. Это тот же мир, с теми же людскими проблемами, которые всегда были. Однако теперь они спрятаны внутри кода и данных, из-за чего их сложнее увидеть и легче игнорировать.
Нам совершенно необходимо изменить наш подход. Нужно перестать подвергать технологии фетишизации, провести аудит алгоритмов, отслеживать акты проявления неравенства, сокращать наличие стереотипов как в вычислительных системах, так и в самой индустрии технологий. Если код есть закон, то, вспоминая Лоуренса Лессинга, необходимо удостовериться, что те, кто его пишет, сами ему же следуют. Пока что их попытки самоуправления оставляют желать лучшего. Мы не можем учиться на прошлых поступках, но нам нужно обратить на них внимание.
В нескольких современных проектах из области науки и журналистики говорится о том, что грядет новый, более сбалансированный подход к пониманию ИИ. Один из них – подход исследовательского центра Института современного искусственного интеллекта (AI Now Institute) при Университете Нью-Йорка, основанный в 2017 г. Кейт Кроуфорд из отдела исследований Microsoft и Мередит Уиттакер из Google. Созданный представителями Кремниевой долины, проект был запущен Управлением по политике в области науки и технологий при Белом доме президента Барака Обамы и Национальным экономическим советом. Первый отчет центра был сфокусирован на социальных и экономических проблемах ближайшего будущего, связанных с ИИ. Ученые выделили четыре области: здравоохранение, рынок труда, неравенство и этика. Второй отчет призывал «все публичные институции, в частности, ответственные за криминологическую экспертизу, системы здравоохранения, социального обеспечения и образования немедленно перестать использовать системы ИИ и алгоритмы типа “черный ящик” и перейти на системы, обеспечивающие прозрачность работы механизмов, например, посредством легализации, аудита и общественной экспертизы»[164]. Исследовательский центр данных и общества, возглавляемый Даной Бойд, придерживается цели понять и обратить внимание общественности на роль человек в ИИ[165]. Так, например, эксперимент с анализом «хороших селфи» из главы 9 мог бы выиграть от более детальной интерпретации социального контекста тех, кто селфи создает (и тех, кто придумал эксперимент). Другая интересная область, достойная внимания, – люди, фильтрующие нежелательный контент в социальных сетях. Когда контент с порнографией или сценами насилия обнаруживается онлайн, человек его проверяет, действительно ли это видео с обезглавливанием, неприличная фотография или другие примеры худших человеческих проявлений. Ведь психологические последствия ежедневного созерцания чего-то подобного могут быть травматичны[166]. Нам нужно изучить эту практику и вместе, как единая культура, принимать решения о том, что она означает и как с ней быть.
Внутри сообщества специалистов в области машинного обучения были подвижки в сторону качественно иного понимания алгоритмического неравенства и ответственности. Сообщество вокруг конференции о честности и прозрачности машинного обучения (Fairness and Transparency in Machine Learning) – лидеры в этом вопросе[167]. Тем временем профессор Латанья Суини из Лаборатории приватности данных при Гарвардском университетском институте количественного социального анализа проводит по-настоящему новаторскую работу с точки зрения понимания потенциала возможностей нарушения приватности больших массивов данных, в частности медицинских. Цель лаборатории состоит в том, чтобы разработать технологии и политику, «гарантирующие защиту приватности при сборе частной (в том числе конфиденциальной) информации для выполнения разных задач»[168]. Кроме того, в Кембридже Лаборатория медиа при МТИ под руководством Джои Ито проводит превосходную работу по трансформации нарратива о расовом и этническом разнообразии в области вычислительной науки, а также способствует запуску систем запроса. Благодаря аналитической работе студента МТИ Картика Динакара, изучавшего феномен человека в контуре управления, профессор Лаборатории медиа МТИ Ияд Рахван начал разрабатывать проблему, обозначенную им как общество в контуре управления машинного обучения, благодаря которой надеется артикулировать моральные проблемы в современных системах ИИ (напоминает проблему вагонетки). В другом проекте, инициированном медиалабораторией МТИ и Центром Беркмана Кляйна в Гарварде и спонсируемом Фондом этики и управления искусственным интеллектом, фокус исследователей обращен к этике и управлению ИИ.
И, конечно же, в эти обсуждения также включаются дата-журналисты, которые продолжают делать свою работу, несмотря на резкую смену контекстов индустрии. Множество невероятных инструментов позволяет проводить хитроумный анализ информации и данных. Так, насколько мне известно, в DocumentCloud, безопасном онлайн-хранилище документов, содержится около 3,6 млн источников, которыми пользуется около 8400 журналистов из 1619 организаций по всему миру. DocumentCloud используют как небольшие, так и крупные новостные агентства со всего света, там можно найти и документы, фигурировавшие в историях вроде «Панамского архива» и те, что опубликовал Сноуден[169]. Число дата-журналистов растет медленно. Ежегодная конференция NICAR для журналистов данных в 2016 г. насчитала немногим больше тысячи человек. Ежегодно вручаются премии – вроде премии в области журналистики данных – за истории, которые внесли наибольший вклад в расследование вычислительных проектов. Есть повод для оптимизма.
В рамках этой книги мы затронули историю и основы современных вычислительных технологий. Размышляя о том, как люди воспринимают компьютеры, я решила отправиться туда, где родилась теория вычислительных машин: в Электротехническую школу Мура при Пенсильванском университете. Именно здесь можно увидеть остатки ENIAC – как предполагается, первого компьютера. В каком-то смысле «дом» этой машины также стал и моей отправной точкой. Я родилась в госпитале почти что за соседней дверью. Будучи выпускниками Пенсильванского университета, мои родители начали встречаться в 1970-х гг. Они много времени проводили вместе в компьютерном центре кампуса – разбирали перфокарты по боксам и затем спускались в компьютерный центр и ждали своей очереди, чтобы вставить их в считывающее устройство и провести статистические эксперименты на большом компьютере. Мама мне когда-то сказала, что если уронить пачку карт, то все кончится, не успев толком начаться: пришлось бы сильно постараться, чтобы собрать их в правильном порядке.
Снаружи здания Мура стоит мемориальный знак, посвященный ENIAC, с информацией, представленной тем же шрифтом, который используется историками для составления мемориальных табличек для домов вроде Бетси Росс. В день моего приезда все шло чинно и мирно. Десятки студентов в темных костюмах и платьях шли мимо меня по тротуару. У некоторых из них можно было заметить папки с надписью «Модель конгресса»[170] (Model Congress). Несколько молодых людей носили пуховики поверх костюмов. На другом была камуфляжная куртка с мехом по капюшону. Я слышала, как девушка жаловалась подруге, идя по улице в туфлях-лодочках: «Я даже не знаю, как правильно ходить на каблуках». Они все были радостными, чистыми и наслаждались ощущением, будто они взрослые, за которыми на территории кампуса не следит учитель. Я вспомнила, как в студенческие годы роли вроде «Модель ООН» (Model UN) (когда приходилось носить неудобный костюм) и похожие события помогли мне и моим друзьям адаптироваться к взрослой жизни. Одеваться как взрослые и представлять, будто участвуешь в реальных рабочих процессах, – все это помогало нам понять, каково быть взрослым. Полагаю, в скором времени будет возможно заменить такого рода опыт участием в видеоконференциях или онлайн-чатах; однако это будет скучно и плотность информации будет ниже. Сложно представить, что подростки действительно этого захотят.
Поскольку у меня не было пропуска, я подождала около здания, пока студент, у которого была карта доступа, не показался рядом. Он взглянул на меня, понял, что я не несу никакой угрозы, пропустил меня и вернулся к разговору по телефону. Я зашла внутрь и начала блуждать по коридорам. Я прошла мимо лабораторий: опытных моделей, прецизионной обработки, где в каждой были сверлильные станки, 3D-принтеры и прочая механическая утварь разной степени изношенности. Инженеры сурово обращаются с оборудованием. Студент механик-инженер сжалился надо мной и проводил к месту, где располагался ENIAC, – в зал для отдыха учащихся за двойными деревянными дверями на первом этаже. Табличка гласила: «ENIAC, первый в мире электронный полномасштабный цифровой компьютер общего назначения» (ENIAC, The World’s First Electronic, Large-Scale, General-Purpose Digital Computer).
В зале было три деревянных обеденных стола, за которыми работали студенты, и еще три зоны с барными столами и стульями для тех, кто работал самостоятельно. Стол, где расположились компьютер и принтер, был усеян промокарточками Facebook. На карточках говорилось: «Как разработчику Facebook – аспиранту или выпускнику – вам предстоит писать код, который влияет на жизни 1,4 млрд человек по всему миру». Очевидно, компания хотела нанять смышленых людей, способных творить, брать на себя ответственность и решать проблемы. «Единение мира – это задача, требующая усилий каждого из нас» – уверял текст на карточке. Соглашусь: попытка соединения всего мира требует коллективных усилий. Правда, сомневаюсь, что технологии являются единственным решением этой задачи. Именно технологии привели к кризису социальных связей, за которым последовало то, что личное общение в группах и организациях становится важным как никогда. Взаимопонимание и групповая идентичность оказываются наиболее важными при взаимодействии как онлайн, так и офлайн, и не только посредством экранов.
Напротив компьютера обосновалась позабытая стопка книг. Я про себя прочитала их названия: «Жизнь: наука биологии», «Руководство по решению задач по углубленной инженерной математике. 3-е издание». Было забавно видеть книги по математике и биологии рядом друг с другом, даже несмотря на то, что они были оставлены каким-то рассеянным студентом. Надежду внушало то, что студент думал одновременно о естественной эволюции и технологиях.
Рядом находилось три компьютерные лаборатории, каждая из которых вмещала десятки компьютеров. Никто из присутствовавших в зале не обращал внимания на ENIAC. Кто-то работал над задачами по Python. Группа неподалеку обсуждала, насколько они готовы к тесту по математике MCAT. Вошли люди с пластиковыми пакетами и ароматными пенопластовыми контейнерами: ланч из припаркованных рядом автокафе. Студенты в лабораториях были важными, серьезными и очаровательными – как только студенты колледжей могут быть очаровательны. Они воплощали собой то, чем через несколько лет надеялись стать дети, – «Модели ООН». Дети такие классные. Люблю работать в университете. Университеты полны надежды и общения.
ENIAC выглядел слегка уменьшенным за своими стеклянными стенами. Оригинальный бы занял всю площадь нижнего этажа, а выставленный набор панелей представлял лишь фрагмент машины. Ряд вакуумных трубок лежал на полу. Они были похожи на миниатюрные лампочки: старомодные, светящиеся особым образом, с раскрученными проводами – такие используют хипстеры в барах Бруклина.
Передо мной располагалась основная часть дисплея. Свисали черные провода, сплетаясь от штекера к штекеру. Столько штекеров, столько рычагов. На одной панели операционного блока располагалось большое белое «глазное яблоко», кажется, смотревшее сквозь меня. Было ли оно считывающим устройством? Вскоре я поняла, почему оно выглядело знакомым: это же камера-глаз, которую Кларк, Кубрик и Минский внедрили в HAL 9000, «сознательный компьютер» из фильма «2001 год: Космическая одиссея». Глаз ENIAC был белым, у HAL – красным. Красный выглядит злее.
На черно-белых фотографиях я видела людей, работавших с ENIAC в его первом доме – в подвале. На динамичных кадрах женщины в костюмах, туфлях без каблуков и с безупречно уложенными волосами что-то переключали и вставляли провода в гнезда. Я начала замечать подобные изображения лишь несколько лет назад. Может, они всегда были, но я не обращала на них внимания. Возможно, это была сознательная попытка внедрить женщин в визуальный нарратив мира вычислительных машин. В любом случае это было мне по душе. Мне также понравилась фотография, на которой были изображены шесть женщин-вычислителей, которые смеялись, обнявшись друг с другом. Мне нравилось видеть, что им было здорово вместе. Это – очередное напоминание, что вычислительные науки необязательно должны быть полем мужского доминирования. Многие из вычислителей 1940–1950-х гг. были женщинами, однако, когда (в основном мужчины) разработчики решили настойчиво продвигаться в области компьютеров, женские профессии стали резко исчезать. По мере того как эта область становилась все более высокооплачиваемой, женщины вытеснялись еще больше. Все это есть следствие обдуманных решений. Когда-то решили уменьшить роль женщин в развитии вычислительных наук и исключить их как рабочую силу. Мы можем начать менять ситуацию прямо сейчас.
Я размышляла о пропасти между ENIAC и компьютерами в лабораториях, работавших на Windows и Linux. Эти машины воплощают в себе столько человеческих усилий, столько мастерства. Я чувствую невероятный трепет перед историей науки и технологий. Ошибки компьютеров есть следствие того, что они созданы людьми, находившимися в определенных социальных и исторических контекстах. Разработчики технологий обладают устойчивыми дисциплинарными приоритетами, помогающими им при разработке алгоритма, который принимает решения. Нередко эти приоритеты приводят к уменьшению роли человеческих существ в создании технологических систем или учебных данных. Или хуже того – к игнорированию последствий автоматизации в конкретных случаях.
Когда смотришь на ENIAC, кажется абсурдной идея о том, что эта гора металла способна решить мировые проблемы. Да, со временем он стал меньше, мощнее и обрел место в наших карманах, и стало проще представлять, как еще можно его применить и как реализовать собственные фантазии. Пора прекратить это. Попытка превратить жизнь в математику – это невероятный магический фокус, однако часто неудобная человеческая часть уравнения остается в стороне. Люди – ни сейчас, ни когда-либо – не были неудобными. Люди и есть цель. Люди – существа, которым все эти технологии должны служить. И речь идет не только о какой-то элитарной группе людей, напротив – все должны быть частью, все должны выигрывать от развития и применения технологий.
Благодарности
Спасибо всем, кто помог мне воплотить эту книгу в жизнь. Я благодарна моим коллегам в институте Артура И. Картера при Нью-Йоркском университете, коллегам из центра науки о данных Мура – Слона при том уже Нью-Йоркском университете, факультету и персоналу Центра цифровой журналистики Тау Колумбийской школы журналистики, моим бывшим коллегам из Университета Темпл и Университета Пенсильвании. За прочтение, советы и попросту за то, что помогли этой книге появиться на свет, я в неоплатном долгу перед Еленой Лар-Виваз, Розали Сигель, Джорданом Элленбергом, Кэти О’Нил, Мириам Песковиц, Самирой Беирд, Лори Тарпс, Кирой Бейкер-Дойл, Джейн Дмочовски, Джозефиной Вульф, Соломон Барокасом, Ханной Валач, Кэти Босс, Джанет Альтевеер, Лесли Хант, Элизабет Хант, Кей Кинси, Карен Масси, Стиви Сантангело, Джеем Кирком, Клэр Уордл, Гитой Манакталой, Мелиндой Ранкин, Кейтлин Карузо, Кайлом Гибсоном, моей писательской группой и талантливой командой издательства Массачусетского технологического университета. Для меня было честью стать частью сообщества дата-журналистов и зануд-новостников. Я бы хотела также поблагодарить моих коллег – участников ежегодного симпозиума Computation + Journalism, всех участников рассылки NICAR-L, команду ProPubliсa, особенно Скотта Кляйна, Дерека Уиллиса и Селеста ЛеКомпт. Кроме того, я исключительно благодарна Джейкобу Фентону, Элли Каник, Эндрю Гарварду, Чейзу Дэвису, Майклу Джонстону, Джонатану Стрею, BC Broussard, Varur D N и всем, кто помогал создавать «Бейливик». Спасибо моей семье, друзьям и родственникам; спасибо за вашу помощь и поддержку во время созревания идеи этой книги. Как и всегда, я благодарна мужу и сыну за то, что они всегда невероятны.
Библиография
ACM Computing Curricula Task Force, ed. Computer Science Curricula 2013: Curriculum Guidelines for Undergraduate Degree Programs in Computer Science. New York: ACM Press, 2013. http://dl.acm.org/citation.cfm?id=2534860.
Alba, Alejandro. “Chicago Uber Driver Charged with Sexual Abuse of Passenger.” New York Daily News, December 30, 2014. http://www.nydailynews.com/news/crime/chicago-uber-driver-charged-alleged-rape-passenger-article-1.2060817.
Alcor Life Extension Foundation. “Official Alcor Statement Concerning Marvin Minsky.” Alcor News, January 27, 2016.
Alexander, Michelle, and Cornel West. The New Jim Crow: Mass Incarceration in the Age of Colorblindness. Revised ed. New York: New Press, 2012.
Ames, Morgan G. “Translating Magic: The Charisma of One Laptop per Child’s XO Laptop in Paraguay.” In Beyond Imported Magic: Essays on Science, Technology, and Society in Latin America, edited by Eden Medina, Ivan da Costa Marques, and Christina Holmes, 207‒224. Cambridge, MA: MIT Press, 2014.
Anderson, C. W. “Towards a Sociology of Computational and Algorithmic Journalism.” New Media & Society 15, no. 7 (November 2013): 1005‒1021. doi:10.1177/1461444812465137.
Angwin, Julia, and Jeff Larson. “Bias in Criminal Risk Scores Is Mathematically Inevitable, Researchers Say.” ProPublica, December 30, 2016. https://www.propublica.org/article/bias-in-criminal-risk-scores-is-mathematically-inevitable-researchers-say.
Angwin, Julia, Jeff Larson, Lauren Kirchner, and Surya Mattu. “A World Apart; A Joint Investigation by Consumer Reports and ProPublica Finds That Consumers in Some Minority Neighborhoods Are Charged as Much as 30 Percent More on Average for Car Insurance than in Other Neighborhoods with Similar Accident-Related Costs. What’s Really Going On?” Consumer Reports, July 1, 2017.
Angwin, Julia, Jeff Larson, Surya Mattu, and Lauren Kirchner. “Machine Bias.” ProPublica, May 23, 2016. https://www.propublica.org/article/machine-bias-risk-assessments-in-criminal-sentencing.
Angwin, Julia, Surya Mattu, and Jeff Larson. “Test Prep Is More Expensive – for Asian Students.” Atlantic, September 3, 2015. https://www.theatlantic.com/education/archive/2015/09/princeton-review-expensive-asian-students/403510/.
Arthur, Charles. “Analysing Data Is the Future for Journalists, Says Tim Berners-Lee.” Guardian (US edition), November 22, 2010. https://www.theguardian.com/media/2010/nov/22/data-analysis-tim-berners-lee.
Barlow, John Perry. “A Declaration of the Independence of Cyberspace.” Electronic Frontier Foundation, February 8, 1996. https://www.eff.org/cyberspace-independence.
Been, Eric Allen. “Jaron Lanier Wants to Build a New Middle Class on Micropayments.” Nieman Lab, May 22, 2013. http://www.niemanlab.org/2013/05/jaron-lanier-wants-to-build-a-new-middle-class-on-micropayments/.
Bench, Shane W., Heather C. Lench, Jeffrey Liew, Kathi Miner, and Sarah A. Flores. “Gender Gaps in Overestimation of Math Performance.” Sex Roles 72, no. 11‒12 (June 2015): 536‒546. doi:10.1007/s11199–015–0486–9.
Best, Joel. Damned Lies and Statistics: Untangling Numbers from the Media, Politicians, and Activists. Updated ed. Berkeley, CA; London: University of California Press, 2012.
Blow, Charles M. Fire Shut Up in My Bones: A Memoir. New York: Houghton Mifflin, 2015.
Bogost, Ian. “Why Nothing Works Anymore.” Atlantic, February 23, 2017. https://www.theatlantic.com/technology/archive/2017/02/the-singularity-in-the-toilet-stall/517551/.
Bonnington, Christina. “Tacocopter: The Coolest Airborne Taco Delivery System That’s Completely Fake.” Wired, March 23, 2012.
Borsook, Paulina. Cyberselfish: A Critical Romp through the Terribly Libertarian Culture of High Tech. 1st ed. New York: PublicAffairs, 2000.
boyd, danah, and Kate Crawford. “Critical Questions for Big Data: Provocations for a Cultural, Technological, and Scholarly Phenomenon.” Information Communication and Society 15, no. 5 (June 2012): 662‒679. doi:10.1080/1369118X.2012.678878.
boyd, danah, Emily F. Keller, and Bonnie Tijerina. “Supporting Ethical Data Research: An Exploratory Study of Emerging Issues in Big Data and Technical Research.” Data & Society Research Institute, August 4, 2016.
Brand, Stewart. The Media Lab: Inventing the Future at MIT. New York: Viking, 1987. Brand, Stewart. “We Are As Gods.” Whole Earth Catalog (blog), Winter 1998.
www.wholeearth.com/issue/1340/article/189/we.are.as.gods.
Brand, Stewart. “We Owe It All to the Hippies.” Time, March 1, 1995. http://content.time.com/time/magazine/article/0,9171,982602,00.html.
Brewster, Zachary W., and Michael Lynn. “Black-White Earnings Gap among Restaurant Servers: A Replication, Extension, and Exploration of Consumer Racial Discrimination in Tipping.” Sociological Inquiry 84, no. 4 (November 2014): 545‒569. doi:10.1111/soin.12056.
Broussard, Meredith. “Artificial Intelligence for Investigative Reporting: Using an Expert System to Enhance Journalists’ Ability to Discover Original Public Affairs Stories.” Digital Journalism 3, no. 6 (November 28, 2014): 814‒831. https://doi.org/10.1080/21670811.2014.985497.
Broussard, Meredith. “Why E-books Are Banned in My Digital Journalism Class.” New Republic, January 22, 2014. https://newrepublic.com/article/116309/data-journalim-professor-wont-assign-e-books-heres-why.
Broussard, Meredith. “Why Poor Schools Can’t Win at Standardized Testing.” Atlantic, July 15, 2014. http://www.theatlantic.com/features/archive/2014/07/why-poor-schools-cant-win-at-standardized-testing/374287/.
Brown, David G. “Chronology – Sinking of S. S. TITANIC.” Encyclopedia Titanica. Last updated June 9, 2009. https://www.encyclopedia-titanica.org/articles/et_timeline.pdf.
Brown, John Seely, and Paul Duguid. The Social Life of Information. Updated, with a new preface. Boston: Harvard Business Review Press, 2017.
Brown, Mike. “Nearly a Third of Millennials Have Used Venmo to Pay for Drugs.” LendEDU.com (blog), July 10, 2017. https://lendedu.com/blog/nearly-third-millennials-used-venmo-pay-drugs/.
Bump, Philip. “Donald Trump’s Campaign Has Spent More on Hats than on Polling.” The Washington Post, October 25, 2016. https://www.washingtonpost.com/news/the-fix/wp/2016/10/25/donald-trumps-campaign-has-spent-more-on-hats-than-on-polling.
Busch, Lawrence. “A Dozen Ways to Get Lost in Translation: Inherent Challenges in Large-Scale Data Sets.” International Journal of Communication 8 (2014): 1727‒1744.
Butterfield, A., and Gerard Ekembe Ngondi, eds. A Dictionary of Computer Science. 7th ed. Oxford Quick Reference. Oxford, UK; New York: Oxford University Press, 2016.
California Department of Corrections and Rehabilitation. “Fact Sheet: COMPAS Assessment Tool Launched – Evidence-Based Rehabilitation for Offender Success,” April 15, 2009. http://www.cdcr.ca.gov/rehabilitation/docs/FS_COMPAS_Final_4–15–09.pdf.
Campolo, Alex, Madelyn Sanfilippo, Meredith Whittaker, Kate Crawford, Andrew Selbst, and Solon Barocas. “AI Now 2017 Report.” AI Now Institute, New York University, October 18, 2017. https://assets.contentful.com/8wprhhvnpfc0/1A9c3ZTCZa2KEYM64Wsc2a/8636557c5fb14f2b74b2be64c3ce0c78/_AI_Now_Institute_2017_Report_.pdf.
Cerulo, Karen A. Never Saw It Coming: Cultural Challenges to Envisioning the Worst. Chicago: University of Chicago Press, 2006.
Chafkin, Max. “Udacity’s Sebastian Thrun, Godfather of Free Online Education, Changes Course.” Fast Company, November 14, 2013. https://www.fastcompany.com/3021473/udacity-sebastian-thrun-uphill-climb.
Chen, Adrian. “The Laborers Who Keep Dick Pics and Beheadings Out of Your Facebook Feed.” Wired, October 23, 2014. https://www.wired.com/2014/10/content-moderation/.
Christian, Andrew, and Randolph Cabell. Initial Investigation into the Psychoacoustic Properties of Small Unmanned Aerial System Noise. Hampton, VA: NASA Langley Research Center, American Institute of Aeronautics and Astronautics, 2017. https://ntrs.nasa.gov/archive/nasa/casi.ntrs.nasa.gov/20170005870.pdf.
Cohen, Sarah, James T. Hamilton, and Fred Turner. “Computational Journalism.” Communications of the ACM 54, no. 10 (October 1, 2011): 66. doi:10.1145/2001269.2001288.
Cohoon, J. McGrath, Zhen Wu, and Jie Chao. “Sexism: Toxic to Women’s Persistence in CSE Doctoral Programs,” 158. New York: ACM Press, 2009. https://doi.org/10.1145/1508865.1508924.
Copeland, Jack. “Summing Up Alan Turing.” Oxford University Press (blog), November 29, 2012. https://blog.oup.com/2012/11/summing-up-alan-turing/.
Cox, Amanda, Matthew Bloch, and Shan Carter. “All of Inflation’s Little Parts.” New York Times, May 3, 2008. http://www.nytimes.com/interactive/2008/05/03/business/20080403_SPENDING_GRAPHIC.html.
Crawford, Kate. “Artificial Intelligence – With Very Real Biases.” Wall Street Journal, October 17, 2017. https://www.wsj.com/articles/artificial-intelligencewith-very-real-biases-1508252717.
Crawford, Kate. “Artificial Intelligence’s White Guy Problem.” New York Times, June 26, 2016. https://www.nytimes.com/2016/06/26/opinion/sunday/artificial-intelligences-white-guy-problem.html.
Dadich, Scott. “Barack Obama Talks AI, Robo Cars, and the Future of the World.” Wired, November 2016. https://www.wired.com/2016/10/president-obama-mit-joi-ito-interview/.
Daniel, Anna, and Terry Flew. “The Guardian Reportage of the UK MP Expenses Scandal: A Case Study of Computational Journalism.” In Communications Policy and Research Forum 2010, November 15‒16, 2010. https://www.researchgate.net/publication/279424256_The_Guardian_Reportage_of_the_UK_MP_Expenses_Scandal_A_Case_Study_of_Computational_Journalism.
DARPA Public Affairs. “Toward Machines That Improve with Experience,” March 16, 2017. https://www.darpa.mil/news-events/2017–03–16.
Data Privacy Lab. “Mission Statement,” n. d. https://dataprivacylab.org/about.html. Diakopoulos, Nicholas. “Accountability in Algorithmic Decision Making.” Communications of the ACM 59, no. 2 (January 25, 2016): 56‒62. doi:10.1145/2844110.
Diakopoulos, Nicholas. “Algorithmic Accountability: Journalistic Investigation of Computational Power Structures.” Digital Journalism 3, no. 3 (November 7, 2014) 398‒415. https://doi.org/10.1080/21670811.2014.976411.
Donn, Jeff. “Eric Trump Foundation Flouts Charity Standards.” AP News, December 23, 2016. https://apnews.com/760b4159000b4a1cb1901cb038021cea.
Dormehl, Luke. “Why John Sculley Doesn’t Wear an Apple Watch (and Regrets Booting Steve Jobs).” Cult of Mac, February 19, 2016. https://www.cultofmac.com/413044/john-sculley-apple-watch-steve-jobs/.
Dougherty, Conor. “Google Photos Mistakenly Labels Black People ‘Gorillas.’” New York Times, July 1, 2015. https://bits.blogs.nytimes.com/2015/07/01/google-photos-mistakenly-labels-black-people-gorillas/.
Dreyfus, Hubert L. What Computers Still Can’t Do: A Critique of Artificial Reason. Cambridge, MA: MIT Press, 1992.
Duncan, Arne. “Robust Data Gives Us the Roadmap to Reform.” Paper presented at the Fourth Annual IES Research Conference, June 8, 2009. https://www.ed.gov/news/speeches/robust-data-gives-us-roadmap-reform.
Elish, Madeleine, and Tim Hwang. “Praise the Machine! Punish the Human! The Contradictory History of Accountability in Automated Aviation.” Comparative Studies in Intelligent Systems – Working Paper #1. Intelligence and Autonomy Initiative: Data & Society Research Institute, February 24, 2015. https://datasociety.net/pubs/ia/Elish-Hwang_AccountabilityAutomatedAviation.pdf.
Evtimov, Ivan, Kevin Eykholt, Earlence Fernandes, Tadayoshi Kohno, Bo Li, Atul Prakash, Amir Rahmati, and Dawn Song. “Robust Physical-World Attacks on Deep Learning Models.” In arXiv Preprint 1707.08945, 2017.
Fairness and Transparency in Machine Learning. “Principles for Accountable Algorithms and a Social Impact Statement for Algorithms,” n. d. https://www.fatml.org/resources/principles-for-accountable-algorithms.
Feltman, Rachel. “Men (on the Internet) Don’t Believe Sexism Is a Problem in Science, Even When They См. Evidence,” January 8, 2015.
Fischhoff, Baruch, and John Kadvany. Risk: A Very Short Introduction. Oxford: Oxford University Press, 2011.
Fletcher, Laurence, and Gregory Zuckerman. “Hedge Funds Battle Losses,” 2016. http://ezproxy.library.nyu.edu:2048/login?url=http://search.proquest.com/docview/1811735200?accountid=12768.
Flew, Terry, Christina Spurgeon, Anna Daniel, and Adam Swift. “The Promise of Computational Journalism.” Journalism Practice 6, no. 2 (April 2012): 157‒171. doi:1 0.1080/17512786.2011.616655.
Fowler, Susan J. “Reflecting on One Very, Very Strange Year at Uber.” Susan Fowler (blog), February 19, 2017. https://www.susanjfowler.com/blog/2017/2/19/reflecting-on-one-very-strange-year-at-uber.
Gomes, Lee. “Facebook AI Director Yann LeCun on His Quest to Unleash Deep Learning and Make Machines Smarter.” IEEE Spectrum (blog), February 18, 2015. http://spectrum.ieee.org/automaton/robotics/artificial-intelligence/facebook-ai-director-yann-lecun-on-deep-learning.
Gray, Jonathan, Liliana Bounegru, and Lucy Chambers, eds. The Data Journalism Handbook: How Journalists Can Use Data to Improve the News. Sebastopol, CA: O’Reilly Media, 2012.
Grazian, David. Mix It Up: Popular Culture, Mass Media, and Society. 2nd ed. New York: W. W. Norton, 2017.
Grier, David Alan. When Computers Were Human. Princeton, NJ: Princeton University Press, 2007.
Hafner, Katie. The Well: A Story of Love, Death, and Real Life in the Seminal Online Community. New York: Carroll & Graf, 2001.
Halevy, Alon, Peter Norvig, and Fernando Pereira. “The Unreasonable Effectiveness of Data.” IEEE Intelligent Systems 24, no. 2 (March 2009): 8‒12. https://doi.org/10.1109/MIS.2009.36.
Hamilton, James. 2016. Democracy’s Detectives: The Economics of Investigative Journalism. Cambridge, MA: Harvard University Press.
Hamilton, James T., and Fred Turner. “Accountability through Algorithm: Developing the Field of Computational Journalism.” Paper presented at the Center for Advanced Study in the Behavioral Sciences Summer Workshop, July 2009. http://web.stanford.edu/~fturner/Hamilton%20Turner%20Acc%20by%20Alg%20Final.pdf.
Hannak, Aniko, Gary Soeller, David Lazer, Alan Mislove, and Christo Wilson. “Measuring Price Discrimination and Steering on E-Commerce Web Sites.” In Proceedings of the 2014 Internet Measurement Conference, 305‒318. New York: ACM Press, 2014. doi:10.1145/2663716.2663744.
Harris, Mark. “God Is a Bot, and Anthony Levandowski Is His Messenger.” Wired, September 27, 2017. https://www.wired.com/story/god-is-a-bot-and-anthony-levandowski-is-his-messenger/.
Hart, Ariel, Danny Robbins, and Carrie Teegardin. “How the Doctors & Sex Abuse Project Came About.” Atlanta Journal-Constitution, July 6, 2016. http://doctors.ajc.com/about_this_investigation/.
Hawkins, Andrew J. “Meet ALVINN, the Self-Driving Car from 1989.” The Verge, November 27, 2016. http://www.theverge.com/2016/11/27/13752344/alvinn-self-driving-car-1989-cmu-navlab.
Heffernan, Virginia. “Amazon’s Prime Suspect.” New York Times, August 6, 2010. http://www.nytimes.com/2010/08/08/magazine/08FOB-medium-t.html.
Hempel, Jessi. “Melinda Gates Has a New Mission: Women in Tech.” Wired, Backchannel, September 28, 2016. https://backchannel.com/melinda-gates-has-a-new-mission-women-in-tech-8eb706d0a903.
Hern, Alex. “Silk Road Successor DarkMarket Rebrands as OpenBazaar.” The Guardian, April 30, 2014. https://www.theguardian.com/technology/2014/apr/30/silk-road-darkmarket-openbazaar-online-drugs-marketplace.
Hill, Kashmir. “Jamming GPS Signals Is Illegal, Dangerous, Cheap, and Easy.” Gizmodo, July 24, 2017. https://gizmodo.com/jamming-gps-signals-is-illegal-dangerous-cheap-and-e-1796778955.
Hillis, W. Daniel. “Radioactive Skeleton in Marvin Minsky’s Closet.” Paper presented at the Web of Stories, n. d. https://webofstories.com/play/danny.hillis/174.
Holovaty, Adrian. “A Fundamental Way Newspaper Sites Need to Change.” Holovaty.com, September 6, 2006. http://www.holovaty.com/writing/fundamental-change/.
Holovaty, Adrian. “In Memory of Chicagocrime.org.” Holovaty.com, January 31, 2008. http://www.holovaty.com/writing/chicagocrime.org-tribute/.
Houston, Brant. Computer-Assisted Reporting: A Practical Guide. 4th ed. New York: Routledge, 2015.
Houston, Brant, and Investigative Reporters and Editors, Inc., eds. The Investigative Reporter’s Handbook: A Guide to Documents, Databases, and Techniques. 5th ed. Boston: Bedford/St. Martin’s, 2009.
IEEE Spectrum. “Tech Luminaries Address Singularity.” IEEE Spectrum, June 1, 2008. http://spectrum.ieee.org/computing/hardware/tech-luminaries-address-singularity.
Isaac, Mike. “How Uber Deceives the Authorities Worldwide.” New York Times, March 3, 2017. https://www.nytimes.com/2017/03/03/technology/uber-greyballprogram-evade-authorities.html.
“Jeremy Corbyn, Entrepreneur.” Economist, June 15, 2017. http://www.economist.com/news/britain/21723426-labours-leader-has-disrupted-business-politics-jeremy-corbyn-entrepreneur.
Kahan, Dan M., Donald Braman, John Gastil, Paul Slovic, and C. K. Mertz. “Culture and Identity-Protective Cognition: Explaining the White-Male Effect in Risk Perception.” Journal of Empirical Legal Studies 4, no. 3 (November 2007): 465‒505.
Kahneman, Daniel. Thinking, Fast and Slow. New York: Farrar, Straus and Giroux, 2013.
“Karel the Robot: Fundamentals.” Middle Tennessee State University, n. d. Accessed April 14, 2017. https://cs.mtsu.edu/~untch/karel/fundamentals.html.
Keim, Brandon. “Why the Smart Reading Device of the Future May Be… Paper.” Wired, May 1, 2014. https://www.wired.com/2014/05/reading-on-screen-versus-paper/.
Kestin, Sally, and John Maines. “Cops Hitting the Brakes – New Data Show Excessive Speeding Dropped 84 % since Investigation.” Sun Sentinel (Fort Lauderdale, FL), December 30, 2012.
Kleinberg, J., S. Mullainathan, and M. Raghavan. “Inherent Trade-Offs in the Fair Determination of Risk Scores.” ArXiv E-Prints, September 2016.
Kovach, Bill, and Tom Rosenstiel. Blur: How to Know What’s True in the Age of Information Overload. New York: Bloomsbury, 2011.
Kraemer, Kenneth L., Jason Dedrick, and Prakul Sharma. “One Laptop per Child: Vision vs. Reality.” Communications of the ACM 52, no. 6 (June 1, 2009): 66. doi:10.1145/1516046.1516063.
Kroeger, Brooke. 2017. The Suffragents: How Women Used Men to Get the Vote. Albany: State University of New York Press.
Kunerth, Jeff. “Any Way You Look at It, Florida Is the State of Weird.” Orlando Sentinel, June 13, 2013. http://articles.orlandosentinel.com/2013–06–13/features/os-florida-is-weird-20130613_1_florida-state-weird-florida-central-florida-lakes.
LaFrance, Adrienne. 2016. Why Do So Many Digital Assistants Have Feminine Names? Atlantic, March 30, 2016. https://www.theatlantic.com/technology/archive/2016/03/why-do-so-many-digital-assistants-have-feminine-names/475884/.
Lane, Charles. “What the AP U. S. History Fight in Colorado Is Really About.” Washington Post, November 6, 2014. https://www.washingtonpost.com/blogs/post-partisan/wp/2014/11/06/what-the-ap-u-s-history-fight-in-colorado-is-really-about.
“The Leibniz Step Reckoner and Curta Calculators.” Computer History Museum, n. d. Accessed April 14, 2017. http://www.computerhistory.org/revolution/calculators/1/49.
Leslie, S. – J., A. Cimpian, M. Meyer, and E. Freeland. “Expectations of Brilliance Underlie Gender Distributions across Academic Disciplines.” Science 347, no. 6219 (January 16, 2015): 262‒265. doi:10.1126/science.1261375.
Lewis, Seth C. “Journalism in an Era of Big Data: Cases, Concepts, and Critiques.” Digital Journalism 3, no. 3 (November 27, 2014): 321‒330. https://doi.org/10.1080/21670811.2014.976399.
Lewis, Tanya. “Rise of the Fembots: Why Artificial Intelligence Is Often Female.” LiveScience, February 19, 2015.
Levy, Steven. 2010. Hackers. 1st ed. Sebastopol, CA: O’Reilly Media.
Liu, Shaoshan, Jie Tang, Zhe Zhang, and Jean-Luc Gaudiot. “CAAD: Computer Architecture for Autonomous Driving.” CoRR abs/1702.01894 (February 7, 2017). http://arxiv.org/abs/1702.01894.
Lord, Walter. A Night to Remember. New York: Henry, Holt, and Co., 2005.
Lowy, Joan, and Tom Krisher. “Tesla Driver Killed in Crash While Using Car’s ‘Autopilot.’” Associated Press, June 30, 2016. http://www.bigstory.ap.org/article/ee71bd075fb948308727b4bbff7b3ad8/self-driving-car-driver-died-after-crash-florida-first.
“machine, n.” OED Online, Oxford University Press. Last updated March 2000. http://www.oed.com/view/Entry/111850.
Marantz, Andrew. “How ‘Silicon Valley’ Nails Silicon Valley.” New Yorker, June 9, 2016. http://www.newyorker.com/culture/culture-desk/how-silicon-valley-nails-silicon-valley.
Marshall, Aarian. “Uber Fired Its Robocar Guru, But Its Legal Fight with Google Goes On.” Wired, May 30, 2017. https://www.wired.com/2017/05/uber-fires-anthony-levandowski-waymo-google-lawsuit/.
Martinez, Natalia. “‘Drone Slayer’ Claims Victory in Court.” WAVE 3 News, October 26, 2015. http://www.wave3.com/story/30355558/drone-slayer-claims-victory-in-court.
Mayer, Jane. Dark Money: The Hidden History of the Billionaires behind the Rise of the Radical Right. New York: Doubleday, 2016.
Meyer, Philip. Precision Journalism: A Reporter’s Introduction to Social Science Methods. 4th ed. Lanham, MD: Rowman & Littlefield Publishers, 2002.
Miner, Adam S., Arnold Milstein, Stephen Schueller, Roshini Hegde, Christina Mangurian, and Eleni Linos. “Smartphone-Based Conversational Agents and Responses to Questions about Mental Health, Interpersonal Violence, and Physical Health.” JAMA Internal Medicine 176, no. 5 (May 1, 2016): 619. doi:10.1001/jamainternmed.2016.0400.
Minsky, Marvin. “Web of Stories Interview: Marvin Minsky.” Web of Stories, January 29, 2011. https://www.webofstories.com/play/marvin.minsky/1.
Mitchell, Tom M. “The Discipline of Machine Learning.” Pittsburgh, PA: School of Computer Science, Carnegie Mellon University, July 2006. http://reports-archive.adm.cs.cmu.edu/anon/ml/abstracts/06–108.html.
Morais, Betsy. “The Unfunniest Joke in Technology.” New Yorker, September 9, 2013. https://www.newyorker.com/tech/elements/the-unfunniest-joke-in-technology.
Morineau, Thierry, Caroline Blanche, Laurence Tobin, and Nicolas Guéguen. “The Emergence of the Contextual Role of the E-book in Cognitive Processes through an Ecological and Functional Analysis.” International Journal of Human-Computer Studies 62, no. 3 (March 2005): 329‒348. doi:10.1016/j.ijhcs.2004.10.002.
Moss-Racusin, Corinne A., Aneta K. Molenda, and Charlotte R. Cramer. “Can Evidence Impact Attitudes? Public Reactions to Evidence of Gender Bias in STEM Fields.” Psychology of Women Quarterly 39 (2) (June 2015): 194‒209. https://doi.org/10.1177/0361684314565777.
Mundy, Liza. “Why Is Silicon Valley So Awful to Women?” The Atlantic, April 2017. https://www.theatlantic.com/magazine/archive/2017/04/why-is-silicon-valley-so-awful-to-women/517788/.
Natanson, Hannah. “A Sort of Everyday Struggle.” The Harvard Crimson, October 20, 2017. https://www.thecrimson.com/article/2017/10/20/everyday-struggle-women-math/.
National Highway Traffic Safety Administration and US Department of Transportation. “Federal Automated Vehicles Policy: Accelerating the Next Revolution in Roadway Safety,” September 2016.
Neville-Neil, George V. “The Chess Player Who Couldn’t Pass the Salt.” Communications of the ACM 60, no. 4 (March 24, 2017): 24‒25. doi:10.1145/3055277.
Newman, Barry. “What Is an A-Hed?” Wall Street Journal, November 15, 2010. https://www.wsj.com/articles/SB10001424052702303362404575580494180594982.
Newman, Lily Hay. “Who’s Buying Drugs, Sex, and Booze on Venmo? This Site Will Tell You.” Future Tense: The Citizen’s Guide to the Future, February 23, 2015. http://www.slate.com/blogs/future_tense/2015/02/23/vicemo_shows_venmo_transactions_related_to_drugs_alcohol_and_sex.html.
Noyes, Jan M., and Kate J. Garland. “VDT versus Paper-Based Text: Reply to Mayes, Sims and Koonce.” International Journal of Industrial Ergonomics 31, no. 6 (June 2003): 411‒423. doi:10.1016/S0169–8141 (03) 00027–1.
Noyes, Jan M., and Kate J. Garland. “Computervs. Paper-Based Tasks: Are They Equivalent?” Ergonomics 51, no. 9 (September 2008): 1352‒1375. doi:10.1080/00140130802170387.
O’Neil, Cathy. Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy. 1st ed. New York: Crown Publishers, 2016.
Oremus, Will. “Terrifyingly Convenient.” Slate, April 3, 2016. http://www.slate.com/articles/technology/cover_story/2016/04/alexa_cortana_and_siri_aren_t_novelties_anymore_they_re_our_terrifyingly.html
Pasquale, Frank. The Black Box Society: The Secret Algorithms That Control Money and Information. Cambridge, MA: Harvard University Press, 2015.
Pedregosa, F., G. Varoquaux, A. Gramfort, V. Michel, B. Thirion, O. Grisel, M. Blondel, et al. “Scikit-Learn: Machine Learning in Python.” Journal of Machine Learning Research 12 (2011): 2825‒2830.
Pickrell, Timothy M., and Hongying (Ruby) Li. “Driver Electronic Device Use in 2015.” Traffic Safety Facts Research Note. Washington, DC: National Highway Traffic Safety Administration, September 2016. https://www.nhtsa.gov/sites/nhtsa.dot.gov/files/documents/driver_electronic_device_use_in_2015_0.pdf.
Pierson, E., C. Simoiu, J. Overgoor, S. Corbett-Davies, V. Ramachandran, C. Phillips, and S. Goel. “A Large-Scale Analysis of Racial Disparities in Police Stops across the United States.” Stanford Open Policing Project. Stanford University, 2017. https://5harad.com/papers/traffic-stops.pdf.
Pilhofer, Aron. “A Note to Users of DocumentCloud.” Medium, July 27, 2017. https://medium.com/@pilhofer/a-note-to-users-of-documentcloud-org-2641774661bb.
Plautz, Jessica. “Hitchhiking Robot Decapitated in Philadelphia.” Mashable, August 1, 2015. http://mashable.com/2015/08/01/hitchbot-destroyed.
Pomerleau, Dean A. “ALVINN, an Autonomous Land Vehicle in a Neural Network.” Carnegie Mellon University, 1989. http://repository.cmu.edu/cgi/viewcontent.cgi?article=2874&context=compsci.
Purington, David. “One Laptop per Child: A Misdirection of Humanitarian Effort.” ACM SIGCAS Computers and Society 40, no. 1 (March 1, 2010): 28‒33. doi:10.1145/ 1750888.1750892.
Quach, Katyanna. “Facebook Pulls Plug on Language-Inventing Chatbots? The Truth.” Register, August 1, 2017. https://www.theregister.co.uk/2017/08/01/facebook_chatbots_did_not_invent_new_language.
“Robot Car ‘Stanley’ Designed by Stanford Racing Team.” Stanford Racing Team, 2005. http://cs.stanford.edu/group/roadrunner/stanley.html.
Royal, Cindy. “The Journalist as Programmer: A Case Study of the New York Times Interactive News Technology Department.” University of Texas at Austin, April 2010. http://www.cindyroyal.com/present/royal_isoj10.pdf.
Russell, Andrew, and Lee Vinsel. “Let’s Get Excited about Maintenance!” New York Times, July 22, 2017. https://mobile.nytimes.com/2017/07/22/opinion/sunday/lets-get-excited-about-maintenance.html.
Russell, Stuart J., and Peter Norvig. Artificial Intelligence: A Modern Approach. 3rd ed. Harlow, UK: Pearson, 2016.
School District of Philadelphia. “Budget Adoption Fiscal Year 2016‒2017.” May 26, 2016. http://webgui.phila.k12.pa.us/uploads/jq/BX/jqBX-vKcX2GM7Nbrpgqwzg/FY17-Budget-Adoption_FINAL_5.26.16.pdf.
Schudson, Michael. “Four Approaches to the Sociology of News.” In Mass Media and Society, 4th ed., edited by James Curran and Michael Gurevitch, 172‒197. London: Hodder Arnold, 2005.
“Scientists Propose a Novel Regional Path Tracking Scheme for Autonomous Ground Vehicles.” Phys Org, January 16, 2017. https://phys.org/news/2017–01-scientistsregional-path-tracking-scheme.html.
Searle, John R. “Artificial Intelligence and the Chinese Room: An Exchange.” New York Review of Books, February 16, 1989. http://www.nybooks.com/articles/1989/02/16/artificial-intelligence-and-the-chinese-room-an-ex/.
Seife, Charles. Proofiness: How You’re Being Fooled by the Numbers. New York: Penguin, 2011.
Sharkey, Patrick. “The Destructive Legacy of Housing Segregation.” Atlantic, June 2016. https://www.theatlantic.com/magazine/archive/2016/06/the-eviction-curse/480738/.
Sheivachman, Andrew. “Clinton vs. Trump: Where Presidential Candidates Spend Their Travel Dollars.” Skift, October 4, 2016. https://skift.com/2016/10/04/clinton-vs-trump-where-presidential-candidates-spend-their-travel-dollars/.
Shetterly, Margot Lee. Hidden Figures: The American Dream and the Untold Story of the Black Women Mathematicians Who Helped Win the Space Race. New York: HarperCollins, 2016.
Silver, David, Aja Huang, Chris J. Maddison, Arthur Guez, Laurent Sifre, George van den Driessche, Julian Schrittwieser, et al. “Mastering the Game of Go with Deep Neural Networks and Tree Search.” Nature 529 (January 28, 2016): 484‒489. doi:10.1038/nature16961.
Silver, Nate. The Signal and the Noise: Why so Many Predictions Fail – but Some Don’t. New York: Penguin Books, 2015.
Singh, Santokh. “Critical Reasons for Crashes Investigated in the National Motor Vehicle Crash Causation Survey.” Traffic Safety Facts Crash Stats. Washington, DC: Bowhead Systems Management, Inc., working under contract with the Mathematical Analysis Division of the National Center for Statistics and Analysis, NHTSA, February 2015. https://crashstats.nhtsa.dot.gov/Api/Public/ViewPublication/812115.
Slovic, Paul. The Perception of Risk. Risk, Society, and Policy Series. Sterling, VA: Earthscan Publications, 2000.
Slovic, S., and P. Slovic, eds. Numbers and Nerves: Information, Emotion, and Meaning in a World of Data. Corvallis: Oregon State University Press, 2015.
Smith, Melissa M., and Larry Powell. Dark Money, Super PACs, and the 2012 Election. Lexington Studies in Political Communication. Lanham, MD: Lexington Books, 2013.
Solon, Olivia. “Roomba Creator Responds to Reports of ‘Poopocalypse’: ‘We См. This a Lot.’” Guardian (US edition), August 15, 2016. https://www.theguardian.com/technology/2016/aug/15/roomba-robot-vacuum-poopocalypse-facebook-post.
Somerville, Heather, and Patrick May. “Use of Illicit Drugs Becomes Part of Silicon Valley’s Work Culture.” San Jose Mercury News, July 25, 2014. http://www.mercurynews.com/2014/07/25/use-of-illicit-drugs-becomes-part-of-silicon-valleys-work-culture/.
Sorrel, Charlie. “Self-Driving Mercedes Will Be Programmed to Sacrifice Pedestrians to Save the Driver.” October 13, 2016. https://www.fastcompany.com/3064539/self-driving-mercedes-will-be-programmed-to-sacrifice-pedestrians-to-save-the-driver.
Sweeney, Latanya. “Foundations of Privacy Protection from a Computer Science Perspective.” Carnegie Mellon University, 2000. http://repository.cmu.edu/isr/245/.
Taplin, Jonathan. Move Fast and Break Things: How Facebook, Google, and Amazon Cornered Culture and Undermined Democracy. New York: Little, Brown and Co., 2017.
Taylor, Michael. “Self-Driving Mercedes-Benzes Will Prioritize Occupant Safety over Pedestrians.” Car and Driver (blog), October 7, 2016. https://blog.caranddriver.com/self-driving-mercedes-will-prioritize-occupant-safety-over-pedestrians/.
Terwiesch, Christian, and Yi Xu. “Innovation Contests, Open Innovation, and Multiagent Problem Solving.” Management Science 54, no. 9 (September 2008): 1529‒1543. doi:10.1287/mnsc.1080.0884.
Tesla, Inc. “A Tragic Loss,” June 30, 2016. https://www.tesla.com/blog/tragic-loss.
Thiel, Peter. “The Education of a Libertarian.” Cato Unbound (blog), April 13, 2009. https://www.cato-unbound.org/2009/04/13/peter-thiel/education-libertarian.
Thrun, S. “Winning the DARPA Grand Challenge: A Robot Race through the Mojave Desert,” 11. IEEE, 2006. https://doi.org/10.1109/ASE.2006.74.
Thrun, Sebastian. “Making Cars Drive Themselves,” 1‒86. IEEE, 2008. https://doi.org/10.1109/HOTCHIPS.2008.7476533.
Tufte, Edward R. 2001. The Visual Display of Quantitative Information. 2nd ed. Cheshire, CT: Graphics Press.
Turban, Stephen, Laura Freeman, and Ben Waber. “A Study Used Sensors to Show That Men and Women Are Treated Differently at Work.” Harvard Business Review, October 23, 2017. https://hbr.org/2017/10/a-study-used-sensors-to-show-that-men-and-women-are-treated-differently-at-work.
Turing, A. M. “Computing Machinery and Intelligence.” Mind 59, no. 236 (1950): 433‒460.
Turner, Fred. From Counterculture to Cyberculture: Stewart Brand, the Whole Earth Network, and the Rise of Digital Utopianism. Chicago: University of Chicago Press, 2008.
Tversky, Amos, and Daniel Kahneman. “Availability: A Heuristic for Judging Frequency and Probability.” Cognitive Psychology 5, no. 2 (September 1973): 207‒232. doi:10.1016/0010–0285 (73) 90033–9.
US Bureau of Labor Statistics. “Newspaper Publishers Lose over Half Their Employment from January 2001 to September 2016.” TED: The Economics Daily, April 3, 2017. https://www.bls.gov/opub/ted/2017/newspaper-publishers-lose-over-half-their-employment-from-january-2001-to-september-2016.htm.
Usher, Nikki. Interactive Journalism: Hackers, Data, and Code. Urbana: University of Illinois Press, 2016.
Valentino-DeVries, Jennifer, Jeremy Singer-Vine, and Ashkan Soltani. “Websites Vary Prices, Deals Based on Users’ Information.” Wall Street Journal, December 24, 2012. https://www.wsj.com/articles/SB10001424127887323777204578189391813881534.
van Dalen, Arjen. “The Algorithms behind the Headlines: How Machine-Written News Redefines the Core Skills of Human Journalists.” Journalism Practice 6, no. 5‒6 (October 2012): 648‒658. doi:10.1080/17512786.2012.667268.
Vincent, James. “Twitter Taught Microsoft’s AI Chatbot to Be a Racist Asshole in Less than a Day.” The Verge, March 24, 2016. https://www.theverge.com/2016/3/24/11297050/tay-microsoft-chatbot-racist.
Vlasic, Bill, and Neal E. Boudette. “Self-Driving Tesla Was Involved in Fatal Crash, U. S. Says.” New York Times, June 30, 2016. https://www.nytimes.com/2016/07/01/business/self-driving-tesla-fatal-crash-investigation.html.
Waite, Matt. “Announcing Politifact.” MattWaite.com (blog), August 22, 2007. http://www.mattwaite.com/posts/2007/aug/22/announcing-politifact/.
Wästlund, Erik, Henrik Reinikka, Torsten Norlander, and Trevor Archer. “Effects of VDT and Paper Presentation on Consumption and Production of Information: Psychological and Physiological Factors.” Computers in Human Behavior 21, no. 2 (March 2005): 377‒394. doi:10.1016/j.chb.2004.02.007.
Weizenbaum, Joseph. “Eliza,” n. d. http://www.atariarchives.org/bigcomputergames/showpage.php?page=23.
Williams, Joan C. “The 5 Biases Pushing Women Out of STEM.” Harvard Business Review, March 24, 2015. https://hbr.org/2015/03/the-5-biases-pushing-women-out-of-stem.
Wolfram, Stephen. “Farewell, Marvin Minsky (1927‒2016).” Stephen Wolfram (blog), January 26, 2016. http://blog.stephenwolfram.com/2016/01/farewell-marvin-minsky-19272016/.
Yoshida, Junko. “Nvidia Outpaces Intel in Robo-Car Race.” EE Times, October 11, 2017. https://www.eetimes.com/document.asp?doc_id=1332425.
Zook, Matthew, Solon Barocas, danah boyd, Kate Crawford, Emily Keller, Seeta Peña Gangadharan, Alyssa Goodman, et al. “Ten Simple Rules for Responsible Big Data Research.” Edited by Fran Lewitter. PLOS Computational Biology 13, no. 3 (March 30, 2017): e1005399. https://doi.org/10.1371/journal.pcbi.1005399.