Даже по мере совершенствования методов, увеличения массивов данных и ускорения обработки данных один недостаток машинного обучения сохранялся. Алгоритмы, которые создавала компания, упорно отказывались объяснять сами себя. Инженеры могли оценить успешность классификатора, протестировав его, чтобы узнать, какой процент его суждений был точным (его "точность") и какую часть вещей он обнаружил (его "отзыв"). Но поскольку система сама учила себя определять что-то на основе логики собственного дизайна, когда она ошибалась, не было никакой понятной человеку причины.
Иногда ошибки казались бессмысленными. В других случаях они были систематическими и отражали человеческий фактор. Артуро Бежар вспоминает, что в самом начале работы Facebook над классификатором для выявления порнографии система регулярно пыталась отсеять изображения кроватей. Вместо того чтобы научиться определять людей, занимающихся сексом, модель научилась распознавать мебель, на которой они чаще всего занимаются сексом.
Проблема легко решалась: инженерам нужно было просто обучить модель на большем количестве матрасных сцен с рейтингом PG. Это стало хорошей шуткой - если не принимать во внимание, что форма машинного обучения, которую только что испортили инженеры, была одной из самых простых, которые использовал Facebook. Подобные фундаментальные ошибки продолжали происходить, даже когда компания стала полагаться на гораздо более продвинутые методы ИИ для принятия гораздо более весомых и сложных решений, чем "порно или не порно". Компания полностью перешла на искусственный интеллект, как для определения того, что должны видеть люди, так и для решения любых проблем, которые могут возникнуть.
Несомненно, компьютерная наука была ослепительной, а достижения - конкретными. Но скорость, широта и масштабы внедрения машинного обучения в Facebook обошлись без понятности. Почему алгоритм Facebook "Страницы, которые вам могут понравиться" так сосредоточен на рекомендациях определенных тем? Как видеофрагмент из компьютерной анимации о зубных имплантатах оказался просмотренным сто миллионов раз? И почему некоторые новостные издательства добивались вирусности, просто переписывая материалы других изданий?
Отвечая на эти вопросы, специалисты по связям с общественностью Facebook отмечали, что системы компании реагируют на поведение людей и не учитывают вкусы. Эти доводы было трудно опровергнуть. Они также скрывали неудобный факт: Facebook добивалась своего роста не совсем понятными способами.
Через пять лет после объявления о начале использования машинного обучения для рекомендации контента и таргетирования рекламы системы Facebook будут настолько сильно зависеть от искусственного интеллекта, способного к самообучению, что без этой технологии, с гордостью заявил Янн ЛеКун, от продуктов компании останется лишь "пыль".
-
Как и большинство членов продуктовых команд Facebook, Хоакин Киньонеро обладал тем, что он называл "инженерным мышлением". Успех заключался в определении проблемы, а затем в создании чего-то эффективного, мощного и широко используемого для ее решения. "Я явно не ожидал непредвиденных последствий интеграции упрощенного машинного обучения в продукт", - говорит он.
Появление машинного обучения в ранжировании ленты было в то время большим событием, хотя мало кто в Facebook понимал, что компания переходит Рубикон. Facebook не просто менял порядок, в котором люди видели посты, - он менял всю динамику социальной жизни в Интернете.
До появления ранжированной ленты добавление в друзья означало занесение в очередь на просмотр всех его будущих сообщений - непривлекательная перспектива для случайного знакомого или гиперпостинга родственника. Как и в оффлайновой жизни, было только столько людей, с которыми вы могли поддерживать связь, только столько групп, в которые вы могли вступить.
Ранжирование устранило эту социальную нагрузку. Пользователи могли следить за сотнями аккаунтов и страниц, не перегружая свой аккаунт; удаленные связи в идеале появлялись только тогда, когда они публиковали что-то исключительно интересное. Это изменение сделало дружбу менее значимой, и пользователи перестали курировать группы друзей - это было большим изменением по сравнению с социальным миром офлайн. С разбуханием списков друзей платформа стала более публичной, побуждая людей создавать контент, который будет пользоваться популярностью у широкой аудитории, и избегать публикации более интимных вещей, которые они не хотели бы передавать случайным знакомым или даже людям, которых они на самом деле не знают.
По мере того как платформа становилась все более зрелой, а число ее пользователей росло и исчислялось миллиардами, Facebook пытался найти правильные показатели успеха. С самого начала высшее руководство компании больше всего ценило показатель Daily Average People, или DAP, - количество пользователей, зашедших на сайт в тот или иной день. Когда эта метрика стала неактуальной в попытках Facebook ускорить свой рост, компания обратилась к сессиям - совокупному количеству заходов на Facebook каждый день, а также к затраченному времени и метрикам производства и потребления определенных типов контента. Наконец, появилась обширная категория показателей вовлеченности, которые варьировались от фундаментальных (повторные публикации) до заумных (взаимодействие с уведомлениями о дне рождения).
Одной из целей, которая явно отсутствовала в регулярных обсуждениях, были деньги. Даже для сотрудников, отвечающих за таргетинг рекламы, "релевантность" должна была превалировать над долларами и центами. Среди сотрудников отдела продуктов обсуждение финансовых последствий решений Facebook было под запретом, а конфликты между пользой и прибылью обычно решались в пользу пользы. "Мы не создаем сервисы, чтобы зарабатывать деньги; мы зарабатываем деньги, чтобы создавать лучшие сервисы", - написал Цукерберг в "Красной книге" 2012 года, призванной воплотить революционную этику Facebook. Положенная на стол каждому новому сотруднику, книга номинально была создана, чтобы отметить достижение платформой миллиарда пользователей. Но она появилась всего через несколько месяцев после первичного размещения акций Facebook. В условиях огромного и стремительно развивающегося рынка миссию компании - сделать мир более открытым и связанным - иногда было трудно отличить от более жадного стремления к завоеванию доли рынка.
Со временем, когда добиться роста становилось все труднее, Facebook все больше полагался на одну особенность своей платформы: вирусность. Любовь Цукерберга к этому явлению проявилась в 2014 году, когда он принял участие в акции Ice Bucket Challenge - вылил ведро ледяной воды себе на голову, чтобы привлечь внимание общественности и собрать деньги на исследования , направленные на лечение дегенеративного неврологического заболевания ALS, и опубликовал видео в Facebook вместе с миллионами других людей. Акция Ice Bucket Challenge собрала более 100 миллионов долларов для главной благотворительной организации, занимающейся лечением этого заболевания, - Ассоциации ALS. На протяжении многих лет Цукерберг приводил это видео в качестве доказательства того, что компания приносит пользу всему миру.
Чтобы стимулировать вирусность, Facebook изменил дизайн новостной ленты, чтобы побудить людей нажимать на кнопку повторной публикации или следить за страницей, когда они просматривают пост. Инженеры изменили алгоритм Facebook, чтобы увеличить частоту репостов контента от незнакомых людей. Facebook также начал поиск "трения" - всего, что замедляло работу пользователей или ограничивало их активность, - с целью его устранения. Одно из таких изменений дало пользователям возможность создавать неограниченное количество страниц. Другое позволило им размещать один и тот же материал сразу в нескольких группах. Третье - приоритетно рекомендовало аккаунты, которые, скорее всего, примут запрос в друзья. Несмотря на различия в механизмах, все они способствовали ускорению работы Facebook.
Время от времени сотрудники замечали, что поведение, которое поощряла компания, выглядит немного странно. В заметке, озаглавленной "1% френдов", специалист по изучению данных отметил, что после нескольких лет "оптимизации объема френдов" поведение френдов становится все более неравномерным. Всего 0,5 % аккаунтов отвечали за большинство новых связей, и эти пользователи отправляли более пятидесяти запросов в день. Возможно ли, что эти беспорядочные друзья не создавали по-настоящему ценных отношений?
В ответ коллеги рассуждали о том, как изменить алгоритм Facebook "Люди, которых вы можете знать" или ограничить пользователей от более чем ста запросов в друзья в течение нескольких дней подряд. Но никто, похоже, не считал однобокий рост числа друзей в Facebook насущной проблемой.
Инструменты компании становились все сложнее, но цели и методы - нет. Facebook хотела, чтобы пользователи публиковали, взаимодействовали и потребляли больше контента, и после коротких тестов изменяла платформу любым способом, который позволял им это делать. Компания хотела роста и не слишком внимательно следила за тем, как он достигается.
-
Перед выборами 2016 года, когда все эти изменения укоренились, Криса Кокса в значительной степени беспокоило то, что происходило с Facebook за рубежом. Женатый на тайской женщине, которая сняла получивший широкую известность документальный фильм о работнице секс-индустрии в Бангкоке, Кокс был более внимателен к международным пользователям Facebook, чем многие другие. (Он также практикующий буддист и известный хороший человек).