НИЧТО ЧЕЛОВЕЧЕСКОЕ
В начале мая студенты факультета компьютерных наук из Технологического университета штата Джорджия внезапно обнаружили, что их ассистент кафедры Джил Уотсон... компьютерная программа. Будущие специалисты по искусственному интеллекту месяцами общались с ней по электронной почте, обсуждали свои проекты, консультировались по разным вопросам и ничего не подозревали.
Оказалось, что в основе «Джил» самообучающийся чат-бот, то есть программа-имитатор общения в интернете. Ее готовили на роль ассистента, заставив изучить 40 тысяч сообщений университетского форума.
Человечество давно задавалось вопросом, как опознать искусственный интеллект, когда он наконец-то появится. В середине прошлого века сошлись на испытании, предложенном математиком Аланом Тьюрингом. Эксперты должны задавать людям и компьютерным программам любые вопросы и пытаться на основании ответов понять, с человеком они общаются или нет. Если большинство проверяющих запутается и примет программу за человека, то вот он, искусственный интеллект. «Джил» тест явно прошла.
Людей заменит имитация?
А двумя месяцами раньше, пока европейцы обсуждали кризис с мигрантами, а россияне наблюдали за отводом войск
из Сирии, в Южной Корее произошло событие, благодаря которому нынешний год наверняка войдет в будущие учебники истории. Программа AlphaGo обыграла чемпиона мира по древнекитайской игре го Седоля Ли. Казалось бы, чего тут удивительного? В шахматы-то компьютеры давно побеждают гроссмейстеров. Но шахматные ходы поддаются просчету методом перебора, а в го такое количество возможных партий, что все их никак не перебрать. До недавнего времени считалось, что хорошо играть может только человек благодаря своей уникальной интуиции. И вот, пожалуйста, - пришлось уступить компьютеру.
И опять удар по человеческому превосходству нанесла самообучающаяся программа. Причем никаких навыков по игре в го в нее изначально не закладывали. Она изучила многие партии, миллиарды раз сыграла сама с собой и выработала какие-то собственные стратегии игры, незнакомые признанным мастерам.
В основе AlphaGo нейронные сети - подход к программированию, дающий сейчас самые поразительные результаты. Особенность в том, что программист пишет не алгоритм по достижению каких-то задач, а создает самообучающуюся структуру из элементов, связанных друг с другом наподобие нейронов в мозге, отсюда и название. Потом эту структуру учат выполнять задачу и после долгого обучения получают алгоритм, куда более эффективный, чем если бы его писал программист. Особенно здорово нейросети справляются с задачами, раньше считавшимися сугубо человеческими, как та же игра го или распознавание лиц.
В конце прошлого года команда московских программистов N-tech.lab привезла из Сиэтла первый приз в конкурсе на распознавание образов, обставив группы из Google и Китайского университета. Российская программа по определению лиц лучше всех справилась с задачей на больших объемах, узнавая человека по фото в трех случаях из четырех.
Сейчас у создателей отбоя нет от заказов. Интересуются все: от торговых сетей, желающих узнавать постоянных клиентов по картинке из камеры наблюдения, до спецслужб, которым, понятно, нужна слежка. А пока на основе алгоритма запущен сервис по поиску людей в социальных сетях. Результаты впечатляющие, но неоднозначные. В Петербурге с его помощью даже поймали каких-то хулиганов. А в Москве травят и шантажируют актрис из порнофильмов. Так или иначе, мир, похоже, необратимо меняется, утрачивая приватность. И тут опять использовались нейросети.
- Сеть состоит из нескольких слоев: первый обрабатывает сигнал и передает информацию второму, второй - третьему и так далее, на выходе получаем результат, - объясняет принцип работы глава N-tech.lab Артем Кухаренко. - При этом мы не понимаем, как конкретно программа узнает лица.
Это самое поразительное. После длительного обучения нейросеть усвоила какие-то свои методы работы с изображениями. Программисты дали ей 80 ячеек для записи разных параметров, но что программа туда записывает, остается только догадываться. Пока сотрудники N-tech.lab, которым самим интересно, сумели идентифицировать три пункта: один как-то связан с полом, другой с овалом лица, а третий отвечает за наличие усов. А так сеть работает по принципу «черного ящика». Даешь запрос, получаешь ответы, а как именно - непонятно.
«В этом отношении мы вернулись в XVI век, когда ученые наблюдали какой-то эффект, но не могли его объяснить, - констатировал в недавнем интервью академик РАН, математик Александр Кулешов. - Сам этот процесс обучения на самом деле достаточно мистический, потому что непонятно, как это происходит. Там, внутри, конечно, работают некоторые математические алгоритмы, в том числе оптимизационные и тому подобные, но как в целом устроен процесс, мы не понимаем».
Веками человечество думало, что создаст искусственный интеллект по своему образу и подобию, заложит в него какую-то картину мира, законы и правила поведения. Но наш собственный разум по-прежнему загадка, и вот теперь у нас есть искусственный интеллект, тоже непонятный и загадочный.
Сеть «читала» и пыталась «угадать»
Лидер группы «Гражданская оборона» Егор Летов умер 8 лет назад. Но в конце июля 2015 года в Сети появился музыкальный альбом «Нейронная оборона», тексты которого настолько напоминали стиль Летова, что люди, мало знакомые с его творчеством, запросто путаются. Так дебютировала на публике нейросеть-поэт. Аналитик «Яндекса» Алексей Тихонов сделал ее в свободное от работы время, практически на коленке.
- Я не занимаюсь нейросетями, поэтому обратился за консультацией к коллегам в подразделении «Яндекса», отвечающем за анализ и синтез речи. Получил от них базовый ликбез, примеры кода и ссылки на нужные онлайн-курсы и статьи. Понадобилось 1,5-2 месяца личного времени, чтобы в этом разобраться, еще несколько недель ушло на то, чтобы собрать и обучить финальную сеть, - рассказывает Алексей Тихонов.
На стадии обучения нейросеть непрерывно работала две недели. За это время она прочитала всех классических русскоязычных поэтов и песенную лирику - примерно 130 мегабайт текста.
- Во время обучения сеть «читала» и пыталась «угадать», каким будет следующее слово, при условии, что она знает, что это за поэт и произведение и какими были предшествующие слова, - объясняет Алексей. - Затем в зависимости от того, угадала она или нет, ее внутренние параметры исправлялись. Сеть читала стихи в случайном порядке, в среднем каждый был прочитан 10-15 раз. В процессе обучения сеть выучила общий словарный запас из всех произведений (чуть больше 400 тысяч уникальных слов), а также сочетаемость, совместную употребимость слов и через это, по сути, построила некоторую модель морфологии.
Финальная сеть занимает около 4 Гб на жестком диске. Теперь она может работать в режиме генерации. Ей задают автора, и программа начинает слово за словом писать текст в его стилистике. Естественно, о понимании тут говорить не приходится, с большими связными текстами тоже пока проблемы. Но авторов-абсурдистов - Даниила Хармса или того же Летова - имитирует очень удачно.
- На данном этапе развития технологий нейросети только учатся работать со «смыслом», лишь недавно появились решения задач на уровне «сохранения/переноса смысла» - это машинный перевод или, например, генерация описания к изображению. Сейчас идет большая работа над генерацией ответов по вопросу и тексту и созданию краткой выжимки текста. Не думаю, что возможности для автоматической генерации новых сюжетов достаточного качества с помощью нейросетей появятся раньше чем через пару лет, - рассуждает Алексей Тихонов.
А что через пару лет? Конечно, нейронная сеть не напишет «Войну и мир». Но стишки для двухлетних, тексты для попсовых песенок и инструкции к кофемолкам - вопрос ближайшего времени. И что тогда будет с их сочинителями?
Следующие кандидаты на потерю заработка - уличные художники. Сотрудник Мэйл.ру Алексей Моисеенков, опять же в свободное время, создал мобильное приложение Prisma на основе нейросетей. После обучения оно умеет переделывать фотографии в стиле известных художников: от Ван Гога до Кандинского. Осталось придумать какой-нибудь манипулятор с кисточкой.
Инженерам приготовиться. Ведь большая часть инженерной работы - поиск и адаптация аналогичных и уже существующих решений. Академик Кулешов уверен, что скоро с этим будут вполне справляться нейросети. Неужели машины потеснят работников умственного труда раньше, чем дворников и грузчиков? Но и это не самое жуткое.
В конце мая известный журналист и медиаменеджер Роман Мазуренко погиб в ДТП. Его девушка, IT-стартапер Евгения Куйда, не могла смириться с потерей и обучила чат-бота. «Я собрала все сообщения из нашей переписки, фотографии, статьи, мысли, воспоминания - свои и друзей, и мы сделали AIРоман, - пишет она. - С ним можно переписываться про него самого или просто про жизнь - он будет отвечать так, как отвечал бы когда-то Рома». Имитация заменила погибшего.
Никита Аронов
|