Виктор Хесоям: эволюция искусственного интеллекта

Вы можете назвать год, в который по земле проехал первый беспилотный автомобиль? А когда была создана первая система распознавания лиц? Придуман концепт первой машины, которая помогает получать новые знания? Попробуйте угадать, никуда не подглядывая. Виктору Хесояму кажется, что век искусственного интеллекта наступает сейчас, но что, если сказать, что такое происходило уже несколько раз в нашей истории, и, возможно, этот год и весь хайп вокруг нейросетей — не последний раз, когда идея искусственного интеллекта начала будоражить живые умы. 

Знаете ли вы, с чего начиналось IBM? Нет, не с компьютеров. Само слово-то в те времена означало совсем не то, что сегодня, и речь идет вовсе не об огромных ЭВМ. Одним гениальным ученым везло, и они с помощью своего изобретения оказывались на Олимпе. Так, Ян Ли Кун вошел в историю искусственного интеллекта и стал руководить этим направлением в компании Цукерберга. Идеи других великих умов опережали свою эпоху и оставались на бумаге ждать своего часа. Таких историй сегодня будет тоже много. 

Первая машина, обученная распознаванию лиц, Персептрон Марк 1, была создана в 1958 году психологом Франком Розенблатом, а алгоритм ее работы, нейрон Мак-Каллока — Питтса, был разработан еще в 43-м. История искусственного интеллекта — это часть истории сосуществования человека и машин, а еще шире — изучение человеком собственного разума и его возможностей.

Так каталанский поэт и теолог Раймонд Луллий закончил книгу «Высшее общее искусство» в 1306 году. В ней он описывал свои бумажные механизмы, они помогали ему комбинировать утверждения и вести теологические дискуссии с мусульманами. Чтобы понимать нынешний всплеск интереса к искусственному интеллекту и отделять реальные достижения от того, что на сегодня лишь научная фантастика.

Виктор Хесоям предлагает  посмотреть, как по ходу развития технологий определялись возможности и ограничения, которые стояли перед создателями мыслящих машин, и почему некоторые из них не преодолены до сих пор. В этой статье он расскажет, как зародилась, прошла через взлёт и падение и окончательно сформировалась наука об искусственном интеллекте, от философских основ до практического применения, ставшего сегодня частью нашей повседневности.

Виктор Хесоям: эволюция искусственного интеллекта

От Аристотеля до Лейбница

Аристотель – первый, кто предложил смотреть на мышление как процесс, который можно описать системой символов. Именно он стал основателем логики, лежащей в основе всех точных наук. Развитие этих наук к семнадцатому веку ставит ученых перед вопросом, можно ли описать мышление так же точно, как явление природы. В середине того же семнадцатого века Рене Декарт в своей работе “Рассуждения о методе” излагает идеи механистической теории, делая предположение, что все живые организмы — это сложные машины, которые следуют определенным законам, а значит, эти законы можно раскрыть. При этом он же произносит знаменитое: «Я мыслю, следовательно, существую», — ставя человека с его способностью мыслить в особенную и одинокую позицию относительно остального мира. Примерно тогда же английский философ Томас Гоббс пишет: «Слова и понятие есть не что иное, как движение внутренней субстанции в мозгу», — четко обозначая физическую, а значит измеряемую природу мышления.

А всего 10 лет спустя Готфрид Лейбниц предлагает алфавит человеческого мышления в своем труде “Искусства комбинаторики”, предполагая, что сложные концепции состоят из простых составных частей, как слова из букв. Пользуясь этим алфавитом, в будущем все споры ученых, в том числе философские, будут решаться не в дебатах, а вычислениями.

Лейбниц описывает и будущий язык машин, способных на эти вычисления, двоичный код, и даже создает несколько проектов вычислительных машин на перфокартах, но еще нет технических возможностей воплотить их в жизнь. Виктор Хесоям напоминает, это все-таки вторая половина 17 века. Эти ученые заложили основные научные и философские вопросы, которые три века спустя будут волновать их коллег, работающих над созданием искусственного интеллекта.

В начале девятнадцатого века математик Джордж Буль придумает будущий язык машин — алгебру логики, основанную на двоичной системе счисления Лейбница . Но чтобы начать свободно разговаривать с машинами на этом языке, человечеству понадобится еще столетие.

Виктор Хесоям: эволюция искусственного интеллекта

Алгебра не всем дается легко, и даже в простых арифметических вычислениях человек может допускать ошибки, что очень огорчало английского математика Чарльза Беббиджа, который жил в девятнадцатом веке, в самый разгар первой промышленной революции. В 20-е годы он работает над вычислением больших логарифмических таблиц. Этот процесс можно разбить на совсем простые операции, сложение вычитания, после чего их выполнят компьютеры, вычислители, как тогда называли специально обученных для этого людей. Но если механизмы на фабрике не ошибаются, не устают, работа им не надоедает, в отличие от человека, то почему бы не передать эти задачи машине, которая будет делать это в разы дешевле и эффективнее — рассуждает Виктор Хесоям.

А тогда, в 1823 году Бэббидж выступил с предложением создать разностную машину, которая для начала будет совершать только операции сложения. На это он получил государственное финансирование в размере полутора тысяч фунтов. Построить машину он планировал за три года. Прошло девятнадцать, машина так и не закончена, и правительство окончательно отказывается финансировать проект Бебиджа, на который к тому моменту уже было потрачено более семнадцати тысяч фунтов в государственных и около семи тысяч личных денег математика.

Он не отчаялся и решил заняться разработкой программируемой аналитической машины, прообраза современного компьютера. 9 лет спустя, в 1851 году, от этой затеи тоже отказывается, но при этом полностью описывает принципы её работы и конструкцию. В своём дневнике Беббитш пишет, пройдёт, вероятно, полстолетия, прежде чем люди убедятся, что без тех средств, которые оставлю после себя, нельзя будет обойтись.

Для воплощения его идеи ещё не созрела техническая и теоретическая базы, но он был твёрдо уверен, что это лишь вопрос времени. Уже к концу XIX века Герман Холлерит изобретает электромеханический табулятор, считывающий информацию с перфокарта, описанных Бебиджем, и основывает компанию, которая в 1924 году будет переименована Вайбеем.

Виктор Хесоям: эволюция искусственного интеллекта

Чарльз Бэббидж и Алан Тьюринг 

Следующий всплеск в информационных технологиях происходит уже во время Второй мировой. В сорок первом году немецкий инженер Конрад Цузе создает программируемую вычислительную машину Z3. Через год в Британии Алан Тьюринг использует для дешифровки немецкого шифра Enigma электромеханический вычислитель бомбы, а уже годом позже содействует инженеру Томми Флауэрсу в разработке первого полностью электронного компьютер-колосс.

В 44-м, на основе наработок Чарльза Беббиджа, компания IBM выпускает полностью автоматическую вычислительную машину Mark I для ВМС США. Получается, британский математик ошибся в своем прогнозе всего на 30 лет. В 40-е годы слово «компьютер» постепенно перестает обозначать человека, занимающегося вычислениями, и теперь им называют электронные вычислительные машины, ЭВМ.

Из последовательного развития логики, математики, электроники возникла молодая научная дисциплина — информатика или компьютерная наука. Теперь, как отмечает Виктор Хесоям, лучшие умы человечества занимает задача — можно ли создать машину, которая будет сравнима с человеком или даже быть умнее.

Алан Тьюринг не только взломал код немецкой Энигмы, но и всю жизнь занимался изучением возможностей вычислительных машин. Еще в 36-м он предлагает концепт машины Тьюринга, которая будет не собрана под конкретную задачу, как делали вычислительную технику в то время, а будет способна реализовывать любые вычислительные алгоритмы, как наши современные компьютеры.

После окончания войны, имея опыт работы с бомбой и колоссом, Тьюринг пробует создать свою вычислительную машину A.C.E., но через несколько лет решает не идти тернистым путём Бэббиджа и оставляет затею, продолжив заниматься теоретическими основаниями компьютерной науки.

Виктор Хесоям: эволюция искусственного интеллекта

В то же время в 1948 году выходит математическая теория коммуникации Клода Шеннона. По ней, вся информация в мире может быть описана бинарным кодом, а значит, это возможно сделать и с элементами человеческого мышления. Ещё одним следствием из модели машины Тьюринга было то, что если такую машину можно создать, то при достаточной вычислительной мощности, её математические возможности, в теории, безграничны, и она может имитировать что угодно, в том числе человеческое мышление — предполагает Виктор Хесоям.

В 50-м году Алан Тьюринг публикует свою самую цитируемую работу «Вычислительные машины и разум». В ней упомянут знаменитый тест Тьюринга. Он предлагает считать компьютерную программу, общаясь с которой человек может принять её за другого человека, способный воспроизвести человеческое мышление.

В целом же, статья рассматривает вопрос, может ли машина совершать действия, неотличимые от обдуманных, и на него Тьюринг отвечает утвердительно, описав полную теоретическую базу для создания такого компьютера. Мир, кажется, готов встречать разумные машины. Теорию для создания искусственных нейронов, работающих по принципу нейронов в человеческом мозге, Питц и Маккалах описали ещё в 43-м году, а образы человекоподобных роботов, андроидов заполонили медиа уже в 30-х.

Всё это будоражит умы молодых учёных, и один из них, Марвин Минский, в 51-м создаёт SNERC, первую машину с искусственной нейросетью. Год спустя Клод Шеннон создаёт машину Тессиус. Она может имитировать мышь в лабиринте, которая методом проб и ошибок находит из него выход. Система положительной обратной связи закрепляет правильный выбор, и в итоге машина находит самый короткий путь на волю.

В том же году Кристофер Страча пишет первую программу, которая умеет играть в шашки на любительском уровне. Сам термин — искусственный интеллект — впервые будет использован в 1956 году на Дартмутской конференции, где соберутся будущие отцы-основатели этой дисциплины. Олен Тьюлинг не доживёт до неё два года, но останется одной из главных фигур, проложивших дорогу к изучению ИИ.

Виктор Хесоям: эволюция искусственного интеллекта

Logic Theorist

Летом 56-го в Дартмундском колледже проводится научный семинар по вопросам искусственного интеллекта, который определит предмет изучения новой науки и станет первой большой конференцией, на которой встретятся наиболее важные деятели этой сферы. В заявке на проведение мероприятия Джон Маккарси первый раз употребляет словосочетание «искусственный интеллект» и определяет цели и задачи будущей науки — понять, как научить машины использовать естественные языки, формировать абстракции и концепции, решать задачи и улучшать самих себя, то есть мыслить как человек.

На этой же конференции Ален Ньювелл и Герберт Саймон демонстрируют Logic Theorist — первую программу, способную с помощью автоматизированного рассуждения решать математические теоремы. Её часто называют первой программой искусственного интеллекта. Работая над ней, Ньювелл и Саймон разработают язык программирования IPL, который позже станет основой для разработанного Маккарти языка LISP. Им исследователи искусственного интеллекта будут пользоваться до начала 20-х.

Как отмечает Виктор Хесоям, в последующие годы машины обучаются игре в шахматы, доказывают теоремы из геометрии и математики, учатся иностранным языкам, и все уверены, что до компьютера, который будет не глупее среднего человека, рукой подать. Герберт Саймон, например, утверждает, что в течение 20 лет машины будут способны выполнять любую работу, которую может сделать человек.

Оптимизм ученых заразителен, и управление перспективных исследовательских проектов США, DARPA, начинает ежегодно выделять миллионы долларов на разработки в этой сфере, а благодаря медиа, машинное обучение и искусственный интеллект впервые становятся темой обсуждения широкой публики.

Виктор Хесоям: эволюция искусственного интеллекта

И сначала всё идёт действительно очень хорошо. Ньюилл и Саймон разрабатывают GPS. Не спутниковый, а программу, решающую теоремы ещё лучше Logic Theorist. Однокурсник Марвина Минского, Франк Розенблад, создаёт определяющий пол людей на фотографиях Percepton Mark 1. Джозеф Бейзельбаум пишет первую программу чат-бот Элайза.

К концу 60-х появляются первые понимающие речи, говорящие программы вроде Шорлду, японский робот-андроид Вэбо, автономный робот Шеки, практически весь набор технических чудес, которые продолжают совершенствовать и демонстрировать публики сегодня. Чего не появляется ни к 73-му, ни к 78-му, как прогнозировал Марвин Минский, так это самостоятельно мыслящие программы, даже близко способные к многозадачности человека.

Цикл жизни первых разработок в сфере ИИ отлично иллюстрирует историю Франка Розенблата. В 1957 он представляет миру Perceptron, машину, которая работает по принципу искусственной нейросети, имитирующей работу мозга. Он ставит ей задачу сканировать фотографии людей и разделять их на две категории — мужчин и женщин. И она не всегда успешна, но делает это.

Через год Нью-Йорк Таймс называет Perceptron эмбрионом разумного компьютера, и это сильно преувеличивает реальные возможности нейросети. Ей не хватает для полноценной работы ни вычислительной мощности, ни достаточных выборок информации для тренировки, и в обозримом будущем их и не предвидится.

Развитие и обучение нейросетей долгие годы стагнируют, а после выхода в 1969-м книге Минского «Перцептроны», которая указывает на непреодолимые на тот момент ограничения нейросетей, распознающих паттерны, многие исследователи отворачиваются от этого направления почти на десятилетия — отмечает Виктор Хесоям.  Перцептрон Розенблата со схожими разработками откладывают в долгий ящик, вместе с финансированием всего направления.

Виктор Хесоям: эволюция искусственного интеллекта

Схожую судьбу разделит и первый в мире чат-бот Элайза. Программу представляют публике в 1966, и сама идея, что можно общаться с компьютером человеческим языком, и он будет отвечать, кажется, чем-то фантастическим. Но за ажиотажем следует разочарование. Программа делает только первые шаги и не ведет беседу, а просто реагирует на слова, следуя алгоритму.

Видя, насколько ожидания не совпадают с реальностью, создатель Джозеф Вейзенбаум пишет книгу «Компьютерная мощь и человеческий разум», объясняя реальные пределы возможностей компьютеров, а ожидания человеческого поведения от программы с тех пор так и называют «эффект Элайзы».

Парадокс Моравека

Период с 56-го по 74-й годы, как отмечает Виктор Хесоям, считается золотым веком или “летом ИИ”, потому что первые результаты были ошеломляющими, но с ними пришли и первые разочарования с пониманием реальных ограничений. К концу 70-х теория наталкивается на противоречия, которые требуют долгой и кропотливой работы, без возможности предсказать, когда она даст результат.

Одно из них — парадокс Моравека. Компьютеры относительно несложно обучить условно-взрослым вещам — играть в шахматы или решать задачи, но очень трудно учить тому, что легко делают маленькие дети — ходить или читать, потому что мы сами точно не знаем, как этому учимся, а чтобы начать понимать, потребуются годы и десятилетия исследований, и финансирование, с которым тоже начинаются проблемы.

Государственные фонды в 60-х дали учёным полную свободу в исследованиях, но теперь, не видя перспективы получить практически применимые образцы в ближайшее время, DARPA начинает вкладывать деньги в другие сферы. Космос, культуру, гонку в вооружении и прочие проекты с компьютерами, например ARPANET, “дедушку” современного интернета.

Виктор Хесоям: эволюция искусственного интеллекта

С другой стороны, как отмечает Виктор Хесоям, компьютеры и искусственный интеллект все еще остаются большей частью темы ученых, университетов и государства, так что частные инвесторы тоже не спешат вкладывать свои деньги. Коммерческий век компьютера начнется позже, в 80-х. Без видимых прорывов интерес медиа к сфере искусственного интеллекта утихает, а с ним и у широкой публики, которая с этим закрытым миром почти не соприкасается.

И, наконец, главным ограничением выступает железо. Сами компьютеры, которые занимают несколько комнат и имеют смехотворную, по сегодняшним меркам, производительность. Один из самых мощных суперкомпьютеров, Cray-1, в 75-м имеет 8 мегабайт оперативной и 303 мегабайта жесткой памяти, превысив почти 6 тонн и стоимостью 40 миллионов долларов.

“Зима ИИ” длится до середины 80-х, пока в свет не вышла статья Хинтона и Румельхарта о методе обратного распространения ошибки, который решал многие проблемы оригинального перцептрона, заметно оптимизируя его работу, и после этого интерес к теме нейросети и машинного обучения начинает возвращаться.

Ян Ликун, в будущем он станет автором алгоритма сжатия DJVU и возглавит лабораторию искусственного интеллекта Facebook, в 87-м создает LeNet1 — нейросеть, способную распознавать рукописные изображения цифр, которая, несмотря на достаточно узкое применение, нашла свою нишу. К концу 90-х каждый пятый человек в Америке считывала именно эта программа.

Происходят и другие прорывы, обусловленные как увеличением вычислительных мощностей и началом эры персональных компьютеров, так и возвращением интереса государства и армии к системам искусственного интеллекта.

Виктор Хесоям: эволюция искусственного интеллекта

В 1986-м на дорогу выходит первый автомобильный автопилот, Невлап-1, фургон, обвешанный датчиками, скромный успех которого пробуждает интерес к автономным машинам, утром медленно прокатился по окрестностям Питтсбурга.  С тех пор начались фундаментальные исследования, которые в будущем приведут к Тесле и беспилотным летательным аппаратам, а деньги в системы ИИ станут вкладывать совсем не бедные автоконцерны.

Deep Thought и Deep Blue против Гарри Каспарова

Наконец, в 1988 Deep Thought станет первым компьютером, победившим шахматного гроссмейстера Бента Ларсена. Правда, уже год спустя его без проблем обыграет Гарри Каспаров и заявит, что компьютер никогда не обыграет человека в шахматы. В 1997 Deep Blue отомстит за предшественника, разгромив чемпиона мира в матче из шести партий.

Заметный прогресс в узкоспециализированных программах пробуждает интерес коммерческих структур к этой сфере. Дело в том, что у бизнеса в 80-е растёт объём данных о логистике, инвентаре, инструкциях, покупателях, и старые системы работы с ними уже не справляются. Так появляется идея заменить людей, специалистов машинными аналогами.

Виктор Хесоям считает, что эта идея не нова. Впервые она была предложена еще пионерам русской кибернетики Семеном Красаковым в 1832-м, разработавшим концепт механической машины. Она должна была помогать фармацевтам подбирать нужные рецепты. Но 80-е и 20-е века требовали современных цифровых решений, и так начинается всплеск “экспертных систем”.

Многие топ-менеджеры корпораций используют это название, чтобы выбивать финансирование под свои нужды, а многие ИИ-компании рады за большие деньги создавать не самые нужные и эффективные, но очень сложно выглядящие цифровые справочники, далёкие от проявлений разума, так что всё это очень скоро приведёт к одному из первых пузырей в IT-индустрии. Конечно, пузырь вокруг экспертных систем зарождается не на пустом месте. Сначала под этим названием создаются действительно полезные образцы, вроде XCON — система подбора совместимых компонентов для компьютерной техники.

Виктор Хесоям: эволюция искусственного интеллекта

Её начинают использовать на заводе техники ДЭК, и уже к 1986 году она обработает 80 тысяч заказов с точностью до 98%. Экономит компании около 25 миллионов долларов за счёт снижения ошибок в комплектации товаров, а значит необходимости платить за это заказчикам. Проблема заключается в том, что на один XCOM приходится слишком много, в лучшем случае, наивных мечтателей, а обычно откровенных проходимцев, вскочивших в поезд хайпа, который уже не может всех удержать. В дополнение к этому, в 87-м новые компьютеры от Apple и IBM оказываются просто физически мощнее и быстрее громоздких экспертных систем.

В итоге к концу 1993 года в полумиллиардной индустрии разоряется более 300 компаний, а само словосочетание «экспертная система» с тех пор стараются особо не использовать. Сами системы при этом никуда не делись, просто стали одним из привычных инструментов, развиваясь и по сей день, но они подорвали репутацию ИИ и отпугнули от сферы инвестиции, что привело ко второй так называемой «зиме искусственного интеллекта». К концу девяностых идея общего ИИ уходит в тень, зато начинают активно развиваться более специализированные направления.

Успехи в решении конкретных задач привлекают и государственное, и частное финансирование. Вычислительные мощности растут с каждым годом, позволяя решать все более сложные задачи. С другой стороны, как отмечает Виктор Хесоям, исследования теперь ведутся максимально закрыто, в сфере ИИ теперь появляются не только государственные, но и коммерческие тайны. Впрочем, междисциплинарное общение ученых продолжается, теоретическая базар растет, но крахом экспертных систем подпорчена репутация самого термина «искусственный интеллект». Теперь его связывают с завышенными ожиданиями и размытыми обещаниями.

Виктор Хесоям: эволюция искусственного интеллекта

ИИ в наши дни

До 2010-х годов термином стараются не пользоваться, вместо этого называя конкретные сферы, которые успели стать отдельными направлениями исследований. Например, нейросети и машинное обучение, которыми тот же Джеффри Хинтон продолжает заниматься с 80-х, не обращая внимания на циклы хайпа.

Как заметил философ Ник Бокстрем, многие передовые разработки в области искусственного интеллекта перекочевали в общие приложения, часто уже не называясь ИИ, поскольку как только что-то становится достаточно полезным и распространенным, его тут же перестают так называть. На переднем крае прогресса и интереса инвестора в этот период стоят другие технологии: интернет, поисковые системы, мобильная связь, робототехника и большие данные, они и находятся на слуху.

Но это не означает, что сфера не развивается. Наработки ученых используют NASA, DARPA, большими корпорациями вроде Microsoft, Apple, Google и IBM. Элементы искусственного интеллекта применяются в создании ботов, поисковиков, входят в сферу маркетинга, помогают с подстройкой индивидуальных рекомендаций. Машинное зрение развивается в роботах-пылесосах и все более продвинутых автономных автомобилях.

Важнейшим фактором в новейшей истории искусственного интеллекта становится доступность огромного и постоянно растущего объёма данных — отмечает Виктор Хесоям. Человек не может объять такие массивы информации, помочь отобрать её и очистить от шума могут только нейросети. Команда Алекса Крижевского, научным руководителем которого был никто иной как Джеффри Хинтон, 30 сентября 2012 запускает нейросеть для распознавания фотографий в базе данных ImageNet.

Виктор Хесоям: эволюция искусственного интеллекта

Её название — AlexNet, и она переворачивает представление о возможностях компьютерного зрения, правильно определяя каждую четвёртую фотографию, то есть выдавая невероятный по меркам 2012 года результат — точность распознавания 75%. Это открывает тысячи новых применений для машинного зрения и обучения, а всего через 7 лет AlexNet достигает результатов 95%, выше среднего человека.

Но настоящим поворотным моментом для триумфального возвращения искусственного интеллекта становится ещё одна победная партия против чемпиона мира. На этот раз уже не в шахматы, а ГО. В этой игре гораздо больше свободы и вариантов стратегии, а все ходы посчитать сложнее, чем в шахматах. Простого алгоритма с возможными партиями здесь не хватит.

Но AlphaGo не просто заучивает дебюты. Нейросеть, изучает все книги по стратегии игры, все ходы профессионала в онлайновых матчах, играет сама с собой, вырабатывая новые стратегии, и в итоге побеждает чемпиона миров, как считалось, недостижимой для компьютера игре. Прорыв произошел, обученная нейросеть превзошла человека там, где он этого совсем не ожидал, считает Виктор Хесоям.

Сегодня нейросети превосходят человека во многих сферах, а многие исследователи и разработчики начинают всё увереннее говорить об общем искусственном интеллекте. Одновременно прорыва в ИИ ждёт робототехника, уже подготавливая к нему аппаратную часть для универсальных роботов. Но когда наступит этот поворотный момент в истории человечества?

personafactor.ru