Как научить искусственный интеллект делать всё в цифровой вселенной?

Как научить искусственный интеллект делать всё в цифровой вселенной?

Многие из нас не забывают и знают, какими бывают детские сады. Помещения для обучения напичканы игрушками и пазлами, книгами и музыкой, цветами а также время от времени котами, являя так пышный мир и богатый, с которым дети смогут играться и обучаться играясь. Но не смотря на бытующую точку зрения, игра детей далеко не несложна.

Они не просто веселятся — они обучаются, покупают познание мира. За счет игры в разнообразной и восхитительной вселенной мы лелеем многогогранный интеллект ребенка.

Из-за чего бы не учить ИИ таким же образом?

Недавно некоммерческий университет OpenAI открыл виртуальный мир для ИИ, дабы он его изучил и игрался с ним. Цель проекта Universe (Вселенная) такая же громадная, как и его наименование: научить отдельный ИИ делать любую задачу, которую человек может выполнить при помощи компьютера.

Обучая отдельных агентов ИИ преуспевать в разных задачах настоящего мира, OpenAI сохраняет надежду привести нас на ход ближе к по-настоящему разумным ботам — каковые владеют эластичными навыками рассуждения наподобие тех, каковые имеем мы.

Интеллект неспециализированного уровня

Нет никаких сомнений в том, что ИИ делается пугающе умным.

Сейчас компьютеры смогут совершенно верно видеть, слышать и переводить языки, время от времени кроме того опережая людей. Лишь в начале этого года, в серии громких игр в го, AlphaGo от DeepMind разгромил 18-кратного мирового чемпиона Ли Седоля, на десять лет раньше, чем ожидали кое-какие специалисты.

Но правда в том, что ИИ хороши ровно так, как их обучили. Попросите AlphaGo сыграть в шахматы, и программа наверное по-машинному растеряется, даже если вы объясните ей правила в небольших подробностях.

До тех пор пока что отечественные совокупности ИИ — сверхэффективные лошадки для одного трюка. Виновен в этом частично способ обучения: исследователи начинают с чистого страницы ИИ, проводя его через миллионы опробований, пока он не преуспеет в одной задаче и не примет решение ее. ИИ ни при каких обстоятельствах не испытывает что-то еще, поскольку он определит, как решить любую другую проблему?

Дабы добраться до интеллекта неспециализированного уровня — талантливого на людской уровне применять приобретённый опыт для ответа новых неприятностей — ИИ необходимо переносить собственный опыт в ответ вторых задач. И вот в этом им окажет помощь Universe. Испытывая мир, полный разных сценариев, ученые OpenAI сохраняют надежду, что ИИ возьмёт знание о мире и эластичные навыки решения проблем, каковые разрешат ему «думать», а не застревать навечно в единственной петле.

Дивный новый мир

По собственной сути, Universe это замечательная платформа, которая включает тысячи сред, в большинстве случаев снабжающих стандартные способы для обучения агентов ИИ. Будучи программной платформой, Universe снабжает площадку для запуска чужого ПО, дабы программы обучались в различных средах — Atari и флеш-игры, приложения и веб-сайты, к примеру, уже приняты.

в первых рядах будут и другие.

В теории Universe может запустить любое ПО под любой компьютер, разрешая ученым вставлять и обучать собственные ИИ по желанию. Это как послать ребенка в летний лагерь: выбираешь собственную нишу, тип деятельности, ожидаешь, пока он ее освоит, после этого другую и без того потом, искупаться и повторить.

В Universe ИИ взаимодействует с виртуальным миром так, как люди применяют компьютер: он «видит» пиксели на экране и применяет мышь и виртуальную клавиатуру, дабы вводить команды.

Это произошло благодаря Virtual Network Computing (VNC), по сути, совокупность совместного применения рабочего стола, которая разрешает передавать мыши и движения клавиатуры с одного компьютера (ИИ) второму (среда обучения). При трансформации внешней среды, VNC отправляет обновленные скриншоты обратно ИИ, что разрешает ему делать следующий ход. VNC выступает как руки и глаза ИИ.

Как происходит обучение?

Все ИИ, что подключены к Universe, обучаются при помощи так именуемого обучения с подкреплением, замечательного способа, что стал причиной успеху AlphaGo. Под этим термином прячется, но, то, как мы, люди, тренируем дельфинов, псов а также детей. Это обучение способом ошибок и проб: выберите воздействие, и в случае если вас за него вознаградили, продолжайте в том же духе.

В случае если нет, попытайтесь что-нибудь еще.

Вместо того дабы затевать с совсем безлюдного ИИ, исследователи время от времени дают им импульс, разрешая им «наблюдать», как люди решают задачу. Это разрешает ИИ организовать первое чувство и иметь более полное представление о том, как оптимизировать собственные решения.

Обучение с подкреплением уже употребляется во многих приложениях ИИ. В Universe, но, сила данной технологии раскрывается на полную. Потому, что ИИ может перескакивать между приложениями и играми, он может забрать изученное в одном приложении и свободно применять его, дабы разобраться в другом — это назвали «трансферное обучение» либо «обучение с переносом».

Данный навык непросто освоить, но он нужно на дороге к разумным автомобилям.

Согласно данным OpenAI, мы медлительно в том направлении движемся: кое-какие из их агентов уже показывают показатели переноса обучения от одной игры с вождением в другую.

От игр к миру битов

Как и многие другие разработчики ИИ, OpenAI применяет игры, дабы подтолкнуть Universe, не просто так: их с позиции успеха. Потому, что игры измеряются оценками и различными статистиками, совокупность может свободно применять эти цифры, дабы оценить прогресс ИИ и вознаградить его соответствующим образом. Это очень принципиально важно для обучения с подкреплением.

Потому, что Universe надеется на клавиатуры и пиксели, люди также смогут играться в игры на платформе. Эти сеансы записываются и снабжают базисный уровень для оценки выступлений ИИ (хорошая работенка, согласитесь).

Но игры — это только малая часть отечественного сотрудничества с цифровым миром, и Universe уже выходит за собственные ограничения с проектом Mini World of Bits («Мини-мир битов»). Биты — это собрание разных сотрудничеств с браузерами, с которыми мы сталкиваемся, бороздя пучины Интернета: в то время, когда вводим текст либо выбирает опции из выпадающих меню, нажимая «послать».

Эти задачи, хоть и простые, формируют фундамент того, как мы подключаемся к сокровищнице называющиеся Сеть. OpenAI желает, дабы ИИ вольно перемещался по Интернету — к примеру, имел возможность заказать билет на самолет. В одной из сред Universe исследователи уже дают ИИ желаемое расписание букинга и учат его искать рейсы на разных авиалиниях.

И это лишь начало.

Universe лишь растет и ширится. Платформа Malmo от Микрософт, которая применяет Minecraft для обучения ИИ, обязана интегрироваться с Universe. Популярная игра со складыванием белка fold.it, приложения для Android, игры на HTML5 и другое стоят в очереди.

Призрак в машине

Итак, сейчас мы можем учить ИИ играться в разные игры и просматривать веб. Великое дело, поразмыслишь. Приведет ли это нас к интеллекту неспециализированного уровня?

Быть может, и дорога будет продолжительной.

Но ИИ, что знает, как победить в любую игру, которую вы ему подбросите, может лишь думать логически и в пара шагов получать победы. ИИ, что может передвигаться по хаотическому миру GTA V, уже обязан осознавать базы физики настоящего мира, жестокости и ответных мер. ИИ, что может трудиться в сети, уже знает, как люди в большинстве случаев общаются между собой и может применять эти знания, для получения информации, создать собственную веб-идентичность либо кроме того посмотреть в вашу.

Ежедневно мы обучаемся, играем, трудимся и растем в цифровом царстве. Для многих мир единичек и нулей так же настоящ, как и тот, в котором мы появились. Сейчас, в то время, когда ИИ имеет доступ к этому цифровому миру, пришла его очередь расти.

Давайте посмотрим, как на большом растоянии он сможет зайти.

Плюсы и Минусы Искусственного интеллекта

Интересные записи

Популярные статьи на сайте: