или войти через:
Ваша корзина пока пуста
favorite_border
Доступно только зарегистрированным пользователям

AlphaGo Zero — новая версия искусственного интеллекта DeepMind

schedule 25.10.2017 в 05:56 link AlphaGo Zero DeepMind США Google
Компания DeepMind, принадлежащая Google, потрясла мир в 2016 году, когда её программа искусственного интеллекта AlphaGo победила одного из лучших игроков в игре Го. Это заставило многих задуматься, насколько способным стал искусственный интеллект за последние годы.

В этом году AlphaGo снова выиграл турнир в Го, на этот раз у Кэ Цзе. После этих побед, Google объявили, что делают перерыв в дальнейшей разработке программы. Однако, этого не произошло: DeepMind представила на днях новую, более совершенную версию AlphaGo – Zero, которая вышла за пределы возможностей своего предшественника, овладев настольной игрой без какой-либо помощи людей, - передает Robotics.ua



Новый будущий чемпион

Будучи ознакомленной только с правилами игры, AlphaGo Zero удалось обучиться технике Го с нуля, приобрести свои собственные знания на этом пути и в конечном итоге победить своего предшественника в серии 100 игр. Новый AlphaGo, как и старый, узнает новые действия через процесс под названием «обучение с подкреплением», поощряющий хорошие ходы, которые с большей вероятностью приведут к победе.

Для обучения оригинального AlphaGo исследователи DeepMind наполнили систему тысячами игр, которые прошли любители и профессиональные игроки Го. Эти игры помогли системе разработать выигрышные стратегии и выявить хорошие и плохие шаги. AlphaGo Zero, с другой стороны, играл только сам по себе (хотя и миллионы раз), делая шаги наугад, пока не узнал стратегии. Что действительно удивительно в самостоятельном обучении AlphaGo Zero, так это то, что он перешел от новичка к чемпиону всего за несколько дней. Система начинала с совершенно некомпетентного игрока. К третьему дню, играя против себя самой, система была способна победить своего предшественника.

Если оригинальный AlphaGo был немного больше, чем исключительно талантливый игрок в настольных играх, успехи, достигнутые AlphaGo Zero, в частности способность учиться с нуля, делает систему актуальной для широкого круга приложений реального мира. Те же принципы, которые помогают AlphaGo Zero изучать только правила, могут применяться к другой задаче, основанной на практике.

«Для нас AlphaGo была не просто победой в игре Го, - говорит Демис Хассавис, генеральный директор DeepMind. - «Это был также большой шаг для нас в создании универсальных алгоритмов».

Комментарии: