Программное обеспечение Breakthrough учит компьютерные знаки идти, управлять, даже играть в футбол

«Мы создаем физически моделируемых людей, которые учатся двигаться с умением и гибкостью посредством их среды», сказал Михиль ван де Пэйнн, преподаватель информатики UBC, который представляет это исследование сегодня в 2017 SIGGRAPH, самую большую компьютерную графику в мире и интерактивную конференцию по методам. «Мы учим компьютерные знаки учиться отвечать на свою среду, не имея необходимость к ручному кодексу необходимые стратегии, такой как, как сохранить равновесие или запланировать путь через движущиеся препятствия. Вместо этого эти поведения могут быть изучены».

Работа, названная DeepLoco, предлагает альтернативный способ оживить человеческое движение в играх и фильме вместо текущего метода, который использует актеров и камеры захвата движения или аниматоров. DeepLoco позволяет знакам автоматически двигаться способами, которые и реалистичны и внимательны к их среде и целям. В будущем, два или четырехногие роботы мог учиться проводить через их среду, не нуждаясь к ручному кодексу в соответствующих правилах.Используя его алгоритм, моделируемые персонажи учились идти по узкому пути без уменьшения, стараться не сталкиваться с людьми или другими движущимися препятствиями, и даже вести футбольный мяч к цели.

Метод делает передовое использование из глубокого изучения укрепления, тип алгоритма машинного обучения, в котором опыт получен методом проб и ошибок и сообщен вознаграждениями. Со временем система прогрессивно определяет лучшие действия, чтобы взять в данных ситуациях.«Это похоже на изучение нового спорта», сказал ван де Пэйнн. «Пока Вы не пробуете его, Вы не знаете то, на что Вы должны обратить внимание. Если Вы учитесь кататься на сноуборде, Вы не можете знать, что должны распределить свой вес конкретным способом между Вашими пальцами ног и пятками.

Это стратегии, которые лучше всего изучены, поскольку их очень трудно закодировать или проектировать любым другим способом».Движением людей и животных управляют не только физика, но также и контроль.

В то время как люди изучают устройство управления двигателем методом проб и ошибок, ван де Пэйнн говорит, что трудно сказать, насколько алгоритм подражает человеческому процессу обучения. В конце концов, компьютерная программа все еще учится намного более медленно, чем человек.

Он начал работать над этим типом моторной проблемы изучения, когда у него были дети; им теперь 17 лет и 20.«Я отчетливо не забываю задаваться вопросом, кто освоит проворную ходьбу и бегущие навыки сначала: мой сын, дочь или алгоритм?» он сказал. «Мой сын и дочь побеждают меня намного».Посмотрите ролик здесь: https://youtu.be/15IyqCwTV4A