O pessoal do OpenAI apresentou os resultados do seu mais recente projeto: ensinar uma Inteligência Artificial a jogar o clássico game do Atari, Montezuma’s Revenge.

Para se obter sucesso em um projeto de aprendizagem reforçada, uma IA precisa ter duas coisas:

1. Encontrar uma sequência de ações que conduza a uma recompensa positiva. Este é o problema de exploração.

2. Relembrar a sequência de ações a tomar, e generalizá-lo a situações relacionadas, mas levemente diferentes. Este é o problema de aprendizagem.

Estes foram os pontos básicos do projeto da OpenAI. A melhor forma de alcançar os objetivos foi através das gravações de vídeo. Diferentes membros da equipe gravaram jogando sessões de pouco mais de 10 minutos do jogo. Assim, a IA analisou as partidas e aprendeu o que deveria fazer para avançar em cada cenário.

A demonstração humana do jogo alcançou 71.500 pontos no final de sua sessão. Já a IA emulou o mesmo percurso, mas alcançou 74.500 pontos.

É um avanço importante, especialmente considerando que, no mês que vem, essa mesma plataforma vai jogar Dota. E aí sim, o bicho vai pegar!

 

 

 

Via OpenAI