O pessoal do OpenAI apresentou os resultados do seu mais recente projeto: ensinar uma Inteligência Artificial a jogar o clássico game do Atari, Montezuma’s Revenge.
Para se obter sucesso em um projeto de aprendizagem reforçada, uma IA precisa ter duas coisas:
1. Encontrar uma sequência de ações que conduza a uma recompensa positiva. Este é o problema de exploração.
2. Relembrar a sequência de ações a tomar, e generalizá-lo a situações relacionadas, mas levemente diferentes. Este é o problema de aprendizagem.
Estes foram os pontos básicos do projeto da OpenAI. A melhor forma de alcançar os objetivos foi através das gravações de vídeo. Diferentes membros da equipe gravaram jogando sessões de pouco mais de 10 minutos do jogo. Assim, a IA analisou as partidas e aprendeu o que deveria fazer para avançar em cada cenário.
A demonstração humana do jogo alcançou 71.500 pontos no final de sua sessão. Já a IA emulou o mesmo percurso, mas alcançou 74.500 pontos.
É um avanço importante, especialmente considerando que, no mês que vem, essa mesma plataforma vai jogar Dota. E aí sim, o bicho vai pegar!
Via OpenAI