Quem cria a inteligência artificial mais poderosa?
Página principal Tecnologia, Inteligência Artificial

Google e Facebook competem para criar a inteligência artificial mais avançada.

Rémi Coulom passou a última década a construir software para jogar o antigo jogo de Go – praticamente melhor do que qualquer outra máquina na terra. Chama à sua criação Crazy Stone – que no início do ano passado, no clímax de um torneio em Tóquio, desafiou o grande mestre de GO – Norimoto Yoda, um dos maiores jogadores do mundo – e portou-se muito bem. No que é conhecido como Electric Sage Battle o Crazy Stone venceu o grande mestre. No entanto, a vitória veio com uma ressalva.

Ao longo dos últimos 20 anos as máquinas têm superado o homem em tantos jogos de habilidade intelectual que agora assumimos que os computadores podem vencer-nos em praticamente qualquer coisa. Mas o Go – uma versão oriental de xadrez em que dois jogadores competem com pedras polidas num tabuleiro de 19 por 19 linhas – continua a ser a exceção. Sim, o Crazy Stone venceu Yoda – mas começou com uma vantagem de quatro pedras. Foi a única forma de garantir uma luta justa.

Em meados dos anos 90 um programa de computador chamado Chinook venceu o melhor jogador do mundo no jogo de damas. Poucos anos depois o Deep Blue, supercomputador da IBM, chocou o mundo do xadrez quando derrotou, com facilidade, o campeão mundial Gary Kasparov. Mais recentemente, outra máquina da IBM – a Watson – ficou acima dos melhores jogadores no Jeopardy! –um jogo de conhecimento geral na televisão. As máquinas também têm dominado o Othello, Scrabble, backgammon e poker. Na esteira da vitória do Crazy Stone sobre Yoda Coulom previu que serão necessários mais dez anos para que uma máquina vença um grande mestre sem vantagem inicial.

Na altura esses dez anos pareciam bastante curtos. Ao jogar Go os grandes mestres muitas vezes dependem de algo que está mais próximo da intuição do que da análise cuidadosamente fundamentada – e construir uma máquina que duplique este tipo de intuição é extremamente difícil. No entanto, uma nova arma poderá ajudar os computadores a conquistar os humanos muito mais cedo: a aprendizagem profunda. No seio de empresas como a Google e Facebook a aprendizagem profunda está a provar-se extremamente hábil no reconhecimento de imagens e padrões espaciais – uma habilidade bem adequada ao Go.

À medida que exploram tantas outras oportunidades que esta tecnologia permite a Google e o Facebook estão também a competir para ver se conseguem resolver o antigo jogo.

Como Yuandong Tian, investigadora de IA do Facebook, explica o Go é um problema clássico de IA – um problema imensamente atraente por ser extremamente difícil. A empresa acredita que uma solução para o Go irá não só ajudar a refinar a IA que impulsiona a popular rede social mas também provar o papel da Inteligência Artificial. Rob Fergus, outro investigador do Facebook, concorda. “O objetivo é avançar em termos de IA.” – Afirma. Mas também reconhece que a empresa é conduzida, pelo menos em pequena escala, por uma rivalidade amigável com a Google. Há orgulho em ser-se encontrado a resolver o jogo Go.

Construir um cérebro para o Go

Hoje a Google e o Facebook utilizam a aprendizagem profunda para identificar rostos em fotografias que você publica na internet. É assim que os computadores reconhecem os comandos extraídos para um telemóvel e traduzem coisas de uma língua para outra. Por vezes, conseguem mesmo entender linguagem natural – a forma natural como nós, seres humanos, conversamos.

Esta tecnologia baseia-se nas chamadas redes neurais profundas – vastas redes de máquinas que se aproximam da rede de neurónios no cérebro humano. Se você submeter suficientes fotografias de árvores nestas redes neurais as mesmas poderão aprender a identificar uma árvore. Se fizer o mesmo com um diálogo, poderão aprender a manter uma conversa decente (apesar de por vezes estranha). E se fizer o mesmo com movimentos Go – poderão aprender a jogar Go.

As redes neurais profundas são muito apropriadas para o Go na medida em que o jogo é muito motivado por padrões no tabuleiro. “Estes métodos são muito bons a generalizar a partir de padrões.” – Afirma Amos Storkey, professor na Universidade de Edimburgo que utiliza redes neurais profundas para abordar o Go, tal como a Google e o Facebook.

A crença é que estas redes neurais podem finalmente fechar a lacuna entre máquinas e seres humanos. Ao jogar Go os grandes mestres não examinam necessariamente os resultados de cada possível movimento. Muitas vezes jogam baseando-se na forma como o tabuleiro se encontra. Com a aprendizagem profunda os investigadores podem começar a duplicar essa abordagem. Ao partilharem imagens de movimentos bem-sucedidos podem ajudar as máquinas a aprender qual o aspeto de um movimento bem-sucedido.

“Em vez de apenas tentar descobrir quais as melhores coisas a fazer aprendem como é que os seres humanos jogam o jogo.” – Avança Storkey em relação às redes neurais. “Copiam, efetivamente, o jogo humano.”

Mais profundo que a aprendizagem profunda

Construir uma máquina capaz de ganhar ao Go não é apenas uma questão de poder de computação. É por isso que programas como o de Coulom ainda não o conseguiram. O Crazy Stone depende daquilo a que se chama uma busca em árvore baseada no método Monte Carlo, um sistema que analisa os resultados de cada movimento possível. Foi assim que as máquinas dominaram as damas, o xadrez e outros jogos: olharam mais longe do que os jogadores que defrontaram. No entanto, com o Go, existem demasiadas possibilidades a considerar. No xadrez, em cada turno, o número médio de movimentos possíveis é 35. Com o Go é 250 – e depois de cada um desses 250 movimentos possíveis existem outros 250. E assim por diante. É impossível para uma busca em árvore considerar os resultados de cada movimento (pelo menos não numa quantidade de tempo razoável).

No entanto, a aprendizagem profunda pode preencher essa lacuna fornecendo um nível de intuição em oposição à força bruta. No mês passado, num paper publicado no Arxiv, site de pesquisa académica, o Facebook demonstrou um método que combina a busca em árvore baseada no método Monte Carlo com a aprendizagem profunda. Em competição com seres humanos o sistema chegou mesmo a jogar com um estilo que parecia humano. Afinal aprendeu com movimentos humanos reais. Coulom refere-se aos resultados da empresa como “muito espetaculares”.

Em última análise Coulom avança que este tipo de abordagem híbrida irá resolver o problema. Ele afirma:

“O que as pessoas estão a tentar fazer é combinar as duas abordagens – de modo a que seja melhor do que com cada uma.”

Ressalta que a Crazy Stone já utiliza um tipo de aprendizagem em concertação com o método Monte Carlo. Apenas os seus métodos não são tão complexos como as redes neurais utilizadas pelo Facebook.

O papel do Facebook mostra o poder da aprendizagem profunda mas é também um lembrete de que as grandes funções da IA são essencialmente resolvidas por mais do que apenas uma tecnologia. São resolvidas por muitas tecnologias. A aprendizagem profunda faz muitas coisas bem – mas pode sempre recorrer a ajuda de outras formas de IA.

Tentativa e Erro

Depois de o Facebook ter revelado o seu trabalho com o Go a Google apresentou uma resposta. Um investigador de topo, em termos de IA, da Google – Demis Hassabis – afirmou que em poucos meses a empresa irá revelar “uma grande surpresa” relacionada com o jogo de Go. A Google recusou-se a avançar mais em relação a esta questão e não é claro o que é que a empresa tem em mãos. Coulom, por exemplo, diz ser pouco provável a Google ter produzido tão rapidamente algo capaz de vencer os jogadores de topo de Go – mas acredita que a empresa irá dar um passo significativo nessa área.

Muito provavelmente também esse passo irá contar com múltiplas tecnologias – e estamos a adivinhar que uma das mesmas será algo chamado aprendizagem por reforço. Enquanto que a aprendizagem profunda é boa na perceção – reconhecer como algo parece, soa ou se comporta – os algoritmos de reforço podem ensinar as máquinas a agir com base nessa perceção.

Hassabis supervisiona a DeepMind, uma subsidiária da Google baseada em Cambridge, no Reino Unido, e a DeepMind já tem utilizado a aprendizagem profunda em conjunto com algoritmos de reforço. No início deste ano Hassabis e a sua equipa publicaram um paper que descrevia como as duas tecnologias podiam ser utilizadas para jogar antigos jogos de vídeo Atari – e, em alguns casos, vencer jogadores profissionais.

Depois de uma rede neural profunda ajudar o sistema a perceber o estado do jogo – como é que o tabuleiro se parece em dado momento – os algoritmos de reforço utilizam a tentativa e erro para ajudar o sistema a perceber como responder a determinado estado do jogo. Basicamente, o computador tenta um movimento particular e se esse movimento trouxer uma recompensa – pontos para o jogo – reconhece o movimento como bom. Depois de tentar movimentos suficientes o sistema acaba por entender as melhores formas de jogar. O mesmo tipo de abordagem pode funcionar com o Go.

Esta abordagem é diferente de uma busca em árvore padrão em que o sistema aprende o aspeto de um bom movimento. Os investigadores treinam-no para jogar antes do jogo real começar. Tal como acontece com a aprendizagem profunda – joga através de um tipo de “conhecimento” em vez de aplicar força bruta ao problema.

Em última análise, para resolverem o jogo de Go as máquinas precisam de todas essas tecnologias. A aprendizagem por reforço pode alimentar-se da aprendizagem profunda e ambas podem encaixar-se numa abordagem tradicional como a busca em árvore baseada no método Monte Carlo.

Resolver o Go continua a ser extremamente difícil mas a moderna IA está a aproximar-se. Quando Hassabis revelar a sua “grande surpresa” saberemos o quão perto chegou.

Leia também:
Por favor, descreva o erro
Fechar