Computador que venceu humanos no jogo Go está ainda mais inteligente

Na quarta-feira (18) os fabricantes do computador que venceu os melhores jogadores de um jogo de tabuleiro de estratégia que exige intuição, informaram que o computador está ainda mais inteligente.

O jornal científico Nature relatou que a versão atual do AlphaGo é totalmente autoditada, o que é um passo extremamente importante em relação ao surgimento de máquinas com alcance de habilidades sobre-humanas, ou seja, sem nenhum auxilio humano.

O AlphaGo Zero venceu 100 partidas disputadas. O sistema de Inteligência Artificial (IA) foi batizado de AlphaGo Zero e aprendeu sozinho em apenas alguns dias a dominar o jogo de tabuleiro chinês conhecido como "Go". O sistema inventou seus próprios movimentos originais para eclipsar toda a perspicácia que os humanos adquiriram no Go ao longo de milhares de anos.

Após três dias de autotreinamento, a máquina foi testada contra o AlphaGo, seu precursor que anteriormente venceu os principais campeões humanos.

Segundo o pesquisador principal do AlphaGo, Dvaid Silver "O AlphaGo Zero não só redescobriu os padrões e as aberturas comuns que os seres humanos tendem a jogar… ele acabou vencendo-os com preferência pelas suas próprias variantes que os humanos sequer conhecem nem jogam no momento".

Jogado com pedras brancas e pretas em um tabuleiro, o jogo chinês já tem mais de 3.000 anos. Em março de 2016, o AlphaGo ganhou as manchetes mundiais com sua vitória por 4 a 1 sobre o campeão de Go Lee Se-Dol por 18 vezes.

Os especialistas na época disseram que a derrota de Lee mostrou que a IA estava progredindo mais rápido do que se pensava, que solicitaram normas para garantir que a IA permaneça sempre sob controle humano.

Já em maio deste ano, a atualização AlphaGo Master venceu o campeão mundial Ke Jie nas três partidas disputadas. O AlphaGo Zero não aprendeu com os humanos, nem mesmo jogando contra eles, ao contrário de seus antecessores, que treinaram com dados de milhares de jogos humanos antes de praticar, afirmam os pesquisadores da empresa britânica de inteligência artificial, DeepMind, que desenvolve o sistema, adquirida pela Google.

Silver para explicar o avanço disse "Foi dito a todas as versões anteriores do AlphaGo: ‘Bem, nesta posição o especialista humano jogou este movimento particular, e nesta outra posição o especialista humano jogou aqui'".

O que não aconteceu com o AlphaGo Zero. Ele foi programado para responder a uma recompensa, um ponto positivo para cada vitória versus um ponto negativo para cada perda. Partindo apenas das regras do Go e sem instruções, o sistema aprendeu o jogo, elaborou uma estratégia e melhorou enquanto competia contra si mesmo, começando com um "jogo completamente aleatório" para descobrir como a recompensa é ganha.

A estratégia utilizada é conhecida por "aprendizagem por reforço", um processo de tentativa e erro. Silver e o CEO da DeepMind, Demis Hassabis, comentaram que "ao contrário de seus predecessores, o AlphaGo Zero não está mais restringido pelos limites do conhecimento humano".

Sendo assim, o AlphaGo Zero surpreendentemente utilizou uma única máquina, uma "rede neural" que imita o cérebro humano, em comparação com o "cérebro" de múltiplas máquinas que venceu Lee.

Satinder Singh, da Universidade de Michigan, em um comentário também publicado pela Nature, destacou "As descobertas sugeriram que a IA baseada na aprendizagem por reforço tem um melhor desempenho do que aquelas que dependem do conhecimento humano".

"No entanto, este não é o começo de qualquer fim porque o AlphaGo Zero, como todas as outras IA bem-sucedidas até agora, é extremamente limitado ao que sabe e ao que pode fazer em comparação com humanos e até com outros animais", completou.

Já Anders Sandberg, da Universidade de Oxford, disse "A habilidade do AlphaGo Zero para aprender por conta própria pode â€‹â€‹parecer assustadoramente autônoma".

Sandberg à AFP ressaltou "Mas há uma diferença importante entre a inteligência polivalente que os humanos têm e a inteligência especializada do software de computador. O que a DeepMind demonstrou nos últimos anos é que é possível fazer softwares que podem ser transformados em especialistas em diferentes domínios, mas eles não se tornam inteligentes de modo geral".