Una nueva versión del programa de inteligencia artificial AlphaGo, creado por Google, es capaz de aprender a usar el clásico juego de estrategia Go sin intervención humana, según publica la revista Nature.
El nuevo algoritmo, bautizado como AlphaGo Zero, ha derrotado por 100 partidas a cero a su predecesor, que logró el reconocimiento mundial al ganar en marzo de 2016 al surcoreano Lee Sedol, campeón del mundo de Go en 18 ocasiones.
El AlphaGo original fue entrenado a partir de un aprendizaje supervisado, a partir de millones de movimientos de partidas disputadas por jugadores humanos expertos, y se sometió después a un proceso de refuerzo con juegos contra sí mismo.
El reto de los ingenieros en la nueva versión del algoritmo era lograr que aprendiera el juego partiendo de una “tabula rasa” y sin ningún conocimiento de partidas humanas previas.
AlphaGo Zero ha adquirido su maestría en el juego de estrategia únicamente disputando partidas contra sí mismo.
Empezó a jugar con movimientos de fichas al azar y fue aprendiendo en cada partida en base a los errores y aciertos cometidos, reporta Efe.
El algoritmo funciona en una única computadora dotada con cuatro Unidades de Procesamiento de Tensor (TPU, en inglés), circuitos integrados desarrollados específicamente para el aprendizaje de máquinas.