Armando Guédez Rodríguez: AlphaZero, la máquina que aprende de manera autónoma a ganar

octubre 17, 2019

Armando Guédez Rodríguez: AlphaZero, la máquina que aprende de manera autónoma a ganar

¿Es posible encontrar una sola máquina capaz de enfrentarse a cualquier reto o tarea sin ayuda? Pues parece que el objetivo no está lejos.

Hasta ahora, los grandes logros de la inteligencia artificial se generan con máquinas dedicadas específicamente a una tarea, entrenadas para ello en una condiciones muy concretas, incapaces de adaptarse a un cambio sustancial.

Pero los pasitos que se van dando hacia ese objetivo son firmes. El último progreso lo firmó DeepMind, que logró que un mismo programa se convirtiera en algo invencible. Se trata de shogi (una versión japonesa del juego de ajedrez) y go, los tres juegos de tablero más exigentes para el intelecto.

AlphaZero

El logro de DeepMind, la división de inteligencia artificial de Google, está generando importantes avances en inteligencia artificial.

El programa denominado AlphaZero, ha aprendido a jugar solo sobre estos difíciles tableros, como explican sus desarrolladores en la revista Science.

De cero (de ahí su nombre), sin ayuda ni ejemplos de jugadores reales. Es importante aclarar que en otras ocasiones, el ordenador aprendía porque lo alimentaban con todo el conocimiento humano, millones de jugadas y ejemplos reales, y a partir de ahí el cerebro de silicio elegía las mejores estrategias.

Deep Blue venció así a Kaspárov. Y AlphaGo venció así a Lee Sedol. Pero AlphaZero aprende de sí mismo y en apenas un puñado de horas; tan solo le explican las reglas del juego y a partir de ahí ha sido capaz de convertirse en el mejor jugador de todos los tiempos en estas tres disciplinas.

Inteligencia y superioridad

Los programas que mejor juegan al ajedrez, al shogi y al go, sin rival entre los humanos y diseñados durante años específicamente para esta tarea apenas son capaces de arañar una victoria entre miles de derrotas.

La inteligencia de AlphaZero era tan superior que ganaba incluso cuando se le concedía tan solo una décima parte del tiempo que a sus rivales para procesar la información y mover. Y no es una cuestión de potencia computacional, es porque se le ha otorgado una forma de razonar más profunda y selectiva.

Este programa valora en ajedrez, únicamente 60.000 posibilidades por segundo frente a los 60 millones de opciones que baraja su rival Stockfish, el más potente jugador de ajedrez hasta ahora. El algoritmo busca solo entre los movimientos más prometedores.

En ajedrez, se habla de cómo sus piezas se arremolinan en torno al rey del oponente con fuerza, dinamismo y determinación. Desprecia el valor material de las piezas y prefiere hacer sacrificios impensables desde el principio de la partida porque al final merecerá la pena.

Ver fuente

Buscar este blog

Armando Guedez Rodríguez