El algoritmo que siempre gana al póker

Científicos de Canadá han desarrollado al jugador de póker perfecto. Su nombre es Cepheus y es un programa informático basado en CFR. El programa aprende de sus errores para diseñar la mejor estrategia

Por Arturo Ledezma

12/01/2015

Publicado en

Tendencias

0 0


poker_AA1

Cepheus es una máquina diseñada para ser prácticamente invencible en el póker. Gracias a un ingenioso algoritmo y varios meses de entrenamiento, los investigadores han creado al jugador perfecto en este juego.

Esta afirmación parece demasiado categórica, pero sus autores no dudan en que es así. La estrategia diseñada por los investigadores para Cepheus es tan cercana a la perfección que reduce las posibilidades para un ser humano de ganar a cifras completamente despreciables. Aunque no es la primera máquina capaz de auténticos prodigios a la hora de jugar, la comunidad científica se sorprende de la rapidez con la que se ha llegado a resolver este algoritmo. Aunque otros juegos fueron «resueltos» anteriormente, como las damas, el póker estaba lejos de hallar una estrategia adecuada por su dificultad. Hasta ahora.

Resolviendo el póker

El póker, como juego, tiene una dificultad que no presentan otros similares. Resolver desafíos como las damas es relativamente sencillo, matemáticamente hablando. El ajedrez presenta todavía bastante dificultad aunque se han obtenido grandes resultados, como todos sabemos. Sin embargo, el póker es un juego de información imperfecta, según la teoría de juegos. Esto quiere decir que la información con la que actúa cada jugador no es completa e incluso puede ser falsa. Si tenemos en cuenta que esta información es esencial para desarrollar una estrategia, nos encontramos ante un problema bastante grave de resolver.

Así que el truco está en empezar desde cero. No en crear un algoritmo para resolver el juego sino uno para diseñar una estrategia efectiva desde la nada. Esto hizo Cepheus durante dos meses jugando en 4.000 ordenadores simultáneamente. Si tenemos en cuenta que puede analizar más de 6.000 millones de manos en un segundo, podemos afirmar que Cepheus ha jugado al póker más que toda la humanidad junta en su historia. Esto dio como resultado una estrategia perfecta en su juego, lo que convierte a Cepheus en un jugador sencillamente imbatible.

El algoritmo en el que se basa Cepheus es un conjunto de ecuaciones que centran su atención en aprender de la experiencia y que se denomina conditional random fields o CFR. A partir de una acción, Cepheus analiza cualquier posible situación, entre millones, valorando y eligiendo la mejor estrategia. Para ello, utiliza la información obtenida de un resultado erróneo, lo que los investigadores califican como «arrepentimiento» de Cepheus, de manera que el programa trata de reducirlo a 0 obteniendo siempre los mejores resultados aprendiendo de los errores pasados.

Para qué queremos a Cepheus

¿Qué tiene Cepheus, aparte de ser imbatible al póker, que sea tan impresionante? En primer lugar, como explicábamos, la velocidad con la que se ha resuelto el problema para esta variante de póker (llamada heads-up limit hold’em). Los investigadores llevan tiempo trabajando en un algoritmo para «romper» la estrategia de este juego y por fin pueden afirmar con rotundidad haberlo hecho. Pero el hallazgo no se queda ahí. Tal vez el apartado más importante sea el espectro de aplicaciones que podemos encontrar en la estrategia de Cepheus.

En primer lugar, en cuestiones de seguridad. La seguridad informática es, sin duda, un campo de información imperfecta. Con algoritmos como este nuevas opciones se abren ante los investigadores, tanto para superar barreras como para entender la manera de fortalecer las reglas. Una aplicación directa sería la mejora sustancial de nuestros sistemas informáticos. Por otro lado, por supuesto, los jugadores podrán mejorar practicando contra Cepheus.

Puesto que el mundo del póker es muy lucrativo, nadie duda de la aplicación comercial que esto puede tener. Pero aún hay más. La biología es también uno de esos aspectos cuya información, por su complejidad, es también imperfecta. La aplicación en sistemas de vida artificial o desarrollo de IAs más avanzadas son los primeros puntos que se nos ocurren. Pero incluso un algoritmo capaz de aprender de los errores podría evaluar una situación y la mejor decisión según las simulaciones realizadas previamente, algo increíblemente útil en eventos críticos. Aunque esto ya existe, con Cepheus se lleva esta estrategia un paso adelante. Y, además, si te atreves, puedes echarte una partida de póker con él.

por Santiago Campillo en Hipertextual

Síguenos y suscríbete a nuestras publicaciones