Recientemente se están comentando las partidas de la continuación del encuentro entre es sistema AlphaZero y la máquina Stockfish 8, ocurrido el pasado enero de este año. La publicación del artículo original en diciembre de 2017 ya había causado cierto revuelo en los amantes del ajedrez. No era para menos. El juego de AlphaZero contra la poderosa máquina Stockfish pareció inusual, imposible de creer a simple vista, y fuera de toda visión estratégica conocida entre humanos y programas de ajedrez hasta ese momento. Se predijo que el estudio de estas partidas darían paso a nuevas visiones del ajedrez y se devolvió la esperanza de que aún queda mucho por ver en nuestro afamado juego a pesar de la ya tan trillada teoría de aperturas y el análisis computadorizado.
En mi caso, el interés se incrementó más por descubrir en qué la visión estratégica de AlphaZero se acercaba a mis ideas en TERA. En el artículo que se publicará en la revista Science y en el libro Game Changer se esperan más detalles técnicos que arrojarán alguna luz sobre cómo los teóricos y maestros de hoy analizan e interpretan (y extrapolan de las partidas) la «visión» estratégica de AlphaZero: un sistema que aprendió por sí mismo cómo jugar el mejor ajedrez, con mucho éxito, sin lugar a dudas.
Me propongo en una seria de artículos comentar algunas de las partidas de esos encuentros. Las miraré en cuanto a cómo se acercan o se alejan de la teoría de las posiciones criticas expuestas en TERA. Anticipo que el resultado me ha sido plenamente satisfactorio. Tanto por el lado de la confirmación de ciertos postulados, como de la manera en que éstos se implementan por tan poderoso sistema.
Las partidas pueden descargarse en el sitio de DeepMind.
Veamos la siguiente partida, para ir haciendo embocadura:
En esta partida AlphaZero entregó al inicio 2 peones a cambio de tener todas sus piezas (exceptuando su dama) en posición dominante. Eventualmente, se sucederán más entregas de peones con el mismo presupuesto. Para recordar, en TERA planteamos que el desequilibrio de toda posición se produce por diferencias sustanciales y sostenibles entre ambos bandos, respecto a los elementos que conforman la posición ajedrecística, a saber: las piezas (el material), sus lugar en el tablero (el espacio) y su movilidad (el tiempo). Mientras las diferencias materiales son sobradamente conocidas, las diferencias que proponemos ventajosas en los otros elementos se distancian un tanto de la tradicional teoría clásica posicional. El dominio, para limitarnos a este caso en particular, se basa en el control de líneas abiertas, en la adquisición de puestos avanzados y en la infiltración. Pero, no se deben tratar estos conceptos de forma estereotipada, sino bajo la consideración de lo que nombramos como territorio propio o ajeno. Dominar significa ganar terreno en el territorio ajeno (las 4 filas que ocupa o donde ejerce inicialmente su influencia), mientras se mantiene el dominio del territorio propio. Para la teoría de las posiciones críticas la cadena de peones blanca en b5-c4-d4, es dominante, así como la posición de sus alfiles y sus torres. El alfil en b2, aunque bloqueado por su propio peón, domina porque dicho peón tiene movilidad que despejaría la línea. En cambio, cuando miramos la situación del bando negro, sólo encontramos los solitarios peones en a5 y f5 como relevantes. El resto de sus piezas están ajenas del terreno contrario.
Para TERA, la posición blanca es ampliamente superior a pesar de los 2 peones de menos. Para las negras, estos peones sirven de poco, pues están retrasados y protegiendo a su rey: su avance es poco menos que imposible sin perder la cabeza. Cuando cuantificamos esa superioridad en unidades posicionales, las blancas tienen 21, mientras el negro apenas 2. En la sección de «La medición del dominio espacial», en el capítulo La ruptura del equilibrio se indica que el valor material de una torre dominante podía ajustarse a 1.67 unidades materiales de peón. La posición de arriba está plenamente justificada cuando las blancas han logrado 2 torres dominantes por 2 peones.
No sé cuál fue la evaluación de AlphaZero para esta posición, pero no me sorprendería que estuviese sobre el 80%. (AlphaZero mide a base de porcentaje de ganar en las posiciones y no en décimas de peón como el resto de las máquinas conocidas.) Para mi humilde versión de Stockfish 9, la posición está igualada (=0.00).
Para mi sorpresa, este «estilo» de jugar es regular para AlphaZero. Trata el material como un elemento más y no teme ceder peones y aun piezas, si la correlación resultante le favorece integralmente.
Más adelante la posición se transforma en esto:
Las blancas han perdido el dominio de una de sus torres (c1), pero a cambio ejercen presión hacia f6, atando a la dama negra y clavando al caballo allí apostado. Nuevamente, la correlación entre lo que se cede y lo que se obtiene es favorable al blanco (12 versus 5). Pero, ahora el negro tiene posibilidades críticas con su alfil, o eso se figura uno a simple vista. La partida siguió 31…Ag4 32.f3! y el alfil tiene que retroceder porque la captura en f3 lleva a 33.Tf1 y se desata el desastre.
Nótese, además, que el dominio viene acompañado de la restricción a las piezas negras, por vía de ataduras o clavadas (su dama y su caballo), como por el encierro (su torre en a1). Y esta es una consecuencia del dominio: las piezas contrarias quedan restringidas a una pequeña parcela de su territorio y pierden toda posibilidad de amenazar críticamente.
Tras varios movimientos después, llegamos a:
Las blancas tiene todas sus piezas en acción dominante. Incluso su dama participa de la presión sobre la diagonal a1-h8, con lo que se mantiene a la dama negra maniatada. Más adelante, incluso se ubicará en d4. La posición exige incorporar la otra torre a presionar sobre el territorio contrario. AlphaZero se decide por 35.Tce1. También existía 35.Tg1 con la evidente amenaza de tomar el caballo negro primero (mi Stockfish la prefiere). Cualquiera de las dos anula la única posibilidad negra de Te8. Pero es meritorio señalar que, tras 35.Tg1 Cg3 36.Tge1, se llega a una posición similar a la de la partida con el caballo negro en situación dominante, lo que AlphaZero evitará mediante 35.Tce1 de inmediato.
Tras el intercambio forzado de damas y un par de torres, las negras se ven obligadas a ceder una pieza más:
Las blancas amenazan con 49.Tf1 para lo que no hay defensa satisfactoria sin pérdidas materiales. Por tanto, toman el peón con su caballo. El final es ya fácil para las blancas.
Esta demostración de AlphaZero fue poderosa. Definitivamente, se puede hablar de un nuevo «estilo» en ajedrez, significando con ello la interpretación de ideas estratégicas, poco vistas con tanta claridad como en esta partida. En otras partidas veremos un comportamiento similar. Destacaremos, por ejemplo, la gran importancia que AlphaZero otorga a los peones adelantados y en 6.a fila. En un buen número de partidas, estos peones se convierten en la punta de lanza de toda la estrategia de finales, como resolución a la materialización de la ventaja obtenida en las primeras fases. En otras ocasiones veremos la sana táctica de eliminar la única pieza dominante del contrario para ampliar la superioridad existente y obtener la ventaja.
¿Cambiará estos planteamientos el juego magistral a partir de hoy? ¿Veremos en los siguientes meses o años el regreso al ajedrez romántico que a tantos de nosotros nos enamoró por primera vez del ajedrez?