Juegos estocásticos con objetivo compuesto: recompensas totales sujetas a alcanzabilidad prioritaria
Date
2024-05-10Author
Feltes, Joaquín Ignacio
Advisor
D'Argenio, Pedro Ruben
Metadata
Show full item recordAbstract
El propósito de este trabajo es estudiar juegos estocásticos de dos jugadores con multiobjetivo. Uno de los objetivos es de alcanzabilidad de un conjunto de estados considerados exitosos y el otro es de recompensa total esperada, con la condición de que las recompensas serán 0 si no se llega a un estado exitoso.
Un juego estocástico es un grafo dirigido con transiciones probabilísticas y con dos jugadores, donde cada jugador tiene el control de varios estados en los que, por medio de acciones, se elige el siguiente estado. Estos jugadores son adversarios, es decir que uno quiere cumplir una serie de objetivos y el otro quiere impedirlo.
En este trabajo se introduce un algoritmo para la obtención del valor del juego, calculando la esperanza de llegar a los estados exitosos y la recompensa total esperada condicionada al objetivo de alcanzabilidad. En cualquiera de los dos casos, el segundo jugador se considera totalmente adversarial y, por consiguiente, busca minimizar ambos objetivos.
The purpose of this paper is to study stochastic two-player games with multiple objectives. One objective is reachability of a set of states considered successful and the other is total rewards, with the condition that rewards will be 0 if a successful state is not reached.
A stochastic game is a directed graph with probabilistic transitions and two players, where each player has control of several states in which, by means of actions, the next state is chosen. These players are adversaries, i.e. one wants to accomplish a set of objectives and the other wants to prevent it.
In this work we introduce an algorithm for obtaining the value of the game, calculating the expectation of reaching the successful states and the total expected reward conditional on the reachability objective. In either case, the second player is considered fully adversarial and therefore seeks to minimize both objectives.
The following license files are associated with this item: