Bisimulación en procesos de decisión de Markov sobre espacios continuos
Date
2022-10Author
Moroni, Martín Santiago
Advisor
Sánchez Terraf, Pedro Octavio
Metadata
Show full item recordAbstract
Los procesos de Markov etiquetados (LMP) consisten de un espacio medible de estados y un conjunto etiquetado de subprobabilidades que codifican la interacción con el ambiente. Por ello son un marco apropiado para estudiar y formalizar sistemas que involucran variables continuas y donde algunas de ellas son conocidas sólo de manera probabilista. Un concepto central es el de bisimulación, del cual se deriva la equivalencia de comportamiento o bisimilitud entre estados. El objetivo general de este trabajo es el estudio y clasificación de las diversas nociones de bisimilitud tanto en la categoría de los LMP como en las variantes que surgen al agregar no determinismo. En el caso de los LMP, el foco está en la bisimilitud de estados y en la de eventos. La primera puede considerarse como una generalización a espacios continuos de la bisimilitud probabilista de Larsen y Skou, mientras que la segunda está caracterizada por una lógica natural. Existe una manera de expresar la bisimilitud de estados como el mayor punto fijo de un operador O y asociarle un ordinal que mide la discrepancia entre ambas. En esta tesis estudiamos este operador en un contexto general y nos enfocamos en la clase de LMP sobre espacios metrizables separables y en el supremo de tales ordinales. En los LMP la incertidumbre es sólo considerada como probabilista. Una generalización de estos modelos que incluye no determinismo interno está dada por los procesos de Markov etiquetados no deterministas (NLMP). Un NLMP admite, para cada estado y cada etiqueta, un conjunto (posiblemente infinito) de comportamientos probabilistas. Luego de estudiar las distintas nociones de bisimilitud existentes para este caso, nos concentramos en los NLMP de imagen contable sobre espacios de Borel estándar y probamos la medibilidad de las clases de bisimilitud para una clase de procesos con condiciones de regularidad adicionales.
Labelled Markov processes (LMP) consist of a measurable state space and a labelled set of sub-probabilities that encode the interaction with the environment. Therefore, they are a suitable framework for studying and formalizing systems that involve continuous variables, some of which are only known probabilistically. A central concept is that of bisimulation, from which derives the equivalence of behavior or bisimilarity between states. The general objective of this work is the study and classification of the various notions of bisimilarity, both in the category of LMPs and in the variants that arise when adding non-determinism. In the case of LMPs, the focus is on the bisimilarity of states and events. The former can be considered as a generalization of Larsen and Skou's probabilistic bisimilarity to continuous spaces, while the latter is characterized by a natural logic. There is a way to express the bisimilarity of states as the greatest fixed point of an operator O and associate it with an ordinal that measures the discrepancy between them. In this thesis, we study this operator in a general context and focus on the class of LMPs over separable metrizable spaces and the supremum of such ordinals. In LMPs, uncertainty is only considered probabilistically. A generalization of these models that includes internal non-determinism is given by labelled non-deterministic Markov processes (NLMP). An NLMP admits, for each state and each label, a (possibly infinite) set of probabilistic behaviors. After studying the different notions of bisimilarity existing for this case, we focus on countably generated NLMPs over standard Borel spaces and prove the measurability of bisimilarity classes for a class of processes with additional regularity conditions.
Collections
The following license files are associated with this item: