Descripción
En
este artículo se presenta un nuevo método de aceleración para resolver a los
procesos de decisión de Markov. El clásico algoritmo de iteración de valor ha
resuelto satisfactoriamente a estos procesos estocásticos, pero este algoritmo
y sus variantes aceleradas han sido lentos con factores de descuento cercanos a
la unidad y sus propiedades de convergencia han dependido, en gran medida, de
un buen ordenamiento en la actualización de estados. Recientemente se mostró que
la iteración de valor presenta buena velocidad de convergencia gracias al uso
de un algoritmo de ordenamiento topológico mejorado. Sin embargo, la desventaja
de este algoritmo es debida a sus requerimientos de memoria. Aquí se presenta
un método diferente para obtener un buen ordenamiento de estados actualizados
con menor requerimiento de memoria. De igual manera se presentan los resultados
experimentales obtenidos sobre un problema de ruta estocástica más corta.
García
Hernández, M. et al. (2011). Nuevo método de aceleración de los procesos de
decisión de Markov. Acta Universitaria,
21 (2), pp. 50-57.
Comentarios