HKS作者

看到 引用 以下为完整的作者信息。

抽象

马尔可夫决策过程(MDPS)已被广泛用作动态决策,这是在微观和宏观层面都经营的经济主体关注的中心宝贵的工具。往往是决策者的有关状态的信息是不完整的;因此,泛化到部分可观察MDPS(pomdps)。不幸的是,pomdps可能需要大量状态和/或行动的空间,创造了著名的“维度灾难。”然而,最近的计算贡献和快如闪电的计算机都有助于消除这个诅咒。本文介绍和地址称为第二诅咒“模糊的诅咒”,这指的是以下事实的确切转变概率往往难以量化,并且是比较模糊。例如,对于涉及动态地设置膨胀速率,以便控制失业货币当局,失业率的下任何给定的膨胀速率的动力学通常是不明确的。同样,在工人岗位匹配,工人的工作匹配/能力水平的动态变化通常是不明确的。本文通过开发被称为暧昧pomdps(apomdps)pomdps的推广,这不仅使决策者能够考虑不完善的状态信息,解决了“模糊魔咒”,而且对于铲球不可避免的不确定性,以正确的概率模型的转变。

引用

saghafian,索罗什。 “暧昧部分可观测马尔科夫决策过程:结构结果和应用。” 经济理论杂志 178(2018年11月):1-35。