MDP § Basic § Markov property: 当一个随机过程在给定现在状态及所有过去状态情况下,其未来状态的条件概率分布仅依赖于当前状态 Factored MDP § SAS-MDP §