Bellman’s Principle of Optimality

Optimal Policy 具有如下性质:每一步的策略只由当前状态决定.

或者另一种表述: