-
1
Least-Squares Policy Iteration
Veröffentlicht in Journal of machine learning research
VolltextArtikel -
2
Efficient Solution Algorithms for Factored MDPs
Veröffentlicht in The Journal of artificial intelligence research
VolltextArtikel -
3
-
4
-
5
-
6
-
7
-
8
-
9
-
10
-
11
-
12
-
13
-
14
-
15
-
16
-
17
-
18
Mitigating Partial Observability in Sequential Decision Processes via the Lambda Discrepancy
Veröffentlicht in arXiv.org
VolltextArtikel -
19
Revisiting the Softmax Bellman Operator: New Benefits and New Perspective
Veröffentlicht in arXiv.org
VolltextArtikel -
20