-
1
-
2
-
3
Efficient evaluation of natural stochastic policies in off-line reinforcement learning
Veröffentlicht in Biometrika
VolltextArtikel -
4
Fast Rates for the Regret of Offline Reinforcement Learning
Veröffentlicht in Mathematics of operations research
VolltextArtikel -
5
-
6
-
7
-
8
-
9
-
10
-
11
-
12
-
13
-
14
-
15
-
16
-
17
-
18
-
19
Pessimistic Model-based Offline Reinforcement Learning under Partial Coverage
Veröffentlicht in arXiv.org
VolltextArtikel -
20