-
1
-
2
Stochastic Online Shortest Path Routing: The Value of Feedback
Veröffentlicht in IEEE transactions on automatic control
VolltextArtikel -
3
-
4
Scaling Up Q-Learning via Exploiting State-Action Equivalence
Veröffentlicht in Entropy (Basel, Switzerland)
VolltextArtikel -
5
-
6
-
7
-
8
-
9
-
10
-
11
Double Graph Attention Networks for Visual Semantic Navigation
Veröffentlicht in Neural processing letters
VolltextArtikel -
12
-
13
SIFTER: space-efficient value iteration for finite-horizon MDPs
Veröffentlicht in Proceedings of the VLDB Endowment
VolltextArtikel -
14
-
15
-
16
-
17
-
18
-
19
How to Shrink Confidence Sets for Many Equivalent Discrete Distributions?
Veröffentlicht in arXiv.org
VolltextArtikel -
20