Suchergebnisse - Durugkar, Ishan

1

Cohort Intelligence: A Self Supervised Learning Behavior von Kulkarni, Anand J., Durugkar, Ishan P., Kumar, Mrinal

Volltext
Tagungsbericht

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
2

Towards a Real-Time, Low-Resource, End-to-End Object Detection Pipeline for Robot Soccer von Narayanaswami, Sai Kiran, Tec, Mauricio, Durugkar, Ishan, Desai, Siddharth, Masetty, Bharath, Narvekar, Sanmit, Stone, Peter

Volltext
Buchkapitel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
3

N-Agent Ad Hoc Teamwork von Wang, Caroline, Rahman, Arrasy, Durugkar, Ishan, Liebman, Elad, Stone, Peter

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
4

f$-Policy Gradients: A General Framework for Goal Conditioned RL using $f$-Divergences von Agarwal, Siddhant, Durugkar, Ishan, Stone, Peter, Zhang, Amy

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
5

ABC: Adversarial Behavioral Cloning for Offline Mode-Seeking Imitation Learning von Hudson, Eddy, Durugkar, Ishan, Warnell, Garrett, Stone, Peter

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
6

DM$^2$: Decentralized Multi-Agent Reinforcement Learning for Distribution Matching von Wang, Caroline, Durugkar, Ishan, Liebman, Elad, Stone, Peter

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
7

Wasserstein Distance Maximizing Intrinsic Control von Durugkar, Ishan, Hansen, Steven, Spencer, Stephen, Mnih, Volodymyr

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
8

Adversarial Intrinsic Motivation for Reinforcement Learning von Durugkar, Ishan, Tec, Mauricio, Niekum, Scott, Stone, Peter

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
9

N-Agent Ad Hoc Teamwork von Wang, Caroline, Rahman, Arrasy, Durugkar, Ishan, Liebman, Elad, Stone, Peter

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
10

Reducing Sampling Error in Batch Temporal Difference Learning von Pavse, Brahma, Durugkar, Ishan, Hanna, Josiah, Stone, Peter

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
11

$(f\)-Policy Gradients: A General Framework for Goal Conditioned RL using $f$-Divergences$

(f\)-Policy Gradients: A General Framework for Goal Conditioned RL using $f$-Divergences von Agarwal, Siddhant, Durugkar, Ishan, Stone, Peter, Zhang, Amy

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
12

Multi-Preference Actor Critic von Durugkar, Ishan, Hausknecht, Matthew, Swaminathan, Adith, MacAlpine, Patrick

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
13

$DM$^2$: Decentralized Multi-Agent Reinforcement Learning for Distribution Matching$

DM$^2$: Decentralized Multi-Agent Reinforcement Learning for Distribution Matching von Wang, Caroline, Durugkar, Ishan, Liebman, Elad, Stone, Peter

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
14

An Imitation from Observation Approach to Transfer Learning with Dynamics Mismatch von Desai, Siddharth, Durugkar, Ishan, Karnan, Haresh, Warnell, Garrett, Hanna, Josiah, Stone, Peter

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
15

ABC: Adversarial Behavioral Cloning for Offline Mode-Seeking Imitation Learning von Hudson, Eddy, Durugkar, Ishan, Warnell, Garrett, Stone, Peter

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
16

Generative Multi-Adversarial Networks von Durugkar, Ishan, Gemp, Ian, Mahadevan, Sridhar

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
17

Adversarial Intrinsic Motivation for Reinforcement Learning von Durugkar, Ishan, Tec, Mauricio, Niekum, Scott, Stone, Peter

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
18

Wasserstein Distance Maximizing Intrinsic Control von Durugkar, Ishan, Hansen, Steven, Spencer, Stephen, Mnih, Volodymyr

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
19

Reducing Sampling Error in Batch Temporal Difference Learning von Brahma Pavse, Durugkar, Ishan, Hanna, Josiah, Stone, Peter

Veröffentlicht in arXiv.org

Volltext
Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:
20

Deep Reinforcement Learning With Macro-Actions von Durugkar, Ishan P, Rosenbaum, Clemens, Dernbach, Stefan, Mahadevan, Sridhar

Volltext bestellen

Artikel

In die Zwischenablage Aus der Zwischenablage entfernen
Zu den Favoriten

Gespeichert in:

Cohort Intelligence: A Self Supervised Learning Behavior von Kulkarni, Anand J., Durugkar, Ishan P., Kumar, Mrinal

Towards a Real-Time, Low-Resource, End-to-End Object Detection Pipeline for Robot Soccer von Narayanaswami, Sai Kiran, Tec, Mauricio, Durugkar, Ishan, Desai, Siddharth, Masetty, Bharath, Narvekar, Sanmit, Stone, Peter

N-Agent Ad Hoc Teamwork von Wang, Caroline, Rahman, Arrasy, Durugkar, Ishan, Liebman, Elad, Stone, Peter

f$-Policy Gradients: A General Framework for Goal Conditioned RL using $f$-Divergences von Agarwal, Siddhant, Durugkar, Ishan, Stone, Peter, Zhang, Amy

ABC: Adversarial Behavioral Cloning for Offline Mode-Seeking Imitation Learning von Hudson, Eddy, Durugkar, Ishan, Warnell, Garrett, Stone, Peter

DM$^2$: Decentralized Multi-Agent Reinforcement Learning for Distribution Matching von Wang, Caroline, Durugkar, Ishan, Liebman, Elad, Stone, Peter

Wasserstein Distance Maximizing Intrinsic Control von Durugkar, Ishan, Hansen, Steven, Spencer, Stephen, Mnih, Volodymyr

Adversarial Intrinsic Motivation for Reinforcement Learning von Durugkar, Ishan, Tec, Mauricio, Niekum, Scott, Stone, Peter

N-Agent Ad Hoc Teamwork von Wang, Caroline, Rahman, Arrasy, Durugkar, Ishan, Liebman, Elad, Stone, Peter

Reducing Sampling Error in Batch Temporal Difference Learning von Pavse, Brahma, Durugkar, Ishan, Hanna, Josiah, Stone, Peter

(f\)-Policy Gradients: A General Framework for Goal Conditioned RL using \(f\)-Divergences von Agarwal, Siddhant, Durugkar, Ishan, Stone, Peter, Zhang, Amy

Multi-Preference Actor Critic von Durugkar, Ishan, Hausknecht, Matthew, Swaminathan, Adith, MacAlpine, Patrick

DM\(^2\): Decentralized Multi-Agent Reinforcement Learning for Distribution Matching von Wang, Caroline, Durugkar, Ishan, Liebman, Elad, Stone, Peter

An Imitation from Observation Approach to Transfer Learning with Dynamics Mismatch von Desai, Siddharth, Durugkar, Ishan, Karnan, Haresh, Warnell, Garrett, Hanna, Josiah, Stone, Peter

ABC: Adversarial Behavioral Cloning for Offline Mode-Seeking Imitation Learning von Hudson, Eddy, Durugkar, Ishan, Warnell, Garrett, Stone, Peter

Generative Multi-Adversarial Networks von Durugkar, Ishan, Gemp, Ian, Mahadevan, Sridhar

Adversarial Intrinsic Motivation for Reinforcement Learning von Durugkar, Ishan, Tec, Mauricio, Niekum, Scott, Stone, Peter

Wasserstein Distance Maximizing Intrinsic Control von Durugkar, Ishan, Hansen, Steven, Spencer, Stephen, Mnih, Volodymyr

Reducing Sampling Error in Batch Temporal Difference Learning von Brahma Pavse, Durugkar, Ishan, Hanna, Josiah, Stone, Peter

Deep Reinforcement Learning With Macro-Actions von Durugkar, Ishan P, Rosenbaum, Clemens, Dernbach, Stefan, Mahadevan, Sridhar

Cohort Intelligence: A Self Supervised Learning Behavior von Kulkarni, Anand J., Durugkar, Ishan P., Kumar, Mrinal

Towards a Real-Time, Low-Resource, End-to-End Object Detection Pipeline for Robot Soccer von Narayanaswami, Sai Kiran, Tec, Mauricio, Durugkar, Ishan, Desai, Siddharth, Masetty, Bharath, Narvekar, Sanmit, Stone, Peter

N-Agent Ad Hoc Teamwork von Wang, Caroline, Rahman, Arrasy, Durugkar, Ishan, Liebman, Elad, Stone, Peter

f$-Policy Gradients: A General Framework for Goal Conditioned RL using $f$-Divergences von Agarwal, Siddhant, Durugkar, Ishan, Stone, Peter, Zhang, Amy

ABC: Adversarial Behavioral Cloning for Offline Mode-Seeking Imitation Learning von Hudson, Eddy, Durugkar, Ishan, Warnell, Garrett, Stone, Peter

DM$^2$: Decentralized Multi-Agent Reinforcement Learning for Distribution Matching von Wang, Caroline, Durugkar, Ishan, Liebman, Elad, Stone, Peter

Wasserstein Distance Maximizing Intrinsic Control von Durugkar, Ishan, Hansen, Steven, Spencer, Stephen, Mnih, Volodymyr

Adversarial Intrinsic Motivation for Reinforcement Learning von Durugkar, Ishan, Tec, Mauricio, Niekum, Scott, Stone, Peter

N-Agent Ad Hoc Teamwork von Wang, Caroline, Rahman, Arrasy, Durugkar, Ishan, Liebman, Elad, Stone, Peter

Reducing Sampling Error in Batch Temporal Difference Learning von Pavse, Brahma, Durugkar, Ishan, Hanna, Josiah, Stone, Peter

(f\)-Policy Gradients: A General Framework for Goal Conditioned RL using \(f\)-Divergences von Agarwal, Siddhant, Durugkar, Ishan, Stone, Peter, Zhang, Amy

Multi-Preference Actor Critic von Durugkar, Ishan, Hausknecht, Matthew, Swaminathan, Adith, MacAlpine, Patrick

DM\(^2\): Decentralized Multi-Agent Reinforcement Learning for Distribution Matching von Wang, Caroline, Durugkar, Ishan, Liebman, Elad, Stone, Peter

An Imitation from Observation Approach to Transfer Learning with Dynamics Mismatch von Desai, Siddharth, Durugkar, Ishan, Karnan, Haresh, Warnell, Garrett, Hanna, Josiah, Stone, Peter

ABC: Adversarial Behavioral Cloning for Offline Mode-Seeking Imitation Learning von Hudson, Eddy, Durugkar, Ishan, Warnell, Garrett, Stone, Peter

Generative Multi-Adversarial Networks von Durugkar, Ishan, Gemp, Ian, Mahadevan, Sridhar

Adversarial Intrinsic Motivation for Reinforcement Learning von Durugkar, Ishan, Tec, Mauricio, Niekum, Scott, Stone, Peter

Wasserstein Distance Maximizing Intrinsic Control von Durugkar, Ishan, Hansen, Steven, Spencer, Stephen, Mnih, Volodymyr

Reducing Sampling Error in Batch Temporal Difference Learning von Brahma Pavse, Durugkar, Ishan, Hanna, Josiah, Stone, Peter

Deep Reinforcement Learning With Macro-Actions von Durugkar, Ishan P, Rosenbaum, Clemens, Dernbach, Stefan, Mahadevan, Sridhar

Suchwerkzeuge:

Treffer weiter einschränken

Eingrenzen

Format

Zeitschriftentitel

Schlagworte

Erscheinungsjahr

Quelle