Dynamic decision making under uncertainty in vehicle routing and logistics
Cette thèse présente trois études menées sur des problèmes de tournées dynamiques. En particulière, elle se concentre sur les challenges résultants de l’utilisation de véhicules électriques dans les systèmes logistiques et de transports. Dans la première étude, nous introduisons le problème de tourn...
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Dissertation |
Sprache: | eng |
Schlagworte: | |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
container_end_page | |
---|---|
container_issue | |
container_start_page | |
container_title | |
container_volume | |
creator | Kullman, Nicholas D |
description | Cette thèse présente trois études menées sur des problèmes de tournées dynamiques. En particulière, elle se concentre sur les challenges résultants de l’utilisation de véhicules électriques dans les systèmes logistiques et de transports. Dans la première étude, nous introduisons le problème de tournées de véhicules électriques avec des bornes de recharge publiques et privées. Dans ce contexte, les véhicules peuvent recharger leurs batteries en route, dans des bornes publiques, ainsi qu’au dépôt (bornes privées). Pour se protéger contre l’incertitude de la disponibilité des bornes publiques, nous présentons des politiques de routage qui anticipent la dynamique des files d’attente des bornes. Nos politiques se basent sur une décomposition du problème en deux phases : routage et planification des opérations de recharge. Grâce à cette décomposition, nous obtenons la politique statique optimale, ainsi qu’un certain nombre de politiques dites « anticipatoires » et une borne inférieure. Des tests numériques effectués sur des instances réelles fournies par une entreprise, monter que nos politiques sont capables de livrer des solutions avec un gap d’optimalité de moins de 5%. Nos tests montrent aussi que permettre aux véhicules de charger en dehors du dépôt (même en présence d’incertitude sur la disponibilité des bornes) se traduit par des économies considérables dans la durée des routes.Dans la deuxième étude, nous considérons le problème d’un opérateur contrôlant une flotte de véhicules de tourisme avec chauffeur (VTCs) électriques. L’opérateur, qui cherche à maximiser ses revenus, doit affecter les véhicules aux demandes au fur et à mesure de leur apparition ainsi que charger et repositionner les véhicules en prévision des demandes futures. Pour attaquer ce problème, nous utilisons des approches basées sur l’apprentissage par renforcement profond. Pour mesurer la qualité de nos approches, nous avons développé aussi une heuristique proche de celle typiquement utilisée dans l’affectation de taxis, ainsi que des bornes supérieures. Nous testons nos approches dans des instances construites à partir de données réelles de l’île de Manhattan. Nos tests montrent que notre meilleure politique basée sur l’apprentissage profond livre des résultats supérieurs à ceux livrés par l’heuristique. Les tests montrent aussi que cette stratégie passe facilement à l’échelle et peut être déployée sur de plus grandes instances sans entrainement supplémentaire.La dernière étude introdui |
format | Dissertation |
fullrecord | <record><control><sourceid>abes_RS3</sourceid><recordid>TN_cdi_abes_theses_2020TOUR4007</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>2020TOUR4007</sourcerecordid><originalsourceid>FETCH-abes_theses_2020TOUR40073</originalsourceid><addsrcrecordid>eNrjZPByqcxLzM1MVkhJTc4szszPU8hNzM7MS1cozUtJLQKSyalFJYmZeSWVCpl5CmWpGZnJOakKRfmlJSBFiXkpCjn56ZnFJZnJxTwMrGmJOcWpvFCam0HezTXE2UM3MSm1OL4kI7UYSBkZGBmE-IcGmRgYmBsTVgEAbVQ0Mg</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>dissertation</recordtype></control><display><type>dissertation</type><title>Dynamic decision making under uncertainty in vehicle routing and logistics</title><source>Theses.fr</source><creator>Kullman, Nicholas D</creator><creatorcontrib>Kullman, Nicholas D</creatorcontrib><description>Cette thèse présente trois études menées sur des problèmes de tournées dynamiques. En particulière, elle se concentre sur les challenges résultants de l’utilisation de véhicules électriques dans les systèmes logistiques et de transports. Dans la première étude, nous introduisons le problème de tournées de véhicules électriques avec des bornes de recharge publiques et privées. Dans ce contexte, les véhicules peuvent recharger leurs batteries en route, dans des bornes publiques, ainsi qu’au dépôt (bornes privées). Pour se protéger contre l’incertitude de la disponibilité des bornes publiques, nous présentons des politiques de routage qui anticipent la dynamique des files d’attente des bornes. Nos politiques se basent sur une décomposition du problème en deux phases : routage et planification des opérations de recharge. Grâce à cette décomposition, nous obtenons la politique statique optimale, ainsi qu’un certain nombre de politiques dites « anticipatoires » et une borne inférieure. Des tests numériques effectués sur des instances réelles fournies par une entreprise, monter que nos politiques sont capables de livrer des solutions avec un gap d’optimalité de moins de 5%. Nos tests montrent aussi que permettre aux véhicules de charger en dehors du dépôt (même en présence d’incertitude sur la disponibilité des bornes) se traduit par des économies considérables dans la durée des routes.Dans la deuxième étude, nous considérons le problème d’un opérateur contrôlant une flotte de véhicules de tourisme avec chauffeur (VTCs) électriques. L’opérateur, qui cherche à maximiser ses revenus, doit affecter les véhicules aux demandes au fur et à mesure de leur apparition ainsi que charger et repositionner les véhicules en prévision des demandes futures. Pour attaquer ce problème, nous utilisons des approches basées sur l’apprentissage par renforcement profond. Pour mesurer la qualité de nos approches, nous avons développé aussi une heuristique proche de celle typiquement utilisée dans l’affectation de taxis, ainsi que des bornes supérieures. Nous testons nos approches dans des instances construites à partir de données réelles de l’île de Manhattan. Nos tests montrent que notre meilleure politique basée sur l’apprentissage profond livre des résultats supérieurs à ceux livrés par l’heuristique. Les tests montrent aussi que cette stratégie passe facilement à l’échelle et peut être déployée sur de plus grandes instances sans entrainement supplémentaire.La dernière étude introduit une nouvelle approche générique pour modéliser des problèmes d’optimisation dynamique sous la forme de jeux vidéo de type Atari. L’objectif est de les rendre abordables à travers de méthodes de solution issus de communauté d’apprentissage par renforcement profond. L’approche est flexible et applicable à un large éventail de problèmes. Pour illustrer son application, nous nous attaquons à un problème bien établie dans la littérature : le problème de tournées de véhicules avec des requêtes de service stochastiques. Nos résultats préliminaires sur ce problème sont très encourageants et montrent que « l’Atari-fication » peut être la voie pour résoudre des problèmes d’optimisation dynamique qui s’avèrent difficiles pour les approches basées sur les outils classiques de la recherche opérationnelle.Les derniers chapitres présentent deux logiciels développées pour supporter nos recherches. Le premier, nommé frvcpy, permet de déterminer l’insertion optimal des opérations de recharge dans une tournée prédéterminée. Ce logiciel et son code source, présenté comme une bibliothèque Python, a été mis à disposition de la communauté scientifique. Le deuxième outil, VRP-REP Mapper, est un outil web pour visualiser et analyser des solutions pour les problèmes de tournées de véhicules. Cette outil a été intégré a www.vrp-rep.org, la plateforme de référence pour le partage de données scientifiques dans le domaine.
This thesis details three problems and two software tools related to dynamic decision making under uncertainty in vehicle routing and logistics, with an emphasis on the challenges encountered when adopting electric vehicles. We first introduce the electric vehicle routing problem with public-private recharging strategy in which vehicles may recharge en-route at public charging infrastructure as well as at a privately-owned depot. To hedge against uncertain demand at public charging stations, we design routing policies that anticipate station queue dynamics. We leverage a decomposition to identify good routing policies, including the optimal static policy and fixed-route-based rollout policies that dynamically respond to observed queues. The decomposition also enables us to establish dual bounds, providing a measure of goodness for our routing policies. In computational experiments using real instances from industry, we show the value of our policies to be within five percent of the value of an optimal policy in the majority of instances and within eleven percent on average. Further, we demonstrate that our policies significantly outperform the industry-standard routing strategy in which vehicle recharging generally occurs at a central depot. Our proposed methods for this problem stand to reduce the operating costs associated with electric vehicles, facilitating the transition from internal-combustion engine vehicles.We then consider the problem of an operator controlling a fleet of electric vehicles for use in a ridehailing service. The operator, seeking to maximize revenue, must assign vehicles to requests as they arise and recharge and reposition vehicles in anticipation of future requests. To solve this problem, we employ deep reinforcement learning, developing policies whose decision making uses Q-value approximations learned by deep neural networks. We compare these policies against a common taxi dispatching heuristic and against dual bounds on the value of an optimal policy, including the value of an optimal policy with perfect information which we establish using a Benders-based decomposition. We assess performance on instances derived from real data for the island of Manhattan in New York City. We find that, across instances of varying size, our best policy trained with deep reinforcement learning outperforms the taxi dispatching heuristic. We also provide evidence that this policy may be effectively scaled and deployed on larger instances without retraining. We then present a new general approach to modeling research problems as Atari-like videogames to make them amenable to recent solution methods from the deep reinforcement learning community. The approach is flexible, applicable to a wide range of problems. Here, we demonstrate its application on the well-studied vehicle routing problem with stochastic service requests. Our preliminary results on this problem, though not transformative, show signs of success and suggest that Atari-fication may be a useful modeling approach for researchers studying problems involving sequential decision making under uncertainty.We then introduce frvcpy, the first of our two proposed software tools. In the routing of electric vehicles, one of the most challenging tasks is determining how to make good charging decisions for an electric vehicle traveling a given route. This is known as the fixed route vehicle charging problem. An exact and efficient algorithm for this task exists, but its implementation is sufficiently complex to deter researchers from adopting it. Our proposed tool, frvcpy, is an open-source Python package implementing this algorithm. Our aim with the package is to make it easier for researchers to solve electric vehicle routing problems, facilitating the development of optimization tools that may ultimately enable the mass adoption of electric vehicles. Finally, we introduce the second software tool, Mapper.</description><language>eng</language><subject>Dynamic routing ; Electric vehicles ; Incertitude ; Logistics ; Logistique ; Markov decision process ; Optimisation ; Optimization ; Processus de décision markovien ; Routage dynamique ; Uncertainty ; Véhicules électriques</subject><creationdate>2020</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>230,311,780,885,26981</link.rule.ids><linktorsrc>$$Uhttps://www.theses.fr/2020TOUR4007/document$$EView_record_in_ABES$$FView_record_in_$$GABES$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>Kullman, Nicholas D</creatorcontrib><title>Dynamic decision making under uncertainty in vehicle routing and logistics</title><description>Cette thèse présente trois études menées sur des problèmes de tournées dynamiques. En particulière, elle se concentre sur les challenges résultants de l’utilisation de véhicules électriques dans les systèmes logistiques et de transports. Dans la première étude, nous introduisons le problème de tournées de véhicules électriques avec des bornes de recharge publiques et privées. Dans ce contexte, les véhicules peuvent recharger leurs batteries en route, dans des bornes publiques, ainsi qu’au dépôt (bornes privées). Pour se protéger contre l’incertitude de la disponibilité des bornes publiques, nous présentons des politiques de routage qui anticipent la dynamique des files d’attente des bornes. Nos politiques se basent sur une décomposition du problème en deux phases : routage et planification des opérations de recharge. Grâce à cette décomposition, nous obtenons la politique statique optimale, ainsi qu’un certain nombre de politiques dites « anticipatoires » et une borne inférieure. Des tests numériques effectués sur des instances réelles fournies par une entreprise, monter que nos politiques sont capables de livrer des solutions avec un gap d’optimalité de moins de 5%. Nos tests montrent aussi que permettre aux véhicules de charger en dehors du dépôt (même en présence d’incertitude sur la disponibilité des bornes) se traduit par des économies considérables dans la durée des routes.Dans la deuxième étude, nous considérons le problème d’un opérateur contrôlant une flotte de véhicules de tourisme avec chauffeur (VTCs) électriques. L’opérateur, qui cherche à maximiser ses revenus, doit affecter les véhicules aux demandes au fur et à mesure de leur apparition ainsi que charger et repositionner les véhicules en prévision des demandes futures. Pour attaquer ce problème, nous utilisons des approches basées sur l’apprentissage par renforcement profond. Pour mesurer la qualité de nos approches, nous avons développé aussi une heuristique proche de celle typiquement utilisée dans l’affectation de taxis, ainsi que des bornes supérieures. Nous testons nos approches dans des instances construites à partir de données réelles de l’île de Manhattan. Nos tests montrent que notre meilleure politique basée sur l’apprentissage profond livre des résultats supérieurs à ceux livrés par l’heuristique. Les tests montrent aussi que cette stratégie passe facilement à l’échelle et peut être déployée sur de plus grandes instances sans entrainement supplémentaire.La dernière étude introduit une nouvelle approche générique pour modéliser des problèmes d’optimisation dynamique sous la forme de jeux vidéo de type Atari. L’objectif est de les rendre abordables à travers de méthodes de solution issus de communauté d’apprentissage par renforcement profond. L’approche est flexible et applicable à un large éventail de problèmes. Pour illustrer son application, nous nous attaquons à un problème bien établie dans la littérature : le problème de tournées de véhicules avec des requêtes de service stochastiques. Nos résultats préliminaires sur ce problème sont très encourageants et montrent que « l’Atari-fication » peut être la voie pour résoudre des problèmes d’optimisation dynamique qui s’avèrent difficiles pour les approches basées sur les outils classiques de la recherche opérationnelle.Les derniers chapitres présentent deux logiciels développées pour supporter nos recherches. Le premier, nommé frvcpy, permet de déterminer l’insertion optimal des opérations de recharge dans une tournée prédéterminée. Ce logiciel et son code source, présenté comme une bibliothèque Python, a été mis à disposition de la communauté scientifique. Le deuxième outil, VRP-REP Mapper, est un outil web pour visualiser et analyser des solutions pour les problèmes de tournées de véhicules. Cette outil a été intégré a www.vrp-rep.org, la plateforme de référence pour le partage de données scientifiques dans le domaine.
This thesis details three problems and two software tools related to dynamic decision making under uncertainty in vehicle routing and logistics, with an emphasis on the challenges encountered when adopting electric vehicles. We first introduce the electric vehicle routing problem with public-private recharging strategy in which vehicles may recharge en-route at public charging infrastructure as well as at a privately-owned depot. To hedge against uncertain demand at public charging stations, we design routing policies that anticipate station queue dynamics. We leverage a decomposition to identify good routing policies, including the optimal static policy and fixed-route-based rollout policies that dynamically respond to observed queues. The decomposition also enables us to establish dual bounds, providing a measure of goodness for our routing policies. In computational experiments using real instances from industry, we show the value of our policies to be within five percent of the value of an optimal policy in the majority of instances and within eleven percent on average. Further, we demonstrate that our policies significantly outperform the industry-standard routing strategy in which vehicle recharging generally occurs at a central depot. Our proposed methods for this problem stand to reduce the operating costs associated with electric vehicles, facilitating the transition from internal-combustion engine vehicles.We then consider the problem of an operator controlling a fleet of electric vehicles for use in a ridehailing service. The operator, seeking to maximize revenue, must assign vehicles to requests as they arise and recharge and reposition vehicles in anticipation of future requests. To solve this problem, we employ deep reinforcement learning, developing policies whose decision making uses Q-value approximations learned by deep neural networks. We compare these policies against a common taxi dispatching heuristic and against dual bounds on the value of an optimal policy, including the value of an optimal policy with perfect information which we establish using a Benders-based decomposition. We assess performance on instances derived from real data for the island of Manhattan in New York City. We find that, across instances of varying size, our best policy trained with deep reinforcement learning outperforms the taxi dispatching heuristic. We also provide evidence that this policy may be effectively scaled and deployed on larger instances without retraining. We then present a new general approach to modeling research problems as Atari-like videogames to make them amenable to recent solution methods from the deep reinforcement learning community. The approach is flexible, applicable to a wide range of problems. Here, we demonstrate its application on the well-studied vehicle routing problem with stochastic service requests. Our preliminary results on this problem, though not transformative, show signs of success and suggest that Atari-fication may be a useful modeling approach for researchers studying problems involving sequential decision making under uncertainty.We then introduce frvcpy, the first of our two proposed software tools. In the routing of electric vehicles, one of the most challenging tasks is determining how to make good charging decisions for an electric vehicle traveling a given route. This is known as the fixed route vehicle charging problem. An exact and efficient algorithm for this task exists, but its implementation is sufficiently complex to deter researchers from adopting it. Our proposed tool, frvcpy, is an open-source Python package implementing this algorithm. Our aim with the package is to make it easier for researchers to solve electric vehicle routing problems, facilitating the development of optimization tools that may ultimately enable the mass adoption of electric vehicles. Finally, we introduce the second software tool, Mapper.</description><subject>Dynamic routing</subject><subject>Electric vehicles</subject><subject>Incertitude</subject><subject>Logistics</subject><subject>Logistique</subject><subject>Markov decision process</subject><subject>Optimisation</subject><subject>Optimization</subject><subject>Processus de décision markovien</subject><subject>Routage dynamique</subject><subject>Uncertainty</subject><subject>Véhicules électriques</subject><fulltext>true</fulltext><rsrctype>dissertation</rsrctype><creationdate>2020</creationdate><recordtype>dissertation</recordtype><sourceid>RS3</sourceid><recordid>eNrjZPByqcxLzM1MVkhJTc4szszPU8hNzM7MS1cozUtJLQKSyalFJYmZeSWVCpl5CmWpGZnJOakKRfmlJSBFiXkpCjn56ZnFJZnJxTwMrGmJOcWpvFCam0HezTXE2UM3MSm1OL4kI7UYSBkZGBmE-IcGmRgYmBsTVgEAbVQ0Mg</recordid><startdate>20200504</startdate><enddate>20200504</enddate><creator>Kullman, Nicholas D</creator><scope>AOWWY</scope><scope>RS3</scope><scope>~IT</scope></search><sort><creationdate>20200504</creationdate><title>Dynamic decision making under uncertainty in vehicle routing and logistics</title><author>Kullman, Nicholas D</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-abes_theses_2020TOUR40073</frbrgroupid><rsrctype>dissertations</rsrctype><prefilter>dissertations</prefilter><language>eng</language><creationdate>2020</creationdate><topic>Dynamic routing</topic><topic>Electric vehicles</topic><topic>Incertitude</topic><topic>Logistics</topic><topic>Logistique</topic><topic>Markov decision process</topic><topic>Optimisation</topic><topic>Optimization</topic><topic>Processus de décision markovien</topic><topic>Routage dynamique</topic><topic>Uncertainty</topic><topic>Véhicules électriques</topic><toplevel>online_resources</toplevel><creatorcontrib>Kullman, Nicholas D</creatorcontrib><collection>Theses.fr (Open Access)</collection><collection>Theses.fr</collection><collection>Thèses.fr</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>Kullman, Nicholas D</au><format>dissertation</format><genre>dissertation</genre><ristype>THES</ristype><btitle>Dynamic decision making under uncertainty in vehicle routing and logistics</btitle><date>2020-05-04</date><risdate>2020</risdate><abstract>Cette thèse présente trois études menées sur des problèmes de tournées dynamiques. En particulière, elle se concentre sur les challenges résultants de l’utilisation de véhicules électriques dans les systèmes logistiques et de transports. Dans la première étude, nous introduisons le problème de tournées de véhicules électriques avec des bornes de recharge publiques et privées. Dans ce contexte, les véhicules peuvent recharger leurs batteries en route, dans des bornes publiques, ainsi qu’au dépôt (bornes privées). Pour se protéger contre l’incertitude de la disponibilité des bornes publiques, nous présentons des politiques de routage qui anticipent la dynamique des files d’attente des bornes. Nos politiques se basent sur une décomposition du problème en deux phases : routage et planification des opérations de recharge. Grâce à cette décomposition, nous obtenons la politique statique optimale, ainsi qu’un certain nombre de politiques dites « anticipatoires » et une borne inférieure. Des tests numériques effectués sur des instances réelles fournies par une entreprise, monter que nos politiques sont capables de livrer des solutions avec un gap d’optimalité de moins de 5%. Nos tests montrent aussi que permettre aux véhicules de charger en dehors du dépôt (même en présence d’incertitude sur la disponibilité des bornes) se traduit par des économies considérables dans la durée des routes.Dans la deuxième étude, nous considérons le problème d’un opérateur contrôlant une flotte de véhicules de tourisme avec chauffeur (VTCs) électriques. L’opérateur, qui cherche à maximiser ses revenus, doit affecter les véhicules aux demandes au fur et à mesure de leur apparition ainsi que charger et repositionner les véhicules en prévision des demandes futures. Pour attaquer ce problème, nous utilisons des approches basées sur l’apprentissage par renforcement profond. Pour mesurer la qualité de nos approches, nous avons développé aussi une heuristique proche de celle typiquement utilisée dans l’affectation de taxis, ainsi que des bornes supérieures. Nous testons nos approches dans des instances construites à partir de données réelles de l’île de Manhattan. Nos tests montrent que notre meilleure politique basée sur l’apprentissage profond livre des résultats supérieurs à ceux livrés par l’heuristique. Les tests montrent aussi que cette stratégie passe facilement à l’échelle et peut être déployée sur de plus grandes instances sans entrainement supplémentaire.La dernière étude introduit une nouvelle approche générique pour modéliser des problèmes d’optimisation dynamique sous la forme de jeux vidéo de type Atari. L’objectif est de les rendre abordables à travers de méthodes de solution issus de communauté d’apprentissage par renforcement profond. L’approche est flexible et applicable à un large éventail de problèmes. Pour illustrer son application, nous nous attaquons à un problème bien établie dans la littérature : le problème de tournées de véhicules avec des requêtes de service stochastiques. Nos résultats préliminaires sur ce problème sont très encourageants et montrent que « l’Atari-fication » peut être la voie pour résoudre des problèmes d’optimisation dynamique qui s’avèrent difficiles pour les approches basées sur les outils classiques de la recherche opérationnelle.Les derniers chapitres présentent deux logiciels développées pour supporter nos recherches. Le premier, nommé frvcpy, permet de déterminer l’insertion optimal des opérations de recharge dans une tournée prédéterminée. Ce logiciel et son code source, présenté comme une bibliothèque Python, a été mis à disposition de la communauté scientifique. Le deuxième outil, VRP-REP Mapper, est un outil web pour visualiser et analyser des solutions pour les problèmes de tournées de véhicules. Cette outil a été intégré a www.vrp-rep.org, la plateforme de référence pour le partage de données scientifiques dans le domaine.
This thesis details three problems and two software tools related to dynamic decision making under uncertainty in vehicle routing and logistics, with an emphasis on the challenges encountered when adopting electric vehicles. We first introduce the electric vehicle routing problem with public-private recharging strategy in which vehicles may recharge en-route at public charging infrastructure as well as at a privately-owned depot. To hedge against uncertain demand at public charging stations, we design routing policies that anticipate station queue dynamics. We leverage a decomposition to identify good routing policies, including the optimal static policy and fixed-route-based rollout policies that dynamically respond to observed queues. The decomposition also enables us to establish dual bounds, providing a measure of goodness for our routing policies. In computational experiments using real instances from industry, we show the value of our policies to be within five percent of the value of an optimal policy in the majority of instances and within eleven percent on average. Further, we demonstrate that our policies significantly outperform the industry-standard routing strategy in which vehicle recharging generally occurs at a central depot. Our proposed methods for this problem stand to reduce the operating costs associated with electric vehicles, facilitating the transition from internal-combustion engine vehicles.We then consider the problem of an operator controlling a fleet of electric vehicles for use in a ridehailing service. The operator, seeking to maximize revenue, must assign vehicles to requests as they arise and recharge and reposition vehicles in anticipation of future requests. To solve this problem, we employ deep reinforcement learning, developing policies whose decision making uses Q-value approximations learned by deep neural networks. We compare these policies against a common taxi dispatching heuristic and against dual bounds on the value of an optimal policy, including the value of an optimal policy with perfect information which we establish using a Benders-based decomposition. We assess performance on instances derived from real data for the island of Manhattan in New York City. We find that, across instances of varying size, our best policy trained with deep reinforcement learning outperforms the taxi dispatching heuristic. We also provide evidence that this policy may be effectively scaled and deployed on larger instances without retraining. We then present a new general approach to modeling research problems as Atari-like videogames to make them amenable to recent solution methods from the deep reinforcement learning community. The approach is flexible, applicable to a wide range of problems. Here, we demonstrate its application on the well-studied vehicle routing problem with stochastic service requests. Our preliminary results on this problem, though not transformative, show signs of success and suggest that Atari-fication may be a useful modeling approach for researchers studying problems involving sequential decision making under uncertainty.We then introduce frvcpy, the first of our two proposed software tools. In the routing of electric vehicles, one of the most challenging tasks is determining how to make good charging decisions for an electric vehicle traveling a given route. This is known as the fixed route vehicle charging problem. An exact and efficient algorithm for this task exists, but its implementation is sufficiently complex to deter researchers from adopting it. Our proposed tool, frvcpy, is an open-source Python package implementing this algorithm. Our aim with the package is to make it easier for researchers to solve electric vehicle routing problems, facilitating the development of optimization tools that may ultimately enable the mass adoption of electric vehicles. Finally, we introduce the second software tool, Mapper.</abstract><oa>free_for_read</oa></addata></record> |
fulltext | fulltext_linktorsrc |
identifier | |
ispartof | |
issn | |
language | eng |
recordid | cdi_abes_theses_2020TOUR4007 |
source | Theses.fr |
subjects | Dynamic routing Electric vehicles Incertitude Logistics Logistique Markov decision process Optimisation Optimization Processus de décision markovien Routage dynamique Uncertainty Véhicules électriques |
title | Dynamic decision making under uncertainty in vehicle routing and logistics |
url | https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-03T15%3A21%3A30IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-abes_RS3&rft_val_fmt=info:ofi/fmt:kev:mtx:dissertation&rft.genre=dissertation&rft.btitle=Dynamic%20decision%20making%20under%20uncertainty%20in%20vehicle%20routing%20and%20logistics&rft.au=Kullman,%20Nicholas%20D&rft.date=2020-05-04&rft_id=info:doi/&rft_dat=%3Cabes_RS3%3E2020TOUR4007%3C/abes_RS3%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true |