Ablating a Graph Neural Network for Branching in Mixed-Integer Linear Programming

Denne oppgaven evaluerer ablasjoner av et grafkonvolusjonelt nevralt nettverk for maskinlæringsassistert forgrening foreslått av Gasse et al. (2019) for mer effektiv løsning av blandede heltallsproblemer (MILP). Effektive MILP-løsningsalgoritmer er viktige for optimering i sanntid i mange industrier...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
1. Verfasser: Sandberg, Lars Lødemel
Format: Dissertation
Sprache:eng
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Denne oppgaven evaluerer ablasjoner av et grafkonvolusjonelt nevralt nettverk for maskinlæringsassistert forgrening foreslått av Gasse et al. (2019) for mer effektiv løsning av blandede heltallsproblemer (MILP). Effektive MILP-løsningsalgoritmer er viktige for optimering i sanntid i mange industrier, blant annet produksjon, logistikk, transport og energiproduksjon. Reduksjon i beregningstid ved å kombinere maskinlæring og branch-and-bound-løsningsalgoritmen kan forbedre disse algoritmene uten å ofre de sterke fordelene til global optimering. I 2019 ble pålitelige resultater med forbedring over de beste forgreningsstrategiene i åpen-kildekodeløsere vist, og i 2020 ble disse metodene utvidet til rent CPU-baserte modeller. Forskjellige nettverkstopologier og datasett for både GPU og CPU har blitt foreslått, men kompromisset mellom nøyaktighet og effektivitet for modellene på forskjellig maskinvare er for det meste uutforsket. For å adressere dette blir to grafkonvolusjonale nevralnett og tre flerlagsperceptroner trent gjennom imitasjonslæring av strong branching-algoritmen på genererte MILP-problemer i det nye rammeverket Ecole. Modellene blir deretter inkorporert i optimaliseringsløseren SCIP og evaluert på testproblemer. Alle modeller viser nær høyeste effektivitet mot sammenlignbare algoritmer på GPU. Modellene med grafkonvolusjoner viser et mye mer betydelig effektivitetstap enn modellene uten når beregningene gjennomføres på CPU.