From data analysis to molecular understanding
Tolkning av resultater og data fra molekylære simuleringer kan være svært krevende. Simuleringene kan ofte produsere mange terabyte av data med mange dimensjoner av høyt korrelerte deskriptorer. For å bedre tolke og behandle denne enorme mengden med data, har en software oppdatering for biblioteket...
Gespeichert in:
1. Verfasser: | |
---|---|
Format: | Dissertation |
Sprache: | eng |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Tolkning av resultater og data fra molekylære simuleringer kan være svært krevende. Simuleringene kan ofte produsere mange terabyte av data med mange dimensjoner av høyt korrelerte deskriptorer. For å bedre tolke og behandle denne enorme mengden med data, har en software oppdatering for biblioteket for visualisering og postprosessering av data fra molekylsimuleringer, PyVisA, blitt utviklet. Oppdateringen inneholder metoder for 1- postprosessering av resultater som beregning av nye kollektive variabler, 2- ikke-veiledet læring som grupperingsanalyser og dimensjonsreduksjon av simuleringsdata, 3- beregning av korrelasjonsmatrisen mellom deskriptorer, 4- interaktivitet, animasjon og lagring av molekylære baner og 5- sortering basert på Monte Carlo prosedyre og lagrede data-filer.
I denne masteroppgaven har burdiffusjon i S1 hydrater blitt studert gjennom RETIS simuleringer av bur til bur hopp av metan. Dette ble gjort ved å bruke den nylig utviklede software-oppdateringen og de nye implementerte metodene i PyVisA. Et metanhydrat er en klatratstruktur av naturlig forekomst som har evnen til å fange gjestemolekyler som CH4 og CO2. Av denne grunn har metanhydratet stort potensiale både som en energiressurs og som et lagringsmedium for CO2. Hydratet ble studert med og uten vannledighet. Fra simuleringsresultatene har PyVisA suksessfullt beregnet og inkludert nye deskriptorer til eksisterende simuleringsdata, samt utført postprosessering av dataen. Som sådan har alle resultater blitt produsert enten direkte gjennom PyVisA, eller gjennom å analysere datafilene produsert gjennom PyRETIS. Fra resultatene kan det vises at arealet av den seksleddede ringen metanet hopper gjennom og volumet av startburet viser økte verdier idet metane hopper ut av startburet. Dette for begge systemer. Systemet med manglende vannmolekyler viste også en lavere rate og krysningssannsynlighet enn systemet uten manglende vann. Videre, for systemet med vannmangel så gav Gaussisk gruppering det beste resultatet når regionene i den potensielle energien skulle grupperes. PCA var også anvendt til begge systemer, og oppnådde en effektiv reduksjon i antall dimensjoner der 90% av variansen var beholdt. |
---|