EFFICIENT DATA REPLICATION AND GARBAGE COLLECTION PREDICTIONS

Described herein are systems and methods for efficient data replication. The remote server generates a set of object hashes representative of data in the source object that is already present on the remote server, and data indicative of source object hashes that are not present on the remote server....

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: PROVENZANO, CHRISTOPHER, A, ABERCROMBIE, PHILIP, J, GOLDBERG, KEITH
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Described herein are systems and methods for efficient data replication. The remote server generates a set of object hashes representative of data in the source object that is already present on the remote server, and data indicative of source object hashes that are not present on the remote server. The source local deduplication store transmits the identified portions of the source object to the remote server to replicate the source object on the remote server. Also described herein are systems and methods for garbage collection prediction. An accumulated difference count is updated when a node is added to a temporal graph, and a divested difference count is updated when a node is removed from the temporal graph. The outcome of the garbage collection is predicted based on at least one of the accumulated difference count and the divested difference count. La présente invention concerne des systèmes et des procédés de reproduction efficace de données. Le serveur distant génère un ensemble de hachages d'objet représentatifs des données dans l'objet source qui est déjà présent sur le serveur distant, et des données indicatives de hachages de l'objet source qui ne sont pas présentes sur le serveur distant. La mémoire de déduplication locale source transmet les parties identifiées de l'objet source au serveur distant pour reproduire l'objet source sur le serveur distant. La présente invention concerne également les systèmes et procédés destinés à la prédiction de récupération d'espace mémoire. Un nombre de différences cumulées est mis à jour lorsqu'un nœud est ajouté à un graphique temporel, et un nombre de différences retranchées est mis à jour lorsqu'un nœud est retiré du graphique temporel. Le résultat de la récupération d'espace mémoire est prédit en se basant sur au moins l'un du nombre de différences cumulées et du nombre de différences retranchées.