LINEAGE-BASED TAPE DEDUPLICATION

Systems and methods for tape deduplication are described, including at least one range of data to be written to at least one tape, a list of data object identifiers in the data, segmenting the data and outputting a strong hash per segment, determining a plurality of search representatives from the s...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: KUVENT, Aviv, NATANZON, Assaf, TOAFF, Yair, ZACH, Idan
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Systems and methods for tape deduplication are described, including at least one range of data to be written to at least one tape, a list of data object identifiers in the data, segmenting the data and outputting a strong hash per segment, determining a plurality of search representatives from the strong hashes, a weak hash output by the at least one processor for each selected strong hash, searching for identifiers in a mapping of identifiers to tapes to determine candidate tapes and to search for the weak hash in a sparse index, one tape selected as a result of the search which has maximal weak hash matches, comparing the strong hash of each segment to an area of the one tape pointed to by the matches, and to updating the mapping such that the identifier now points to at least one tape. Des systèmes et des procédés de déduplication de bande sont décrits, comprenant au moins une plage de données à écrire sur au moins une bande, une liste d'identifiants d'objet de données dans les données, la segmentation des données et la sortie d'un hachage fort par segment, la détermination d'une pluralité de représentants de recherche à partir des hachages forts, une sortie de hachage faible par ledit processeur pour chaque hachage fort sélectionné, la recherche d'identifiants dans un mappage d'identifiants à des bandes pour déterminer des bandes candidates et la recherche du hachage faible dans un indice épars, une bande sélectionnée résultant de la recherche qui a des correspondances de hachage faible maximales, la comparaison du hachage fort de chaque segment à une zone de la bande pointée par les correspondances, et la mise à jour du mappage de telle sorte que l'identifiant pointe maintenant vers au moins une bande.