INCREASED IN-LINE DEDUPLICATION EFFICIENCY

Exemplary method, system, and computer program product embodiments for increased in-line deduplication efficiency in a computing environment are provided. In one embodiment, by way of example only hash values are calculated in nth iterations for accumulative data chunks extracted from an object requ...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: PATIL, SANDEEP RAMESH, BHOSALE, NILESH P, BALDWIN, DUANE MARK, OLSON, JOHN THOMAS
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Exemplary method, system, and computer program product embodiments for increased in-line deduplication efficiency in a computing environment are provided. In one embodiment, by way of example only hash values are calculated in nth iterations for accumulative data chunks extracted from an object requested for in-line deduplication. For each of the nth iterations, the calculated hash values for the accumulative data chunks are matched in a nth hash index table with a corresponding hash value of existing objects in storage. The nth hash index table is exited upon detecting a mismatch during the matching. The mismatch is determined to be a unique object and is stored. A hash value for the object is calculated. A master hash index table is updated with the calculated hash value for the object and the calculated hash values for the unique object. Additional system and computer program product embodiments are disclosed and provide related advantages. Des modes de réalisation illustratifs de l'invention portent sur un procédé, un système et un produit programme d'ordinateur pour améliorer l'efficacité de déduplication en ligne dans un environnement informatique. Selon un mode de réalisation, à titre d'exemple seulement, des valeurs de hachage sont calculées dans des nièmes itérations pour des blocs de données cumulés extraits d'un objet demandé pour une déduplication en ligne. Pour chacune des nièmes itérations, les valeurs de hachage calculées pour les blocs de données cumulés sont appariées, dans une nième table d'index de hachage, à une valeur de hachage correspondante d'objets existants dans un dispositif de stockage. Une sortie de la nième table d'index de hachage est effectuée lors de la détection d'un défaut d'appariement durant l'appariement. Le défaut d'appariement est déterminé comme étant un objet unique et est stocké. Une valeur de hachage pour l'objet est calculée. Une table d'index de hachage maître est mise à jour avec la valeur de hachage calculée pour l'objet et les valeurs de hachage calculées pour l'objet unique. Des modes de réalisation supplémentaires de système et de produit programme d'ordinateur sont décrits et offrent des avantages associés.