LINEAGE-BASED TAPE DEDUPLICATION

Systems and methods for tape deduplication are described, including at least one range of data to be written to at least one tape, a list of data object identifiers in the data, segmenting the data and outputting a strong hash per segment, determining a plurality of search representatives from the s...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: KUVENT, Aviv, NATANZON, Assaf, TOAFF, Yair, ZACH, Idan
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page
container_issue
container_start_page
container_title
container_volume
creator KUVENT, Aviv
NATANZON, Assaf
TOAFF, Yair
ZACH, Idan
description Systems and methods for tape deduplication are described, including at least one range of data to be written to at least one tape, a list of data object identifiers in the data, segmenting the data and outputting a strong hash per segment, determining a plurality of search representatives from the strong hashes, a weak hash output by the at least one processor for each selected strong hash, searching for identifiers in a mapping of identifiers to tapes to determine candidate tapes and to search for the weak hash in a sparse index, one tape selected as a result of the search which has maximal weak hash matches, comparing the strong hash of each segment to an area of the one tape pointed to by the matches, and to updating the mapping such that the identifier now points to at least one tape. Des systèmes et des procédés de déduplication de bande sont décrits, comprenant au moins une plage de données à écrire sur au moins une bande, une liste d'identifiants d'objet de données dans les données, la segmentation des données et la sortie d'un hachage fort par segment, la détermination d'une pluralité de représentants de recherche à partir des hachages forts, une sortie de hachage faible par ledit processeur pour chaque hachage fort sélectionné, la recherche d'identifiants dans un mappage d'identifiants à des bandes pour déterminer des bandes candidates et la recherche du hachage faible dans un indice épars, une bande sélectionnée résultant de la recherche qui a des correspondances de hachage faible maximales, la comparaison du hachage fort de chaque segment à une zone de la bande pointée par les correspondances, et la mise à jour du mappage de telle sorte que l'identifiant pointe maintenant vers au moins une bande.
format Patent
fullrecord <record><control><sourceid>epo_EVB</sourceid><recordid>TN_cdi_epo_espacenet_WO2024149437A1</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>WO2024149437A1</sourcerecordid><originalsourceid>FETCH-epo_espacenet_WO2024149437A13</originalsourceid><addsrcrecordid>eNrjZFDw8fRzdXR31XVyDHZ1UQhxDHBVcHF1CQ3w8XR2DPH09-NhYE1LzClO5YXS3AzKbq4hzh66qQX58anFBYnJqXmpJfHh_kYGRiaGJpYmxuaOhsbEqQIAaRkirw</addsrcrecordid><sourcetype>Open Access Repository</sourcetype><iscdi>true</iscdi><recordtype>patent</recordtype></control><display><type>patent</type><title>LINEAGE-BASED TAPE DEDUPLICATION</title><source>esp@cenet</source><creator>KUVENT, Aviv ; NATANZON, Assaf ; TOAFF, Yair ; ZACH, Idan</creator><creatorcontrib>KUVENT, Aviv ; NATANZON, Assaf ; TOAFF, Yair ; ZACH, Idan</creatorcontrib><description>Systems and methods for tape deduplication are described, including at least one range of data to be written to at least one tape, a list of data object identifiers in the data, segmenting the data and outputting a strong hash per segment, determining a plurality of search representatives from the strong hashes, a weak hash output by the at least one processor for each selected strong hash, searching for identifiers in a mapping of identifiers to tapes to determine candidate tapes and to search for the weak hash in a sparse index, one tape selected as a result of the search which has maximal weak hash matches, comparing the strong hash of each segment to an area of the one tape pointed to by the matches, and to updating the mapping such that the identifier now points to at least one tape. Des systèmes et des procédés de déduplication de bande sont décrits, comprenant au moins une plage de données à écrire sur au moins une bande, une liste d'identifiants d'objet de données dans les données, la segmentation des données et la sortie d'un hachage fort par segment, la détermination d'une pluralité de représentants de recherche à partir des hachages forts, une sortie de hachage faible par ledit processeur pour chaque hachage fort sélectionné, la recherche d'identifiants dans un mappage d'identifiants à des bandes pour déterminer des bandes candidates et la recherche du hachage faible dans un indice épars, une bande sélectionnée résultant de la recherche qui a des correspondances de hachage faible maximales, la comparaison du hachage fort de chaque segment à une zone de la bande pointée par les correspondances, et la mise à jour du mappage de telle sorte que l'identifiant pointe maintenant vers au moins une bande.</description><language>eng ; fre</language><subject>CALCULATING ; COMPUTING ; COUNTING ; ELECTRIC DIGITAL DATA PROCESSING ; PHYSICS</subject><creationdate>2024</creationdate><oa>free_for_read</oa><woscitedreferencessubscribed>false</woscitedreferencessubscribed></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><linktohtml>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20240718&amp;DB=EPODOC&amp;CC=WO&amp;NR=2024149437A1$$EHTML$$P50$$Gepo$$Hfree_for_read</linktohtml><link.rule.ids>230,308,780,885,25562,76317</link.rule.ids><linktorsrc>$$Uhttps://worldwide.espacenet.com/publicationDetails/biblio?FT=D&amp;date=20240718&amp;DB=EPODOC&amp;CC=WO&amp;NR=2024149437A1$$EView_record_in_European_Patent_Office$$FView_record_in_$$GEuropean_Patent_Office$$Hfree_for_read</linktorsrc></links><search><creatorcontrib>KUVENT, Aviv</creatorcontrib><creatorcontrib>NATANZON, Assaf</creatorcontrib><creatorcontrib>TOAFF, Yair</creatorcontrib><creatorcontrib>ZACH, Idan</creatorcontrib><title>LINEAGE-BASED TAPE DEDUPLICATION</title><description>Systems and methods for tape deduplication are described, including at least one range of data to be written to at least one tape, a list of data object identifiers in the data, segmenting the data and outputting a strong hash per segment, determining a plurality of search representatives from the strong hashes, a weak hash output by the at least one processor for each selected strong hash, searching for identifiers in a mapping of identifiers to tapes to determine candidate tapes and to search for the weak hash in a sparse index, one tape selected as a result of the search which has maximal weak hash matches, comparing the strong hash of each segment to an area of the one tape pointed to by the matches, and to updating the mapping such that the identifier now points to at least one tape. Des systèmes et des procédés de déduplication de bande sont décrits, comprenant au moins une plage de données à écrire sur au moins une bande, une liste d'identifiants d'objet de données dans les données, la segmentation des données et la sortie d'un hachage fort par segment, la détermination d'une pluralité de représentants de recherche à partir des hachages forts, une sortie de hachage faible par ledit processeur pour chaque hachage fort sélectionné, la recherche d'identifiants dans un mappage d'identifiants à des bandes pour déterminer des bandes candidates et la recherche du hachage faible dans un indice épars, une bande sélectionnée résultant de la recherche qui a des correspondances de hachage faible maximales, la comparaison du hachage fort de chaque segment à une zone de la bande pointée par les correspondances, et la mise à jour du mappage de telle sorte que l'identifiant pointe maintenant vers au moins une bande.</description><subject>CALCULATING</subject><subject>COMPUTING</subject><subject>COUNTING</subject><subject>ELECTRIC DIGITAL DATA PROCESSING</subject><subject>PHYSICS</subject><fulltext>true</fulltext><rsrctype>patent</rsrctype><creationdate>2024</creationdate><recordtype>patent</recordtype><sourceid>EVB</sourceid><recordid>eNrjZFDw8fRzdXR31XVyDHZ1UQhxDHBVcHF1CQ3w8XR2DPH09-NhYE1LzClO5YXS3AzKbq4hzh66qQX58anFBYnJqXmpJfHh_kYGRiaGJpYmxuaOhsbEqQIAaRkirw</recordid><startdate>20240718</startdate><enddate>20240718</enddate><creator>KUVENT, Aviv</creator><creator>NATANZON, Assaf</creator><creator>TOAFF, Yair</creator><creator>ZACH, Idan</creator><scope>EVB</scope></search><sort><creationdate>20240718</creationdate><title>LINEAGE-BASED TAPE DEDUPLICATION</title><author>KUVENT, Aviv ; NATANZON, Assaf ; TOAFF, Yair ; ZACH, Idan</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-epo_espacenet_WO2024149437A13</frbrgroupid><rsrctype>patents</rsrctype><prefilter>patents</prefilter><language>eng ; fre</language><creationdate>2024</creationdate><topic>CALCULATING</topic><topic>COMPUTING</topic><topic>COUNTING</topic><topic>ELECTRIC DIGITAL DATA PROCESSING</topic><topic>PHYSICS</topic><toplevel>online_resources</toplevel><creatorcontrib>KUVENT, Aviv</creatorcontrib><creatorcontrib>NATANZON, Assaf</creatorcontrib><creatorcontrib>TOAFF, Yair</creatorcontrib><creatorcontrib>ZACH, Idan</creatorcontrib><collection>esp@cenet</collection></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext_linktorsrc</fulltext></delivery><addata><au>KUVENT, Aviv</au><au>NATANZON, Assaf</au><au>TOAFF, Yair</au><au>ZACH, Idan</au><format>patent</format><genre>patent</genre><ristype>GEN</ristype><title>LINEAGE-BASED TAPE DEDUPLICATION</title><date>2024-07-18</date><risdate>2024</risdate><abstract>Systems and methods for tape deduplication are described, including at least one range of data to be written to at least one tape, a list of data object identifiers in the data, segmenting the data and outputting a strong hash per segment, determining a plurality of search representatives from the strong hashes, a weak hash output by the at least one processor for each selected strong hash, searching for identifiers in a mapping of identifiers to tapes to determine candidate tapes and to search for the weak hash in a sparse index, one tape selected as a result of the search which has maximal weak hash matches, comparing the strong hash of each segment to an area of the one tape pointed to by the matches, and to updating the mapping such that the identifier now points to at least one tape. Des systèmes et des procédés de déduplication de bande sont décrits, comprenant au moins une plage de données à écrire sur au moins une bande, une liste d'identifiants d'objet de données dans les données, la segmentation des données et la sortie d'un hachage fort par segment, la détermination d'une pluralité de représentants de recherche à partir des hachages forts, une sortie de hachage faible par ledit processeur pour chaque hachage fort sélectionné, la recherche d'identifiants dans un mappage d'identifiants à des bandes pour déterminer des bandes candidates et la recherche du hachage faible dans un indice épars, une bande sélectionnée résultant de la recherche qui a des correspondances de hachage faible maximales, la comparaison du hachage fort de chaque segment à une zone de la bande pointée par les correspondances, et la mise à jour du mappage de telle sorte que l'identifiant pointe maintenant vers au moins une bande.</abstract><oa>free_for_read</oa></addata></record>
fulltext fulltext_linktorsrc
identifier
ispartof
issn
language eng ; fre
recordid cdi_epo_espacenet_WO2024149437A1
source esp@cenet
subjects CALCULATING
COMPUTING
COUNTING
ELECTRIC DIGITAL DATA PROCESSING
PHYSICS
title LINEAGE-BASED TAPE DEDUPLICATION
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-13T12%3A47%3A19IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-epo_EVB&rft_val_fmt=info:ofi/fmt:kev:mtx:patent&rft.genre=patent&rft.au=KUVENT,%20Aviv&rft.date=2024-07-18&rft_id=info:doi/&rft_dat=%3Cepo_EVB%3EWO2024149437A1%3C/epo_EVB%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true