IMPROVED ENCODING AND DECODING OF VARIABLE-LENGTH DATA WITH GROUP FORMATS

Embodiments provide methods and systems for encoding and decoding variable-length data, which may include methods for encoding and decoding search engine posting lists. Embodiments may include different encoding formats including group unary, packed unary, and/or packed binary formats. Some embodime...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: ROSE, DANIEL, E, OBEROI, PARAMJIT, S, STEPANOV, ALEXANDER, A, GANGOLLI, ANIL, RAMESH, ERNST, RYAN, JACOB
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Embodiments provide methods and systems for encoding and decoding variable-length data, which may include methods for encoding and decoding search engine posting lists. Embodiments may include different encoding formats including group unary, packed unary, and/or packed binary formats. Some embodiments may utilize single instruction multiple data (SIMD) instructions that may perform a parallel shuffle operation on encoded data as part of the decoding processes. Some embodiments may utilize lookup tables to determine shuffle sequences and/or masks and/or shifts to be utilized in the decoding processes. Some embodiments may utilize hybrid formats. Des modes de réalisation concernent des procédés et des systèmes de codage et de décodage de données de longueur variable, notamment des procédés de codage et de décodage de listes de correspondances de moteur de recherche. Des modes de réalisation peuvent comporter différents formats de codage, parmi lesquels des formats unaires en groupes, des formats unaires compressés et/ou des formats binaires compressés. Certains modes de réalisation peuvent utiliser des instructions SIMD (instruction unique à données multiples) susceptibles d'exécuter une opération de réorganisation parallèle sur des données codées en tant que partie des processus de décodage. Certains modes de réalisation peuvent utiliser des tables de correspondances pour déterminer des séquences et/ou des masques et/ou des décalages de réorganisation devant être utilisés au cours des processus de décodage. Certains modes de réalisation peuvent utiliser des formats hybrides.