SYSTOLIC ARRAY WITH EFFICIENT INPUT REDUCTION AND EXTENDED ARRAY PERFORMANCE

Systems and methods are provided to perform multiply-accumulate operations of reduced precision numbers in a systolic array. Each row of the systolic array can receive reduced inputs from a respective reducer. The reduced input can include a reduced input data element and/or a reduced weight. The sy...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: MEYER, Paul Gilbert, BOWMAN, Joshua Wayne, ELMER, Thomas, DIAMANT, Ron, VOLPE, Thomas A, DESAI, Nishith
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Systems and methods are provided to perform multiply-accumulate operations of reduced precision numbers in a systolic array. Each row of the systolic array can receive reduced inputs from a respective reducer. The reduced input can include a reduced input data element and/or a reduced weight. The systolic array may lack support for inputs with a first bit-length and the reducers may reduce the bit-length of a given input from the first bit-length to a second shorter bit-length and provide the reduced input to the array. In order to reduce the bit-length, the reducer may reduce the number of trailing bits of the input. Further, the systolic array can receive a reduced and rounded input. The systolic array can propagate the reduced input through the processing elements in the systolic array. Each processing element may include a multiplier and/or an adder to perform arithmetical operations based on the reduced input. L'invention concerne des systèmes et des procédés pour effectuer des opérations de multiplication-accumulation de nombres de précision réduits dans un réseau systolique. Chaque rangée du réseau systolique peut recevoir des entrées réduites provenant d'un réducteur respectif. L'entrée réduite peut comprendre un élément de données d'entrée réduit et/ou un poids réduit. Le réseau systolique peut ne pas prendre en charge les entrées avec une première longueur de bit et les réducteurs peuvent réduire la longueur de bit d'une entrée donnée de la première longueur de bit à une seconde longueur de bit plus courte et fournir l'entrée réduite au réseau. Afin de réduire la longueur de bit, le réducteur peut réduire le nombre de bits de fuite de l'entrée. En outre, le réseau systolique peut recevoir une entrée réduite et arrondie. Le réseau systolique peut propager l'entrée réduite à travers les éléments de traitement dans le réseau systolique. Chaque élément de traitement peut comprendre un multiplicateur et/ou un additionneur pour effectuer des opérations arithmétiques sur la base de l'entrée réduite.