Acceleratore PMM innovativo nella crittografia basata su reticoli
Un nuovo approccio migliora la moltiplicazione polinomiale modulare per l'elaborazione sicura dei dati.
― 7 leggere min
Indice
- Il Ruolo della Moltiplicazione Modulare Polinomiale
- Metodi Attuali per Accelerare la Moltiplicazione Modulare Polinomiale
- Introducendo un Nuovo Approccio alla Moltiplicazione Modulare Polinomiale
- Progettazione del Nuovo Acceleratore PMM
- Sfide nelle Implementazioni Attuali
- Valutazione delle Prestazioni del Nuovo Acceleratore
- Efficienza Energetica e dell'Area
- Scalabilità e Futuri Applicazioni
- Conclusione
- Fonte originale
La crittografia basata su reticoli è un'area di ricerca importante nel campo della sicurezza dei dati. Utilizza strutture matematiche chiamate reticoli, che sono come griglie di punti nello spazio. Questi reticoli servono a creare sistemi sicuri che possono resistere agli attacchi dei computer quantistici, capaci di rompere molti dei metodi di crittografia attuali. Una delle operazioni chiave nella crittografia basata su reticoli è la moltiplicazione modulare polinomiale (PMM). Questa operazione è essenziale per le prestazioni di diversi algoritmi, soprattutto nella Crittografia omomorfica (HE), che permette di eseguire calcoli su dati crittografati senza doverli prima decrittografare.
Il Ruolo della Moltiplicazione Modulare Polinomiale
La moltiplicazione modulare polinomiale è il processo di moltiplicare due polinomi e poi ridurre il risultato modulo un altro polinomio. In termini più semplici, implica calcolare il prodotto di due espressioni matematiche e assicurarsi che il risultato rimanga all'interno di un certo intervallo definito da un terzo polinomio. Questa operazione è spesso la parte più dispendiosa in termini di tempo degli algoritmi crittografici basati su reticoli, in particolare nella HE, dove può contare per oltre la metà del tempo di calcolo.
Per illustrare questo, considera una situazione in cui si utilizza un servizio cloud per l'elaborazione dei dati mantenendo i dati sicuri attraverso la crittografia. In questo caso, l'operazione PMM può occupare una parte significativa del tempo necessario per eseguire vari compiti. Pertanto, accelerare la PMM è cruciale per migliorare l'efficienza di questi sistemi.
Metodi Attuali per Accelerare la Moltiplicazione Modulare Polinomiale
Sono stati sviluppati diversi metodi per accelerare la PMM, focalizzandosi principalmente su un approccio chiamato Trasformata Teorico-Numerica (NTT). Questa tecnica semplifica il processo di moltiplicazione, rendendolo più veloce. Ci sono diverse implementazioni di NTT, comprese le circuiti integrati specifici per l'applicazione (ASIC), le matrici logiche programmabili sul campo (FPGA) e i sistemi di calcolo in memoria (CIM).
Le architetture CIM sono particolarmente note per la loro capacità di eseguire calcoli direttamente all'interno della memoria, riducendo così il tempo e l'energia spesi per spostare i dati. I ricercatori hanno visto risultati promettenti con gli acceleratori PMM basati su CIM poiché riducono significativamente i ritardi causati dal trasferimento dei dati.
Sebbene le soluzioni basate su NTT siano popolari, non sono senza sfide. Ad esempio, implementare NTT su alcune apparecchiature può comportare costi elevati in termini di spazio e scalabilità. Pertanto, cresce l'interesse a esplorare metodi alternativi che potrebbero adattarsi meglio alle esigenze delle operazioni crittografiche avanzate.
Introducendo un Nuovo Approccio alla Moltiplicazione Modulare Polinomiale
Questo documento presenta un nuovo design per un acceleratore PMM che non si basa sul metodo NTT. Invece, si concentra su una tecnica diversa nota come approccio convoluzionale (Conv1D). Questo approccio ha mostrato vantaggi potenziali in termini di area e velocità quando implementato in un sistema CIM basato su crossbar.
Vantaggi dell'Approccio Convoluzionale
Il metodo convoluzionale offre un modo diretto di gestire la moltiplicazione polinomiale. Funziona sommando le parti corrispondenti dei polinomi, simile a come funziona la convoluzione nell'elaborazione dei segnali. Questo contrasta con il metodo NTT, che richiede diversi passaggi complessi e introduce un sovraccarico aggiuntivo.
Una delle scoperte chiave di questa ricerca è che l'NTT potrebbe non essere la scelta migliore per l'architettura crossbar utilizzata nei sistemi CIM. L'approccio Conv1D porta generalmente a prestazioni migliori grazie alle sue più semplici esigenze di mappatura dei dati e ai livelli di rumore ridotti, che sono particolarmente importanti per le applicazioni crittografiche che non possono tollerare errori.
Progettazione del Nuovo Acceleratore PMM
L'acceleratore PMM proposto è costruito su un'architettura crossbar, che consiste in più elementi di memoria interconnessi. Questa configurazione consente calcoli efficienti collegando ogni segnale di input a tutti i segnali di output attraverso punti di incrocio, facilitando operazioni rapide.
Struttura Gerarchica
L'acceleratore utilizza una struttura gerarchica composta da diversi strati, i più importanti dei quali includono piastrelle, elementi di elaborazione (PE) e la matrice crossbar stessa. Ogni piastrella contiene diversi PE, che eseguono calcoli sui bit dei dati di input simultaneamente, consentendo così operazioni ad alta velocità.
Tecnica di Mappatura dei Bit
Una significativa innovazione in questo design è la nuova tecnica di mappatura dei bit, che organizza i dati in modo da ridurre il numero di operazioni di shift-add necessarie per polinomi ad alta larghezza di bit. Questo metodo consente di elaborare più bit di dati di input in parallelo all'interno dei PE, aumentando notevolmente velocità ed efficienza minimizzando la necessità di hardware aggiuntivo.
Sfide nelle Implementazioni Attuali
Le operazioni polinomiali ad alta larghezza di bit presentano sfide in termini di complessità computazionale e utilizzo delle risorse. I design crossbar esistenti spesso faticano a gestire gradi polinomiali grandi in modo efficiente. Per affrontare questo, il nuovo design ottimizza la mappatura dei dati per garantire che le risorse siano utilizzate in modo più efficace, portando a migliori prestazioni complessive.
Riduzione Modulare
Tecniche diLa riduzione modulare è un altro aspetto critico della moltiplicazione modulare polinomiale. Questo passaggio garantisce che il polinomio risultante rispetti vincoli specifici. Nell'architettura proposta, viene impiegata una variante della tecnica di riduzione di Barrett per mantenere l'efficienza durante l'esecuzione di queste operazioni modulari. Questo approccio riduce il tempo dedicato a divisioni e moltiplicazioni complesse, consentendo calcoli più veloci.
Valutazione delle Prestazioni del Nuovo Acceleratore
Le prestazioni del nuovo acceleratore PMM sono state valutate rispetto alle soluzioni esistenti. Ha mostrato miglioramenti sostanziali in termini di velocità ed efficienza nel trattamento dei polinomi, in particolare nel contesto degli algoritmi crittografici basati su reticoli.
Confronto con le Implementazioni CPU
Rispetto alle implementazioni tradizionali su CPU, il nuovo acceleratore ha dimostrato una significativa riduzione della latenza. Questo miglioramento deriva dalle capacità di calcolo parallelo dell'architettura crossbar, che consente a numerose operazioni di avvenire simultaneamente.
Analisi rispetto agli Acceleratori Esistenti
Il nuovo design è stato anche messo a confronto con altri acceleratori PMM all'avanguardia (SOTA), che utilizzano principalmente NTT. I risultati indicano che l'approccio proposto non solo eguaglia, ma spesso supera le prestazioni di queste soluzioni esistenti, in particolare in termini di throughput e efficienza dell'area.
Efficienza Energetica e dell'Area
Un aspetto essenziale del computing moderno è il costo energetico associato all'esecuzione dei calcoli. Il design PMM proposto enfatizza la minimizzazione sia del consumo energetico che dell'utilizzo dello spazio fisico. Ottimizzando la mappatura dei dati e riducendo la necessità di operazioni di shift-add eccessive, la nuova architettura raggiunge un'efficienza energetica superiore rispetto ai modelli precedenti.
Risultati dello Studio sulla Mappatura dei Bit
I risparmi energetici osservati con l'implementazione della nuova tecnica di mappatura dei bit sono stati notevoli. Questo miglioramento è derivato da una significativa riduzione dell'area richiesta per le operazioni di shift-add, portando a risparmi energetici complessivi su diverse dimensioni polinomiali.
Scalabilità e Futuri Applicazioni
Un grande vantaggio del proposto acceleratore PMM è la sua scalabilità. È stato progettato per adattarsi a un'ampia gamma di gradi polinomiali e larghezze di bit mantenendo un alto throughput. Questa flessibilità lo rende adatto a diverse applicazioni, soprattutto man mano che cresce la domanda di elaborazione sicura dei dati.
Uso nella Critografia Omomorfica
I guadagni di efficienza ottenuti da questa architettura possono avere implicazioni significative per l'uso della crittografia omomorfica nelle applicazioni del mondo reale. Poiché questi sistemi cercano di mantenere la sicurezza consentendo calcoli complessi, acceleratori come questo possono drasticamente ridurre il tempo e l'energia richiesti per elaborare dati crittografati.
Conclusione
Il nuovo acceleratore PMM presenta una soluzione promettente per migliorare le prestazioni degli algoritmi crittografici basati su reticoli. Concentrandosi su un approccio non NTT e sfruttando i punti di forza dei design CIM tipo crossbar, l'architettura proposta raggiunge miglioramenti significativi in termini di velocità, efficienza dell'area e consumo energetico. Man mano che i ricercatori e i praticanti continuano a cercare metodi robusti e sicuri per la protezione dei dati di fronte a minacce emergenti, innovazioni come questa giocheranno un ruolo cruciale nel futuro della crittografia.
Titolo: Accelerating Polynomial Modular Multiplication with Crossbar-Based Compute-in-Memory
Estratto: Lattice-based cryptographic algorithms built on ring learning with error theory are gaining importance due to their potential for providing post-quantum security. However, these algorithms involve complex polynomial operations, such as polynomial modular multiplication (PMM), which is the most time-consuming part of these algorithms. Accelerating PMM is crucial to make lattice-based cryptographic algorithms widely adopted by more applications. This work introduces a novel high-throughput and compact PMM accelerator, X-Poly, based on the crossbar (XB)-type compute-in-memory (CIM). We identify the most appropriate PMM algorithm for XB-CIM. We then propose a novel bit-mapping technique to reduce the area and energy of the XB-CIM fabric, and conduct processing engine (PE)-level optimization to increase memory utilization and support different problem sizes with a fixed number of XB arrays. X-Poly design achieves 3.1X10^6 PMM operations/s throughput and offers 200X latency improvement compared to the CPU-based implementation. It also achieves 3.9X throughput per area improvement compared with the state-of-the-art CIM accelerators.
Autori: Mengyuan Li, Haoran Geng, Michael Niemier, Xiaobo Sharon Hu
Ultimo aggiornamento: 2023-07-26 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2307.14557
Fonte PDF: https://arxiv.org/pdf/2307.14557
Licenza: https://creativecommons.org/licenses/by-nc-sa/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.