Fortschritte in der serverlosen Berechnung und Speicherung
Erforschen eines neuen Modells für schnelle und effiziente serverlose Anwendungen.
― 5 min Lesedauer
Inhaltsverzeichnis
Serverless Computing wird immer beliebter in der Cloud-Welt. Es ermöglicht Entwicklern, Code auszuführen, ohne sich um Server kümmern zu müssen. Das ist super, weil es Zeit und Ressourcen spart. Firmen wie Amazon, Google und Microsoft bieten serverless Optionen an, die Flexibilität und Kosteneinsparungen bieten. Nutzer zahlen nur für die Rechenressourcen, die sie tatsächlich nutzen, was es für viele Unternehmen attraktiv macht.
Veränderungen in Rechenzentren
Mit dem Anstieg der Beliebtheit von Serverless Computing ändern sich auch die Rechenzentren. Zwei grosse Trends sind zu beobachten: die Trennung von Speicherung und Rechenressourcen und die Nutzung von spezieller Hardware zur Beschleunigung von Aufgaben.
Speicher-Disaggregation: Das bedeutet, dass Speicherung und Rechnen nicht mehr eng miteinander verknüpft sind. Stattdessen können Daten getrennt von den Servern, die sie verwenden, gespeichert werden. Das ermöglicht eine bessere Ressourcennutzung, bringt aber auch einige Herausforderungen mit sich, vor allem, wenn es um den Zugriff und die Bewegung von Daten geht.
Domänenspezifische Beschleuniger: Das sind spezielle Hardwareteile, die dazu entworfen wurden, bestimmte Aufgaben schneller zu erledigen. Sie werden in vielen Rechenzentren von Cloud-Anbietern eingesetzt, um die Leistung zu verbessern. Die Verwendung in Serverless Computing kann jedoch kompliziert sein, da serverless Funktionen oft mit kurzlebigen Daten zu tun haben, die schnell zugänglich sein müssen.
Die Herausforderung
Obwohl beide Trends Vorteile bieten, kann ihre Kombination zu Ineffizienzen führen. Wenn serverless Funktionen auf getrennte Speicherung zugreifen müssen, dauert das Zeit. Das kann die Vorteile spezieller Hardware in den Schatten stellen. Daher ist es wichtig, einen Weg zu finden, diese Fortschritte effektiv zu integrieren.
Vorgeschlagene Lösung: Domänenspezifischer Rechen-Speicher
Um diese Probleme anzugehen, schlagen wir einen neuen Ansatz namens domänenspezifischer Rechen-Speicher für Serverless Computing vor. Im Grunde kombiniert dieses Modell Speicherung und Berechnung, indem kleine, programmierbare Beschleuniger direkt neben den Speichergeräten platziert werden.
Auf diese Weise können wir die Zeit minimieren, die benötigt wird, um Daten zwischen Speicher und Rechenressourcen zu übertragen. Diese Beschleuniger sind für spezielle Aufgaben konzipiert, was bedeutet, dass sie Daten schnell verarbeiten können, ohne viel Energie zu benötigen.
Vorteile des vorgeschlagenen Modells
Erhöhte Leistung: Durch die Verringerung der Distanz, die Daten zurücklegen müssen, können wir die Latenz deutlich reduzieren. Dadurch können Aufgaben schneller abgeschlossen werden.
Energieeffizienz: Die Verwendung kleiner Beschleuniger ermöglicht es uns, innerhalb enger Stromgrenzen zu bleiben und gleichzeitig Rechenkapazitäten bereitzustellen.
Kostenersparnis: Die Kombination aus Geschwindigkeit und Energieeffizienz hilft, die Betriebskosten zu senken, was es zu einer finanziell attraktiven Option für Unternehmen macht.
Wie es funktioniert
Architekturübersicht
Das vorgeschlagene Modell nutzt ein Rechen-Speichermedium, das einen kleinen Beschleuniger enthält. Dieser Beschleuniger kommuniziert direkt mit dem Speichermedium über eine spezielle Verbindung. Wenn eine serverless Funktion ausgeführt werden muss, kann sie auf den Speicher zugreifen und den Beschleuniger dort nutzen, wodurch lange Netzwerkübertragungen vermieden werden.
Betriebsaufteilung
Serverless Anwendungen bestehen aus mehreren Funktionen, die sequenziell ausgeführt werden können. Jede Funktion kann Daten verarbeiten und Ausgaben zurückgeben. In traditionellen Setups würde jede Funktion Daten von einem entfernten Speicherort abrufen, was zu Verzögerungen führt. In unserem vorgeschlagenen Modell hingegen verarbeitet der Beschleuniger die Daten direkt dort, wo sie gespeichert sind, was die Geschwindigkeit und Effizienz erhöht.
Minimale Änderungen erforderlich
Dieses neue Modell ist so gestaltet, dass es in bestehende serverless Frameworks passt, ohne umfassende Änderungen zu erfordern. Durch die Nutzung standardisierter Bereitstellungstools und ein System zur Kennzeichnung von Funktionen, die von einer Beschleunigung profitieren können, ist es möglich, Verbesserungen nahtlos in bestehende Systeme zu integrieren.
Leistungsevaluation
Anwendungsbeispiele aus der Praxis
Die Effektivität des vorgeschlagenen Modells wurde mit acht realen Anwendungen getestet. Diese Anwendungen zeigen eine signifikante Leistungsverbesserung bei der Verwendung des neuen Systems im Vergleich zu traditionellen Setups.
Ergebnisse
Die Bewertungen haben gezeigt, dass die Integration eines kleinen Beschleunigers mit Rechen-Speicher zu einer besseren Leistung führen kann als die Verwendung von High-End-GPUs. Das liegt hauptsächlich an den reduzierten Verzögerungen bei der Datenbewegung.
Herausforderungen und Überlegungen
Obwohl das neue Modell viele Vorteile bietet, gibt es immer noch Herausforderungen, die angegangen werden müssen:
Strombeschränkungen: Die Beschleuniger müssen innerhalb bestimmter Stromgrenzen arbeiten. Das erfordert eine sorgfältige Planung, um sicherzustellen, dass sie mit verschiedenen Arbeitslasten umgehen können, ohne diese Grenzen zu überschreiten.
Softwareintegration: Obwohl nur minimale Änderungen erforderlich sind, erfordert die Integration mit bestehenden Softwaresystemen dennoch sorgfältige Planung, um Störungen zu vermeiden.
Hardwarevariabilität: Das System muss verschiedene Arten von Hardware berücksichtigen, was die Setups komplizieren kann.
Zukünftige Richtungen
In Zukunft wird der Fokus darauf liegen, das Design von domänenspezifischen Beschleunigern weiter zu verfeinern, um ein breiteres Anwendungsspektrum über serverless Funktionen hinaus abzudecken. Es gibt Potenzial, Optimierungen für verschiedene Arten von Datenverarbeitungsaufgaben zu erkunden, was die Nutzbarkeit des Modells erweitern kann.
Erweiterung der Anwendungsbereiche
Die Ergebnisse zeigen, dass insbesondere Aufgaben im Bereich maschinelles Lernen von Beschleunigern profitieren, aufgrund ihrer Rechenanforderungen. Zukünftige Arbeiten könnten sich darauf konzentrieren, die Leistung des Modells in anderen Bereichen zu verbessern, die schnelle Datenverarbeitung erfordern, wie z.B. Big Data Analytics und Echtzeit-Datenverarbeitung.
Fazit
Das Aufkommen von Serverless Computing, zusammen mit den Veränderungen in der Architektur von Rechenzentren, bietet aufregende Möglichkeiten sowie Herausforderungen. Der vorgeschlagene domänenspezifische Rechen-Speicher für Serverless Computing zielt darauf ab, die Vorteile von Speicher-Disaggregation und spezieller Hardwarebeschleunigung zu verbinden, um eine effizientere und leistungsstärkere Computerumgebung zu schaffen. Durch die Verringerung der Latenz, die Verbesserung der Energieeffizienz und signifikante Kosteneinsparungen kann dieses Modell potenziell verändern, wie serverless Anwendungen entworfen und bereitgestellt werden, und den Weg für zukünftige Fortschritte in diesem Bereich ebnen.
Titel: In-Storage Domain-Specific Acceleration for Serverless Computing
Zusammenfassung: While (1) serverless computing is emerging as a popular form of cloud execution, datacenters are going through major changes: (2) storage dissaggregation in the system infrastructure level and (3) integration of domain-specific accelerators in the hardware level. Each of these three trends individually provide significant benefits; however, when combined the benefits diminish. Specifically, the paper makes the key observation that for serverless functions, the overhead of accessing dissaggregated persistent storage overshadows the gains from accelerators. Therefore, to benefit from all these trends in conjunction, we propose Domain-Specific Computational Storage for Serverless (DSCS-Serverless). This idea contributes a serverless model that leverages a programmable accelerator within computational storage to conjugate the benefits of acceleration and storage disaggregation simultaneously. Our results with eight applications shows that integrating a comparatively small accelerator within the storage (DSCS-Serverless) that fits within its power constrains (15 Watts), significantly outperforms a traditional disaggregated system that utilizes the NVIDIA RTX 2080 Ti GPU (250 Watts). Further, the work highlights that disaggregation, serverless model, and the limited power budget for computation in storage require a different design than the conventional practices of integrating microprocessors and FPGAs. This insight is in contrast with current practices of designing computational storage that are yet to address the challenges associated with the shifts in datacenters. In comparison with two such conventional designs that either use quad-core ARM A57 or a Xilinx FPGA, DSCS-Serverless provides 3.7x and 1.7x end-to-end application speedup, 4.3x and 1.9x energy reduction, and 3.2x and 2.3x higher cost efficiency, respectively.
Autoren: Rohan Mahapatra, Soroush Ghodrati, Byung Hoon Ahn, Sean Kinzer, Shu-ting Wang, Hanyang Xu, Lavanya Karthikeyan, Hardik Sharma, Amir Yazdanbakhsh, Mohammad Alian, Hadi Esmaeilzadeh
Letzte Aktualisierung: 2024-03-23 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2303.03483
Quell-PDF: https://arxiv.org/pdf/2303.03483
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.