SPAM bietet eine smarte Möglichkeit, Videodaten effizient zu kennzeichnen.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
SPAM bietet eine smarte Möglichkeit, Videodaten effizient zu kennzeichnen.
― 6 min Lesedauer
TROT verbessert die Genauigkeit bei der Erkennung von menschlichen Aktivitäten, indem es zeitliche Beziehungen nutzt.
― 8 min Lesedauer
SLAIM verbessert die Echtzeitverfolgung und -kartierung mit fortschrittlichen neuronalen Netzwerken und Tiefeninformationen.
― 6 min Lesedauer
Neue Methoden verbessern die Bildqualität in Satellitenbildern.
― 5 min Lesedauer
Ein neues Datensatz und Framework zum Verfolgen von Fussballspielern mit Videomaterial von einer einzelnen Kamera.
― 8 min Lesedauer
GenLFI revolutioniert die Live-Zell-Bildgebung mit unvergleichlicher Geschwindigkeit und Sichtfeld.
― 7 min Lesedauer
Ein Blick darauf, wie Roboter Umgebungen mit verschiedenen Technologien navigieren.
― 6 min Lesedauer
Eine neue Methode verbessert die Qualität von Satellitenbildern mit niedriger Auflösung.
― 7 min Lesedauer
Eine neue Methode verbessert multimodale Modelle mit gemeinsamen visuellen Aufforderungen.
― 8 min Lesedauer
Lernen von dichten Entsprechungen zwischen Formen ohne perfekte Ausrichtung.
― 5 min Lesedauer
Neue Methoden verbessern die Genauigkeit beim Zählen von Aedes aegypti Mücken-Eiern.
― 8 min Lesedauer
Eine neue Methode vereinfacht die Bildbearbeitung, indem sie sich auf Rauschen und Timing konzentriert.
― 7 min Lesedauer
Neue Methoden zielen darauf ab, die Kommunikation für die Gehörlosengemeinschaft zu verbessern.
― 5 min Lesedauer
Ein Leitfaden zu Rotationsdarstellungen und ihrem Einfluss auf maschinelles Lernen.
― 7 min Lesedauer
Dieser Artikel stellt eine Methode vor, um die Unsicherheitsabschätzungen in TinyML-Anwendungen zu verbessern.
― 7 min Lesedauer
Videos ganz einfach bearbeiten, indem du Bilder als Orientierung für Änderungen verwendest.
― 5 min Lesedauer
Ein neuer Ansatz, um komprimierte dunkle Bilder zu verbessern und gleichzeitig Artefakte zu reduzieren.
― 6 min Lesedauer
Eine Methode, die das Textur bearbeiten für Bilder vereinfacht und beschleunigt.
― 5 min Lesedauer
Die Einschränkungen der Fréchet Video Distance bei der Bewertung der Videoqualität untersuchen.
― 6 min Lesedauer
Ein neuer Benchmark zeigt Lücken im visuellen Verständnis von grossen Sprachmodellen.
― 7 min Lesedauer
Diese Studie verbessert die Segmentierung von bewegten Objekten, indem SAM mit optischen Fluss-Techniken kombiniert wird.
― 7 min Lesedauer
Ein System erzeugt lebensechte Handinteraktionen mit verschiedenen Objekten.
― 7 min Lesedauer
Ein neuer Ansatz verbessert die Geschwindigkeit und Qualität beim Bildbearbeiten.
― 6 min Lesedauer
Eine schnelle Methode, um 3D-Modelle nur aus sechs Fotos zu erstellen, perfekt für Fahrzeuge.
― 6 min Lesedauer
Ein neuer Ansatz, um das Multi-Objekt-Tracking durch 3D-Daten zu verbessern.
― 7 min Lesedauer
Eine Methode, um Bias in bestehenden Deep-Learning-Modellen mit minimalen Beispielen zu reduzieren.
― 6 min Lesedauer
Das Verstehen von individuellen Aufmerksamkeitsmustern kann die Technologie und Pflege in verschiedenen Bereichen verbessern.
― 7 min Lesedauer
Dieser Artikel beschäftigt sich damit, leichte Vision Transformers durch maskiertes Bildmodellieren zu verbessern.
― 6 min Lesedauer
Eine neue Methode verbessert die Bewertung von Gesichtsbilden für die Erkennungsgenauigkeit.
― 6 min Lesedauer
Diese Studie verbessert das föderierte Lernen, indem sie die Modellvielfalt erhöht und gleichzeitig die Privatsphäre schützt.
― 7 min Lesedauer
PureForest liefert wichtige Daten für ein besseres Waldmanagement und die Identifizierung von Baumarten.
― 6 min Lesedauer
Diese Methode verwendet Skizzen für präzise Bildwiederherstellung und -bearbeitung.
― 6 min Lesedauer
Neue Methode verbessert die frühzeitige Erkennung von Gallenblasenkrebs mit Ultraschallvideos.
― 6 min Lesedauer
Neue Methoden verbessern die Fähigkeit von Modellen, 3D-Umgebungen zu verstehen.
― 7 min Lesedauer
Ein neuer Ansatz, der genetisches Programmieren nutzt, um Verlustfunktionen für die Bildklassifizierung zu verbessern.
― 5 min Lesedauer
Eine neue Methode erzeugt realistische menschliche Bewegungen in virtuellen Umgebungen.
― 6 min Lesedauer
Learn2Talk kombiniert 2D- und 3D-Techniken für realistische Gesichtsanimationen.
― 6 min Lesedauer
Ein neuer Ansatz verbessert die Segmentierung in medizinischen Bildern ohne detaillierte Beschriftungen.
― 6 min Lesedauer
Das neue Dataset Square-10M verbessert die Open-Source-Fähigkeiten im Bereich visuelle Fragen und Antworten erheblich.
― 6 min Lesedauer
OTSeg verbessert die semantische Segmentierung, indem es mehrere Textaufforderungen für bessere Genauigkeit verwendet.
― 7 min Lesedauer