Presentiamo SMPLOlympics: una nuova frontiera per gli sport umanoidi
SMPLOlympics offre ambienti simulati per permettere ai umani di competere in sport in stile olimpico, migliorando l'apprendimento del movimento.
― 9 leggere min
Indice
- Lavori Correlati
- Formulazione del Problema
- Apprendimento Rinforzato Condizionato da Obiettivi per il Controllo degli Umanoidi
- SMPLOlympics: Ambienti Sportivi per Umanoidi Simulati
- Acquisizione di Dimostrazioni Umane da Video
- Dettagli di Implementazione
- Baseline
- Metriche
- Benchmarking degli Algoritmi di Umanoidi Simulati Popolari
- Limitazioni, Conclusioni e Lavoro Futuro
- Fonte originale
- Link di riferimento
Introduciamo una collezione di ambienti dove gli umanoidi possono partecipare a vari Sport olimpici, chiamata SMPLOlympics. Questi ambienti consentono agli atleti virtuali di competere, aiutando i ricercatori a testare e migliorare i loro algoritmi che insegnano alle macchine a muoversi come gli esseri umani. Poiché gli esseri umani praticano questi sport da molto tempo, c'è un sacco di informazioni esistenti su come avere successo in essi. I nostri modelli umanoidi sono progettati per lavorare con modelli di corpo umano popolari nel campo della grafica, rendendo più facile applicare i movimenti umani esistenti ai nostri atleti virtuali.
In SMPLOlympics, offriamo sia sport individuali come golf, lancio del giavellotto, salto in alto, salto in lungo e ostacoli, sia sport di squadra come tennis da tavolo, tennis, scherma, boxe, calcio e basket. Abbiamo scoperto che se combiniamo movimenti forti appresi dalle performance umane con modi semplici per premiare gli umanoidi, possiamo osservare comportamenti in loro che assomigliano a come gli esseri umani praticano questi sport.
Creare questi ambienti sportivi simulati non è facile. Molti sforzi passati si sono concentrati principalmente su compiti di base come camminare o correre, che sono più semplici per gli umanoidi da apprendere. Tuttavia, queste simulazioni precedenti non hanno sfruttato appieno la complessità e la varietà che derivano dai movimenti sportivi, che possono portare a comportamenti più interessanti e avanzati.
Un importante vantaggio di lavorare con simulazioni umanoidi è la possibilità di ottenere facilmente i movimenti umani per l'Allenamento. Poiché gli umanoidi assomigliano alle persone, è semplice capire i movimenti che stanno compiendo. Possiamo usare video o dati di motion capture per raccogliere tali movimenti umani, che sono fondamentali per migliorare i nostri atleti virtuali.
In questo lavoro, presentiamo SMPLOlympics, un insieme variegato di ambienti simulati dove gli umanoidi possono competere in sport olimpici. Questa collezione non solo sfida gli umanoidi nel Movimento, ma anche nella coordinazione e nel processo decisionale. Con i nostri design umanoidi allineati ai modelli umani popolari, possiamo convertire direttamente i movimenti umani nelle nostre simulazioni. In situazioni in cui i movimenti delle mani sono essenziali, utilizziamo il modello umanoide SMPL-X. Per altri compiti, il modello SMPL è sufficiente.
I nostri ambienti sportivi sono dedicati sia agli sport individuali che a quelli di squadra, fornendo una piattaforma ampia per la valutazione e il benchmarking. Per gli sport individuali, abbiamo golf, lancio del giavellotto, salto in alto, salto in lungo e ostacoli. Negli sport di squadra, includiamo giochi uno contro uno come ping pong, tennis, scherma e boxe, insieme a giochi di squadra come calcio e basket. Per semplificare la misurazione del successo, includiamo anche compiti più semplici come calci di rigore nel calcio o colpire obiettivi con la palla nel ping pong e nel tennis.
Per mostrare come i movimenti umani possano migliorare le performance, estraiamo dati di movimento dai video e li applichiamo ai nostri umanoidi. Questo aiuta i nostri atleti simulati a muoversi in modo più simile agli esseri umani, rendendo i risultati più realistici. Abbiamo anche esaminato come i recenti progressi nella rappresentazione del movimento potrebbero migliorare il controllo dei nostri umanoidi attraverso l'apprendimento.
Lavori Correlati
Sport Umanoidi Simulati
L'uso di sport umanoidi simulati può aiutare a creare animazioni e trovare strategie migliori per questi sport. La ricerca precedente ha principalmente studiato sport individuali in simulazioni, inclusi tennis, tennis da tavolo, boxe, scherma, basket e calcio. Questi studi miravano a imitare i movimenti umani utilizzando i dati disponibili. Tuttavia, diversi design umanoidi rendono difficile combinare efficacemente i dati di movimento umano. Il nostro approccio con SMPLOlympics crea un ambiente unificato, consentendo confronti più semplici tra metodi di apprendimento attraverso diversi sport.
Benchmark di Apprendimento Rinforzato Simulato
Gli umanoidi simulati offrono anche un'opportunità preziosa per studiare movimenti intelligenti perché assomigliano ad azioni umane reali. La maggior parte dei benchmark attuali si concentra su compiti semplici come camminare o superare ostacoli. Al contrario, SMPLOlympics offre opportunità per sport competitivi, che richiedono movimenti più agili e lavoro di squadra. Questi elementi sono altamente visibili e consentono misurazioni chiare delle performance.
Formulazione del Problema
Definiamo i movimenti dell'umanoide utilizzando un metodo specifico che rappresenta le posizioni e le orientazioni delle articolazioni in 3D. In questo modo, abbiamo incluso anche le velocità di questi movimenti per un controllo preciso. Quando sono coinvolti oggetti, come un giavellotto o un pallone da calcio, monitoriamo come si muovono in relazione all'umanoide.
Apprendimento Rinforzato Condizionato da Obiettivi per il Controllo degli Umanoidi
Impostiamo ogni sport utilizzando l'apprendimento rinforzato condizionato da obiettivi. Una politica è addestrata a gestire le azioni di un umanoide in un ambiente sportivo. L'allenamento è strutturato attorno a un sistema di stati, azioni, transizioni di movimento, Ricompense e altri fattori. Questo metodo aiuta l'umanoide a imparare a svolgere i suoi compiti sportivi designati.
SMPLOlympics: Ambienti Sportivi per Umanoidi Simulati
In questa sezione, analizziamo come ciascun sport in SMPLOlympics è strutturato, dagli eventi individuali alle attività di squadra. Inoltre, discuteremo di come raccogliamo i dati di movimento umano dai video. Ogni sport ha il proprio design di ricompense, creando un punto di partenza per ulteriori sviluppi.
Sport Individuali
Salto in Alto: Nell'evento di salto in alto, l'umanoide deve saltare oltre un'asticella posizionata a un certo altezza senza toccarla e deve raggiungere un punto obiettivo dietro l'asticella. L'asticella è disposta come nei giochi olimpici ufficiali. Le ricompense vengono date per avvicinarsi all'obiettivo e saltare più in alto.
Salto in Lungo: Nel salto in lungo, l'umanoide ha una pista di 20 metri per prendere velocità prima del salto. Deve decollare dalla linea di salto, e le ricompense vengono date in base a quanto è lungo il salto, oltre alla velocità prima del salto.
Ostacoli: Nell'evento degli ostacoli, un umanoide corre per 110 metri mentre salta su dieci ostacoli. L'umanoide riceve ricompense per correre verso il traguardo e superare ogni ostacolo. L'altezza degli ostacoli viene regolata casualmente per creare varie sfide.
Golf: L'umanoide utilizza una mazza da golf per colpire una palla verso un obiettivo. L'ambiente imita veri prati, e l'umanoide viene ricompensato per colpire la palla in avanti, fare contatto con la mazza e far entrare la palla nel buco.
Giavellotto: Nel lancio del giavellotto, utilizziamo un umanoide con dita articolate. L'obiettivo dell'umanoide è lanciare il giavellotto il più lontano possibile, e riceve ricompense per tenere il giavellotto, lanciarlo con precisione e mantenere stabilità durante il lancio.
Sport di Gruppo
Tennis: Ogni umanoide è dotato di una racchetta per colpire una palla. Ci sono sessioni di pratica individuale e partite competitive uno contro uno. L'umanoide viene premiato per avvicinarsi alla palla e colpirla con precisione verso un obiettivo.
Tennis da Tavolo: Simile al tennis, l'umanoide usa una racchetta per colpire la palla su un tavolo di dimensioni standard. Ci sono compiti sia individuali che competitivi, e l'umanoide riceve ricompense per colpi riusciti.
Scherma: In un duello di scherma, ogni umanoide brandisce una spada. Le ricompense includono affrontare l'avversario, muoversi verso di lui e colpire il bersaglio.
Boxe: Nella configurazione della boxe, gli umanoidi combattono in un ring usando le loro mani potenziate. L'allenamento è simile a quello della scherma, con ricompense strutturate per il movimento e il contatto.
Calcio: Nel calcio, gli umanoidi possono partecipare a calci di rigore o partite di squadra. Per i calci di rigore, l'umanoide cerca di calciare una palla in una rete. Nel gioco di squadra, è incoraggiata e premiata la cooperazione con i compagni di squadra.
Basket: Questo ambiente imita un campo da basket dove gli umanoidi devono tirare una palla nel canestro. Gli umanoidi imparano a lanciare la palla senza toccarla con i piedi.
Negli sport competitivi, abilitiamo un meccanismo di auto-gioco di base, dove due politiche si sfidano, aiutando ciascuna a migliorare le proprie strategie.
Acquisizione di Dimostrazioni Umane da Video
Per raccogliere dimostrazioni di movimento umano, utilizziamo metodi avanzati che ricostruiscono i movimenti 3D da filmati video. Questi sistemi possono tracciare i movimenti anche in ambienti dinamici come le trasmissioni sportive. I dati raccolti vengono poi utilizzati per guidare i movimenti degli umanoidi, assicurando che rimangano realistici e fisicamente plausibili.
Dettagli di Implementazione
La simulazione avviene in un ambiente specializzato che funziona a determinate velocità. Gli umanoidi utilizzati hanno strutture articolari specifiche, con misurazioni dettagliate per i loro movimenti. Il processo di allenamento per gli umanoidi può essere completato in pochi giorni utilizzando hardware progettato per elaborare algoritmi complessi. Ogni articolazione ha limitazioni per mantenere movimenti realistici.
Baseline
Testiamo i nostri sport simulati usando alcuni dei più recenti metodi di controllo per umanoidi. Ogni compito viene allenato utilizzando approcci diversi, e osserviamo le performance di vari metodi nei nostri ambienti sportivi.
Metriche
Misuriamo il successo basandoci su compiti facilmente quantificabili come salti, lanci e gol. Ogni compito viene valutato su numerosi tentativi, raccogliendo metriche che forniscono informazioni sulla qualità delle performance.
Benchmarking degli Algoritmi di Umanoidi Simulati Popolari
Valutiamo e confrontiamo vari metodi di controllo per vedere quanto bene si comportano attraverso sport diversi. Esaminando i risultati, possiamo determinare quali metodi sono più efficaci per insegnare agli umanoidi come svolgere compiti sportivi.
Limitazioni, Conclusioni e Lavoro Futuro
Sebbene SMPLOlympics offra più ambienti sportivi, diversi sport popolari non sono stati inclusi a causa delle sfide nella loro simulazione. I nostri design iniziali delle ricompense possono essere migliorati per produrre risultati ancora migliori, specialmente negli sport di squadra competitivi.
In sintesi, SMPLOlympics introduce un insieme completo di ambienti simulati per gli umanoidi per impegnarsi negli sport. Con un design pensato e una forte guida ai movimenti umani, questi umanoidi possono raggiungere performance impressionanti in vari compiti sportivi. Questo framework getta le basi per una comprensione fisica più avanzata e lo sviluppo di comportamenti umanoidi in futuro.
Nell'appendice, forniamo dettagli aggiuntivi sui nostri ambienti, inclusi design specifici per ricompense e metodi di allenamento. Risultati qualitativi completi possono essere consultati, mostrando ciò che è stato realizzato in questi ambienti sportivi e i risultati dell'allenamento basati sui nostri design iniziali.
Titolo: SMPLOlympics: Sports Environments for Physically Simulated Humanoids
Estratto: We present SMPLOlympics, a collection of physically simulated environments that allow humanoids to compete in a variety of Olympic sports. Sports simulation offers a rich and standardized testing ground for evaluating and improving the capabilities of learning algorithms due to the diversity and physically demanding nature of athletic activities. As humans have been competing in these sports for many years, there is also a plethora of existing knowledge on the preferred strategy to achieve better performance. To leverage these existing human demonstrations from videos and motion capture, we design our humanoid to be compatible with the widely-used SMPL and SMPL-X human models from the vision and graphics community. We provide a suite of individual sports environments, including golf, javelin throw, high jump, long jump, and hurdling, as well as competitive sports, including both 1v1 and 2v2 games such as table tennis, tennis, fencing, boxing, soccer, and basketball. Our analysis shows that combining strong motion priors with simple rewards can result in human-like behavior in various sports. By providing a unified sports benchmark and baseline implementation of state and reward designs, we hope that SMPLOlympics can help the control and animation communities achieve human-like and performant behaviors.
Autori: Zhengyi Luo, Jiashun Wang, Kangni Liu, Haotian Zhang, Chen Tessler, Jingbo Wang, Ye Yuan, Jinkun Cao, Zihui Lin, Fengyi Wang, Jessica Hodgins, Kris Kitani
Ultimo aggiornamento: 2024-06-28 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2407.00187
Fonte PDF: https://arxiv.org/pdf/2407.00187
Licenza: https://creativecommons.org/licenses/by-sa/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.