Simple Science

La science de pointe expliquée simplement

# Génie électrique et science des systèmes# Traitement de l'audio et de la parole# Son# Traitement du signal

Nouvelles idées dans la technologie du langage parlé

Un nouvel aperçu des avancées dans les méthodes et applications de la science du langage parlé.

― 8 min lire


Innovations dans la techInnovations dans la techlinguistiquede la langue parlée.dans la recherche et les applicationsAvancées qui poussent au changement
Table des matières

Quand tu soumets un papier, commence toujours avec le modèle fourni. Ne prends pas un ancien papier comme guide. Assure-toi de lire tout le document avant de mettre tes infos. Vérifie ton papier avec le modèle pour être sûr qu'il respecte le format requis, sinon, ça peut être refusé.

Résumé et Mots-Clés

Ton résumé doit faire au max 1000 caractères. Le résumé dans ton papier doit correspondre exactement à ce que tu mets dans le formulaire de soumission. Évite d'utiliser des caractères spéciaux, des symboles mathématiques ou des italics dans le résumé. Pas de citations, car il n’y aura pas de bibliographie séparée dans le recueil des résumés. Après le résumé, ajoute des mots-clés qui mettent en avant les sujets principaux de ton travail.

Lignes Directrices Générales

C'est important d'expliquer comment ton travail se connecte à la Recherche précédente. Indique clairement ce qui est nouveau dans ton étude. Assure-toi que ta soumission suit les règles de la conférence, que tu peux trouver sur le site de la conférence.

Thème de la Conférence

Le thème de cette année se concentre sur l'Inclusivité dans la science et la Technologie du langage parlé. Bien que ce ne soit pas obligatoire de se concentrer sur ce thème, les soumissions sont encouragées à inclure des Données diverses, à rapporter des résultats basés sur différents groupes, et à identifier les obstacles qui pourraient affecter l'adoption. Les auteurs sont invités à discuter de la manière dont le thème se rapporte à leur travail.

Reproductibilité de la Recherche

Il est essentiel de présenter ta recherche de manière à ce que d'autres puissent reproduire ton travail. Voici quelques points à considérer :

  • Indique clairement quelles affirmations ta recherche examine.
  • Assure-toi que les affirmations dans ton résumé et ton introduction reflètent avec précision ton travail.
  • Parle des limitations de ta recherche.
  • Décris toutes les hypothèses faites dans ton travail.
  • Pour tout ensemble de données utilisé, donne des détails comme le nombre d'exemples et comment les données ont été divisées pour l'entraînement, la validation et le test.
  • Explique comment tu as traité tes données avant l'analyse.
  • Référence la littérature existante pour tout ensemble de données que tu n'as pas créé.
  • Si tu as collecté de nouvelles données, décris le processus de collecte, y compris qui a été impliqué et comment la qualité a été contrôlée.
  • Indique si l'approbation éthique était nécessaire pour les données utilisées.

Si tu utilises des données non publiques, explique comment tu y as accès et si tu prévois de les partager plus tard. Donne aussi des détails sur comment tu as mené tes expériences, y compris :

  • Nombre d'essais d'entraînement et d'évaluation.
  • Réglages pour chaque paramètre utilisé.
  • Meilleurs réglages pour chaque modèle.
  • Résultats moyens et toute statistique pertinente.

Ton papier doit aussi décrire :

  • Les formules mathématiques ou modèles utilisés.
  • Les ressources informatiques et les temps de calcul.
  • Les métriques d'évaluation.
  • Tout logiciel disponible publiquement que tu as utilisé, avec des liens.

Si tu as du code non public, indique si tu le rendras disponible à la publication ou pourquoi il ne peut pas être partagé.

Processus de Révision à Double Insanité

Cette conférence utilise un processus de révision à double insouciante, ce qui signifie que ni les auteurs ni les examinateurs ne devraient connaître l'identité de l'autre. Ta soumission ne doit pas contenir d'infos révélant qui sont les auteurs. Ça inclut les références à ton propre travail passé. Utilise des citations tierces pour parler de ta recherche précédente au lieu de te mentionner directement.

Version Finale pour Publication

Dans la version finale de ton papier, indique clairement les noms et affiliations de tous les auteurs. Ne mets pas de logos, et assure-toi que les affiliations incluent le pays. Si tu as plus de 20 auteurs, liste les noms supplémentaires en note de bas de page. Une fois ton papier accepté, tu peux révéler ton identité d'autres manières, comme en ajustant comment tu cites ton propre travail.

Assure-toi de suivre la politique concernant les prépublications, qui s'applique non seulement aux prépublications mais aussi à tout matériel connexe rendu public qui chevauche ton travail soumis.

Formatage du Papier

Suis le format spécifié à la lettre. Utilise les modèles fournis et évite de changer la mise en page. La taille du papier doit être A4, avec deux colonnes, et des marges spécifiques doivent être respectées.

Les titres de section doivent être centrés et en gras, avec le premier mot en majuscule. Les sous-titres doivent commencer à partir de la marge gauche, et les sous-sous-titres doivent être en italique. Utilise la police Times ou Times Roman avec une taille de 9 points pour le texte principal et 8 points pour les références.

Il ne doit pas y avoir de numéros de page ou d'en-têtes/pieds de page. Évite d'utiliser des liens actifs ou des caractères spéciaux qui pourraient mal s'imprimer. Toutes les figures doivent être correctement formatées et centrées, avec des légendes claires en dessous.

Chaque tableau doit aussi être lisible et inclure une légende au-dessus. Garde les équations sur des lignes séparées et numérote-les de manière appropriée.

Langue et Références

Ton papier doit être en anglais, en utilisant soit l'orthographe américaine, soit l’orthographe britannique de manière cohérente. Lorsque tu cites des travaux précédents, assure-toi que les références suivent un format spécifique, et inclue seulement des publications évaluées par des pairs. Si aucun travail évalué par des pairs n'existe, les citations non évaluées par des pairs doivent être limitées et notées en tant que notes de bas de page.

Unités de Mesure

Utilise des unités de mesure standard, en veillant à laisser un espace entre les chiffres et les unités.

Utilisation du Modèle Word

Si tu utilises Microsoft Word, assure-toi de profiter des styles intégrés pour un formatage facile. Ça aidera à numéroter automatiquement les titres et les références.

Lorsque tu enregistres ton document, évite de convertir des formats qui pourraient réduire la qualité, surtout pour les équations.

Exigences de Soumission

Soumets un seul fichier PDF qui répond à certains critères : il ne doit pas être protégé par un mot de passe, toutes les polices doivent être intégrées, et le texte doit être consultable. Si ton PDF ne respecte pas ces normes, tu pourrais être amené à fournir une nouvelle version.

Intégration des Polices

Sois sûr d'intégrer toutes les polices dans ton PDF. C'est crucial pour maintenir la qualité de ton document, surtout pour les figures qui peuvent contenir des polices supplémentaires.

Nettoyage des Métadonnées du PDF

Avant de soumettre, vérifie que les métadonnées du PDF ne révèlent pas l'identité des auteurs.

Fichiers Multimédia

Il y a une option pour soumettre des fichiers multimédia pour ta présentation. Ces fichiers devraient améliorer ton travail et être dans des formats courants. Ils doivent être soumis dans un fichier ZIP, avec une brève description du contenu.

Ressources en Ligne

Tu peux fournir des liens vers des ressources en ligne, mais ne les utilise pas pour contourner la limite de longueur du manuscrit. Fais attention à ne pas exposer ton identité à travers les ressources liées.

Dernières Vérifications

Avant de soumettre, relis soigneusement ton PDF pour attraper les erreurs. C'est ta dernière chance d'assurer que tout est correct.

Remerciements

Merci aux précédents comités d'organisation pour leurs contributions et pour avoir fourni des ressources qui ont aidé à façonner ce modèle.

N'oublie pas, la dernière page de ta soumission est réservée aux références ; aucun autre contenu ne doit y apparaître. Les annexes doivent être incluses sur des pages antérieures pour garder tes références organisées.

Source originale

Titre: PhonMatchNet: Phoneme-Guided Zero-Shot Keyword Spotting for User-Defined Keywords

Résumé: This study presents a novel zero-shot user-defined keyword spotting model that utilizes the audio-phoneme relationship of the keyword to improve performance. Unlike the previous approach that estimates at utterance level, we use both utterance and phoneme level information. Our proposed method comprises a two-stream speech encoder architecture, self-attention-based pattern extractor, and phoneme-level detection loss for high performance in various pronunciation environments. Based on experimental results, our proposed model outperforms the baseline model and achieves competitive performance compared with full-shot keyword spotting models. Our proposed model significantly improves the EER and AUC across all datasets, including familiar words, proper nouns, and indistinguishable pronunciations, with an average relative improvement of 67% and 80%, respectively. The implementation code of our proposed model is available at https://github.com/ncsoft/PhonMatchNet.

Auteurs: Yong-Hyeok Lee, Namhyun Cho

Dernière mise à jour: 2023-08-31 00:00:00

Langue: English

Source URL: https://arxiv.org/abs/2308.16511

Source PDF: https://arxiv.org/pdf/2308.16511

Licence: https://creativecommons.org/licenses/by/4.0/

Changements: Ce résumé a été créé avec l'aide de l'IA et peut contenir des inexactitudes. Pour obtenir des informations précises, veuillez vous référer aux documents sources originaux dont les liens figurent ici.

Merci à arxiv pour l'utilisation de son interopérabilité en libre accès.

Articles similaires