Le proxy-tuning simplifie et améliore l'adaptation des modèles de langage en utilisant des modèles experts plus petits.
― 7 min lire
La science de pointe expliquée simplement
Le proxy-tuning simplifie et améliore l'adaptation des modèles de langage en utilisant des modèles experts plus petits.
― 7 min lire
Un aperçu des problèmes et des solutions pour les hallucinations dans les modèles de langage.
― 9 min lire
Un aperçu des obstacles et des progrès dans la technologie de traduction.
― 6 min lire
RoDia fournit des échantillons audio essentiels pour identifier les dialectes roumains.
― 7 min lire
Une nouvelle méthode améliore les classificateurs de texte en générant des exemples multilingues trompeurs.
― 8 min lire
Cette étude améliore la façon dont les modèles de langage gèrent les tâches de raisonnement mathématique.
― 6 min lire
Une nouvelle méthode pour surveiller et prédire la propagation des rumeurs en ligne.
― 9 min lire
Examiner comment les réseaux sociaux alimentent les troubles alimentaires et leur impact sur les individus.
― 10 min lire
T5LLMCipher montre du potentiel pour identifier efficacement le contenu écrit par l'IA.
― 9 min lire
Un nouveau jeu de données renforce le lien entre la langue et les environnements 3D.
― 9 min lire
Examiner et classifier le langage raciste sur Twitter, en se concentrant sur l'Équateur.
― 8 min lire
Un nouveau jeu de données améliore les interactions des chatbots en intégrant les émotions et la démographie des utilisateurs.
― 8 min lire
Une étude sur la détection de contenu offensant dans plusieurs langues.
― 16 min lire
Stratégies pour améliorer les modèles QA quand les données étiquetées sont rares.
― 9 min lire
Explorer comment les gestes et les expressions améliorent notre compréhension du langage parlé.
― 9 min lire
Cette étude analyse à quel point les invites de jailbreak sont efficaces sur les modèles de langue.
― 7 min lire
Cette étude évalue la performance des modèles de langage sur des problèmes de maths modifiés.
― 6 min lire
Explore comment l'approche x-elm améliore le traitement des langues multilingues.
― 8 min lire
Améliorer les agents de dialogue en intégrant une compréhension culturelle pour des interactions plus cool.
― 7 min lire
Apprends comment les modèles de QA conversationnels changent les interactions des utilisateurs avec l'IA.
― 7 min lire
Les invites de code améliorent la performance de raisonnement dans des modèles de langage comme GPT 3.5.
― 5 min lire
Une nouvelle méthode améliore la façon dont on identifie les synonymes et les antonymes.
― 6 min lire
Un aperçu de comment la traduction automatique reflète et renforce les préjugés de genre.
― 10 min lire
Améliorer les LMM pour qu'ils réfléchissent et posent des questions pour plus de précision.
― 7 min lire
Un aperçu de comment les memes peuvent propager des messages nuisibles en ligne.
― 7 min lire
Explorer l'impact des accélérateurs matériels sur les grands modèles de langage.
― 8 min lire
MatSciRE simplifie l'extraction de données à partir d'articles en science des matériaux pour aider la recherche sur les batteries.
― 7 min lire
Enquête sur les risques des attaques de jailbreak sur les grands modèles de langage.
― 7 min lire
Une méthode pour gérer les ambiguïtés dans les noms propres grâce à la polysémie régulière.
― 9 min lire
Les tactiques de phishing évoluent avec l'IA, ce qui pose de nouveaux risques pour les organisations.
― 9 min lire
Cette étude améliore la recherche sur la jurisprudence grâce à une combinaison de modélisation de sujets et d'analyse des citations.
― 6 min lire
Apprends comment les principes FAIR guident la gestion éthique des données pour les modèles d'IA.
― 9 min lire
Une méthode pour identifier de nouveaux termes antisémites dans les discussions sur les réseaux sociaux.
― 8 min lire
Un aperçu de la Reconnaissance d'Entités Nommées et de ses applications clés.
― 9 min lire
MuMo accélère les performances des modèles de langage pour les scripts non-romains.
― 9 min lire
Explore le rôle de l'auto-formation dans l'amélioration des processus de conversion de données en texte.
― 9 min lire
Examiner l'impact de l'analyse des sentiments sur les identités et les biais bengalis.
― 6 min lire
Explorer le rôle des modèles de langage dans l'analyse de la littérature en sciences des matériaux.
― 9 min lire
Une nouvelle méthode accélère la génération de texte par LLM en utilisant des têtes de prédiction supplémentaires.
― 5 min lire
Orion-14B déchire dans la compréhension et la génération de textes multilingues avec 14 milliards de paramètres.
― 8 min lire