Uma olhada em como as operações de conjuntos podem ajudar a avaliar modelos de linguagem.
Bardiya Akhbari, Manish Gawali, Nicholas A. Dronen
― 7 min ler
Ciência de ponta explicada de forma simples
Uma olhada em como as operações de conjuntos podem ajudar a avaliar modelos de linguagem.
Bardiya Akhbari, Manish Gawali, Nicholas A. Dronen
― 7 min ler
OpenThaiGPT 1.5 é um chatbot avançado para tarefas em tailandês.
Sumeth Yuenyong, Kobkrit Viriyayudhakorn, Apivadee Piyatumrong
― 7 min ler
O contexto melhora a qualidade e a relevância das respostas dos modelos de linguagem.
Chaitanya Malaviya, Joseph Chee Chang, Dan Roth
― 7 min ler
Um estudo sobre duas abordagens pra melhorar o desempenho da IA em tarefas de linguagem.
Madeline Brumley, Joe Kwon, David Krueger
― 6 min ler
Pesos super são essenciais pra performance e eficiência do modelo de linguagem.
Mengxia Yu, De Wang, Qi Shan
― 5 min ler
Uma visão geral de como os modelos de linguagem aprendem e retêm informações.
Kristijan Armeni, Marko Pranjić, Senja Pollak
― 5 min ler
Pesquisadores investigam como modelos de linguagem grandes preveem sequências usando indução.
Niclas Luick
― 6 min ler
Explore como o Align-SLM tá mudando a geração de fala em computadores.
Guan-Ting Lin, Prashanth Gurunath Shivakumar, Aditya Gourav
― 7 min ler
As incorporações de neurônios esclarecem funções complicadas dos neurônios, melhorando a interpretabilidade da IA.
Alex Foote
― 6 min ler
Estudo explora como modelos de linguagem transmitem emoções e significados de forma implícita.
Joshua Tint, Som Sagar, Aditya Taparia
― 7 min ler
Uma olhada na compensação de verbosidade e seu impacto nos modelos de linguagem.
Yusen Zhang, Sarkar Snigdha Sarathi Das, Rui Zhang
― 4 min ler
Explorando como a ironia confunde os sistemas de aprendizado de máquina.
Xiaoyin Yi, Jiacheng Huang
― 6 min ler
Descubra como a sequência das informações afeta a qualidade das respostas da IA.
Tianyu Liu, Jirui Qi, Paul He
― 7 min ler
Um estudo compara modelos de IA na compreensão de relações espaciais.
Shang Hong Sim, Clarence Lee, Alvin Tan
― 7 min ler
Pesquisadores desenvolvem o DROJ pra aumentar a segurança dos modelos de linguagem contra comandos perigosos.
Leyang Hu, Boran Wang
― 7 min ler
Aprenda como a Edição de Conceitos Afins melhora a capacidade da IA de recusar pedidos de forma inteligente.
Thomas Marshall, Adam Scherlis, Nora Belrose
― 7 min ler
Analisando como o viés afeta modelos de linguagem e a interpretação de linguagem ofensiva.
Shayan Alipour, Indira Sen, Mattia Samory
― 7 min ler
Novos modelos CamemBERTav2 e CamemBERTv2 melhoram o processamento de linguagem em francês.
Wissam Antoun, Francis Kulumba, Rian Touchent
― 6 min ler
Uma olhada mais de perto em como a atenção causal molda os modelos de linguagem de IA.
Nikita Karagodin, Yury Polyanskiy, Philippe Rigollet
― 8 min ler
Automatizando correções de gramática e ortografia para erros de escrita em Bangla.
Shayekh Bin Islam, Ridwanul Hasan Tanvir, Sihat Afnan
― 6 min ler
Métodos focados em precisão melhoram a eficiência na seleção de ferramentas dos modelos de linguagem.
Hang Gao, Yongfeng Zhang
― 7 min ler
Um novo método chamado AVA melhora o alinhamento em modelos de linguagem para resultados mais seguros.
Yuang Cai, Yuyu Yuan, Jinsheng Shi
― 5 min ler
Um novo sistema melhora a adaptabilidade de grandes modelos de linguagem em diferentes dispositivos.
Yonggan Fu, Zhongzhi Yu, Junwei Li
― 5 min ler
O SoftLM deixa os modelos de linguagem menores e mais rápidos pra uso diário.
Priyansh Bhatnagar, Linfeng Wen, Mingu Kang
― 8 min ler
Explorando a esparsidade de ativação pra melhorar a eficiência de modelos de linguagem.
Yuqi Luo, Chenyang Song, Xu Han
― 6 min ler
NeKo melhora a comunicação entre máquinas corrigindo erros de fala, traduções e texto.
Yen-Ting Lin, Chao-Han Huck Yang, Zhehuai Chen
― 7 min ler
Um olhar profundo sobre como nossos cérebros reagem ao diálogo dos filmes.
Christopher Wang, Adam Uri Yaari, Aaditya K Singh
― 7 min ler
Descubra como os LLMs ajudam a encontrar as ferramentas certas para os usuários.
Mohammad Kachuee, Sarthak Ahuja, Vaibhav Kumar
― 6 min ler
Pesquisas mostram como modelos de linguagem podem agilizar a meta-análise, economizando tempo para os pesquisadores.
Jawad Ibn Ahad, Rafeed Mohammad Sultan, Abraham Kaikobad
― 7 min ler
Modelos de linguagem têm dificuldade com perguntas populares, resultando em respostas rasas e inconsistências.
Prasoon Bajpai, Sarah Masud, Tanmoy Chakraborty
― 6 min ler
Este artigo analisa como identificar sátira usando modelos de linguagem.
Omar W. Abdalla, Aditya Joshi, Rahat Masood
― 7 min ler
Um novo conjunto de dados para embeddings de palavras em quirguiz melhora as capacidades de processamento de linguagem.
Anton Alekseev, Gulnara Kabaeva
― 6 min ler
Um novo método ajuda a proteger modelos de linguagem de ataques backdoor prejudiciais.
Nay Myat Min, Long H. Pham, Yige Li
― 6 min ler
Pesquisadores estão melhorando modelos de palavras pra reduzir o viés de gênero no processamento de linguagem.
Navya Yarrabelly, Vinay Damodaran, Feng-Guang Su
― 6 min ler
Criando um modelo de IA pra conversas naturais em mandarim taiwanês.
Chih-Kai Yang, Yu-Kuan Fu, Chen-An Li
― 5 min ler
Modelos de Nougat em árabe facilitam a conversão de páginas impressas em árabe para Markdown.
Mohamed Rashad
― 7 min ler
Um método pra melhorar a retenção de detalhes importantes nos LLMs em textos longos.
Zhuohan Gu, Jiayi Yao, Kuntai Du
― 6 min ler
Pesquisadores avaliam vários modelos de busca em tcheco, destacando pontos fortes e fracos.
Jakub Stetina, Martin Fajcik, Michal Stefanik
― 5 min ler
Um olhar sobre como truques ocultos afetam modelos de linguagem e suas explicações.
Huaizhi Ge, Yiming Li, Qifan Wang
― 7 min ler
Saiba mais sobre Modelos de Linguagem Grandes e seu impacto no processamento de linguagem.
Xiaoliang Luo, Michael Ramscar, Bradley C. Love
― 7 min ler