Simple Science

Ciência de ponta explicada de forma simples

# Informática# Computadores e sociedade# Inteligência Artificial

A Crescente Diferença nos Recursos de Pesquisa em IA

Analisando como o poder de computação afeta a pesquisa em IA na academia e na indústria.

― 8 min ler


Divisão de Recursos deDivisão de Recursos deIA: Indústria vs.Academiaas contribuições acadêmicas.A dominância da indústria em IA limita
Índice

A inteligência artificial (IA) e o aprendizado de máquina (AM) se tornaram essenciais em várias Indústrias. Com o aumento dos recursos computacionais poderosos, a diferença entre a indústria e a academia em relação ao acesso a esses recursos tá aumentando. Essa divisão afeta como a pesquisa é feita e quem lidera os avanços nessa área. Este artigo explora como as diferenças no poder computacional impactam as contribuições acadêmicas para o aprendizado de máquina e por que isso é importante.

A Divisão Computacional

Tem uma diferença clara em como a indústria e a academia usam os recursos computacionais para a pesquisa em IA. Os laboratórios da indústria geralmente têm acesso a computadores muito mais potentes e orçamentos maiores do que as instituições acadêmicas. Essa divisão é particularmente evidente nas áreas de aprendizado de máquina que exigem muitos recursos computacionais. A capacidade da indústria de aproveitar esse poder computacional tem levado a uma mudança sobre quem domina áreas significativas de pesquisa, especialmente aquelas que envolvem Modelos grandes, como modelos de linguagem.

Impacto nas Contribuições de Pesquisa

A tendência mostra que menos modelos de aprendizado de máquina em larga escala estão sendo desenvolvidos por instituições acadêmicas. No passado, a academia era responsável por uma parte significativa desses desenvolvimentos. Por exemplo, no início dos anos 2010, cerca de 65% dos modelos notáveis vinham de laboratórios Acadêmicos. No entanto, no início dos anos 2020, esse número caiu para cerca de 10%. Como resultado, os laboratórios da indústria passaram a dominar o treinamento de modelos em larga escala, com mais de 80% dos modelos vindo apenas de equipes da indústria.

Essa mudança levanta preocupações sobre o papel dos pesquisadores acadêmicos nas contribuições para os avanços do aprendizado de máquina. A pesquisa focada na indústria frequentemente visa aplicações comerciais, o que pode deixar de lado investigações acadêmicas importantes que não têm potencial de lucro imediato. A falta de contribuição acadêmica pode dificultar perspectivas diversas e avaliações críticas necessárias para o desenvolvimento responsável da IA.

Razões para a Divisão Computacional

A divisão nos recursos computacionais pode ser atribuída a vários fatores:

Desafios de Financiamento

Pesquisadores acadêmicos geralmente lidam com financiamento limitado, o que restringe sua capacidade de adquirir o hardware computacional mais recente. Em contraste, laboratórios da indústria podem justificar orçamentos significativos para experimentos já que esperam um retorno sobre o investimento através de produtos comerciais. Consequentemente, os altos custos associados ao treinamento de IA podem fazer com que pesquisadores acadêmicos foquem em projetos que exigem menos poder computacional.

Expertise em Engenharia

Configurar e gerenciar clusters computacionais poderosos exige conhecimento especializado. Enquanto a indústria pode contratar equipes de engenheiros com as habilidades necessárias, a academia geralmente não tem esses recursos dedicados. Muitos pesquisadores trabalham em pequenas equipes ou individualmente, o que dificulta lidar com as complexidades das montagens de hardware em larga escala.

Acesso a Redes Computacionais

Os jogadores da indústria geralmente têm melhor acesso a data centers e recursos, às vezes com pouco ou nenhum custo. As principais empresas de tecnologia também são provedores de serviços em nuvem, o que significa que têm a infraestrutura disponível para suas equipes de pesquisa. Essa vantagem facilita para os pesquisadores da indústria realizar experimentos que requerem muitos recursos computacionais.

Diferenças de Foco de Pesquisa

O foco da indústria tende a ser na comercialização da pesquisa, o que os leva a priorizar projetos que trazem benefícios imediatos. Em contraste, a pesquisa acadêmica é frequentemente mais exploratória e pode nem sempre precisar de extensos recursos computacionais. Essa diferença de prioridades pode contribuir para a ampliação da lacuna nas saídas de pesquisa entre os dois setores.

Consequências da Divisão Computacional

A ampliação da divisão computacional tem várias implicações para o cenário da pesquisa em aprendizado de máquina:

Mudança nos Tópicos de Pesquisa

À medida que a indústria assume a liderança em áreas de alto consumo computacional, a academia provavelmente vai se voltar para tópicos de pesquisa que exigem menos. Essa mudança pode levar a um foco mais estreito na pesquisa acadêmica, limitando a exploração de áreas complexas e inovadoras que requerem um poder computacional significativo.

Desvalorização dos Modelos Fundamentais

A indústria se tornou a força principal por trás do desenvolvimento de grandes modelos fundamentais, como modelos de linguagem avançados. Muitas das inovações e quebras de paradigma nesse espaço agora são impulsionadas pela indústria, com a academia desempenhando um papel muito menor. A falta de envolvimento acadêmico significa que algumas questões cruciais sobre as capacidades e limitações desses modelos podem não ser examinadas a fundo.

Scrutínio Limitado dos Sistemas de IA

Com a predominância da indústria no desenvolvimento de grandes modelos, existe o risco de um escrutínio reduzido desses sistemas. A avaliação e teste críticos dos artefatos de aprendizado de máquina são vitais para entender seus riscos e limitações. Se o papel da academia diminuir, isso pode prejudicar o escrutínio geral necessário para garantir um desenvolvimento responsável e seguro da IA.

Recomendações de Políticas

Para enfrentar os desafios decorrentes da divisão computacional, várias intervenções políticas podem ajudar a preencher a lacuna entre a academia e a indústria:

Melhorar o Acesso ao Computador

Iniciativas nacionais voltadas a fornecer às instituições acadêmicas um melhor acesso a recursos computacionais podem ajudar a nivelar o campo. Ao apoiar a academia com subsídios e infraestrutura, os pesquisadores podem realizar projetos de alto impacto que requerem um poder computacional extensivo. Esse suporte é crucial para áreas que focam na interpretação e segurança de modelos de IA.

Promover Iniciativas de Ciência Aberta

Incentivar pesquisadores acadêmicos a participar de ciência aberta pode reduzir significativamente o impacto da divisão computacional. Compartilhar modelos pré-treinados ou conjuntos de dados pode empoderar pesquisadores não ligados à indústria a contribuir para a comunidade de pesquisa, permitindo perspectivas e inovações diversificadas. A ciência aberta promove colaboração, o que pode ajudar a enfrentar desafios que foram negligenciados por iniciativas focadas na indústria.

Acesso Estruturado a Modelos da Indústria

Criar programas de acesso estruturado permite que pesquisadores acadêmicos avaliem e estudem modelos da indústria ao mesmo tempo que respeitam a propriedade intelectual. Ao controlar como esses modelos podem ser usados, os pesquisadores podem obter insights sem comprometer os interesses dos desenvolvedores. Essa abordagem ajuda a facilitar o escrutínio independente e apoia Pesquisas de alta qualidade.

Auditoria de Terceiros

Estabelecer práticas de auditoria de terceiros pode garantir que os sistemas de IA desenvolvidos pela indústria sejam avaliados por especialistas independentes. Esse processo ajudaria a validar as alegações sobre a segurança e eficácia desses sistemas e promoveria a responsabilidade dentro da indústria. As auditorias de terceiros também podem preencher a lacuna entre a pesquisa acadêmica e as práticas da indústria, oferecendo uma oportunidade de colaboração.

Conclusão

A divisão entre os recursos computacionais disponíveis para a indústria e a academia impacta significativamente o cenário da pesquisa em IA e aprendizado de máquina. À medida que a indústria continua a dominar o desenvolvimento de modelos em larga escala, as contribuições acadêmicas podem diminuir, levando a menos perspectivas diversificadas e menos escrutínio crítico de sistemas de IA poderosos. Enfrentar essa situação requer esforços colaborativos e intervenções políticas para garantir que a academia possa continuar sendo um jogador vital no desenvolvimento responsável das tecnologias de IA. Ao melhorar o acesso a recursos computacionais, promover ciência aberta e incentivar avaliações independentes, podemos trabalhar em direção a um ecossistema de pesquisa mais equilibrado, onde tanto a indústria quanto a academia contribuam para o avanço do aprendizado de máquina de forma responsável e transparente.

Fonte original

Título: The Compute Divide in Machine Learning: A Threat to Academic Contribution and Scrutiny?

Resumo: There are pronounced differences in the extent to which industrial and academic AI labs use computing resources. We provide a data-driven survey of the role of the compute divide in shaping machine learning research. We show that a compute divide has coincided with a reduced representation of academic-only research teams in compute intensive research topics, especially foundation models. We argue that, academia will likely play a smaller role in advancing the associated techniques, providing critical evaluation and scrutiny, and in the diffusion of such models. Concurrent with this change in research focus, there is a noticeable shift in academic research towards embracing open source, pre-trained models developed within the industry. To address the challenges arising from this trend, especially reduced scrutiny of influential models, we recommend approaches aimed at thoughtfully expanding academic insights. Nationally-sponsored computing infrastructure coupled with open science initiatives could judiciously boost academic compute access, prioritizing research on interpretability, safety and security. Structured access programs and third-party auditing may also allow measured external evaluation of industry systems.

Autores: Tamay Besiroglu, Sage Andrus Bergerson, Amelia Michael, Lennart Heim, Xueyun Luo, Neil Thompson

Última atualização: 2024-01-08 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2401.02452

Fonte PDF: https://arxiv.org/pdf/2401.02452

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes