Checklist Essencial para Pesquisa em Aprendizado de Máquina
Garanta que sua pesquisa siga as melhores práticas em aprendizado de máquina.
― 5 min ler
Índice
- Afirmativas e Contribuições
- Suposições Teóricas e Provas
- Resultados Experimentais e Reprodutibilidade
- Configuração e Detalhes Experimentais
- Recursos Computacionais
- Código de Ética
- Impactos Mais Amplos
- Ativos Existentes
- Novos Ativos
- Crowdsourcing e Sujeitos Humanos
- Aprovações do Comitê de Ética (IRB)
- Conclusão
- Fonte original
- Ligações de referência
Essa lista de verificação foi feita pra ajudar pesquisadores a garantir que seus artigos sigam as melhores práticas em aprendizado de máquina. Ela cobre áreas importantes como Reprodutibilidade, transparência, Considerações Éticas e Impacto Social. A lista deve ser incluída com o artigo e é parte essencial do processo de submissão.
Afirmativas e Contribuições
- Afirmativas Claras: O resumo e a introdução devem explicar claramente o que o artigo afirma. Isso inclui dizer quais são as contribuições feitas e notar quaisquer suposições ou Limitações importantes. Se as afirmativas não baterem com os resultados, pode refletir mal no artigo.
- Limitações: O artigo precisa abordar quaisquer limitações. Se não houver, isso deve ser declarado. Uma seção separada de "Limitações" é encorajada.
- Suposições: O artigo deve deixar claras as suposições fortes e discutir como os resultados são robustos se essas suposições forem violadas.
- Escopo das Afirmativas: Os autores devem refletir sobre quão amplamente as afirmativas se aplicam, especialmente se o método foi testado em apenas alguns conjuntos de dados ou execuções.
- Fatores de Desempenho: Comente sobre como diferentes fatores podem afetar o desempenho do método. Por exemplo, um sistema de reconhecimento facial pode ter dificuldades com imagens de baixa qualidade.
- Eficiência Computacional: Discuta como os métodos propostos desempenham com tamanhos variados de conjuntos de dados.
- Privacidade e Justiça: Se aplicável, quaisquer limitações relacionadas à privacidade e justiça devem ser abordadas.
Suposições Teóricas e Provas
- Resultados Teóricos: Se o artigo inclui resultados teóricos, todos os teoremas e provas devem ser numerados e referenciados.
- Suposições em Teoremas: Quaisquer suposições devem ser claramente mencionadas nos teoremas.
- Provas: As provas podem estar no artigo principal ou em material suplementar. Se estiverem em material suplementar, um resumo breve é encorajado.
- Referências: Teoremas e provas utilizadas devem ser devidamente referenciadas.
Resultados Experimentais e Reprodutibilidade
- Experimentos Inclusos: Se o artigo inclui experimentos, deve detalhar como reproduzir os resultados, mesmo que o código e os dados não sejam fornecidos.
- Passos para Reprodutibilidade: Para conjuntos de dados ou modelos, descreva os passos tomados para garantir que os resultados sejam reprodutíveis. Isso pode envolver fornecer acesso ao modelo ou descrever a arquitetura em detalhe.
- Liberação de Código e Dados: Embora compartilhar código e dados seja encorajado, é aceitável dizer "Não" se o compartilhamento não for possível. No entanto, o artigo deve oferecer uma maneira razoável para que outros reproduzam os resultados.
- Instruções: Inclua instruções claras sobre acesso a dados e preparação para reprodutibilidade.
Configuração e Detalhes Experimentais
- Detalhes sobre Experimentos: O artigo deve dar detalhes suficientes sobre a configuração experimental para que outros entendam como os resultados foram obtidos.
- Significância Estatística: Se aplicável, os resultados devem ser acompanhados de barras de erro, intervalos de confiança ou testes de significância. Os autores devem explicar claramente como isso foi calculado.
Recursos Computacionais
- Requisitos de Computação: O artigo deve dizer que tipo de hardware (CPU ou GPU) foi usado e quanto de computação foi necessário para os experimentos.
- Estimativa Total de Computação: Inclua estimativas do total de computação usada no projeto, não apenas nos experimentos reportados.
Código de Ética
- Revisão Ética: Os autores devem confirmar se revisaram o Código de Ética e explicar quaisquer desvios se necessário.
Impactos Mais Amplos
- Impacto Social: Discuta quaisquer potenciais impactos sociais negativos da pesquisa. Isso pode incluir mau uso da tecnologia, problemas de privacidade ou considerações de justiça.
- Estratégias de Mitigação: Se houver impactos negativos, os autores devem discutir como poderiam abordar esses riscos.
Ativos Existentes
- Citação de Ativos: O artigo deve citar quaisquer conjuntos de dados ou códigos existentes usados na pesquisa. Também deve informar a versão utilizada e incluir informações de licença.
Novos Ativos
- Detalhes sobre Novos Ativos: Se o artigo introduz novos conjuntos de dados ou modelos, deve comunicar detalhes importantes como treinamento, licenciamento e limitações.
- Consentimento: Se aplicável, discuta se o consentimento foi obtido de indivíduos cujos dados estão incluídos.
Crowdsourcing e Sujeitos Humanos
- Detalhes sobre Pesquisa com Humanos: Se a pesquisa envolve sujeitos humanos, forneça o máximo de detalhes possível sobre os métodos de pesquisa e os sujeitos.
Aprovações do Comitê de Ética (IRB)
- Aprovação Ética: Se necessário, declare se a aprovação do IRB foi obtida para qualquer pesquisa envolvendo sujeitos humanos.
Conclusão
Essa lista de verificação visa promover altos padrões na pesquisa em aprendizado de máquina. Seguindo essas diretrizes, os pesquisadores podem garantir que seu trabalho seja responsável, transparente e impactante.
Título: Fast and Efficient: Mask Neural Fields for 3D Scene Segmentation
Resumo: Understanding 3D scenes is a crucial challenge in computer vision research with applications spanning multiple domains. Recent advancements in distilling 2D vision-language foundation models into neural fields, like NeRF and 3DGS, enable open-vocabulary segmentation of 3D scenes from 2D multi-view images without the need for precise 3D annotations. However, while effective, these methods typically rely on the per-pixel distillation of high-dimensional CLIP features, introducing ambiguity and necessitating complex regularization strategies, which adds inefficiency during training. This paper presents MaskField, which enables efficient 3D open-vocabulary segmentation with neural fields from a novel perspective. Unlike previous methods, MaskField decomposes the distillation of mask and semantic features from foundation models by formulating a mask feature field and queries. MaskField overcomes ambiguous object boundaries by naturally introducing SAM segmented object shapes without extra regularization during training. By circumventing the direct handling of dense high-dimensional CLIP features during training, MaskField is particularly compatible with explicit scene representations like 3DGS. Our extensive experiments show that MaskField not only surpasses prior state-of-the-art methods but also achieves remarkably fast convergence. We hope that MaskField will inspire further exploration into how neural fields can be trained to comprehend 3D scenes from 2D models.
Autores: Zihan Gao, Lingling Li, Licheng Jiao, Fang Liu, Xu Liu, Wenping Ma, Yuwei Guo, Shuyuan Yang
Última atualização: 2024-12-19 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2407.01220
Fonte PDF: https://arxiv.org/pdf/2407.01220
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.