Inovações na Transcrição em Pesquisa Qualitativa em Saúde
Explorando o impacto do Vink na transcrição de dados qualitativos.
― 6 min ler
Índice
Recentemente, métodos de pesquisa qualitativa ficaram mais populares nos estudos de saúde. Esses métodos se concentram em entender as experiências e perspectivas das pessoas, o que pode levar a soluções melhores para problemas de saúde. Uma parte importante desse processo é a Transcrição, onde conversas gravadas de entrevistas ou discussões são transformadas em texto escrito. A transcrição adequada é fundamental para capturar a essência do que foi dito e garantir a qualidade dos Dados coletados.
A Importância e os Desafios da Transcrição
A transcrição é vital para a pesquisa qualitativa porque ajuda a criar um registro preciso do que foi discutido. Escolher a maneira certa de transcrever é essencial. Por exemplo, os Pesquisadores podem optar por capturar cada palavra, incluindo sons como "uh-huh" ou "umm", ou podem escolher focar apenas no diálogo principal. As decisões tomadas durante a transcrição podem afetar a confiabilidade da pesquisa, mas esse passo muitas vezes recebe pouco destaque na escrita acadêmica.
Pesquisas mostraram que muitos estudos nem mencionam como a transcrição foi feita. Essa falta de foco é surpreendente, já que a transcrição é uma prática comum em muitos estudos Qualitativos.
Diferentes Métodos de Transcrição
Existem três maneiras principais de transcrever Áudio gravado:
Transcrição Manual: Esse método envolve um pesquisador ou uma equipe ouvindo o áudio e digitando. Embora essa abordagem permita um envolvimento profundo com os dados, ela é também muito demorada. Para cada hora de áudio, pode levar de seis a sete horas para transcrever.
Serviços de Transcrição Profissional: Pesquisadores podem enviar seus arquivos de áudio para empresas que se especializam em transcrição. Embora isso possa economizar tempo, pode também aumentar os custos e resultar em qualidade variável, já que os transcritores podem não estar familiarizados com o conteúdo da pesquisa.
Transcrição Baseada em Software: Existem vários programas disponíveis que podem transcrever automaticamente gravações de áudio. Esses programas permitem que os pesquisadores façam upload de seus arquivos de áudio e recebam transcrições escritas. No entanto, a precisão desses programas pode variar, especialmente com áudio de baixa qualidade ou conversas com múltiplos falantes.
Cada método tem suas vantagens e desafios, mas muitos pesquisadores enfrentam atrasos na obtenção de transcrições, o que pode afetar a relevância de seus dados.
O Crescimento de Ferramentas de Transcrição de Código Aberto
Para enfrentar os desafios existentes na transcrição, alguns cientistas da computação e engenheiros de software estão trabalhando em algoritmos de reconhecimento de fala (STT) de código aberto. Essas ferramentas oferecem opções gratuitas para transcrever áudio, tornando-as acessíveis a muitos pesquisadores. No entanto, poucas dessas ferramentas são projetadas especificamente para pesquisa qualitativa.
Uma dessas ferramentas é chamada Vink. Ela foi criada para ser amigável e atender às necessidades de pesquisadores que precisam de transcrição confiável e precisa de entrevistas.
Desenvolvimento do Vink: Uma Nova Ferramenta de Transcrição
A ferramenta Vink é baseada em um sistema de reconhecimento de fala desenvolvido pela OpenAI. Ela pode lidar com vários idiomas e está equipada para transcrever áudio que inclui ruído de fundo ou diferentes sotaques. O sistema roda localmente no computador do usuário, o que significa que dados sensíveis permanecem privados e não são enviados para serviços externos.
Para tornar o Vink acessível, ele foi criado como um aplicativo independente que não requer habilidades avançadas de programação. Essa abordagem permite que pesquisadores com conhecimento técnico limitado usem a ferramenta de forma eficaz.
Avaliando a Qualidade da Transcrição do Vink
Para avaliar como o Vink funciona, os pesquisadores o testaram usando dados de áudio da vida real em diferentes idiomas. Eles analisaram quão precisamente o Vink transcreveu as gravações de áudio e quão fácil era para os usuários entenderem e corrigirem as transcrições geradas automaticamente.
Os resultados mostraram que, enquanto o Vink teve um bom desempenho para muitos idiomas, houve algumas discrepâncias. Por exemplo, alguns idiomas produziram resultados menos precisos do que outros devido à limitação de dados de treinamento. Revisores que usaram o Vink para avaliar sua saída indicaram que muitas vezes precisavam corrigir as transcrições, especialmente em casos onde pistas não verbais, como pausas, risadas ou interrupções, foram omitidas.
Testes de Usabilidade e Feedback
Para garantir que o Vink seja amigável, ele foi testado por pessoas sem experiência anterior em ciência computacional. Elas receberam instruções para ajudá-las a navegar pela ferramenta. O feedback revelou alguns desafios, como dificuldades em localizar o arquivo executável ou confusão sobre os tipos de arquivos de texto que podiam ser usados. Melhorias foram feitas para resolver essas questões, incluindo a adição de um instalador para simplificar o processo de configuração.
O Valor do Vink para Pesquisadores
O Vink oferece uma opção gratuita para transcrever dados qualitativos, tornando-se especialmente valioso para pesquisadores que trabalham com orçamentos apertados. Ele é fácil de usar e não requer conexão à internet, o que protege a confidencialidade dos dados sensíveis.
A precisão das transcrições produzidas pelo Vink é essencial para a pesquisa qualitativa, que depende de representações detalhadas e nuançadas das conversas. Embora o Vink possa ajudar a acelerar o processo de transcrição, os pesquisadores ainda devem revisar e revisar as transcrições geradas para garantir que reflitam com precisão as gravações originais.
Limitações e Direções Futuras
Atualmente, o Vink é compatível apenas com computadores Windows, restringindo sua base de usuários potencial. No entanto, há planos para versões futuras que estarão disponíveis para usuários de macOS e Linux. Além disso, avaliações mais abrangentes do Vink serão realizadas em vários ambientes para entender melhor seu desempenho, especialmente em condições desafiadoras, como discussões em grupo ou ambientes barulhentos.
Conclusão
O desenvolvimento do Vink demonstra o potencial das ferramentas de transcrição de código aberto na pesquisa qualitativa. Tais ferramentas podem ajudar os pesquisadores a economizar tempo e recursos, permitindo que se envolvam mais profundamente com seus dados. À medida que a tecnologia nessa área continua a evoluir, esperamos ver melhorias na precisão e usabilidade, que beneficiarão, em última análise, os pesquisadores em vários campos.
Ao compartilhar nossas experiências e descobertas relacionadas ao Vink, esperamos estimular discussões sobre as melhores práticas em transcrição e suas implicações para a pesquisa qualitativa. Convidamos outros a compartilharem suas experiências com transcrição automatizada e aguardamos a evolução de ferramentas que atendam melhor às necessidades da comunidade.
Título: From voice to ink (VINK): Development and assessment of an automated, free-of-charge transcription tool
Resumo: Verbatim transcription of qualitative data is a cornerstone of analytic quality and rigor, yet the time and energy required for such transcription can drain resources, delay analysis and hinder the timely dissemination of qualitative insights. In recent years, software programs have presented a promising mechanism to accelerate transcription, but the broad application of such programs has been constrained due to expensive licensing or "per-minute" fees, data protection concerns, and limited availability of such programs in many languages. In this article, we outline our process of developing and adapting a free, open-source, speech-to-text algorithm (Whisper by OpenAI) into a usable and accessible tool for qualitative transcription. Our program, which we have dubbed "Vink" for voice to ink, is available under a permissive open-source license (and thus free of cost). We assessed Vinks reliability in transcribing authentic interview audio data in 14 languages, and identified high accuracy and limited correction times in most languages. A majority (9 out of 12) of reviewers evaluated the software performance positively, and all reviewers whose transcript had a word-error-rate below 20% (n=9) indicated that they were likely or very likely to use the tool in their future research. Our usability assessment indicates that Vink is easy-to-use, and we are continuing further refinements based on reviewer feedback to increase user-friendliness. With Vink, we hope to contribute to facilitating rigorous qualitative research processes globally by reducing time and costs associated with transcription, and expanding the availability of this transcription software into several global languages. With Vink running on the researchers computers, data privacy issues arising within many other solutions do not apply. Summary boxO_LIWhat is already known on this topic: Transcription is a key element to ensure quality and rigor of qualitative data for analysis. Current practices, however, often entail high costs, variable quality, data privacy concerns, stress for human transcribers, or long delays of analysis. C_LIO_LIWhat this study adds: We present the development and assessment of a transcription tool (Vink) for qualitative research drawing upon an open-source automatic speech recognition system developed by OpenAI and trained on multilingual audio data (Whisper). Initial validation in real-life data from 14 languages shows high accuracy in several languages, and an easy-to-use interface. C_LIO_LIHow this study might affect research, practice or policy: Vink overcomes limitations of transcription by providing a ready to use, open source and free-of-cost tool, with minimal data privacy concerns, as no data is uploaded to the web during transcription. C_LI
Autores: Hannah Tolle, M. d. M. Castro, J. Wachinger, A. Z. Putri, D. Kempf, C. M. Denkinger, S. A. McMahon
Última atualização: 2023-05-21 00:00:00
Idioma: English
Fonte URL: https://www.medrxiv.org/content/10.1101/2023.05.04.23289518
Fonte PDF: https://www.medrxiv.org/content/10.1101/2023.05.04.23289518.full.pdf
Licença: https://creativecommons.org/licenses/by-nc/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao medrxiv pela utilização da sua interoperabilidade de acesso aberto.