Ir para conteúdo
Faça parte da equipe! (2024) ×
Conheça nossa Beta Zone! Novas áreas a caminho! ×
  • Quem está por aqui   0 membros estão online

    • Nenhum usuário registrado visualizando esta página.

[Tutorial] aTrain – Como transcrever videos localmente no seu PC


 Compartilhar

Posts Recomendados

  • Velha Guarda Ex-Staffer

aTrain é um software de transcrição e diarização de áudios muito utilizado para legendar entrevistas, audiências, etc.

 

Dessa vez graças ao povo da Universidade de Graz, na Áustria. Eles unificaram tudo em uma ferramenta facílima de usar, o aTrain. E sim, é Open Source. O aTrain é uma solução completa de transcrição, diarização e legendação de áudios e vídeos.

 

Melhor ainda: Ele roda tanto em placas de vídeo (nVidia) com no mínimo 6GB de VRAM, ou direto em CPU, só demorando (bem) mais para realizar a transcrição. Mesmo assim, ordens de magnitude mais rápido do que manualmente.

 

Ele entende inglês, português e uma penca de outros idiomas.


Depois de tudo baixado e instalado, execute o aTrain, clicando em Escolher Arquivo a gente... escolhe o arquivo para ser transcrito

 

A opção seguinte é onde selecionamos o modelo de IA para fazer a transcrição. Quanto menor, mais rápido, mas perdemos em precisão. O médio é suficiente para a maioria dos usos, mas sendo honesto, o bicho é tão rápido que o modelo large-v2 deve ser usado como padrão.

 


Screenshot_39-680x584.jpg

 

A seleção de idioma é opcional, mas eu recomendo, evita que o aTrain se confunda.


Multispeaker é onde você sai da transcrição simples do Whisper para a diarização, separando por participante. Selecione Multispeaker. Ele pedirá o número de participantes. Não é obrigatório, mas ajuda bastante. No caso como é uma entrevista simples, selecionei dois.


Screenshot_34-585x680.jpg

 

Feito isso, agora basta apertar START

 

Em Advanced Settings há uma opção de Compute Type, int8 ou float16. É a representação interna numérica usada pela GPU. Se sua placa for uma Nvidia decente, selecione float16, o ganho de velocidade é absurdo.


Screenshot_41-680x582.jpg

 

A tela de finalização dá a opção de abrir a pasta com as transcrições. Normalmente elas ficam em:

 

C:\Users\<username>\Documents\aTrain\transcriptions


Screenshot_43.jpg

 

 

arquivo metadata.txt traz informações sobre o comprimento do áudio transcrito, idioma e outros dados. É ótimo para comparar resultados e configurações.

 

Transcription.json é o arquivo principal com todas as informações transcritas, um bom programador pode se divertir com ele, mas não é para nos preocuparmos com esse arquivo.

 

transcription.srt é a transcrição em formato de legenda, pronto para ser lido no VLC ou em praticamente qualquer outro player de vídeo.

transcription.txt, se a opção de Multispeaker tiver sido selecionada, será  a transcrição com cada participante identificado. O padrão é SPEAKER_01, SPEAKER_02, SPEAKER_03... você, claro, irá usar um simples comando de substituição para trocar pelo nome do interlocutor, claro.

 

transcription_maxqda.txt traz a transcrição com informações de timestamp, mostrando onde na linha do tempo cada frase foi dita. Isso é essencial para localizar o trecho na gravação, quando você precisa recuperar aquela parte do vídeo para usar em alguma coisa.

transcription_timestamps.txt separa linha a linha, marcando a timestamp, mais fácil de identificar o momento, mas mais chato de ler.


Baixei um tutorial em ingles no Youtube e criou a legenda em 5min num video de 68mb de 28min

 

6QgAQbZ.jpeg

 

K4vPNew.jpeg

 

6nyRuU3.jpeg

 


Contras:

O aTrain não é perfeito. Mas de longe é muito melhor do que transcrever dialogo por dialogo na mão. Ele às vezes se confunde com falas rápidas, e quando pessoas falam ao mesmo tempo, ele não consegue transcrever o áudio. E Arquivos de videos/audio MUITO longos (nada de transcrever filmes  tá pessoal kkkkk)

Não é aconselhável rodar o aTrain e disponibilizar o resultado imediatamente, sem revisão, mas isso vale para qualquer trabalho.

 

 

Onde Baixar o aTrain?

 

É necessário se cadastrar para acessar o conteúdo.

 

  • Curtir 5

qRXaV1L.png

Link para o comentário
Compartilhar em outros sites

 Compartilhar

×
×
  • Criar Novo...

Informação Importante

Nós fazemos uso de cookies no seu dispositivo para ajudar a tornar este site melhor. Você pode ajustar suas configurações de cookies , caso contrário, vamos supor que você está bem para continuar.