Ajude o IFG a criar um conjunto de dados biométricos de voz!

Grave algumas amostras de sua voz para ajudar a montarmos um conjuntos de dados para treino de algoritmos de inteligência artificial.

Todo o processo leva menos de cinco minutos e fique tranquilo, pois todos os dados coletados são anônimos.

gravar

0 pessoas já colaboraram.

O que é?

Esta é a plataforma de coleta de dados biométricos do Projeto de Inovação Tecnológica denominado “Avaliação de Redes Neurais Profundas no Reconhecimento de Voz” .

Esse projeto é realizado por Bruno de Araújo Alves (orientando), Dr. Hugo Vinícius Leão e Silva (orientador) e Dr. Daniel Xavier de Sousa (co-orientador), respectivamente discente e docentes do curso de bacharelado em Ciência da Computação do Instituto Federal de Goiás em Anápolis.

Com isso, pode-se criar novas aplicações que permitam, por exemplo, identificar e autorizar a entrada de pessoas utilizando apenas a sua voz. Neste contexto de pandemia, as pessoas devem usar máscara para evitar ainda mais infecções pelo Sars-Cov-2, dificultando algoritmos de reconhecimento facial, como apresentado num relatório do Instituto Nacional de Padrões e Tecnologia dos Estados Unidos (NIST) em 2020.

Sendo assim, o propósito deste projeto é auxiliar os integrantes na coleta de sinais de voz para verificar a precisão de algoritmos de aprendizado de máquina no reconhecimento de pessoas. Daí, pode-se criar novas soluções tecnológicas desenvolvidas no Brasil que permitam a identificação e a autenticação de pessoas para criar soluções cada vez mais seguras na autorização da entrada de pessoas em locais com acesso restrito.

Para tanto, é de suma importância que exista uma base de dados de amostras de voz de diversas pessoas do Brasil. Nesse sentido, criamos esta plataforma, que coletará apenas informações anônimas, como sexo, idade e o estado brasileiro que você julga ser o mais próximo do seu sotaque. Em nenhum momento serão coletados dados como seu nome, RG, CPF, e-mail ou quaisquer outros dados que possam identificá-lo.

Ao fim deste projeto, os dados aqui coletados podem ser disponibilizados publicamente, permitindo que outras Instituições de Ensino possam utilizá-los para desenvolver outras soluções, contribuindo para o avanço da Ciência e Tecnologia no Brasil.

Se você concordar com o texto acima, pode iniciar o processo de coleta de amostras de voz clicando no botão abaixo, que leva menos de cinco minutos.

gravar

Como posso ajudar?

Você pode ajudar gravando dez amostras de sua voz e, também, divulgando a plataforma para seus familiares e amigos utilizando os botões abaixo.

Quais dados serão coletados?

  • Sexo
  • Idade
  • Sotaque (por estado)
  • Dez arquivos de áudio, sendo duas repetições para cada uma das cinco frases
  • Código identificador único (gerado aleatoriamente)

Não são coletados dados que possam identificá-lo.

Logo do Instituto Federal de Goiás Logo de Ciência da Computação IFG Câmpus Anápolis