Movatterモバイル変換


[0]ホーム

URL:


Skip to content

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

We read every piece of feedback, and take your input very seriously.

Saved searches

Use saved searches to filter your results more quickly

Sign up

Desenvolvimento e treino de modelos CNN e Random Forest para classificação de áudios ambientes

NotificationsYou must be signed in to change notification settings

gcolussi11/Biochallenge

Repository files navigation

Sobre mim e a proposta do projeto

Oi! Meu nome é Gabriella Colussi e quando desenvolvi esse projeto estava no meu quinto semestre de Engenharia Biomédica.O projeto foi desenvolvido para uma competição nacional chamada Biochallenge, organizada pelo Inatel, de Santa Rita do Sapucaí - MG.

A proposta deles foi o desenvolvimento de um aplicativo que pudesse classificar sons ambientes. Visando essa funcionalidade, desenvolvi um pipeline simplificado de machine learning que pudesse fazer a extração de áudios do youtube, caso necessário,toda a etapa de pré-processamento requerida para que o modelo pudesse ser treinado, treino, validação e teste.

O Projeto

Este repositório lista os seguintes arquivos:Audios.ipynbModelos.ipynbbalanced_train_segments.csvdic_labels_negadas2.json

O dataset foi formado a partir da complementação de dois bancos de dados diferentes,ESC-50 e oAudioset.Considerando que o Audioset apenas referencia os segmentos de audios de links do YouTube, diferentemente do ESC-50 que já provê os áudios em formato .wav, o primeiro arquivoAudios.ipynb é um notebook destinado a filtragem delabels e download dos áudios no mesmo formato que o .wav.

O próximo noteboook,Modelos.ipynb, é o código que traz um pipeline simplificado dividio em:

  • Banco de dados;
  • Pré-Processamento dos dados;
  • Modelos

De forma resumida, o banco de dados traz a leitura e filtragem dos dados provenientes de ambos datasets, ESC-50 e Audioset, como também junta o conteúdo dos dois para melhor acesso posteriormente e cria um df para melhor mapeamento dos áudios e labels disponíveis.O pré-processamento faz a extração de features dos áudios como MFCCs e Zero-Crossing Rate que vão servir como entradas para os modelos. Por fim, a seção "Modelos" traz o treinamento e avaliação de dois modelos diferentes, Random Forest.

Já os arquivosbalanced_train_segments.csvedic_labels_negadas2.json foram arquivos auxiliares ao meu propósito de desenvolvimento, o primeiro podendo ser encontrado no próprio site do audioset e o segundo um dicionário de labels filtradas por mim.

Conclusões

Com este repositório, meu objetivo é contribuir para a comunidade de desenvolvedores e entusiastas que compartilham interesses semelhantes. Embora este seja um trabalho amador, ele reflete minha dedicação e aprendizado contínuo no campo. Estou sempre buscando aprimorar minhas habilidades e conhecimento, e espero que este projeto possa ser útil para aqueles que estão nessa mesma jornada!

Agradeço por explorar meu repositório! Estou aberta a feedbacks e sugestões.

Sinta-se à vontade para me contatar através do meuLinkedIn, até a próxima!

About

Desenvolvimento e treino de modelos CNN e Random Forest para classificação de áudios ambientes

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

[8]ページ先頭

©2009-2025 Movatter.jp