NotificationsYou must be signed in to change notification settings
Fork0
Star0

Desenvolvimento e treino de modelos CNN e Random Forest para classificação de áudios ambientes

You must be signed in to change notification settings

Folders and files

Name		Name	Last commit message	Last commit date
Latest commit History 38 Commits
Audios.ipynb		Audios.ipynb
Modelos.ipynb		Modelos.ipynb
README.md		README.md
balanced_train_segments.csv		balanced_train_segments.csv
dic_labels_negadas2.json		dic_labels_negadas2.json

Repository files navigation

Classificador de sons ambientes

Sobre mim e a proposta do projeto

Oi! Meu nome é Gabriella Colussi e quando desenvolvi esse projeto estava no meu quinto semestre de Engenharia Biomédica.O projeto foi desenvolvido para uma competição nacional chamada Biochallenge, organizada pelo Inatel, de Santa Rita do Sapucaí - MG.

A proposta deles foi o desenvolvimento de um aplicativo que pudesse classificar sons ambientes. Visando essa funcionalidade, desenvolvi um pipeline simplificado de machine learning que pudesse fazer a extração de áudios do youtube, caso necessário,toda a etapa de pré-processamento requerida para que o modelo pudesse ser treinado, treino, validação e teste.

O Projeto

Este repositório lista os seguintes arquivos:Audios.ipynbModelos.ipynbbalanced_train_segments.csvdic_labels_negadas2.json

O dataset foi formado a partir da complementação de dois bancos de dados diferentes,ESC-50 e oAudioset.Considerando que o Audioset apenas referencia os segmentos de audios de links do YouTube, diferentemente do ESC-50 que já provê os áudios em formato .wav, o primeiro arquivoAudios.ipynb é um notebook destinado a filtragem delabels e download dos áudios no mesmo formato que o .wav.

O próximo noteboook,Modelos.ipynb, é o código que traz um pipeline simplificado dividio em:

Banco de dados;
Pré-Processamento dos dados;
Modelos

De forma resumida, o banco de dados traz a leitura e filtragem dos dados provenientes de ambos datasets, ESC-50 e Audioset, como também junta o conteúdo dos dois para melhor acesso posteriormente e cria um df para melhor mapeamento dos áudios e labels disponíveis.O pré-processamento faz a extração de features dos áudios como MFCCs e Zero-Crossing Rate que vão servir como entradas para os modelos. Por fim, a seção "Modelos" traz o treinamento e avaliação de dois modelos diferentes, Random Forest.

Já os arquivosbalanced_train_segments.csvedic_labels_negadas2.json foram arquivos auxiliares ao meu propósito de desenvolvimento, o primeiro podendo ser encontrado no próprio site do audioset e o segundo um dicionário de labels filtradas por mim.

Conclusões

Com este repositório, meu objetivo é contribuir para a comunidade de desenvolvedores e entusiastas que compartilham interesses semelhantes. Embora este seja um trabalho amador, ele reflete minha dedicação e aprendizado contínuo no campo. Estou sempre buscando aprimorar minhas habilidades e conhecimento, e espero que este projeto possa ser útil para aqueles que estão nessa mesma jornada!

Agradeço por explorar meu repositório! Estou aberta a feedbacks e sugestões.

Sinta-se à vontade para me contatar através do meuLinkedIn, até a próxima!

About

Desenvolvimento e treino de modelos CNN e Random Forest para classificação de áudios ambientes

Releases

No releases published

Packages

No packages published

Languages

Jupyter Notebook100.0%

Movatterモバイル変換

Navigation Menu

Search code, repositories, users, issues, pull requests...

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Folders and files

Latest commit

History

Repository files navigation

Classificador de sons ambientes

Sobre mim e a proposta do projeto

O Projeto

Conclusões

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages

Languages

Movatterモバイル変換

gcolussi11/Biochallenge

Folders and files

Latest commit

History

Repository files navigation

Classificador de sons ambientes

Sobre mim e a proposta do projeto

O Projeto

Conclusões

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages0

Languages

Packages