Ficha proyecto IVACE
Título
Creación de una base de datos de sonidos de entornos portuarios
Resumen
El proyecto, tal cual se plantea, se desarrollará en dos grandes etapas: Primera etapa: Grabación y captura de datos. Segunda etapa: Etiquetado de los eventos sonoros y organización de la información. La etapa de grabación y captura consiste en el despliegue de una serie de micrófonos, tras el estudio y la selección cuidadosa de los puntos de captura más adecuados. Es decir, se debe primero analizar cuáles son los eventos acústicos que más información pueden aportar y desde qué localizaciones se pueden capturar mejor. En lo que se refiere al etiquetado, segunda etapa, éste es un proceso complejo y costoso, tanto desde el punto de vista del tiempo como del personal necesario. La situación habitual es que la cantidad de datos a etiquetar supere, con creces, los recursos disponibles para realizar el proceso de forma exhaustiva, por lo que es necesario desarrollar estrategias de optimización. Las técnicas conocidas como aprendizaje activo (active learning, según su denominación en inglés) se centran en seleccionar, dentro del conjunto de muestras que deben etiquetarse, cuáles son las más relevantes para los algoritmos de IA que se desean entrenar. Es decir, que mediante un proceso iterativo se busca etiquetar, no cualquier muestra al azar, sino las muestras que más información aportan de acuerdo a un determinado criterio. Las técnicas de active learning para el etiquetado de muestras de audio son un tema de investigación actual y vigente sobre el que se pretende trabajar en este proyecto.
Resultados
Este proyecto pone el foco en uno de los problemas más habituales con los que se encuentran los investigadores en el área de audición por computador: la falta de datos válidos y contextualizados con los que entrenar modelos de IA. Esta limitación proviene, por un lado, del hecho de que no existan muchas bases de datos públicas de sonidos disponibles (a diferencia de lo que sucede con las imágenes) y, por otro lado, porque por cuestiones relacionadas con la privacidad de los datos, muchas de las bases de datos disponibles no son utilizables con fines de transferencia de tecnología a los sectores industriales. Es por ello por lo que, el principal objetivo de este proyecto es el de crear una base de datos de sonidos contextualizados en la Comunitat Valenciana. En particular se ha puesto el foco en un entorno industrial abierto, como el representado por un puerto comercial.
Áreas de conocimiento y líneas tecnológicas
Sectores de aplicación
1
TICs
2
Tecnologías logísticas y de distribución
L1 - Sistemas de gestión de expediciones (muelles, rutas y cargas)
TIC
Proyecto financiado por