- Organization
- Universidad Federal de Rio Grande del Sur (UFRGS)
- Tipo
- Setor Acadêmico
- Years
- 2023
- Countries
- Brasil
O projeto aborda um problema urgente na pesquisa e desenvolvimento de segurança de rede, que é a falta de explicabilidade em soluções inovadoras baseadas em ML aplicadas para identificar, prevenir e responder a ataques à infraestrutura da Internet, especialmente considerando o surgimento da Internet das coisas. (IoT) e malware de dia zero. Embora esse problema não seja exclusivo da América Latina, o conhecimento técnico dos pesquisadores da região é adequado exclusivamente para abordar essa questão premente.
Os objetivos deste projeto são definir uma métrica de qualidade de dados específica para cada um dos seguintes aspectos de qualidade de dados: precisão, pontualidade, exclusividade, validade, consistência e integridade. Dadas as métricas estabelecidas para qualidade de dados em redes, o projeto desenvolverá uma plataforma online colaborativa para avaliar e classificar conjuntos de dados publicamente disponíveis e conjuntos de dados comumente usados para ML em redes. Espera-se que esta plataforma sirva de guia para os pesquisadores escolherem qual conjunto de dados melhor se adapta às necessidades da pesquisa que estão desenvolvendo. Além disso, esse intervalo servirá como ponto de referência para o desenvolvimento de novos conjuntos de dados no futuro.
Os resultados esperados são uma classificação e categorização das abordagens atuais para medir a qualidade dos dados em ML em geral e para redes e segurança de rede em particular, fornecendo recomendações para desenvolvedores e pesquisadores sobre como aumentar a qualidade dos dados. os conjuntos de dados usados nas redes, com base nas observações produzidas por meio das métricas de qualidade de dados. Essas recomendações serão baseadas na classificação e avaliações realizadas para que sejam suportadas por evidências científicas. Os resultados do projeto serão um pacote Python de código aberto que permitirá a qualquer desenvolvedor ou pesquisador usar as métricas de qualidade de dados desenvolvidas em qualquer captura de tráfego específica; uma plataforma colaborativa de código aberto para classificar conjuntos de dados relacionados à rede e software de código aberto para permitir e facilitar a avaliação local de conjuntos de dados privados.