
Ps-graduao IPT
Dissertaes
Um mtodo de avaliao da qualidade de dados utilizando regras identificadas por Dependncias Funcionais Condicionais
por SANTANA, Vanusa da Silva
Estatistcas
Visitas: 747
Downloads: 59
Orientao: LOPES, Fbio
Ano: 2019
Os dados são um ativo importante para as organizações, o que torna a qualidade de dados imprescindível para o seu crescimento intelectual. Nos últimos anos, diversos estudos abordaram as dimensões da qualidade e métodos foram propostos para guiar as atividades de avaliação e melhoria dos dados. A qualidade apresenta-se como um conceito multifacetado e, em geral, refere-se à aptidão para o uso. Isso indica que o pilar para a avaliação da qualidade é a definição de um conjunto de regras de qualidade, determinadas a partir de critérios de negócio. No entanto, pode ser impossível especificar manualmente as regras de qualidade para a avaliação. Com a utilização das Dependências Funcionais Condicionais (CFDs), é possível identificar automaticamente regras de qualidade dependentes do contexto. Este trabalho apresenta um método para avaliação da qualidade de dados utilizando o conceito da CFD para extrair as regras de qualidade e identificar as inconsistências. A qualidade da base de dados no método proposto será avaliada na dimensão acurácia semântica. O método consolida o processo de descoberta de conhecimento com a avaliação da qualidade de dados, listando as respectivas atividades que resultam na quantificação da acurácia semântica. Uma instância do método foi demonstrada, ao aplicá-lo no contexto da CETESB, cujo sistema apresenta os dados de monitoramento da qualidade do ar. A avaliação do método mostrou que as regras CFDs mineradas foram capazes de refletir alguns fenômenos atmosféricos, emergindo regras dependentes do contexto interessantes. Os padrões identificados nas transações, que inicialmente podem ser desconhecidos pelos usuários, podem ser utilizados como insumo para a avaliação e monitoramento da qualidade de dados.
Acesse: cassiopea.ipt.br/teses/2019_EC_Vanusa.pdf