Descrição
O termo data mining é empregado no meio acadêmico há quase uma década como“aprendizado a partir de bases de dados”. A área surgiu com background de anos depesquisas em aprendizado de máquina, redes neurais e estatística. Dentro de um processomais amplo, chamado descoberta de conhecimento em bases de dados [FAY 96], seuobjetivo é extrair conhecimento novo, útil e interessante a partir de bases de dados. Emtermos das organizações onde o data mining é aplicado [BER 97], tais ferramentas apóiama extração de valor a partir das bases de dados, ativo comumente sub-utilizado. Apenasrecentemente a mineração de dados tem conquistado espaço nas organizações onde, aoaplicar data mining a grandes volumes de dados, sujeitos a redundâncias, inconsistências,distribuídos e armazenados em formatos distintos, foi encontrado o primeiro “gargalo” parase obter sucesso na aplicação da tecnologia: a preparação e qualificação de dados. Integraresquemas, deduplicar entidades [REG 00], padronizar a representação de diversos atributose disponibililizar repositórios de dados para aplicações analíticas foram alguns dos desafiosonde data warehousing [KIM 96] e data mining se encontraram. Atualmente, novosdesafios são encontrados em outras etapas deste processo, tal como a aplicação deresultados, que é o tema deste trabalho.