Área Restrita  |

Descoberta do Conhecimento

Descoberta do Conhecimento (DC)

Descoberta do Conhecimento (DC) é o processo de preparação, mineração e pós-processamento de dados visando extrair padrões interessantes, relevantes, inéditos e eventualmente ocultos [119]. A preparação dos dados é de extrema importância, uma vez que os dados frequentemente não são coletados visando DC. A fase da mineração é responsável por encontrar os padrões nos dados, garantindo que esses tragam a informação demandada pelo usuário. A fase de pós-processamento transforma e apresenta os padrões extraídos de acordo com a necessidade do usuário.

Distinguimos três grandes problemas a serem tratados nesta linha de pesquisa no contexto de mineração: incerteza nos dados [89], evolução temporal [7, 102] e escalabilidade das técnicas e algoritmos [9, 92, 105]. Pela própria natureza emergente e descentralizada, as informações existentes na Web se caracterizam por um alto grau de incerteza com relação à sua qualidade, uma vez que não há nenhum controle ou validação sistemática. A evolução temporal é um fenômeno em todas as áreas do conhecimento e o mesmo acontece na Web. O desafio neste caso reside em entender, modelar e explorar as informações temporais para melhorar o processo de DC. O desafio da escalabilidade vai além do mencionado anteriormente, pois não apenas temos uma quantidade crescente de dados, mas também um aumento da complexidade dos padrões a serem minerados.

Esta linha de pesquisa tem como objetivo investigar algoritmos e técnicas de DC que tratem desses problemas. Em especial, ela considera o uso de algoritmos de computação soft [123], dada sua capacidade de lidar com problemas como incerteza, imprecisão e verdade parcial, a criação de modelos de caracterização e técnicas de mineração de dados que considerem informações temporais, e o desenvolvimento de algoritmos para mineração de padrões complexos que sejam escaláveis.

Os algoritmos e técnicas estudados contribuirão para a solução dos problemas expostos nos Desafios 1, 2 e 3. Em relação ao Desafio 1, eles estarão diretamente envolvidos nos objetivos específicos 1.1 a 1.4. Em relação ao Desafio 2, eles serão de grande utilidade para alcançar os objetivos específicos 2.5 e 2.6. Em relação ao Desafio 3, os algoritmos e técnicas a serem desenvolvidos vão utilizar os resultados do objetivo 3.5 e contribuir para os objetivos 3.1 e 3.6.

Esta linha de pesquisa contará com a participação principalmente dos pesquisadores Wagner Meira (UFMG), Marcos Gonçalves (UFMG), Gisele L. Pappa (UFMG), e Adriano Pereira (UFMG).

Copyright © 2010 InWeb - Instituto Nacional de Ciência e Tecnologia para a Web - Todos os direitos reservados.
XHTML 1.1 OKXHTML 1.1 CSS 2.1 OKCSS 2.1 razz