Pentaho Data Integration

Pentaho

O Pentaho Data Integration é uma ferramenta Open Source e gratuita que permite fazer a extracção, carregamento e transformação de dados (ETL).

Ao contrário do Excel ou do Access trabalha sem dificuldades com milhões de linhas e com ficheiros que podem ter mais que 1 gigabyte.

Já trabalhei com bases de dados com mais de 13 milhões de linhas a partir do qual se efectuaram diversos tratamentos. O processamento das linhas é feito linha a linha podendo-se fazer de forma sequencial todo o tipo de transformações. O desenho do tratamento de dados é também possível de ser feito na sua interface gráfica tornando mais fácila manutenção de transformações extensas de dados necessárias para obter resultados da agregação de quantidades massivas de dados.

Ao contrário do Excel e do Access o facto de estar a processar centenas de milhares de linhas não impede que se continue a usar o computador.