domingo, 27 de outubro de 2013

Detalhando o processo de ETL - (PARTE 1 - Extração)

Em uma postagem anterior eu falei de forma bem superficial do processo de ETL, pretendo agora detalhar cada uma destas etapas.

Nesta postagem irei falar da etapa de extração, etapa inicial do processo de ETL.
A extração é feita de ambientes OLTP, ou seja ambientes de produção, ambientes transacionais, que são alimentados a todo minuto, o processo de ETL não abstrai todos os dados do ambiente transacional, somente as informações relevantes para o negócio são extraídas, tratadas, e importadas para o ambiente OLAP, ou seja para o Data Warehouse para ser usado na analise de negócio.

O Processo


O primeiro passo é definir as fontes de extração, e os dados podem vir das mais diversas fontes, sistemas de gestão(SIG, ERP, CRM e etc), diversos SGBD's (Oracle, SQLSERVER, DB2 e etc), e até arquivos mais triviais como planilhas do excel, e documentos de texto.



Depois de definir as fontes, é necessário definir a ferramenta que irá fazer a extração. Um exemplo de ferramenta é a que vem acoplada ao SQLSERVER, o Integration Services, e existem outras diversas ferramentas como poderio variado como o Power Center da empresa Informática, e o DataStage da IBM, entre outras, cabe ao analista do projeto definir qual ferramenta será usada no seu projeto, avaliando a sua necessidade, custo e etc.

A maioria das ferramentas faz o processo completo de ETL, porém nesse post falamos apenas da etapa de extração de dados e suas fontes.

Então é isso pessoal, na semana que vem eu irei fazer um post sobre a etapa de transformação do processo de ETL.

Deixe seu feedback nos comentários.

Nenhum comentário:

Postar um comentário