Lendo conteúdo de arquivo PDF para o SQL Server com Integration Services (Parte 2)


Olá pessoal, vamos continuar...

     Neste momento, vamos criar um novo projeto no BIDS (Business Intelligence Development Studio)
Abaixo, segue a imagem do BIDS.


     Abaixo, estou criando um novo projeto do integration services. Como já disse anteriormente, o SSiS ou integration services, é a ferramenta de ETL do SQL Server, tal ferramenta será a responsável por todo o tratamento do arquivo que irei trabalhar.


Com o projeto criado, agora tenho que adicionar um componente chamado Data Flow Task.


     O Data Flow Task, encapsula o mecanismo de fluxo de dados que move dados entre fontes e destinos, e permite ao usuário transformar, limpar e modificar dados.
Dentro do Data Flow Task, para podermos ler a partir de um arquivo TXT ou CSV, usamos o componente Flat File Source, o qual, lê dados de um arquivo de texto. O arquivo de texto pode estar delimitado por tabulação, vírgula, ponto e virgula, dois pontos, barra vertical, por largura fixa, ou de formato misto.


     Quanto entramos no componente, devemos criar uma conexão para o arquivo que será lido na opção New, ou selecioná-la, caso já exista no Flat File Connection Manager.


     Ao clicar em New, aparecerá a tela abaixo onde poderão ser feitas diversas configurações a respeito do arquivo que será trabalhado.


     Em file name, indica-se o caminho do arquivo, no restante das configurações indica-se várias opções para que seja ajustado o arquivo, que vão desde o pais,  formatação do cabeçalho, colunas e linhas do arquivo.
Não vou entrar em detalhes deste item, aconselho a procurar mais sobre o assunto para entender de todas as opções, vou criar um post só para ele futuramente.
Observe abaixo, que depois de criada a conexão, na parte do connection manager, vai aparecer o atalho para a conexão do arquivo TXT.


     Neste ponto já temos configurado o nosso acesso aos dados que serão transformados.
Agora, será inserido mais um conjunto de componentes para fazer todo o processo, veja abaixo.


Foi inserido um Derived Column, um Conditional Split e um OLE DB Destination.

No próximo post tratarei de explicar cada um dos outros itens.










Referências





Comentários