A Importância da Linguagem SQL para o Business Intelligence
Dando sequência ao artigo anterior “Como Iniciar Uma Carreira em Business Intelligence”, vou falar um pouco sobre algumas ferramentas que são importantes para quem deseja começar a trabalhar com BI.
Antes de abordar ferramentas, no entanto, vou escrever sobre a importância da linguagem SQL para o processo de BI, algo que muitos alunos me questionam nos treinamentos, principalmente os que estão migrando de outras áreas para a cada vez mais efervescente área de BI.
A SQL (Structured Query Language ou Linguagem de Consulta Estruturada), é a linguagem padrão para a operação de bancos de dados relacionais, que permite a criação de objetos como tabelas, visões e índices, e também a manipulação dos dados através de inserções, atualizações, deleções e consultas.
Uma das interfaces de extração de dados mais comuns no Processo de Business Intelligence é o próprio banco de dados, que fornece dados que se juntarão a outros dados em um Data Warehouse, um grande banco de dados que integra todas as fontes utilizadas para se criar análises sobre dados de um determinado negócio.
Sendo os bancos de dados parte importante desse processo, a manipulação dos dados contidos neles também será freqüente, fato que torna recomendável o entendimento das propriedades dos bancos de dados e, obviamente, de sua manipulação.
É fato que hoje algumas ferramentas tornam o processo de extração de dados bastante transparente ao usuário, mas para a excelência dos resultados, muitas vezes precisaremos realizar algumas intervenções nos códigos gerados de maneira automática por essas ferramentas.
Veja o exemplo da Figura 1, nela temos o resultado de um script criado automaticamente pela ferramenta PDI (Pentaho Data Integration), para a exportação de dados para uma Staging Area, área temporária onde os dados ficam antes de passar pelo processo de ETL. Nesse caso, quem conhece a linguagem SQL consegue perceber que esse Script gerado pela ferramenta pode (e deve!) ser melhorado.
Para a nossa sorte, ferramentas como o PDI e a maioria dos players de BI permitem a intervenção do analista para modificar ou reescrever o código, antes que a ferramenta efetivamente rode o script no SGBD.
Rapare que o papel do profissional de BI nesse processo é um importante termômetro para apurarmos o grau de necessidade do conhecimento da linguagem SQL em sua formação. Se o profissional espera trabalhar mais na parte de projetos, elaboração da camada de aplicação via Dashboards, levantamento de requisitos, ou demais funções menos técnicas, a SQL, embora importante, não será um entrave. Afinal de contas, há aquele velho ditado de que o Engenheiro não precisa saber assentar tijolos para exercer a sua profissão.
Para as funções mais técnicas, e nesse grupo incluo o envolvimento do profissional na extração, transformação e carga de dados, o conhecimento da linguagem SQL é vital, praticamente um pré-requisito, visto que com essa linguagem algumas transformações poderão ser feitas já no momento da extração dos dados para a Staging. Além disso, ainda destaco o conhecimento de funções de agregação em SQL como outro ponto crítico quando falamos sobre o processo de carga do banco de dados.
Em resumo, se você está querendo fazer parte dessa apaixonante aventura que é a área de Business Intelligence, procure investir algum tempo no aprendizado dessa linguagem que é tão simples, quanto essencial.
Fique de olho aqui no Blog para futuros treinamentos que serão oferecidos em linguagem SQL, players como Power BI, QlikView, QlikSense, e ferramentas de ETL como o Pentaho Data Integration.