Para todos os profissionais da área de dados é imprescindível conhecer a analogia da transformação de dados, reconhecendo o processo de transformação que se inicia na coleta dos dados brutos e vai até a aplicação do conhecimento como sabedoria nos negócios e nos cases do dia-a-dia.
Uma das figuras mais conhecidas quando tratamos desse assunto é a pirâmide chamada de DICS, sigla em português que significa Dados, Informação, Conhecimento e Sabedoria, conforme podemos ver na Figura 1.
Esta pirâmide também pode ser encontrada em sua versão em inglês, denominada WKID (Wisdow, Knowledge, Information and Data), conforme podemos ver na Figura 2.
Bom, mas vamos tratar de cada uma dessas fases de transformação do dado, levando em consideração os aspectos pertinentes a cada etapa.
Primeiramente, notamos que a base da pirâmide onde ficam os dados é a mais larga, isso se justifica porque ali é onde encontramos os dados brutos provenientes dos vários sistemas e demais fontes de coleta de dados, de onde temos interesse em conhecer os dados que serão aplicados na resolução de problemas futuramente.
Os dados brutos não possuem significado, relacionamento com outros dados, e nem estrutura suficientemente definidas para que os eles sejam aproveitados de maneira relevante.
Imagine, por exemplo, que em você tenha um compromisso e simplesmente acesse os dados brutos 15º, 90%, 50 km/h. Veja que esses dados isolados podem dizer muita coisa, mas como não há um processamento, não há rótulos e nem relacionamentos, eles não dizem nada.
Quando falamos da segunda camada da pirâmide de baixo para cima, estamos falando sobre Informação, que é o momento em que os dados são processados e relacionados, passamos a ganhar contexto, com a informação útil, organizada e estruturada.
Veja que agora, voltando ao nosso exemplo, podemos relacionar os dados e estabelecer uma organização, dizendo que as condições climáticas na cidade do Rio de Janeiro esperada para o dia de amanhã são: 15º Celsius de temperatura, 90% de umidade relativa do ar e ventos de 50 km/h, ou seja, teremos um mal tempo na cidade.
Quando falamos em Conhecimento, estamos abordando a Informação contextualizada, nesse caso vamos levar em consideração o que sabemos sobre a cidade do Rio de Janeiro, e como essas condições climáticas atrapalham o trânsito, as condições humanas dos moradores, dentre outras questões que certamente vão influenciar o dia da população, tendo em vista os seus compromissos, deslocamentos e demais atividades.
Por fim, quando abordamos a última camada da pirâmide, temos a Sabedoria, que tem a ver com a aplicação do conhecimento obtido a partir da transformação dos dados brutos e de sua consequente transformação.
A Sabedoria diz respeito ao o que vamos fazer com os dados, como vamos aplicá-los e usarmos os mesmos para o processo de tomada de decisão.
Certamente nesse caso, vamos precisar avaliar se realmente precisamos manter o compromisso para o dia de amanhã, se sim, vamos precisar ficar atentos ao horário de sair de casa, para evitar atrasos, além disso, vamos precisar carregar guarda-chuva, e mudar sensivelmente as nossas vestimentas. Viram? A sabedoria está influenciando em nossa tomada de decisão, e isso logicamente também se aplica ao mundo dos negócios e tomadas de decisões corporativas.
No fim das contas, cabe ao profissional de dados estabelecer um pipeline de dados, organizados a partir de um bom processo de orquestração que vai garantir que tudo funcione adequadamente, para que ferramentas localizadas na camada de DataViz (Visualização de Dados) possam exibir e distribuir os dados de maneira democrática, útil e consistente.