0

Os mundos da Inteligência de Negócios e Ciência de Dados se divergem mas também convergem no universo do conhecimento

#Power BI #Python
André Gomes
André Gomes

A era dos dados já é uma realidade, de contato telefônico a segredos industriais, as informações geradas pelos dados sempre foram valiosas para os concorrentes e principalmente para os detentores dos dados. Sendo muitas vezes objeto de espionagem e outras formas questionáveis de obtê-las e usá-las, se fez necessária a discussão sobre os direitos de utilização dos detentores e dos geradores dos dados ou informações, e a ética na obtenção. E tudo isso tem uma ênfase exponencial com a popularização dos “IOTs”, do inglês (Internet of Things). “Realmente, a nova fonte de riqueza não é de natureza material, mas consiste de informação, de conhecimento aplicado ao trabalho para criar valor.” (Walter Wriston O Crepúsculo da Soberania, Makron Books, 1994)


A geração ou criação desses dados vem aumentando cada vez mais rápido, desde a criação do microprocessador por volta de 1970 a capacidade de processamento vem dobrando a cada dois anos e consequentemente a quantidade de dados armazenados cresce proporcionalmente até a popularização da internet na década de 1990, quando a dinâmica da geração de informações se torna muito mais ágil, principalmente pelo fato das informações estarem disponíveis sem a necessidade do processamento dos dados.


Contudo, a Ciência de Dados (Data Science - DS, em inglês) e sua prática, já havia surgido juntamente com o conceito de “Big Data”, na década de 1970, quando já se identificava a oportunidade de extrair informações úteis analisando os dados. Já o termo Inteligência de Negócios (Business Intelligence - BI, em inglês) é ainda mais antigo, utilizado pela primeira vez em 1865 por Richard Devens para descrever como o bancário Sir Henry Furness lucrou recebendo e agindo embasado em informações sobre o ambiente, se antecipando aos seus concorrentes. “Sob essa ótica, o sucesso não é determinado pelo que se possui, e sim pelo que se sabe.” (MCGEE e PRUSAK, 1994)


Todavia, o conceito de BI como é conhecido hoje só começou a ser formado na década de 1970, vinculado à evolução das formas de armazenamento e acesso aos dados pelos Sistemas de Informações Gerenciais - SIG, e foi se transformando com o decorrer do tempo. Passando pelos Sistemas de Informações Executivas - EIS na década de 1980, já com a geração de relatórios dinâmicos multidimensionais, prognósticos, análises de tendências, acesso a status e fatores críticos de sucesso. E se consolidando com a junção de novos recursos disponibilizados pelo avanço da tecnologia na década de 1990, juntamente com a necessidade de mais agilidade no processo de análise dos dados.


Tendo em vista o avanço da tecnologia, o processo de DS se tornou viável e possibilitou a implantação de modelos estatísticos mais complexos e robustos, com relação à época em que foi criada, o custo computacional exigido é cada vez maior pela quantidade de dados que são gerados continuamente, apesar deste poder de processamento estar ficando mais acessível, o mercado exige cada vez mais agilidade, com isso, mais capacidade de processamento. Porém, não houve grandes mudanças no conceito como vem sendo popularizado, desde sua criação, é embasada em matemática estatística e probabilidade, com a utilização de cálculos simples, como probabilidade de ocorrência, a cálculos complexos como álgebra linear para operações em matrizes, por exemplo.


Dito isso, ainda não fica claro o porquê das discussões de autores e acadêmicos sobre a definição e diferença dos conceitos. O detalhamento que será disposta em seguida pode facilitar o entendimento da discussão. O BI é só uma ferramenta ou software com dashboard? A DS é só matemática estatística e o profissional é um estatístico moderno? Afinal, a finalidade é a mesma?


Apesar da ciência de dados e da inteligência de negócio utilizarem dados para gerar informações úteis para tomada de decisões táticas e estratégicas, são dois mundos que seguem direções opostas tecnicamente, mas antes disso, estão diretamente ligados pela sua matéria-prima, os dados. Pois nos dois conceitos se faz necessária uma análise minuciosa dos dados para verificar sua integridade, consistência, ruídos e dados faltantes, por exemplo, já podem ser identificados e exigir a revisão ou reforço na capacitação de colaboradores e ou cultura da organização em tudo que tange a gestão dos dados. Pode-se dizer que este é o ponto zero das órbitas dos dois mundos, seguindo os conceitos de “Data Literacy” e “Data Driven”.


Sabendo de todo o contexto que permeia os dados, das fontes aos valores resultantes, e a que direção eles apontam, os processos de transformação dos dados para informações se tornam assertivas e as diferenças entre os dois conceitos se mostram evidentes. Os dados podem ser capazes de descrever o passado e explicar a história e identificar tendências e dar suporte às decisões (BI), e ou, ter potencial de serem explorados para testar hipóteses e tentar prever eventos e embasar o planejamento (DS). Os entregáveis podem ser confundidos no campo da visualização dos dados, comum nos dois conceitos, onde gráficos e relatórios são dispostos e explicados chamando a atenção para as informações que os dados geram por “Storytelling” ou “Dashboard” com a utilização dos conceitos de “Design”, mas os entregáveis são, basicamente, modelos estatísticos (DS) e relatórios e gráficos (BI). A automação dos processos é diretamente impactada pela estruturação dos dados disponíveis, dados bem estruturados e com pontos concretos, suposições simples e métricas autoexplicativas (BI) viabilizam a automação dos processos, enquanto dados mal estruturados ou não estruturados (DS) dependem de pré-processamento, muitas vezes exigem processos manuais para se tornarem utilizáveis num processo de automação. Imagens e vídeos são exemplos de dados não estruturados que dependem de pré-processamento, mas nada impede a utilização das técnicas de “Machine Learning” para pré-processar e estruturar os dados para utilização em processos de (BI) ou automatizar a ciência dos dados, o que também possibilita maior aproveitamento dos dados.


Conclui-se que as órbitas dos dois mundos, BI e DS, partem do mesmo ponto e se divergem à medida em que os processos vão sendo executados, mas ao final se convergem para gerar o conhecimento fundamentado. No universo do conhecimento, esses são dois conceitos que agilizam os processos com técnicas, métodos e tecnologias, mas ainda dependem da cultura e do comportamento para efetivar o ciclo contínuo da inteligência. A compreensão do conhecimento se faz essencial, para isso os processos de “Sensemaking”, ou construção de sentido em português, são fundamentais para gerar inteligência competitiva e de mercado, todo conhecimento deve fazer sentido para os colaboradores interessados e devem ficar acessíveis para utilização e compartilhamento. “O capital intelectual não é criado a partir de partes distintas de capital humano, estrutural e do cliente, mas do intercâmbio entre eles.” (STEWART, 1998).

0
4

Comentários (0)

Tecnólogo: Gestão de TI | MBA: Ciência de Dados e Inteligência Artificial

Brasil