As ferramentas de software estão a capacitar os analistas de negócios a gerar modelos analíticos e insights sem a ajuda de engenheiros de software.
Os Data Scientist são caros, apresentando um desafio para qualquer empresa que não seja o Google, Facebook, Amazon ou Apple. Os CIOs que tiveram a sorte de tirá-los de grandes organizações de tecnologia ou atraí-los diretamente da faculdade ficam orgulhosos quanto falam sobre todas as ideias de negócios que terão com os seus gurus de dados.
A IBM espera que a procura por Data Scientist suba 28% até ao final de 2020 - e este número pode ser ainda maior. Para lidar com a escassez de talentos, as empresas estão a desenvolver softwares que fazem o seu trabalho, criando efetivamente Data Scientist a partir de funcionários corporativos que não fazem parte da equipa de TI.
De acordo com o Gartner, a ciência de dados por software inclui recursos e práticas que permitem aos utilizadores extrair informações preditivas e prescritivas dos dados enquanto trabalham em posições fora dos campos de estatística e análise. Estes Data Scientist são "utilizadores avançados", como analistas de negócios que não têm formação em ciência da computação, mas podem executar tarefas analíticas simples a moderadamente sofisticadas que anteriormente exigiam mais conhecimento. Esta tem sido uma maneira útil de lidar com a escassez de talentos.
"O aumento da disponibilidade de ferramentas, tecnologia, dados e modelos está permitindo a disseminação de insights para pessoas que normalmente não teriam capacidade de se dar bem", diz Brandon Purcell, analista da Forrester Research.
A ciência dos dados foi democratizada para (quase) todos
A tecnologia encontra sempre uma maneira de democratizar o acesso à informação. Então o que mudou? No modelo tradicional - ainda praticado pela maioria das empresas - os analistas de negócios ficam meses com alguém de TI e um Data Scientist para planear modelos com o objetivo de gerar insights preditivos, com o especialista em data science a construir o modelo do zero.
Agora, graças as ferramentas como o SPSS e o Alteryx da IBM, novos Data Scientist (conhecidos como Cidadão de Data Scientist), muitos com pouca ou nenhuma experiência em código, utilizam softwares para obter insights. Estas plataformas tornam "muito mais fácil para os analistas de linha de negócios manipular dados do que no Excel", afirma Purcell.
A General Motors, por exemplo, criou o Maxis, uma plataforma de análise que permite aos utilizadores realizar consultas do tipo Google para obter previsões de vendas e métricas operacionais, como desempenho da cadeia de suprimentos. A GM pode ser uma exceção agora, mas muitas empresas vão acabar por optar pela mesma abordagem em pouco tempo.
A ciência de dados é um foco fundamental da gigante petrolífera Shell, onde os funcionários analisam os petabytes de dados da empresa para gerar insights operacionais e de negócios. Graças ao software de autoatendimento, os funcionários que, de outra forma, talvez não pudessem usar a análise, agora podem desfrutar das informações sem ajuda técnica. Por exemplo, a Shell usa o software de autoatendimento da Alteryx para ajudar a executar modelos preditivos que antecipam quando peças da máquina de perfuração de petróleo poderão apresentar falhas.
O Cidadão Data Scientist, preenche a lacuna entre a análise realizada por utilizadores de negócios e a análise avançada atribuída aos Data Scientist. Já os cData Scientist profissionais criam e escalam modelos e algoritmos em toda a empresa.
Convencidas pela máxima já amplamente aceita de que os dados são o novo petróleo, muitas empresas ficaram "seduzidas pelo glamour de análises complexas", observa Joe DosSantos, vice-presidente sênior de informações corporativas do TD Bank Group.
O TD Bank usa uma ampla gama de ferramentas analíticas básicas e sofisticadas para melhor alinhar os dados históricos e atuais dos clientes, bem como para conduzir análises de fraude. Por exemplo, o banco usa o software da AtScale para ajudar os utilizadores de negócios a consultar dados em tempo real do banco de dados Hadoop e obter resultados rápidos. Os analistas do TD Bank visualizam as informações no sistema de autoatendimento Tableau.
Data Scientist ainda são desejados
Outros fornecedores de software estão a acelerar a tendência da democratização de dados, geralmente utilizando recursos de machine learning (ML) e inteligência artificial (IA) para criar modelos automatizados.
A Salesforce, por exemplo, oferece o Einstein Prediction Builder, que permite aos analistas de negócios criar modelos de IA personalizados, adicionando variáveis para prever resultados. O Sensei da Adobe, outra ferramenta de software de ML, ajuda os profissionais de marketing a criar campanhas em minutos, economizando horas de trabalho.
Mais de 40% das tarefas de Data Scientist provavelmente serão automatizadas até ao final 2020, diz o Gartner. Para Purcell, essa abordagem automatizada de ML "será a próxima geração da ciência de dados".
Obviamente, nem todo desafio de big data será facilmente enfrentado por um Cidadão Data Scientist. As empresas ainda precisam de estatísticos e outros especialistas de técnicas matemáticas avançadas, revela Bill Roberts, da Deloitte Consulting.
Além disso, Roberts observa que, embora as ferramentas de autoatendimento possam servir bem a uma empresa, se elas não funcionarem corretamente poderão gerar problemas para a organização. Se algo der errado, talvez haja um problema com o próprio algoritmo. "Quando há um problema, será preciso de alguém com formação ou grau avançado em matemática que possa resolver isso", conclui.