Funções da área de ciência de dados

Ciência de Dados

Não se submeta a ser unicórnio

quando você pode ser um especialista e não generalista

Muitas empresas, principalmente as que não sabem ao certo quais são as funções da área de ciência de dados, acabam exigindo muitas habilidades que não tem relação direta com as atividades em suas descrições de vagas. Isso impacta negativamente nos candidatos, aumentando a ansiedade de quem pleiteia uma vaga para trabalhar na empresa. Sem contar que durante o processo, muitas destas habilidades não são nem avaliadas por quem está analisando a vaga.

Por experiência própria, se aplique às vagas que tenha interesse em trabalhar, mesmo não atendendo à todos os requerimentos exigidos. Não minta, mas explique o porque se candidatou. Aprenda com os feedbacks que forem lhe passados. Se não for contratado, exija um retorno com um plano de estudo e se prepare para evoluir.

Na empresa que trabalho, criamos uma matriz de habilidades com as pessoas que trabalham no meu time. Levantamos mais de 90 habilidades, contudo, são realmente conhecidas pelas pessoas do time. Construímos uma equipe multidisciplinar, com pessoas complementando as habilidades das outras. Isso permitiu que o grupo fosse mais sólido e plural, com habilidades diferentes as reuniões são bastante ricas no contexto das ideias.

Utilizando a imagem que está na capa deste post para ilustrar o texto, separamos 8 grandes funções da área de ciência de dados.

Engenharia dos Dados e Computação Aplicada

Os profissionais que já trabalhavam com infra-estrutura e arquitetura de ambientes de alta disponibilidade, possuem uma facilidade grande de migrar para esta área. Isso porque eles são responsáveis por garantir que a solução atenderá o projeto de forma satisfatória. Tanto na questão de disponibilidade, quanto de armazenamento e também no que diz respeito ao tempo de resposta. Tanto a ingestão como também a movimentação de dados, é projetada por profissionais desta área de engenharia dos dados e computação aplicada.

Métodos Científicos

Quem tem familiaridade com pesquisas em academia já está acostumado a pesquisar para suas publicações. Mas a prática não é tão comum de se encontrar no segmento corporativo. Os profissionais estão acostumados a pesquisar em sites de busca, como Google ou Bing, mas geralmente é para encontrar uma solução específica de erro em código ou problema de implantação. A aplicação de métodos cientifícos ajuda os profissionais a entender como outros pesquisadores estão aplicando técnicas em seus problemas. Para base de comparação, na minha pesquisa de mestrado eu fiz o levantamento de quase 120 artigos científicos dos ultimos 5 anos que utilizavam técnicas de Machine Learning para predição de explosões solares. Sem esta pesquisa, eu não teria aprendido quais técnicas estão sendo utilizadas como o estado da arte da Inteligência Artificial.

Matemática e Estatística

O conhecimento em estatística é importante para validação de hipóteses, entendimento dos dados, criação de exploração e distribuição dos dados… Além da escrita de modelos de predição que envolvem os paradigmas de aprendizagem supervisionada e não supervisionada. Já na parte matemática a implementação de algoritmos em sua essência consiste em representações matemáticas, e para melhorar os resultados dos algoritmos, alterações podem ser feitas. Contudo, nem sempre eu recomendo começar por esta área de estudo. Principalmente por que muitas vezes dá para começar a implementar as soluções com o uso de Serviços Cognitivos, e então depois que já está familiarizado com as técnicas, ai parte para os estudos de matemática e estatística.

Visualização

Esta é uma das ciências que desde sempre é negligenciada pelos times de desenvolvimento. Infelizmente, de forma bastante errada, há uma percepção que qualquer um pode fazer a tela de interação com o usuário. Qualquer pessoa pode escrever o relatório para avisar o cliente como foi o projeto. Elaborar os gráficos para apresentar os dados analisados. Contudo, apenas poucas pessoas de fato estudou o assunto.

É importante que a mensagem seja passada de forma correta para quem vai receber. Saber como comunicar com o grupo que receberá aquela informação é fundamental. E esta é uma habilidade que o grupo de profissionais que estudam esta ciência fazem muito bem. No livro Storytelling com Dados: um Guia Sobre Visualização de Dados Para Profissionais de Negócios a autora explica como apresentar os dados em melhores formas. Vale a pena a leitura!

Pensamento fora da caixa

No livro Pense como um freak: Como pensar de maneira mais inteligente sobre quase tudo um dos capítulos os autores sugerem que você pense como uma criança de 8 anos, não é para agir como uma criança, mas sim fazer perguntas curiosas sobre o assunto. Isso ajudará aos participantes do projeto pensarem em assuntos para lhe explicar de forma simples. Alguns tópicos são tão obvios para eles, que ficam automáticos e não pensam sobre aquilo. Quando precisam explicar o processo à outra pessoa, eles revisitam esses tópicos e pensam como funciona. Esta tarefa reabre a discussão e a real utilização daquela tarefa.

Experiência nos Business

Montar soluções baseados em dados, sem o apoio da área de negócios, talvez não traga tantos benefícios quanto se há o profissional que conhece o domínio do assunto. É essencial ter este profissional disponível no projeto, contudo, ele não precisa estar 100% do tempo dedicado ao projeto. Isso porque suas atividades podem ser mais pontuais, principalmente para validar se a metodologia aplicada não fere nenhuma regra de negócios.

Nestes dias atuais que estamos enfrentando a pandemia de Novo Coronavirus existem várias pessoas publicando análises em redes sociais, mas não há necessariamente uma validação de epidemiologistas em cima dos resultados. Contudo, isso não significa que os profissionais devem parar de continuar com as análises dos dados publicos, só precisam tomar cuidado e consciência que está faltando uma peça fundamental, que é o conhecedor de domínio de assunto.

Sobre Diego Nogare 346 Artigos
Diego Nogare é Gerente Técnico de Engenharia de Machine Learning no Itaú-Unibanco. Também é professor em programas de pós graduação no Mackenzie e na FIAP, em São Paulo. Foi nomeado como Microsoft MVP por 11 anos seguidos, e hoje faz parte do programa Microsoft Regional Director.