Por Marcos Rodrigues
Não podemos negar que cada vez mais estes assuntos estão em alta, o volume de dados hoje gerado nunca foi tão grande , e isso não irá parar. Se olharmos ao nosso redor, temos tantos dispositivos gerando informações, que às vezes chegamos a nos perder neste universo . Podemos ver que as ferramentas de redes sociais, os dados de nossas navegações na web, nosso celular, são grandes captadores desta informação .
Considerando isso , temos o desafio de coletar os dados e tratá-los de uma forma adequada , em busca de tirarmos melhor destas informações.
Neste sentido , os caminhos relacionados a Big Data e Data Science, ganham muita força e trilham um caminho de novas tecnologias e descobertas. Estes itens não são novos para nós, temos estudos em dados relacionando estes itens tecnológicos há mais de 20 anos, de forma significativa.
Sendo assim, vamos descrever brevemente os 5 principais caminhos a trilhar, para quem está querendo descobrir e se preparar para o futuro (na verdade o presente).
Os caminhos podem ser divididos em 5 grandes tópicos:
Estes caminhos irão abranger desde a criação de uma infraestrutura, para a coleta e armazenamento dos dados, até a análise deles, levando a decisões estratégicas, como também o uso de machine learnings em busca de uma evolução de padrões e tomadas de decisão.
Descrevendo cada item , podemos ter o seguinte :
- Data Management
Se descreve como o responsável por operacionalizar a parte de infraestrutura, tendo importantes responsabilidades como manter o ambiente sustentável, monitoramento, armazenamento, entre demais atividades no foco operacional . Trabalhando com tecnologias como ecossistemas em Apache Hadoop , Spark , banco de dados Relacionais e não relacionais. Além disso, trabalho em ambientes clouds , onde temos diversos players com produtos muito bem elaborados.
- Data Engineer
Tem como responsabilidade elaborar a engenharia a ser empregada para a infraestrutura do ambiente de armazenamento dos dados a serem utilizados no processo, seja ela On Premise ou Cloud. Estando diretamente ligado ao Big Data , focando em um ambiente que venha cumprir as necessidades para um futuro de informações sustentável, e com um tempo de resposta aceitável. Considerando que o tempo de retorno de uma informação ganha enorme significado . Não adianta eu ter uma informação importante , em um momento que não necessito mais. Podemos citar como exemplo, um prognóstico de tempestade, após a tempestade passar , a sua importância cai muito.
Este caminho deve trabalhar com tecnologias descritas na carreira de Data Management , porém com um foco um pouco mais em alto nível . E tendo uma interação com as demais áreas , para que seja possível ter uma solução auto escalável a necessidades propostas.
- Business Analyst
Nesta carreira , podemos relacionar bem com a atividade de DA ( Data Administrator ), amplamente usada para análise de dados, tendo um foco em trabalho como reports , ou dashboards a nível de negócio. Poderíamos entender esta carreira como o elo mais forte entre a área tecnológica e a área de negócios, o que diz a respeito a análise de dados e reports gerenciais.
- Machine Learning Researcher
Podemos identificar um misto entre a área tecnológica e de negócio, onde temos um grande valor para relacionamentos de estatística, cálculos, gerando algoritmos e busca de padrões para os dados coletados.
Temos a importante missão de ter domínio sobre programação, cálculos, e conhecimento de tecnologias com a utilização de machine learning. Em uma outra abordagem, também temos a busca de comportamento, e suas ações, assim gerando algo relacionado a Inteligência Artificial .
Esta carreira tem muito a crescer e acredita-se que em um futuro próximo venha a se tornar cada vez mais significativa, sendo promissora em sua evolução .
- Data-oriented
Para este item , nós vamos em uma linha muito mais científica, o foco deste caminho são os dados, não importando que tipo de ferramenta possa utilizar, porém a importância deste dado. Esta linha pode seguir paralelamente a uma linha acadêmica, com um estudo aprofundado e ligado aos dados como são .
Este deve ser focado em estatística, visualização de dados , programação para manipulação.
Concluo que possa ter ajudado quem deseja seguir nestas linhas, existem diversos artigos na internet com informações que venham a ajudar a entender os caminhos, no caso, tentei compilar algumas informações e junto delas adicionar um olhar de acordo com minha experiência profissional . Lembrando que este assunto pode ter diversos entendimentos, devido a ser um assunto relativamente novo.