Autor: Ricarto Dortas
Data Science é o estudo de dados estruturados e não-estruturados visando obter conhecimento, informação e ideias, além de dar suporte ao processo de tomada de decisões. Para fazer Data Science é necessário dominar diversos campos de conhecimento, tais como matemática, estatística e ciência da computação. Além disso, Data Science utiliza-se de diversas técnicas como Machine Learning, Data Mining, Deep Learning e Inteligência Artificial.
Grandes empresas passaram a usar Data Science como forma de obter vantagens competitivas a partir dos dados gerados em suas operações. Ademais, levando-se em consideração o crescimento exponencial do volume de dados, surgiu um novo tipo de profissional para analisá-los – o ‘data scientist’. Além de aplicar as técnicas de Data Science, o ‘data scientist’ deve saber interpretar dados e demonstrar suas descobertas de forma eloquente usando técnicas de visualização e de narrativa de dados (data stories).
Em resumo, um data scientist deve:
- Fazer perguntas: O que não sabemos? O que deveríamos saber?
- Definir e testar hipóteses. Fazer experimentos com dados.
- Trabalhar dados: ‘scrape’, transformar, limpar.
- Explorar dados, descobrir desconhecidos
- Modelar dados, entender relacionamento entre dados
- Criar produtos relacionados a dados. Contar histórias de negócio relevantes.
Referências
Veja também: