viernes, 29 de diciembre de 2017

4 características de un científico de datos

4 habilidades fundamentales para ser Data Scientist

Los Científicos de Datos lideran los rankings mundiales de los profesionales más solicitados. Si bien adquirir este perfil no es complejo, es indispensable contar con conocimientos muy concretos.



En la “era de los datos” los Data Scientists son los reyes. Lideran numerosos rankings sobre los perfiles más demandados tanto en la Argentina como en el resto del mundo. Este fenómeno se debe a que estos profesionales son los que tienen los conocimientos apropiados para analizar inmensos volúmenes de datos con el objetivo de descubrir tendencias y detectar patrones. Así es como las empresas pueden anticiparse a diferentes escenarios y, por ende, tomar mejores decisiones para el negocio.

En este contexto, estos talentos en Estados Unidos tienen salarios que rondan los 111 mil dólares anuales, según la plataforma norteamericana Glassdoor. Además, hay escasez de profesionales, de hecho, como señala la consultora Gartner, en los próximos dos años hasta el 75% de las empresas invertirán en Big Data y necesitarán contratar a estos colaboradores.

Para ser Científico de Datos hay que contar con las siguientes habilidades:

1. Programación

Como trabajan con conjuntos de datos inmensos, no es posible apelar al Excel. Por este motivo, utilizan SQL (del inglés “Structured Query Language”), que es un lenguaje de programación especialmente diseñado para manipular y extraer datos de sistemas gestores de bases de datos relacionales, como MySQL y SQL Server, entre otros.

También es indispensable dominar Python. Se trata de un lenguaje que tiene una curva de aprendizaje corta que permite visualizar datos y automatizar procesos. Además, resulta útil para extraer datos o avanzar en trabajos de basados en aprendizaje automático.

2. Modelado Predictivo

 El modelado predictivo es lo que distingue al Científico de Datos del analista de datos. Los primeros tienen la tarea de predecir el futuro utilizando datos del pasado y el presente. Por ejemplo, si una tienda de electrodomésticos quiere saber cuántos calefactores va a vender el próximo invierno, el Data Scientist estima esta predicción cruzando datos tales como el historial de unidades comercializadas en el pasado, el pronóstico meteorológico histórico y la situación económica de los consumidores, entre otros para llegar a obtener una cifra aproximada. Para explotar esa gran cantidad de datos, el profesional utiliza métodos de aprendizaje automático tales como regresiones, máquinas vectoriales de apoyo o árboles de decisión para determinar la conducta de los consumidores y así anticiparse al comportamiento de la próxima temporada de venta de estos electrodomésticos.

3. Matemáticas

Ya sea para solucionar problemas o bien para interpretar información, los Científicos de Datos deben tener conocimientos de estadística y probabilidad, entre otros. De esta manera, es capaz de entender y representar datos de forma más apropiada.

4. Visualización

 Obtenidas las conclusiones buscadas, llega el momento de transmitirlas a los tomadores decisión de la compañía, y para eso es crucial que el Data Scientist cuente con habilidades de comunicación para transmitir sus hallazgos de forma clara y precisa. Para eso, existen librerías que son de gran utilidad como Matplotlib, Seaborn, plot.ly y Bokeh, entre otras.

La revolución digital ya comenzó, y este es uno de los motivos por los cuales las empresas de todas las industrias están creando la posición de Científico de Datos para que se desempeñen en distintas áreas, como Marketing, Ventas y Recursos Humanos, por mencionar solo algunas. Por este motivo, esta disciplina promete un gran futuro laboral para aquellas personas que tengan pasión por interpretar y analizar los datos que circulan entre nosotros.

Digital House