Entender cuál es la función de los programas más usados en cada etapa del estudio de la información.
<aside> <img src="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/556e1199-208d-4059-9784-e70ccb5297b6/icons8-filter.png" alt="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/556e1199-208d-4059-9784-e70ccb5297b6/icons8-filter.png" width="40px" /> Extracción de la información.
</aside>
<aside> <img src="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/d154b320-a9fe-4dfe-9894-a395c1a1bffc/icons8-database_view.png" alt="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/d154b320-a9fe-4dfe-9894-a395c1a1bffc/icons8-database_view.png" width="40px" /> Síntesis de la base de datos
</aside>
<aside> <img src="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/01b80e82-d27f-441c-b670-624f0089db2a/icons8-dashboard_layout.png" alt="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/01b80e82-d27f-441c-b670-624f0089db2a/icons8-dashboard_layout.png" width="40px" /> Cuadros de control de la operación
</aside>
Esta etapa y estas herramientas son principalmente utilizadas por los analistas y los ingenieros, estas son las personas que crean bases de datos y las sintetizan.
El lenguaje que van a utilizar es SQL. SQL Nos ayuda a extraer información.
<aside> <img src="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/b8f1c2a8-2b8c-4297-816e-44ac81b684f6/icons8-data.png" alt="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/b8f1c2a8-2b8c-4297-816e-44ac81b684f6/icons8-data.png" width="40px" /> Análisis de datos con enfoque estadístico
</aside>
<aside> <img src="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/47333af0-eccb-4057-bb37-8158275394e7/icons8-hard_working.png" alt="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/47333af0-eccb-4057-bb37-8158275394e7/icons8-hard_working.png" width="40px" /> Más complejo al inicio
</aside>
<aside> <img src="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/b40170ad-48e1-4294-8e50-0eddd1d25ebd/icons8-financial_growth_analysis.png" alt="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/b40170ad-48e1-4294-8e50-0eddd1d25ebd/icons8-financial_growth_analysis.png" width="40px" /> Análisis descriptivo y explotratorio
</aside>
<aside> 📦 Packages: ggplot2, dplyr
</aside>
<aside> <img src="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/2560819a-9648-4b6a-8eb8-9e28a1e02f82/icons8-engine.png" alt="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/2560819a-9648-4b6a-8eb8-9e28a1e02f82/icons8-engine.png" width="40px" /> Análisis de datos con enfoque en ingeniería
</aside>
<aside> <img src="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/bd814a4a-d9ca-49e5-88c3-0d703d143e7b/icons8-programming.png" alt="https://s3-us-west-2.amazonaws.com/secure.notion-static.com/bd814a4a-d9ca-49e5-88c3-0d703d143e7b/icons8-programming.png" width="40px" /> Parecido a otros lenguajes
</aside>
<aside> 🔎 Análisis descriptivo y exploratorio
</aside>
<aside> 📦 Librerías: Panda, Numpy
</aside>
Estas herramientas son las que utiliza el científico de datos, estas herramientas son exploratorias son predictivas y se basan en modelos estadísticos, modelos matemáticos y también nos van a servir para hacer gráficos y visualización.
En realidad, puedes elegir el que más te guste, si tu rol deseado es el de científico de datos.
Ambos lenguajes son open-source por lo que podemos descargarlos de manera gratutia.
R tiene un enfiqye más estadístico, nos ayuda a sacar ¿P Values?, Intervalos de confianza, es un enfoque más basado en la econometría. Y en cambio Python tiene un enfoque más ingenieril, como Java, C++ ese enfoque de ingeniería.
R Puede parecernos un tanto complejo al inicio, pero como todo, con práctica y al paso del tiempo nos familiarizamos y se nos va facilitar el trabajo. Python es más parecido a Java y a otros lenguajes, por lo que si ya sabemos programar es una mejor opción irnos por Python.
R vamos hacer un análisis descriptivo y exploratorio, en Python haremos lo mismo. ¿Qué es un Análisis Descriptivo? Como dice la palabra, nos ayuda a DESCRIBIR la información que ya tenemos, interpretarla, para ver cuánta información hay, y el EXPLORATORIO nos va servir para pasar a otra fase, para poder predecir. Ya sé que tengo esta información, pero quiero saber la información que voy a tener en un mes.
Ambos lenguajes tienen apoyos adicionales, tenemos packages R y Librerías Python.
R ggplot2 nos sirve para hacer gráficos increíbles, colors, funcionalidades.
R dplyr para reorganizar nuestra información.
Python Pandas y Numpy, los dos nos sirven para reorganizar la información, para ser más eficientes y no tener que escribir tanto código