Si tuviera que aprender Data Science de nuevo, ¿Cómo lo haría?

Un día de estos me puse a pensar por dónde empezaría a aprender machine learning y data science si tuviera que comenzar de nuevo. Y lo vacilón de este ejercicio es que la ruta que me imaginé no fue nada similar a la que hice en su momento.

Estoy consciente de que todos aprendemos de distintas maneras. Algunos prefieren videos, a otros les basta con unos buenos libros y muchos ocupan un curso pago para sentir un poco de presión extra. Y todos están bien, lo importante es aprender y disfrutarlo.

Entonces, hablando desde mi propia experiencia y conociendo cómo es que aprendo mejor, creé esta ruta que explica por dónde empezaría a aprender sobre ciencias de datos si tuviera que iniciar de nuevo.

Como irán viendo mi manera preferida de aprender es ir de lo simple a lo complejo gradualmente. Es decir comenzar con ejemplos concretos para luego poder entender los conceptos más abstractos.

Kaggle micro-cursos

Además, estos son mini cursos de 4 horas cada uno. Entonces ir cumpliendo esas pequeñas metas al inicio agrega un boost de motivación adicional.

Kaggle micro-curso: Python

Link: https://www.kaggle.com/learn/python

Precio: Gratis

Kaggle micro-curso: Pandas

Link: https://www.kaggle.com/learn/pandas

Precio: Gratis

Kaggle micro-curso: Visualización de Datos

Link: https://www.kaggle.com/learn/data-visualization

Precio: Gratis

Kaggle micro-curso: Introducción al Machine Learning

Link: https://www.kaggle.com/learn/intro-to-machine-learning

Precio: Gratis

Kaggle micro-curso: Intermediate Machine Learning

Link: https://www.kaggle.com/learn/intermediate-machine-learning

Precio: Gratis

Detengamonos un momento acá. Hay que tener claro que estos 5 mini cursos no van a ser un proceso lineal, probablemente vayas a tener que estar yendo y viniendo entre uno y otro para refrescar conceptos. Cuando estés en el Pandas tal vez tengas que volver a de Python para recordar algunas cosas o ir a la documentación de pandas para entender nuevas funciones que viste en el de Introducción a Machine Learning. Y todo esto está bien, justo acá es dónde va a ocurrir el aprendizaje real.

Ahora, si te das cuenta estos primeros 5 cursos te van a dar las habilidades necesarias para hacer análisis exploratorios y crear modelos base que luego más adelante vas a poder mejorar. Así que este es el momento justo para empezar con competencias simples en Kaggle y poner en práctica lo que has aprendido.

Kaggle Playground Competition: Titanic

Link: https://www.kaggle.com/c/titanic

Kaggle Playground Competition: Housing Prices

Link: https://www.kaggle.com/c/home-data-for-ml-course

Ya para este punto tenés bastante experiencia práctica y sentís que podés resolver un montón de problemas, peeero tal vez no entendés qué es lo que pasa por detrás de cada uno de los algoritmos de clasificación y regresión que has usado. Así que aquí es donde tenemos que ponernos a estudiar los fundamentos de lo que estamos aprendiendo.

Muchos cursos empiezan por aquí, pero al menos yo absorbo mejor esta información ya una vez que he trabajado en algo práctico antes.

Libro: Data Science from Scratch

Este libro es bastante amigable de leer, trae ejemplos en Python de cada uno de los temas y no tiene mucha matemática pesada, que es algo fundamental para esta etapa. Queremos entender el principio de los algoritmos pero aún teniendo una perspectiva práctica, no queremos desmotivarnos viendo un montón de notación matemática densa.

Link: Amazon

Precio: $26 aprox

Si llegaste hasta acá diría que sos bastante capaz de trabajar en ciencias de datos y entender los principios fundamentales detrás de las soluciones. Entonces acá te invito a seguir participando en competencias de Kaggle más complejas, participar en los foros y explorar nuevos métodos que te vayas encontrando en las soluciones de otros participantes.

Curso Online: Machine Learning de Andrew Ng

Link: https://www.coursera.org/learn/machine-learning

Precio: Gratis sin el certificado - $79 con el certificado

Libro: The Elements of Statistical Learning

Link: Amazon

Precio: $60, hay una versión gratuita oficial en la página de Stanford.

Curso Online: Deep Learning de Andrew Ng

Link: https://www.deeplearning.ai/deep-learning-specialization/

Precio: $49/mes

Y ya en este punto depende mucho de tus propios intereses, podés concentrarte en problemas de regresión y series de tiempo o quizás ir más en deep learning. Va a depender mucho de vos.

Por último les quería contar que estoy pronto a lanzar un juego de Trivia de Data Science con preguntas y respuestas que suelen salir en las entrevistas. Para recibir más noticias sobre el juego pueden suscribirse acá.

Physicist turned data scientist. Creator of http://datasciencetrivia.com a Q&A card game to learn key data science concepts by playing.

Physicist turned data scientist. Creator of http://datasciencetrivia.com a Q&A card game to learn key data science concepts by playing.