Kaggle [30 días de ML] – días 12-14
Continuamos con la formación de Kaggle: ¡30 días de ML!: días 12-14.
Si quieren ver las publicaciones anteriores:
- 1-7: https://jahazielponce.com/kaggle-30-dias-ml-1-7/
- 8-11: https://jahazielponce.com/kaggle-30-dias-ml-dias-8-11/
Índice
Día 12
Este día aprendemos de manera triple:
- Probando distintos parámetros de un modelo Random Forest y eligiendo el mejor usando un conjunto de validación.
- Tratamiento de datos missing:
- Eliminando columnas.
- Simple imputación: media, mediana.
- Simple imputación y añadiendo una columna indicando que se ha imputado.
- Tratamiento de datos categóricos:
- Eliminar columnas.
- Ordinal encoding.
- One Hot Encoding.
Tutorial 1
https://github.com/Jazielinho/kaggle-30-days/blob/master/day_12/introduction.ipynb
Ejercicios 1
https://github.com/Jazielinho/kaggle-30-days/blob/master/day_12/exercise-introduction.ipynb
Tutorial 2
https://github.com/Jazielinho/kaggle-30-days/blob/master/day_12/missing-values.ipynb
Ejercicios 2
https://github.com/Jazielinho/kaggle-30-days/blob/master/day_12/exercise-missing-values.ipynb
Tutorial 3
https://github.com/Jazielinho/kaggle-30-days/blob/master/day_12/categorical-variables.ipynb
Ejercicios 3
https://github.com/Jazielinho/kaggle-30-days/blob/master/day_12/exercise-categorical-variables.ipynb
Día 13
Este día aprendemos de manera doble:
- Cómo crear Pipelines.
- Validación cruzada para evaluar modelos.
Tutorial 1
https://github.com/Jazielinho/kaggle-30-days/blob/master/day_13/pipelines.ipynb
Ejercicios 1
https://github.com/Jazielinho/kaggle-30-days/blob/master/day_13/exercise-pipelines.ipynb
Tutorial 2
https://github.com/Jazielinho/kaggle-30-days/blob/master/day_13/cross-validation.ipynb
Ejercicios 2
https://github.com/Jazielinho/kaggle-30-days/blob/master/day_13/exercise-cross-validation.ipynb
Día 14
Y finalizamos esta publicación aprendiendo de manera doble:
- XGBOOST.
- Fuga de datos.
Tutorial 1
https://github.com/Jazielinho/kaggle-30-days/blob/master/day_14/xgboost.ipynb
Ejercicios 1
https://github.com/Jazielinho/kaggle-30-days/blob/master/day_14/exercise-xgboost.ipynb
Tutorial 2
https://github.com/Jazielinho/kaggle-30-days/blob/master/day_14/data-leakage.ipynb
Ejercicios 2
https://github.com/Jazielinho/kaggle-30-days/blob/master/day_14/exercise-data-leakage.ipynb