Repositorio que contiene notebooks con la solución a problemas de minería de datos:
- Preparación de datos A lo largo de esta práctica veremos como aplicar distintas técnicas para la carga y preparación de datos:
- Carga de conjuntos de datos
- Análisis de los datos
- Análisis estadístico básico
- Análisis exploratorio de los datos
- Reducción de dimensionalidad
- Entrenamiento y test
La solución es el archivo eda_pca_train_test.ipynb. Se usó el dataset Breast Cancer Wisconsin (Diagnostic) Data Set
- Métodos no supervisados A lo largo de esta práctica veremos como aplicar distintas técnicas no supervisadas así como algunas de sus aplicaciones reales:
- Clustering con distintas estrategias: k-means y regla del codo, basadas en densidad y jerárquicas.
- Aplicación: generación de imágenes con reducción de dimensionalidad. PCA y UMAP.
- Aplicación: identificación de puntos de interés turísticos.
La solución es el archivo unsupervised_methods.ipynb. Se han usado los datasets de la librería scikit-learn: make_blobs, make_moons y make_circles