Skip to content

gpbonillas/data-mining-python

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 

Repository files navigation

data-mining-python

Repositorio que contiene notebooks con la solución a problemas de minería de datos:

Preparación de datos

  • Preparación de datos A lo largo de esta práctica veremos como aplicar distintas técnicas para la carga y preparación de datos:
  1. Carga de conjuntos de datos
  2. Análisis de los datos
    1. Análisis estadístico básico
    2. Análisis exploratorio de los datos
  3. Reducción de dimensionalidad
  4. Entrenamiento y test

La solución es el archivo eda_pca_train_test.ipynb. Se usó el dataset Breast Cancer Wisconsin (Diagnostic) Data Set

Métodos no supervisados

  • Métodos no supervisados A lo largo de esta práctica veremos como aplicar distintas técnicas no supervisadas así como algunas de sus aplicaciones reales:
  1. Clustering con distintas estrategias: k-means y regla del codo, basadas en densidad y jerárquicas.
  2. Aplicación: generación de imágenes con reducción de dimensionalidad. PCA y UMAP.
  3. Aplicación: identificación de puntos de interés turísticos.

La solución es el archivo unsupervised_methods.ipynb. Se han usado los datasets de la librería scikit-learn: make_blobs, make_moons y make_circles

scikit-learn datasets