Data Mining (Minería de datos)

Paulo7 de enero de 2026

Definición

Proceso que analiza grandes volúmenes de datos para descubrir patrones ocultos.

Descripción

Permite encontrar relaciones útiles para la toma de decisiones. Combina estadística, machine learning y bases de datos.

Ejemplo

# Ejemplo de minería de datos con Python y pandas import pandas as pd from sklearn.cluster import KMeans # Cargar datos df = pd.read_csv('clientes.csv') # Análisis exploratorio print(df.describe()) print(df.corr()) # Correlaciones # Clustering - agrupar clientes similares X = df[['edad', 'gasto_mensual', 'frecuencia_compra']] kmeans = KMeans(n_clusters=3) df['segmento'] = kmeans.fit_predict(X) # Análisis de cada segmento for segmento in df['segmento'].unique(): print(f"Segmento {segmento}:") print(df[df['segmento'] == segmento].mean()) # Reglas de asociación (ej: productos comprados juntos) # "Clientes que compran X también compran Y"

← Volver al glosario