Proceso que analiza grandes volúmenes de datos para descubrir patrones ocultos.
Permite encontrar relaciones útiles para la toma de decisiones. Combina estadística, machine learning y bases de datos.
# Ejemplo de minería de datos con Python y pandas import pandas as pd from sklearn.cluster import KMeans # Cargar datos df = pd.read_csv('clientes.csv') # Análisis exploratorio print(df.describe()) print(df.corr()) # Correlaciones # Clustering - agrupar clientes similares X = df[['edad', 'gasto_mensual', 'frecuencia_compra']] kmeans = KMeans(n_clusters=3) df['segmento'] = kmeans.fit_predict(X) # Análisis de cada segmento for segmento in df['segmento'].unique(): print(f"Segmento {segmento}:") print(df[df['segmento'] == segmento].mean()) # Reglas de asociación (ej: productos comprados juntos) # "Clientes que compran X también compran Y"