Una de las cosas más interesantes en la explotación de una base de datos es, finalmente, la minería de éstos.
El concepto de "minería de datos" se basa en el análisis de los datos con fines predictivos, para encontrar patrones ocultos en éstos... ¿quien podría adivinar que a una determinada hora o un determinado día de la semana se consume un determinado producto? ¿o que un producto orientado a hombres (cuchillas de afeitar) pasa a ser usado por mujeres solteras de un rango de edad?
Una predicción de este tipo podría sugerir la creación de una nueva linea de producto, ofertas, etc.
Hace tiempo impartí una conferencia sobre cómo implementar un modelo de base de datos de reservas en vuelos, desde un diagrama entidad-relación concreto hasta la explotación de datos históricos en el futuro. La aplicación pasaba por varias etapas (diseño, implementación, uso/cargas de datos, paso a histórico y reporting), y aunque los datos eran cargas completamente aleatorias, sucedían ciertos patrones interesantes.
Los casados tomaban vuelos a Roma, los solteros a Milán, "Air France" viajaba con los vuelos a medio llenar, y otras compañías apenas tenían uno o dos vuelos con pérdidas...
De modo que se me ocurrió hacer una prueba de minería de datos, para buscar una predicción que no pudiera verse "a simple vista". Éste fue el resultado:
El concepto de "minería de datos" se basa en el análisis de los datos con fines predictivos, para encontrar patrones ocultos en éstos... ¿quien podría adivinar que a una determinada hora o un determinado día de la semana se consume un determinado producto? ¿o que un producto orientado a hombres (cuchillas de afeitar) pasa a ser usado por mujeres solteras de un rango de edad?
Una predicción de este tipo podría sugerir la creación de una nueva linea de producto, ofertas, etc.
Hace tiempo impartí una conferencia sobre cómo implementar un modelo de base de datos de reservas en vuelos, desde un diagrama entidad-relación concreto hasta la explotación de datos históricos en el futuro. La aplicación pasaba por varias etapas (diseño, implementación, uso/cargas de datos, paso a histórico y reporting), y aunque los datos eran cargas completamente aleatorias, sucedían ciertos patrones interesantes.
Los casados tomaban vuelos a Roma, los solteros a Milán, "Air France" viajaba con los vuelos a medio llenar, y otras compañías apenas tenían uno o dos vuelos con pérdidas...
De modo que se me ocurrió hacer una prueba de minería de datos, para buscar una predicción que no pudiera verse "a simple vista". Éste fue el resultado:
Ejemplo de Uso - Oracle Data Miner - Parte 1/2
Ejemplo de Uso - Oracle Data Miner - Parte 2/2
Al final, la predicción (absurda) sobre los datos aleatorios fue una relación de probabilidades en las cuales un determinado tipo de persona (hombre/mujer, de una edad, de una ciudad) reservaría billetes con precios superiores a la media.
No hay comentarios:
Publicar un comentario