Algoritmos de minería de datos
El algoritmo de minería de datos es el mecanismo que crea modelos de minería de datos. Para crear un modelo, un algoritmo analiza primero un conjunto de datos, buscando patrones y tendencias específicos. Después, el algoritmo utiliza los resultados de este análisis para definir los parámetros del modelo de minería de datos.
El modelo de minería de datos que crea un algoritmo puede tomar diversas formas, incluyendo:
- Un conjunto de reglas que describen cómo se agrupan los productos en una transacción.
- Un árbol de decisión que predice si un cliente determinado comprará un producto.
- Un modelo matemático que predice las ventas.
- Un conjunto de clústeres que describe cómo se relacionan los escenarios de un conjunto de datos.
Microsoft SQL Server 2005 Analysis Services (SSAS) proporciona varios algoritmos que puede usar en las soluciones de minería de datos. Estos algoritmos son un subconjunto de todos los algoritmos que pueden utilizarse en la minería de datos. También puede utilizar algoritmos de minería de datos desarrollados por terceros que cumplan la especificación OLE DB para minería de datos. Para obtener más información sobre los algoritmos de terceros, vea Algoritmos de complemento.
Revisar los algoritmos
Analysis Services incluye los siguientes tipos de algoritmos:
- Algoritmos de clasificación, que predicen una o más variables discretas, basándose en otros atributos del conjunto de datos. Un ejemplo de algoritmo de clasificación es el Algoritmo de árboles de decisión de Microsoft.
- Algoritmos de regresión, que predicen una o más variables continuas, como las pérdidas o los beneficios, basándose en otros atributos del conjunto de datos. Un ejemplo de algoritmo de regresión es el Algoritmo de serie temporal de Microsoft.
- Algoritmos de segmentación, que dividen los datos en grupos, o clústeres, de elementos que tienen propiedades similares. Un ejemplo de algoritmo de segmentación es el Algoritmo de clústeres de Microsoft.
- Algoritmos de asociación, que buscan correlaciones entre diferentes atributos de un conjunto de datos. La aplicación más común de esta clase de algoritmo es la creación de reglas de asociación, que pueden utilizarse en un análisis de la cesta de compra. Un ejemplo de algoritmo de asociación es el Algoritmo de asociación de Microsoft.
- Algoritmos de análisis de secuencias, que resumen secuencias o episodios frecuentes en los datos, como un flujo de rutas Web. Un ejemplo de algoritmo de análisis de secuencias es el Algoritmo de clústeres de secuencia de Microsoft.
Aplicar los algoritmos
La elección del algoritmo apropiado para una tarea empresarial específica puede ser un trabajo difícil. Aunque puede utilizar diferentes algoritmos para realizar la misma tarea, cada uno de ellos genera un resultado diferente, y algunos pueden generar más de un tipo de resultado. Por ejemplo, puede usar el algoritmo Árboles de decisión de Microsoft no sólo para la predicción, sino también como una forma de reducir el número de columnas de un conjunto de datos, ya que el árbol de decisión puede identificar las columnas que no afectan al modelo de minería de datos final.
Tampoco es necesario que use los algoritmos de modo independiente: en una solución de minería de datos puede utilizar algunos algoritmos para examinar los datos y, después, usar otros para predecir un resultado específico basándose en esos datos. Por ejemplo, puede utilizar un algoritmo de clústeres, que reconoce patrones, para dividir los datos en grupos que sean más o menos homogéneos, y luego usar los resultados para crear un mejor modelo de árbol de decisión. Puede utilizar varios algoritmos dentro de una solución para realizar tareas independientes, por ejemplo, usar un algoritmo de árbol de regresión para obtener información de previsiones financieras y un algoritmo basado en reglas para llevar a cabo un análisis de la cesta de compra.
Los modelos de minería de datos pueden predecir valores, generar resúmenes de datos y buscar correlaciones ocultas. Para ayudarle a seleccionar los algoritmos para su solución de minería de datos, la siguiente tabla proporciona sugerencias sobre qué algoritmos usar en tareas específicas.
Tarea | Algoritmos de Microsoft que se pueden usar |
---|---|
Predecir un atributo discreto.Por ejemplo, predecir si el destinatario de una campaña de correo directo adquirirá un producto. |
Algoritmo de árboles de decisión de Microsoft Algoritmo Bayes naive de Microsoft |
Predecir un atributo continuo. Por ejemplo, prever las ventas del año próximo. |
|
Predecir una secuencia. Por ejemplo, realizar un análisis del flujo de clics en el sitio Web de una empresa. |
|
Buscar grupos de elementos comunes en transacciones. Por ejemplo, utilizar el análisis de la cesta de compra para sugerir a un cliente la compra de productos adicionales. |
|
Buscar grupos de elementos similares. Por ejemplo, segmentar datos demográficos en grupos a fin de comprender mejor las relaciones entre los atributos. |
Debido a que cada modelo devuelve un tipo de resultado diferente, Analysis Services proporciona un visor independiente para cada algoritmo. Cuando explora un modelo de minería de datos en Analysis Services, el modelo aparece en la ficha Visor de modelos de minería de datos del Diseñador de minería de datos, utilizando el visor apropiado para el modelo. Para obtener más información, vea Ver un modelo de minería de datos.
Detalles del algoritmo
Puede utilizar funciones para ampliar los resultados que devuelve un modelo de minería de datos. La siguiente tabla presenta una lista de las funciones que admiten todos los algoritmos de Analysis Services.
Algunos algoritmos individuales pueden admitir funciones adicionales. Ninguno de los algoritmos que ofrece Microsoft permite claves duplicadas.
Vea también
Conceptos
Conceptos de minería de datos
Estructuras de minería de datos (Analysis Services)
Algoritmo de asociación de Microsoft
Algoritmo de clústeres de Microsoft
Algoritmo de árboles de decisión de Microsoft
Algoritmo Bayes naive de Microsoft
Algoritmo de red neuronal de Microsoft (SSAS)
Algoritmo de clústeres de secuencia de Microsoft
Algoritmo de serie temporal de Microsoft
Algoritmo de regresión lineal de Microsoft
Algoritmo de regresión logística de Microsoft
Algoritmos de complemento
Usar las herramientas de minería de datos
Otros recursos
Referencia de Extensiones de minería de datos (DMX)