>

Tipos de aprendizaje en Analítica Avanzada

 In Analítica avanzada

Dentro del campo de la analítica avanzada se puede decir que existen dos grandes grupos de algoritmos en los cuales se catalogan los diferentes tipos de algoritmos que se usan para la construcción de un modelo predictivo, estos son mejor conocidos como algoritmos de aprendizaje supervisado y no supervisado. Independientemente del tipo de aprendizaje que se aplique al modelo es importante contar con una gran cantidad de datos y entre más datos se tenga, el algoritmo puede ‘aprender’ y más probabilidades de acertar tiene, pero esto a su vez puede llevar a otro problema y es que el algoritmo se ajuste demasiado a los datos ocasionando problemas de overfitting (cosa que trataremos en una entrada más adelante y como evitarlo)

Aprendizaje supervisado

De este grupo forman parte todos aquellos algoritmos que hacen uso de una base de datos en la cual se les indica cuál o cuáles son las variables de que debe de aprender a ‘predecir’ o clasificar.

Una de las técnicas usadas para esto es dividir la base de datos que se tiene en dos, mejor conocidos como datos de Training y datos de Testing, estos se suelen corresponder al 70% y 30% del conjunto total de los datos respectivamente; en donde usamos los datos de Training, como lo indica su nombre, para entregar al algoritmo o algoritmos usados en el modelo, y para saber que tan bueno es el modelo resultante usamos los datos de Testing, debido a que es allí dónde tenemos un conjunto de datos correctos y podemos comparar los resultados arrojados con el modelo con los correctos y verificar que tanto se acercan a un porcentaje esperado, si este valor se encuentra por debajo se hace necesario revisar el modelo y revisar el conjunto de datos, si es necesario agregar o eliminar transformaciones a los mismos en busca de mejorar el resultado final.

Aprendizaje no supervisado

A diferencia del aprendizaje supervisado, este no hace uso de un conjunto de datos de Training y Testing, puesto que no se tiene algo con que comparar un resultado realmente, por lo cual solo hace uso de datos de Training, es decir, no se tiene un conocimiento a priori; este tipo de algoritmos son muy usados en clusters. Debido a esto, este tipo de algoritmos son aquellos que presentan una mayor dificultad al momento de evaluarlos.


Sobre nosotros:

En nuestra experiencia desarrollando soluciones de toma de decisiones basadas en las prácticas ágiles, hemos sido participes de la evolución del movimiento ágil, y ponemos a tu disposición este conocimiento. Te invitamos a conocer las soluciones de Business Intelligence (BI),  y  Planificación Financiera que Rollup Consulting puede ofrecerte para involucrarte en la cultura de la analítica de datos ágil.

 

Contactanos para conversar más sobre Analítica Avanzada

Recent Posts

Start typing and press Enter to search