¿Qué es el aprendizaje automático? Tipos y modelos.
Machine learning
Como se ha mencionado anteriormente, el aprendizaje automático, más conocido como machine learning (ML), es una rama de la IA capaz de crear algoritmos con la habilidad de aprender a realizar una determinada tarea para la cual no han sido específicamente programados. La principal diferencia entre el machine learning y la programación regular es que para crear un algoritmo de aprendizaje automático el desarrollador no tendrá que programarlo considerando todas las situaciones y excepciones posibles.
Para que el algoritmo aprenda a realizar una determinada tarea de forma automática es necesario introducirle una gran cantidad de datos, con el objetivo de que conozca qué debe hacer en cada situación. Este procedimiento se le conoce como entrenamiento del modelo o algoritmo.
Se trata del principal enfoque de la inteligencia artificial. Gracias al machine learning es posible ofrecer a los usuarios una experiencia personalizada en motores de búsqueda como Google aprendiendo a partir de un conjunto de patrones de información [2]. Otro ejemplo de uso de ML es la clasificación automática que se realiza de correo electrónico mediante filtros de spam, decidiendo y clasificando qué correo es deseado o no deseado.
Existen tres tipos de aprendizaje automático: el aprendizaje supervisado, no supervisado y el aprendizaje reforzado:
Tipos de machine learning
Método que consiste en entrenar a un algoritmo de machine learning a partir de una serie de datos de entrada etiquetados y organizados previamente para indicar cuál tendría que ser la salida en cada caso, es decir, cómo tendría que ser clasificada la nueva información de entrada. Por tanto, este método requiere de intervención humana en un principio. Existen 2 técnicas:
- Algoritmo de clasificación: se agrupan los datos según patrones comunes.
- Algoritmo de regresión: se emplean gráficos de dispersión para representar los datos modelándolos con una función que los represente.
En este método se entrena al algoritmo con datos que no han sido previamente categorizados. Por tanto, a diferencia del aprendizaje supervisado, en este caso al algoritmo debe buscar la forma de clasificar los datos por él mismo en base a características comunes, no requiriendo de la intervención humana. Luego en el aprendizaje no supervisado en ningún momento se proporciona al algoritmo las etiquetas, es decir, las respuestas.
Se trata de un método en el cual el algoritmo aprende en base a su experiencia, es decir, basándose en sus aciertos y errores. El objetivo es minimizar el error en la medida de lo posible
Modelos de machine learning
Se basan en definir una línea que mejor se ajuste al conjunto de datos disponible representados en forma de nube de puntos. Destacan la regresión lineal y la regresión logística.
Sin embargo estos modelos tienen un problema denominado overfit. Esto es debido al excesivo ajuste de los datos disponibles, lo cual puede provocar que nuevos datos de entrada fueran mal clasificados.
- Random forest: resuelve las limitaciones de los modelos de árbol, ya que suelen tender al overfit. Mediante esta técnica se combinan diferentes árboles de decisión, donde cada uno ve parte de la información total, obteniendo mejores predicciones. Los resultados de cada modelo se promedian y se obtiene la decisión final.


Comentarios
Publicar un comentario