Aprendizaje supervisado o no supervisado: diferencias clave

Tabla de contenido:

Anonim

¿Qué es el aprendizaje automático supervisado?

En el aprendizaje supervisado, entrena la máquina utilizando datos que están bien "etiquetados ". Significa que algunos datos ya están etiquetados con la respuesta correcta. Se puede comparar con el aprendizaje que tiene lugar en presencia de un supervisor o un profesor.

Un algoritmo de aprendizaje supervisado aprende de los datos de entrenamiento etiquetados y le ayuda a predecir los resultados de los datos imprevistos. Crear, escalar e implementar con éxito un modelo de ciencia de datos de aprendizaje automático supervisado y preciso requiere tiempo y experiencia técnica de un equipo de científicos de datos altamente capacitados. Además, el científico de datos debe reconstruir modelos para asegurarse de que la información proporcionada se mantenga verdadera hasta que cambien los datos.

En este tutorial, aprenderá

  • ¿Qué es el aprendizaje automático supervisado?
  • ¿Qué es el aprendizaje no supervisado?
  • ¿Por qué el aprendizaje supervisado?
  • ¿Por qué el aprendizaje no supervisado?
  • ¿Cómo funciona el aprendizaje supervisado?
  • ¿Cómo funciona el aprendizaje no supervisado?
  • Tipos de técnicas de aprendizaje automático supervisadas
  • Tipos de técnicas de aprendizaje automático no supervisadas
  • Aprendizaje supervisado o no supervisado

¿Qué es el aprendizaje no supervisado?

El aprendizaje no supervisado es una técnica de aprendizaje automático en la que no es necesario supervisar el modelo. En su lugar, debe permitir que el modelo funcione por sí solo para descubrir información. Se ocupa principalmente de los datos sin etiquetar.

Los algoritmos de aprendizaje sin supervisión le permiten realizar tareas de procesamiento más complejas en comparación con el aprendizaje supervisado. Sin embargo, el aprendizaje no supervisado puede ser más impredecible en comparación con otros métodos de aprendizaje profundo y de refuerzo de aprendizaje natural.

¿Por qué el aprendizaje supervisado?

  • El aprendizaje supervisado le permite recopilar datos o producir una salida de datos de la experiencia anterior.
  • Le ayuda a optimizar los criterios de rendimiento utilizando la experiencia
  • El aprendizaje automático supervisado le ayuda a resolver varios tipos de problemas de computación del mundo real.

¿Por qué el aprendizaje no supervisado?

A continuación, presentamos las principales razones para utilizar el aprendizaje no supervisado:

  • El aprendizaje automático no supervisado encuentra todo tipo de patrones desconocidos en los datos.
  • Los métodos no supervisados ​​lo ayudan a encontrar características que pueden ser útiles para la categorización.
  • Se lleva a cabo en tiempo real, por lo que todos los datos de entrada se analizarán y etiquetarán en presencia de los alumnos.
  • Es más fácil obtener datos sin etiquetar de una computadora que datos etiquetados, que necesitan intervención manual.

¿Cómo funciona el aprendizaje supervisado?

Por ejemplo, desea entrenar una máquina para que le ayude a predecir cuánto tiempo le llevará conducir a casa desde su lugar de trabajo. Aquí, comienza creando un conjunto de datos etiquetados. Estos datos incluyen

  • Las condiciones climáticas
  • Hora del día
  • Vacaciones

Todos estos detalles son sus aportaciones. El resultado es la cantidad de tiempo que tardó en conducir de regreso a casa ese día específico.

Instintivamente sabes que si está lloviendo afuera, te tomará más tiempo conducir a casa. Pero la máquina necesita datos y estadísticas.

Veamos ahora cómo puede desarrollar un modelo de aprendizaje supervisado de este ejemplo que ayude al usuario a determinar el tiempo de viaje. Lo primero que debe crear es un conjunto de datos de entrenamiento. Este conjunto de entrenamiento contendrá el tiempo total de viaje y los factores correspondientes como el clima, la hora, etc. Según este conjunto de entrenamiento, su máquina puede ver que existe una relación directa entre la cantidad de lluvia y el tiempo que tardará en llegar a casa.

Por lo tanto, se asegura de que cuanto más llueva, más tiempo conducirá para regresar a su casa. También puede ver la conexión entre el tiempo que sale del trabajo y el tiempo que estará en la carretera.

Cuanto más cerca esté de las 6 pm, más tiempo tardará en llegar a casa. Su máquina puede encontrar algunas de las relaciones con sus datos etiquetados.

Este es el comienzo de su modelo de datos. Comienza a afectar la forma en que la lluvia afecta la forma en que las personas conducen. También comienza a ver que más personas viajan durante un momento particular del día.

¿Cómo funciona el aprendizaje no supervisado?

Tomemos el caso de un bebé y su perro de la familia.

Ella conoce e identifica a este perro. Unas semanas más tarde, un amigo de la familia trae un perro e intenta jugar con el bebé.

Baby no ha visto a este perro antes. Pero reconoce que muchas características (2 orejas, ojos, caminar sobre 4 patas) son como su perro mascota. Ella identifica un nuevo animal como un perro. Este es un aprendizaje no supervisado, en el que no se le enseña, pero se aprende de los datos (en este caso, datos sobre un perro). Si hubiera sido un aprendizaje supervisado, el amigo de la familia le habría dicho al bebé que es un perro.

Tipos de técnicas de aprendizaje automático supervisadas

Regresión:

La técnica de regresión predice un único valor de salida utilizando datos de entrenamiento.

Ejemplo: puede utilizar la regresión para predecir el precio de la vivienda a partir de los datos de formación. Las variables de entrada serán la localidad, el tamaño de la casa, etc.

Clasificación:

Clasificación significa agrupar la salida dentro de una clase. Si el algoritmo intenta etiquetar la entrada en dos clases distintas, se denomina clasificación binaria. La selección entre más de dos clases se denomina clasificación multiclase.

Ejemplo : Determinar si alguien será o no moroso del préstamo.

Fortalezas : Las salidas siempre tienen una interpretación probabilística y el algoritmo se puede regularizar para evitar el sobreajuste.

Debilidades : la regresión logística puede tener un rendimiento inferior cuando existen límites de decisión múltiples o no lineales. Este método no es flexible, por lo que no captura relaciones más complejas.

Tipos de técnicas de aprendizaje automático no supervisadas

Los problemas de aprendizaje no supervisados ​​se agrupan además en problemas de agrupación y asociación.

Agrupación

La agrupación en clústeres es un concepto importante cuando se trata de aprendizaje no supervisado. Se trata principalmente de encontrar una estructura o patrón en una colección de datos sin clasificar. Los algoritmos de agrupación procesarán sus datos y encontrarán agrupaciones naturales (grupos) si existen en los datos. También puede modificar cuántos clústeres deben identificar sus algoritmos. Le permite ajustar la granularidad de estos grupos.

Asociación

Las reglas de asociación le permiten establecer asociaciones entre objetos de datos dentro de grandes bases de datos. Esta técnica sin supervisión se trata de descubrir relaciones interesantes entre variables en grandes bases de datos. Por ejemplo, las personas que compran una casa nueva tienen más probabilidades de comprar muebles nuevos.

Otros ejemplos:

  • Un subgrupo de pacientes con cáncer agrupados por sus medidas de expresión génica
  • Grupos de compradores según su historial de navegación y compras
  • Grupo de películas según la calificación otorgada por los espectadores de películas

Aprendizaje supervisado o no supervisado

Parámetros Técnica de aprendizaje automático supervisada Técnica de aprendizaje automático sin supervisión
Proceso En un modelo de aprendizaje supervisado, se darán las variables de entrada y salida. En el modelo de aprendizaje no supervisado, solo se proporcionarán datos de entrada
Los datos de entrada Los algoritmos se entrenan utilizando datos etiquetados. Los algoritmos se utilizan contra datos que no están etiquetados.
Algoritmos utilizados Admite máquinas vectoriales, redes neuronales, regresión lineal y logística, bosques aleatorios y árboles de clasificación. Los algoritmos no supervisados ​​se pueden dividir en diferentes categorías: como algoritmos de clúster, K-medias, clústeres jerárquicos, etc.
Complejidad computacional El aprendizaje supervisado es un método más simple. El aprendizaje no supervisado es computacionalmente complejo
Uso de datos El modelo de aprendizaje supervisado utiliza datos de entrenamiento para aprender un vínculo entre la entrada y las salidas. El aprendizaje no supervisado no utiliza datos de salida.
Exactitud de los resultados Método altamente preciso y confiable. Método menos preciso y confiable.
Aprendizaje en tiempo real El método de aprendizaje se lleva a cabo sin conexión. El método de aprendizaje se lleva a cabo en tiempo real.
Numero de clases Se conoce el número de clases. Se desconoce el número de clases.
Inconveniente principal La clasificación de macrodatos puede ser un verdadero desafío en el aprendizaje supervisado. No puede obtener información precisa sobre la clasificación de datos, y la salida como datos utilizados en el aprendizaje no supervisado está etiquetada y no se conoce.

Resumen

  • En el aprendizaje supervisado, entrena la máquina utilizando datos que están bien "etiquetados".
  • El aprendizaje no supervisado es una técnica de aprendizaje automático en la que no es necesario supervisar el modelo.
  • El aprendizaje supervisado le permite recopilar datos o producir una salida de datos de la experiencia anterior.
  • El aprendizaje automático no supervisado le ayuda a encontrar todo tipo de patrones desconocidos en los datos.
  • Por ejemplo, podrá determinar el tiempo necesario para volver según las condiciones meteorológicas, las horas del día y las vacaciones.
  • Por ejemplo, Baby puede identificar a otros perros basándose en el aprendizaje supervisado en el pasado.
  • La regresión y la clasificación son dos tipos de técnicas de aprendizaje automático supervisadas.
  • El agrupamiento y la asociación son dos tipos de aprendizaje no supervisado.
  • En un modelo de aprendizaje supervisado, se proporcionarán variables de entrada y salida, mientras que con el modelo de aprendizaje no supervisado, solo se proporcionarán datos de entrada.