Diferencia entre Deep Learning y Machine Learning Vs AI

Tabla de contenido:

Anonim

¿Qué es la IA?

La IA (inteligencia artificial) es una rama de la informática en la que se programan máquinas y se les da la capacidad cognitiva para pensar e imitar acciones como las de los humanos y los animales. El punto de referencia para la IA es la inteligencia humana con respecto al razonamiento, el habla, el aprendizaje, la visión y la resolución de problemas, que está muy lejos en el futuro.

La IA tiene tres niveles diferentes:

  1. IA estrecha : se dice que una inteligencia artificial es estrecha cuando la máquina puede realizar una tarea específica mejor que un humano. La investigación actual de la IA está aquí ahora
  2. IA general : una inteligencia artificial alcanza el estado general cuando puede realizar cualquier tarea intelectual con el mismo nivel de precisión que un humano.
  3. IA activa : una IA está activa cuando puede vencer a los humanos en muchas tareas.

Los primeros sistemas de IA utilizaban sistemas expertos y de coincidencia de patrones.

Descripción general del sistema de inteligencia artificial

En este tutorial, aprenderá:

  • ¿Qué es la IA?
  • ¿Qué es ML?
  • ¿Qué es el aprendizaje profundo?
  • Proceso de aprendizaje automático
  • Proceso de aprendizaje profundo
  • Automatizar la extracción de características mediante DL
  • Diferencia entre aprendizaje automático y aprendizaje profundo
  • ¿Cuándo usar ML o DL?

¿Qué es ML?

ML (Machine Learning) es un tipo de IA en la que se entrena una computadora para automatizar tareas que son exhaustivas o imposibles para los seres humanos. Es la mejor herramienta para analizar, comprender e identificar patrones en datos basados ​​en el estudio de algoritmos informáticos. El aprendizaje automático puede tomar decisiones con una mínima intervención humana.

Al comparar la inteligencia artificial con el aprendizaje automático, el aprendizaje automático utiliza datos para alimentar un algoritmo que puede comprender la relación entre la entrada y la salida. Cuando la máquina terminó de aprender, puede predecir el valor o la clase de un nuevo punto de datos.

¿Qué es el aprendizaje profundo?

El aprendizaje profundo es un software informático que imita la red de neuronas del cerebro. Es un subconjunto del aprendizaje automático y se denomina aprendizaje profundo porque hace uso de redes neuronales profundas. La máquina usa diferentes capas para aprender de los datos. La profundidad del modelo está representada por el número de capas del modelo. El aprendizaje profundo es el nuevo estado del arte en términos de IA. En el aprendizaje profundo, la fase de aprendizaje se realiza a través de una red neuronal. Una red neuronal es una arquitectura en la que las capas se apilan una encima de la otra.

Proceso de aprendizaje automático

Imagina que estás destinado a crear un programa que reconozca objetos. Para entrenar el modelo, usará un clasificador . Un clasificador usa las características de un objeto para intentar identificar la clase a la que pertenece.

En el ejemplo, el clasificador se entrenará para detectar si la imagen es:

  • Bicicleta
  • Bote
  • Auto
  • Plano

Los cuatro objetos anteriores son la clase que el clasificador debe reconocer. Para construir un clasificador, necesita tener algunos datos como entrada y asignarle una etiqueta. El algoritmo tomará estos datos, buscará un patrón y luego lo clasificará en la clase correspondiente.

Esta tarea se llama aprendizaje supervisado. En el aprendizaje supervisado, los datos de entrenamiento que alimenta al algoritmo incluyen una etiqueta.

Entrenar un algoritmo requiere seguir algunos pasos estándar:

  • Recoge los datos
  • Entrena al clasificador
  • Hacer predicciones

El primer paso es necesario, elegir los datos correctos hará que el algoritmo sea un éxito o un fracaso. Los datos que elige para entrenar el modelo se denominan característica. En el ejemplo de objeto, las características son los píxeles de las imágenes.

Cada imagen es una fila en los datos, mientras que cada píxel es una columna. Si su imagen tiene un tamaño de 28 x 28, el conjunto de datos contiene 784 columnas (28 x 28). En la imagen siguiente, cada imagen se ha transformado en un vector de características. La etiqueta le dice a la computadora qué objeto está en la imagen.

Proceso de aprendizaje automático

El objetivo es utilizar estos datos de entrenamiento para clasificar el tipo de objeto. El primer paso consiste en crear las columnas de características. Luego, el segundo paso consiste en elegir un algoritmo para entrenar el modelo. Cuando finaliza el entrenamiento, el modelo predecirá qué imagen corresponde a qué objeto.

Después de eso, es fácil usar el modelo para predecir nuevas imágenes. Para cada nueva imagen que ingresa al modelo, la máquina predecirá la clase a la que pertenece. Por ejemplo, una imagen completamente nueva sin etiqueta está pasando por el modelo. Para un ser humano, es trivial visualizar la imagen como un automóvil. La máquina utiliza sus conocimientos previos para predecir que la imagen es un automóvil.

Proceso de aprendizaje profundo

En el aprendizaje profundo, la fase de aprendizaje se realiza a través de una red neuronal. Una red neuronal es una arquitectura en la que las capas se apilan unas sobre otras.

Considere el mismo ejemplo de imagen anterior. El conjunto de entrenamiento se enviaría a una red neuronal.

Cada entrada entra en una neurona y se multiplica por un peso. El resultado de la multiplicación fluye a la siguiente capa y se convierte en la entrada. Este proceso se repite para cada capa de la red. La capa final se denomina capa de salida; proporciona un valor real para la tarea de regresión y una probabilidad de cada clase para la tarea de clasificación. La red neuronal utiliza un algoritmo matemático para actualizar los pesos de todas las neuronas. La red neuronal está completamente entrenada cuando el valor de los pesos da una salida cercana a la realidad. Por ejemplo, una red neuronal bien entrenada puede reconocer el objeto en una imagen con mayor precisión que la red neuronal tradicional.

Proceso de aprendizaje profundo

Automatizar la extracción de características mediante DL

Un conjunto de datos puede contener de una docena a cientos de características. El sistema aprenderá de la relevancia de estas características. Sin embargo, no todas las funciones son significativas para el algoritmo. Una parte crucial del aprendizaje automático es encontrar un conjunto de características relevantes para que el sistema aprenda algo.

Una forma de realizar esta parte en el aprendizaje automático es utilizar la extracción de características. La extracción de características combina las características existentes para crear un conjunto de características más relevante. Se puede realizar con PCA, T-SNE o cualquier otro algoritmo de reducción de dimensionalidad.

Por ejemplo, en un procesamiento de imágenes, el médico debe extraer la característica manualmente en la imagen, como los ojos, la nariz, los labios, etc. Esas características extraídas se alimentan al modelo de clasificación.

El aprendizaje profundo resuelve este problema, especialmente para una red neuronal convolucional. La primera capa de una red neuronal aprenderá pequeños detalles de la imagen; las siguientes capas combinarán los conocimientos previos para hacer información más compleja. En la red neuronal convolucional, la extracción de características se realiza con el uso del filtro. La red aplica un filtro a la imagen para ver si hay una coincidencia, es decir, la forma de la característica es idéntica a una parte de la imagen. Si hay una coincidencia, la red utilizará este filtro. Por lo tanto, el proceso de extracción de características se realiza automáticamente.

Aprendizaje automático tradicional frente a aprendizaje profundo

Diferencia entre aprendizaje automático y aprendizaje profundo

A continuación se muestra una diferencia clave entre Deep Learning y Machine Learning

Aprendizaje automático

Aprendizaje profundo

Dependencias de datos

Excelentes rendimientos en un conjunto de datos pequeño / mediano

Excelente rendimiento en un gran conjunto de datos

Dependencias de hardware

Trabaja en una máquina de gama baja.

Requiere una máquina potente, preferiblemente con GPU: DL realiza una cantidad significativa de multiplicación de matrices

Ingeniería de características

Necesita comprender las características que representan los datos.

No es necesario comprender la mejor característica que representa los datos

Tiempo de ejecución

De unos minutos a horas

Hasta semanas. La red neuronal necesita calcular una cantidad significativa de pesos

Interpretabilidad

Algunos algoritmos son fáciles de interpretar (logístico, árbol de decisiones), otros son casi imposibles (SVM, XGBoost)

Difícil a imposible

¿Cuándo usar ML o DL?

En la siguiente tabla, resumimos la diferencia entre el aprendizaje automático y el aprendizaje profundo con ejemplos.

Aprendizaje automático Aprendizaje profundo
Conjunto de datos de entrenamiento Pequeño Grande
Elige características No
Numero de algoritmos Muchos Pocos
Tiempo de entrenamiento Pequeño Largo

Con el aprendizaje automático, necesita menos datos para entrenar el algoritmo que el aprendizaje profundo. El aprendizaje profundo requiere un conjunto de datos extenso y diverso para identificar la estructura subyacente. Además, el aprendizaje automático proporciona un modelo entrenado más rápido. La arquitectura de aprendizaje profundo más avanzada puede tardar días o una semana en entrenarse. La ventaja del aprendizaje profundo sobre el aprendizaje automático es que es muy preciso. No es necesario que comprenda qué características son la mejor representación de los datos; la red neuronal aprendió a seleccionar características críticas. En el aprendizaje automático, debe elegir usted mismo qué características incluir en el modelo.

Resumen

La inteligencia artificial está impartiendo una capacidad cognitiva a una máquina. Al comparar la IA con el aprendizaje automático, los primeros sistemas de IA utilizaban sistemas expertos y de coincidencia de patrones.

La idea detrás del aprendizaje automático es que la máquina puede aprender sin intervención humana. La máquina necesita encontrar una manera de aprender a resolver una tarea dados los datos.

El aprendizaje profundo es el gran avance en el campo de la inteligencia artificial. Cuando hay suficientes datos para entrenar, el aprendizaje profundo logra resultados impresionantes, especialmente para el reconocimiento de imágenes y la traducción de texto. La razón principal es que la extracción de características se realiza automáticamente en las diferentes capas de la red.