¿Cuál de las siguientes afirmaciones no es cierta sobre el aprendizaje profundo?
- Es un «nuevo» concepto/capacidad tecnológica.
- Es lo mismo que el aprendizaje automático.
- Requiere una importante inversión en infraestructura local (y un gran equipo de científicos de datos).
Si dijiste: «Todo lo anterior», tienes toda la razón.
Los fundamentos del aprendizaje profundo (es decir, el aprendizaje automático y las redes convolucionales) existen desde hace mucho tiempo, como en casi un siglo. Sin embargo, el aprendizaje profundo, tal y como lo conocemos hoy en día, no alcanzó el estatus de hashtag hasta hace unos 10 años, que es cuando creo que nosotros, como humanos, empezamos a darnos cuenta, o tal vez a aceptar, nuestras limitaciones. Cuanto más nos empujaban a trabajar más rápido y a hacer todo a la perfección, más rápido nos dábamos cuenta de que esas dos ambiciones no encajaban bien.
No importa cuántas personas de tu equipo estén enfocadas en completar una tarea, ni importa si son los especialistas más experimentados del mundo. Cuando debe apresurarse a tomar una decisión, y tomar la decisión correcta, aumentan las probabilidades de equivocarse. Al igual que el costo de tomar esa decisión (posiblemente equivocada).
Según un estudio de McKinsey realizado justo antes de la pandemia, los trabajadores de todos los niveles «pasaban el 37% de su tiempo tomando decisiones, y se pensaba que más de la mitad de este tiempo se gastaba de manera ineficaz. Para los gerentes de una empresa promedio de Fortune 500, esto podría traducirse en más de 530,000 días de tiempo de trabajo perdido y aproximadamente $ 250 millones de costos laborales desperdiciados por año».
Esa es solo una de las muchas razones por las que cada vez más líderes empresariales están interesados en aprender más sobre el aprendizaje profundo en estos días. Consigue esto…
«De acuerdo con los resultados [de McKinsey], el nivel de ineficiencia [en la toma de decisiones] disminuye con la antigüedad. Mientras que el 68% de los mandos intermedios dicen que la mayor parte de su tiempo de toma de decisiones es ineficiente, el 57% de los ejecutivos de nivel C informan lo mismo. Si se examinan más de cerca los datos, hay poca evidencia de economías de escala. Los encuestados que dedican la mayor parte de su tiempo a la toma de decisiones no se califican a sí mismos mejor que sus pares en el uso bien de ese tiempo (exhibición)».
En otras palabras, nadie es perfecto, ni siquiera los ejecutivos en los que se confía para tener todas las respuestas y dirigir el barco en la dirección correcta. Tal vez por eso estamos empezando a ver que, en algunos casos, la IA (y específicamente el aprendizaje profundo) debería usarse para compensar nuestras limitaciones físicas y informáticas.
Como seres humanos, solo podemos ver hasta cierto punto, hacer tanto y pensar tan rápido antes de que comencemos a fallar. Y no importa cuánto nos esforcemos por ser perfectos en el trabajo, siempre vamos a tener sesgos o desventajas. Por ejemplo, no siempre podemos saber cuándo un frasco está deformado o las marcas de una píldora son más anaranjadas que rojas. También podemos tener dificultades para tomar la decisión correcta porque carecemos del contexto completo de una situación.
Sin embargo, podemos hacer que estas limitaciones no sean un problema entrenando a la IA para que vea cosas, conecte los puntos entre puntos de datos aparentemente dispares y tome decisiones de maneras que nosotros no podemos. Esto reduce el riesgo de equivocarnos, lo cual es enorme cuando se piensa en lo que se necesita para tener éxito en los negocios.
Dicho esto, la IA es tan inteligente como permitimos que sea. No puede ayudarnos si no le enseñamos cómo ayudarnos. Por eso es tan importante que obtenga el modelo de IA (y el modelo de entrenamiento) justo cuando decida que es el momento de solicitar ayuda de IA con ciertas tareas empresariales. Esto es especialmente cierto cuando se utiliza la IA para informar o tomar decisiones (como una decisión de aprobación/reprobación durante las inspecciones de calidad).
Entonces, hablemos de lo que necesita saber antes de gastar dinero en herramientas de aprendizaje profundo (o cualquier asistente de automatización impulsado por IA).
Aprendizaje Profundo 101
Hay muchos términos que se están lanzando en relación con la IA, incluido el aprendizaje profundo, el aprendizaje automático y las redes neuronales, entre otros. Entonces, probablemente te estés preguntando: «¿Cuál es la diferencia entre el aprendizaje automático y el aprendizaje profundo?»
Técnicamente, el aprendizaje profundo es un subconjunto del aprendizaje automático, como explicó el Dr. Yan Zhang en esta publicación, y es más probable que se use cuando «la dimensionalidad de los datos y la complejidad del modelo son demasiado grandes para manejar». Tomemos como ejemplo la detección de rostros. Es cierto que se podía reducir la dimensionalidad utilizando enfoques tradicionales como el análisis de componentes principales (PCA), y esto se hizo en el famoso enfoque de Eigenfaces. Pero PCA solo ofrece un modelo lineal, que no puede competir con las no linealidades de las redes profundas actuales cuando se aplica a imágenes de megapíxeles.
Por ejemplo, en Zebra, utilizamos el aprendizaje profundo cuando ayudamos a los clientes…
- Enfocar un sistema de visión artificial en los artículos, o en ciertas cualidades de los artículos, para su inspección.
- Mejorar la seguridad de los trabajadores. En este caso, podemos utilizar el aprendizaje profundo junto con las cámaras para detectar cuando los trabajadores entran en zonas inseguras, se acercan demasiado a la maquinaria o no tienen puesto el equipo de protección personal (EPI) adecuado.
- Programa de forma predictiva las acciones de mantenimiento para evitar el tiempo de inactividad de los equipos y sistemas.
- Determine qué piezas necesitan fabricar, cuándo y dónde, para que puedan programar la producción de manera más efectiva y evitar retrasos en las entregas o desperdicios de inventario.
De hecho, estamos utilizando una solución basada en el aprendizaje profundo para ayudar a un cliente en el espacio de bienes de consumo de alta rotación (FMCG) a automatizar y mejorar la eficiencia de su proceso de devolución. Antes de que los artículos devueltos puedan volver a ponerse en circulación, un trabajador debe registrar su número de lote y verificar la fecha de vencimiento. Los tamaños de letra pequeños, la mala calidad de las marcas y el uso de texto de bajo contraste hicieron que este fuera un trabajo impopular y que consumiera mucho tiempo, ya que creaba cuellos de botella y desperdicios, ya que los productos caducaban antes de que pudieran devolverse a los estantes. La solución habilitada para el aprendizaje profundo en la que trabajamos con ellos ahora permite a los trabajadores verificar estos detalles automáticamente mostrando el artículo a una cámara, lo que resulta en una mayor eficiencia y una reducción de los residuos.
Ahora, debido a que el aprendizaje profundo es el entrenamiento de redes neuronales, puede aprender a través de procesos supervisados o no supervisados, al igual que lo hacemos nosotros como humanos. Aprendemos tanto en un entorno educativo estructurado (es decir, en la escuela, cursos de desarrollo profesional, etc.) como a medida que avanzamos en nuestro día. Cada nueva experiencia que tenemos y cada interacción con una persona puede equivaler a un «entrenamiento». Nos estamos llevando más información o una perspectiva diferente.
La diferencia entre cómo aprende el cerebro humano y cómo se produce el aprendizaje profundo dentro de una red neuronal es que el «aprendizaje» de la IA/red neuronal se produce en un entorno totalmente controlado. Nosotros (los humanos) estamos transfiriendo lo que hemos aprendido de nuestros cerebros a la IA/red neuronal para ayudarla a entender lo que está bien y lo que está mal. Está haciendo lo que le decimos que haga, en cierto modo. Por ejemplo, entrenamos el sistema de IA utilizado para inspeccionar semiconductores que salen de una fábrica utilizando imágenes «buenas» y «malas» utilizando el aprendizaje profundo. Le enseñamos lo que tiene que buscar para que finalmente pueda funcionar de forma autónoma.
¿Por qué utilizar el aprendizaje profundo, o la IA, para las inspecciones cuando se puede enseñar a una persona lo que es bueno o malo? Bueno, todo se reduce a nuestras limitaciones físicas y computacionales y a la necesidad de convertirlas en un punto discutible.
Si realmente quieres estar seguro de que lo que estás enviando a un cliente es de la más alta calidad, o de que la calidad de un producto no se ha degradado a lo largo de su viaje a la cadena de suministro, tendrás que examinarlo como ningún humano puede hacerlo. Necesitará algún tipo de IA para inspeccionarlo rápida y perfectamente, muy probablemente utilizando una combinación de cámaras y software basado en IA, como un sistema de visión artificial o incluso un escáner industrial fijo con capacidades de reconocimiento óptico de caracteres (OCR) de aprendizaje profundo.
¿Qué modelo de aprendizaje profundo es mejor?
No existe una regla estándar que diga: «Este tipo de modelo de aprendizaje profundo va a ser universalmente aplicable en este tipo de flujo de trabajo o entorno empresarial». Sin embargo, estos son los modelos en los que solemos apoyarnos cuando tenemos ciertos objetivos:
- Reconocimiento óptico de caracteres (OCR) de aprendizaje profundo: Esta es una manera fácil de leer automáticamente el texto de una imagen/artículo, como un número de lote, un número de pieza o una fecha de vencimiento. Lo bueno de esta capacidad es que se puede implementar de inmediato en 5 minutos. No es necesario que esté capacitado y no necesita un científico de datos calificado para ponerlo en línea. Puedes leer más sobre cómo funciona aquí y verlo en acción aquí:
- Detección de anomalías/detección de defectos: Podemos usar imágenes de su escáner industrial fijo o cámara de visión artificial para enseñar a la red neuronal a detectar la diferencia entre esta imagen y aquella imagen. Esto es útil para el control de calidad. Puedes enseñarle a la red neuronal lo que es correcto y luego hacer que busque cualquier cosa que parezca ligeramente diferente.
- Ubicación/segmentación de objetos a nivel de píxel: El objetivo aquí es identificar y localizar ciertas cosas, como la colocación de un tornillo, una marca, etc.
- Clasificación a nivel global: En este escenario, la red neuronal está entrenada para mirar la imagen completa y descifrar qué es algo. (Por ejemplo, ¿es una fregona o un perro?)
También hay modelos de aprendizaje profundo preentrenados basados en soluciones en los que prácticamente dibujamos una caja alrededor de algo, enseñamos a la red neuronal a buscar lo que hay dentro de esa caja y damos por terminado el día. También existe el aprendizaje profundo tradicional, en el que normalmente anotamos qué buscar en un conjunto de imágenes y luego construimos un modelo en torno a la anotación. Por lo general, estos están muy personalizados para un objetivo comercial en particular, por lo que sería imposible hablar de todos los ejemplos aquí.
Sin embargo, el ejemplo que mencioné antes sobre cómo una empresa de bienes de consumo masivo está utilizando el aprendizaje profundo para el procesamiento acelerado de devoluciones y la recolocación de artículos en estanterías es un gran ejemplo de lo que es posible. Para darle otro, tenemos un gran cliente automotriz que tiene su equipo de primera línea buscando anomalías en los paquetes de baterías utilizando el aprendizaje profundo. Estas anomalías incluyen suciedad, escombros, arañazos, contaminantes, pliegues, pliegues, etc. Y si eres un fanático (o empresa) del sushi, te encantará que el aprendizaje profundo pueda ayudar a garantizar que los combos de sushi envasados que se colocan en los estantes de una tienda o restaurante estén exactamente como se etiquetan y organizan correctamente. (Echa un vistazo a las imágenes de sushi en la página siete de este folleto que, por cierto, tiene un montón de ejemplos de cómo se podría utilizar el aprendizaje profundo).
Ahora, en el título de este post dije que el aprendizaje profundo puede ayudar a detener las hemorragias dentro de tu negocio. ¿Qué quise decir con eso?
En resumen, hay que eliminar los residuos. En muchos casos, el desperdicio se produce cuando los productos pasan inicialmente la inspección (humana), pero luego se identifica un defecto y se hace necesaria una retirada masiva. Por otra parte, el desperdicio se deriva de la identificación tardía de un defecto, lo que lleva a la producción en masa de un producto defectuoso que nunca llega al mercado. También se pierde mucho tiempo cuando la inspección es manejada exclusivamente por humanos, porque simplemente no podemos trabajar tan rápido como una máquina, sin importar cuánto lo intentemos.
Así que, en lugar de luchar contra este hecho, acéptalo. Apóyate en el aprendizaje profundo. Míralo como una mejor versión de ti mismo, una herramienta que puede hacerte lucir como una estrella de rock cuando eres capaz de acelerar el ritmo de producción o cumplimiento, reducir las tasas de error y establecer un nuevo récord de calidad (por la menor cantidad de productos desechados o retirados).
Si usted es alguien que necesita ver para creer que algo es tan bueno como suena, entonces mis colegas y yo estaremos encantados de organizar una demostración para usted. Créeme, el aprendizaje profundo es mucho más genial de presenciar en la vida real que de leer. Pero me alegro de que te hayas tomado el tiempo de leer este post hasta el final.
En las próximas semanas, mis colegas y yo vamos a compartir contigo todo lo que estamos aprendiendo sobre el aprendizaje profundo, incluidas las muchas formas en que puede ayudarte, los errores que otros han cometido y que no debes repetir, y cómo los nuevos modelos de aprendizaje profundo están enseñando a la «vieja» tecnología OCR nuevos trucos que sorprenderán a tu equipo. Por lo tanto, permanezca atento al blog de Your Edge para obtener esa información, o comuníquese con nosotros para obtener más información sobre el beneficio potencial del aprendizaje profundo para usted (si no puede esperar).
También deberías echar un vistazo a este estudio recientemente publicado sobre el uso de la visión artificial entre los fabricantes de automóviles si aún no lo has visto.
Este blog es propiedad de Zebra Technologies.