{"id":3662,"date":"2023-07-27T15:22:16","date_gmt":"2023-07-27T13:22:16","guid":{"rendered":"https:\/\/foqum.io\/blog\/?p=3662"},"modified":"2025-11-18T15:35:54","modified_gmt":"2025-11-18T14:35:54","slug":"introduccion-al-machine-learning","status":"publish","type":"post","link":"https:\/\/foqum.io\/es\/introduccion-al-machine-learning\/","title":{"rendered":"Introducci\u00f3n al Machine Learning"},"content":{"rendered":"<p>El aprendizaje autom\u00e1tico es uno de los campos tecnol\u00f3gicos que est\u00e1n revolucionando nuestra sociedad. Sin embargo, esta familia de t\u00e9cnicas y algoritmos surgieron antes de lo que se pueda pensar.<\/p>\n<p>Antes de nada, conviene aclarar que hay mucho abuso\u2014intencionado o accidental\u2014con la terminolog\u00eda. En muchos casos se habla de lo mismo bajo paraguas tan distintos como \u00abinteligencia artificial\u00bb, \u00abaprendizaje autom\u00e1tico\u00bb o \u00abmachine learning\u00bb.<\/p>\n<p>En cualquier caso, el origen de este campo se sit\u00faa aproximadamente a mitad del siglo XX, de mano de pioneros como Alan Turing. A lo largo de los \u201950, Arthur Samuel present\u00f3 uno de los primeros programas capaces de alguna forma de aprendizaje, adem\u00e1s de popularizar el t\u00e9rmino machine learning, y poco despu\u00e9s Frank Rosenblatt introdujo las redes neuronales artificiales con su Perceptron<sup>1<\/sup>.<\/p>\n<p>Por muchas razones, incluyendo un exceso de optimismo comunicativo, el campo sufri\u00f3 un relativo estancamiento, que podemos conocer como el primer \u00abinvierno\u00bb del aprendizaje autom\u00e1tico<sup>2<\/sup>.<\/p>\n<p>El optimismo regres\u00f3 con fuerza en la d\u00e9cada de los \u201980, que vio avances te\u00f3ricos fundamentales, como el algoritmo de back-propagation. Sin embargo, el impacto de las aplicaciones no estuvo a la altura de las promesas, por lo que el ciclo volvi\u00f3 a un duro invierno. A principios del siglo XXI la situaci\u00f3n cambiar\u00eda para siempre. En parte aprovechando los avances de hardware como son las unidades de procesamiento GPU, los algoritmos de machine learning comenzaron a asentarse con fuerza en la industria.<\/p>\n<p>Deep learning, reinforcement learning, redes generativas\u2026 un diverso grupo de algoritmos nos ha sorprendido con avances que una vez parecieron imposibles. Se dice que inteligencia artificial es todo aquello que la inteligencia artificial a\u00fan no ha conseguido realizar. La idea es que, tan pronto como se supera un monumental reto, nuestra comprensi\u00f3n sobre la inteligencia artificial y sobre los retos a los que la aplicamos da un gran salto, y trivializamos los avances pasados.<\/p>\n<p>As\u00ed, el ajedrez fue durante d\u00e9cadas el ejemplo paradigm\u00e1tico de una prueba de inteligencia artificial. Es imposible dominar un juego tan complejo a nivel profesional sin hablar de verdadera inteligencia artificial\u2014o eso se dec\u00eda. Luego lleg\u00f3 la derrota de Kasparov ante Deep Blue en 1996 y nuestra mirada se puso en Go, el siguiente hito inalcanzable\u2014el ajedrez, resulta, no necesitaba \u00abverdarera inteligencia\u00bb, despu\u00e9s de todo. Hasta que AlphaGo venci\u00f3 al maestro Lee Sedol en 2016, como recoge el fant\u00e1stico documental de igual nombre (AlphaGo, 2017).<\/p>\n<p>Hoy los algoritmos de machine learning est\u00e1n detr\u00e1s de las acciones m\u00e1s cotidianas de nuestras vidas. Google y dem\u00e1s buscadores, aplicaciones de mapas en nuestros tel\u00e9fonos, traductores, sistemas de conducci\u00f3n semi- autom\u00e1tica o incluso el termostato del sal\u00f3n. Y explican en gran parte de muchas de las mayores fortunas (Apple, Amazon, Google), que han utilizado las nuevas tecnolog\u00edas para ganar una influencia y riqueza que rivaliza\u2014y supera\u2014a naciones enteras.<\/p>\n<p>Esta breve gu\u00eda es una introducci\u00f3n a los fundamentos del aprendizaje autom\u00e1tico, con un \u00e9nfasis pr\u00e1ctico para que cualquiera pueda usarlo en sus proyectos y negocios, incluyendo cursos y sugerencias de software para hacer m\u00e1s f\u00e1cil tu comienzo en este apasionante mundo.<\/p>\n<h2>\u00bfQu\u00e9 es el aprendizaje autom\u00e1tico?<\/h2>\n<p>Aunque ya hemos indicado que los t\u00e9rminos se usan de forma indistinta en la pr\u00e1ctica, inteligencia artificial y machine learning no son lo mismo.<\/p>\n<p>Inteligencia artificial es un ampl\u00edsimo campo que se inspira en sistemas inteligentes naturales para mejorar nuestro conocimiento sobre el dise\u00f1o y funcionamiento de algoritmos y dispositivos. Incluye, por tanto, campos como la rob\u00f3tica e incluso alcanza aplicaciones art\u00edsticas.<\/p>\n<p>Dentro de la inteligencia artificial encontramos el machine learning, que se centra en la ejecuci\u00f3n de tareas sin una gu\u00eda completa de instrucciones. Los modelos se construyen identificando patrones en los datos, que se utilizan para hacer predicciones. Detr\u00e1s de descripciones tan rimbombantes encontramos que los ejemplos m\u00e1s b\u00e1sicos son algo muy cercano, como puede ser un ajuste lineal a un conjunto de datos que utilizamos para predecir un valor desconocido: estamos utilizando un patr\u00f3n para predecir algo no observado.<\/p>\n<p><a href=\"https:\/\/foqum.io\/wp-content\/uploads\/2023\/07\/grafico01.jpg\" data-elementor-open-lightbox=\"yes\" data-elementor-lightbox-title=\"Xkcd en \u00abLinear Regression\u00bb nos muestra los riesgos de aplicar modelos sin reflexionar sobre los resultados.\" data-e-action-hash=\"#elementor-action%3Aaction%3Dlightbox%26settings%3DeyJpZCI6MzY4OSwidXJsIjoiaHR0cHM6XC9cL2ZvcXVtLmlvXC9ibG9nXC93cC1jb250ZW50XC91cGxvYWRzXC8yMDIzXC8wN1wvZ3JhZmljbzAxLmpwZyJ9\"><br \/>\n<img decoding=\"async\" width=\"1920\" height=\"985\" src=\"https:\/\/foqum.io\/wp-content\/uploads\/2023\/07\/grafico01.jpg\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico01.jpg 1920w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico01-300x154.jpg 300w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico01-1024x525.jpg 1024w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico01-768x394.jpg 768w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico01-370x190.jpg 370w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico01-1536x788.jpg 1536w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico01-1170x600.jpg 1170w\" sizes=\"auto, (max-width: 1920px) 100vw, 1920px\" title=\"\">\t\t\t\t\t\t\t\t<\/a><br \/>\nXkcd en \u00abLinear Regression\u00bb nos muestra los riesgos de aplicar modelos sin reflexionar sobre los resultados.<br \/>\n<a href=\"https:\/\/foqum.io\/wp-content\/uploads\/2023\/07\/grafico02.jpg\" data-elementor-open-lightbox=\"yes\" data-elementor-lightbox-title=\"AI - Deep Learning - Machine Learning\" data-e-action-hash=\"#elementor-action%3Aaction%3Dlightbox%26settings%3DeyJpZCI6MzY5OSwidXJsIjoiaHR0cHM6XC9cL2ZvcXVtLmlvXC9ibG9nXC93cC1jb250ZW50XC91cGxvYWRzXC8yMDIzXC8wN1wvZ3JhZmljbzAyLmpwZyJ9\"><br \/>\n<img decoding=\"async\" width=\"1920\" height=\"1920\" src=\"https:\/\/foqum.io\/wp-content\/uploads\/2023\/07\/grafico02.jpg\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico02.jpg 1920w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico02-300x300.jpg 300w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico02-1024x1024.jpg 1024w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico02-150x150.jpg 150w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico02-768x768.jpg 768w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico02-80x80.jpg 80w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico02-70x70.jpg 70w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico02-100x100.jpg 100w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico02-480x480.jpg 480w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico02-670x670.jpg 670w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico02-370x370.jpg 370w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico02-1536x1536.jpg 1536w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico02-75x75.jpg 75w\" sizes=\"auto, (max-width: 1920px) 100vw, 1920px\" title=\"\">\t\t\t\t\t\t\t\t<\/a><\/p>\n<p>Por supuesto, machine learning tambi\u00e9n es un gran campo en s\u00ed mismo, e incluye conceptos fundamentales como deep learning, de los que hablaremos m\u00e1s adelante.<\/p>\n<p><strong>\u00bfCu\u00e1l es la motivaci\u00f3n pr\u00e1ctica para todo esto? Incluso las tareas aparentemente m\u00e1s sencillas, como clasificar im\u00e1genes de d\u00edgitos, resultan abrumadoras para un sistema de reglas.<\/strong><\/p>\n<p>Tratar de considerar todas las excepciones se vuelve una tarea imposible, lo que se traduce en algoritmos muy complejos, dif\u00edciles de mantener y no demasiado efectivos. En lugar de eso, resulta mucho m\u00e1s atractivo utilizar un sencillo algoritmo dise\u00f1ado para que busque \u00e9l mismo los patrones que le resulten m\u00e1s \u00fatiles en la tarea lo que, en las condiciones correctas, produce asombrosos resultados que superan a humanos expertos.<\/p>\n<h2>Machine Learning: Familias y Sabores<\/h2>\n<p>Si preguntas a un experto, la taxonom\u00eda de los algoritmos de machine learning es algo muy sofisticado. Sin embargo, podemos distinguir dos familias fundamentales muy v\u00e1lidas para esta introducci\u00f3n: aprendizaje supervisado frente a aprendizaje no supervisado.<br \/>\n<a href=\"https:\/\/foqum.io\/wp-content\/uploads\/2023\/07\/grafico03.png\" data-elementor-open-lightbox=\"yes\" data-elementor-lightbox-title=\"Aprendizaje supervisado, a partir de ejemplos etiquetados (izquierda) frente a aprendizaje no supervisado.\" data-e-action-hash=\"#elementor-action%3Aaction%3Dlightbox%26settings%3DeyJpZCI6MzcwNCwidXJsIjoiaHR0cHM6XC9cL2ZvcXVtLmlvXC9ibG9nXC93cC1jb250ZW50XC91cGxvYWRzXC8yMDIzXC8wN1wvZ3JhZmljbzAzLnBuZyJ9\"><br \/>\n<img decoding=\"async\" width=\"1920\" height=\"1238\" src=\"https:\/\/foqum.io\/wp-content\/uploads\/2023\/07\/grafico03.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico03.png 1920w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico03-300x193.png 300w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico03-1024x660.png 1024w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico03-768x495.png 768w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico03-1536x990.png 1536w\" sizes=\"auto, (max-width: 1920px) 100vw, 1920px\" title=\"\">\t\t\t\t\t\t\t\t<\/a><br \/>\nAprendizaje supervisado, a partir de ejemplos etiquetados (izquierda) frente a aprendizaje no supervisado.<\/p>\n<h3>1.- Aprendizaje supervisado<\/h3>\n<p>Hablamos de aprendizaje supervisado cuando contamos con un conjunto de datos etiquetado para entrenar nuestros modelos. \u00bfQu\u00e9 significa esto? Por ejemplo, si queremos entrenar un clasificador de im\u00e1genes que distinga perros y gatos, primero buscaremos un dataset de fotograf\u00edas de perros y gatos donde la clase que corresponde a cada imagen es ya conocida. Estos datos son los que alimentan al modelo, que utilizar\u00e1 los patrones de estos datos para clasificar im\u00e1genes desconocidas.<br \/>\nEn el mundo empresarial dominan los proyectos de aprendizaje supervisado, que a su vez se dividen en dos categor\u00edas fundamentales.<\/p>\n<h4>A.- Clasificaci\u00f3n<\/h4>\n<p>En un problema de clasificaci\u00f3n debemos asignar categor\u00edas a un ejemplo desconocido. Ya hemos visto un ejemplo sencillo\u2014de explicar\u2014que consiste en distinguir fotograf\u00edas de perros y gatos. Una aplicaci\u00f3n real es identificar im\u00e1genes no apropiadas en redes sociales, o clasificar tomates seg\u00fan su estado de maduraci\u00f3n.<\/p>\n<p>Por supuesto, no siempre las categor\u00edas son \u00fanicas y excluyentes. Si imaginamos un clasificador de textos seg\u00fan su tem\u00e1tica, es perfectamente posible encontrar un documento que trate de deportes y de medio ambiente simult\u00e1neamente.<\/p>\n<p>Los clasificadores son una de las aplicaciones con m\u00e1s potencial empresarial, ya que son tareas repetitivas que consumen gran cantidad de recursos y en las que los algoritmos suelen alcanzar un grado elevado de competencia.<\/p>\n<p><a href=\"https:\/\/foqum.io\/wp-content\/uploads\/2023\/07\/grafico04.png\" data-elementor-open-lightbox=\"yes\" data-elementor-lightbox-title=\"\u00c1rbol de decisi\u00f3n para clasificaci\u00f3n de supervivientes del Titanic seg\u00fan su sexo (Male?), edad (Age) y n\u00famero de hermanos (Sibsp).\" data-e-action-hash=\"#elementor-action%3Aaction%3Dlightbox%26settings%3DeyJpZCI6MzcxNSwidXJsIjoiaHR0cHM6XC9cL2ZvcXVtLmlvXC9ibG9nXC93cC1jb250ZW50XC91cGxvYWRzXC8yMDIzXC8wN1wvZ3JhZmljbzA0LnBuZyJ9\"><br \/>\n<img decoding=\"async\" width=\"1920\" height=\"2077\" src=\"https:\/\/foqum.io\/wp-content\/uploads\/2023\/07\/grafico04.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico04.png 1920w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico04-277x300.png 277w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico04-947x1024.png 947w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico04-768x831.png 768w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico04-370x400.png 370w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico04-1420x1536.png 1420w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/grafico04-1893x2048.png 1893w\" sizes=\"auto, (max-width: 1920px) 100vw, 1920px\" title=\"\">\t\t\t\t\t\t\t\t<\/a><br \/>\n\u00c1rbol de decisi\u00f3n para clasificaci\u00f3n de supervivientes del Titanic seg\u00fan su sexo (Male?), edad (Age) y n\u00famero de hermanos (Sibsp).<\/p>\n<h4>B.- Regresi\u00f3n<\/h4>\n<p>En este caso el objetivo es predecir un valor num\u00e9rico, en lugar de una categor\u00eda. Un ejemplo real podr\u00eda ser encontrar el centro de la cara de una persona en una fotograf\u00eda (ya que la posici\u00f3n de este punto viene dada por dos n\u00fameros).<br \/>\nEn la pr\u00e1ctica encontramos que muchas veces podemos transformar problemas de una categor\u00eda a otra seg\u00fan convenga. Por ejemplo, en lugar de predecir un n\u00famero continuo entre 0 y 10, puede ser conveniente clasificar nuestros datos en grupos (0\u20131, 1\u20132, etc.) y construir un clasificador.<br \/>\n<a href=\"https:\/\/foqum.io\/wp-content\/uploads\/2023\/07\/regresion.jpg\" data-elementor-open-lightbox=\"yes\" data-elementor-lightbox-title=\"Detecci\u00f3n de objetos es un problema habitual que incluye clasificaci\u00f3n\" data-e-action-hash=\"#elementor-action%3Aaction%3Dlightbox%26settings%3DeyJpZCI6MzcyMiwidXJsIjoiaHR0cHM6XC9cL2ZvcXVtLmlvXC9ibG9nXC93cC1jb250ZW50XC91cGxvYWRzXC8yMDIzXC8wN1wvcmVncmVzaW9uLmpwZyJ9\"><br \/>\n<img decoding=\"async\" width=\"1300\" height=\"836\" src=\"https:\/\/foqum.io\/wp-content\/uploads\/2023\/07\/regresion.jpg\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/regresion.jpg 1300w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/regresion-300x193.jpg 300w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/regresion-1024x659.jpg 1024w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/regresion-768x494.jpg 768w\" sizes=\"auto, (max-width: 1300px) 100vw, 1300px\" title=\"\">\t\t\t\t\t\t\t\t<\/a><br \/>\nDetecci\u00f3n de objetos es un problema habitual que incluye clasificaci\u00f3n (determinaci\u00f3n del tipo de objeto) as\u00ed como regresi\u00f3n (la posici\u00f3n del objeto). Fuente: Wikipedia.<\/p>\n<h3>2.- Aprendizaje no supervisado<\/h3>\n<p>No siempre tenemos la suerte de tener datos clasificados por un humano, o incluso donde exista una ground truth, es decir, una \u00fanica respuesta v\u00e1lida y objetiva a una pregunta. Pero no por ello carecemos de herramientas de trabajo.<\/p>\n<p>Este campo suele incluir t\u00e9cnicas orientadas a la exploraci\u00f3n de nuestros datos y la generaci\u00f3n de nuevo conocimiento. Sin duda la aplicaci\u00f3n m\u00e1s com\u00fan es clustering, o agrupaci\u00f3n, que consiste en agrupar nuestros datos en familias que compartan distintas caracter\u00edsticas.<\/p>\n<p>Los ejemplos m\u00e1s sencillos que suelen verse en gu\u00edas e introducciones, tienen una respuesta casi insultantemente evidente. Pero eso no debe hacernos subestimar el gran valor de estos algoritmos, que muchas veces son sencillamente imprescindibles para acercarnos siquiera a los dataset m\u00e1s complejos\u2014y m\u00e1s reales.<\/p>\n<p>Si los datos de nuestros clientes contienen 200 campos independientes, puede resultar imposible buscar criterios de agrupaci\u00f3n significativos, dej\u00e1ndonos llevar en la pr\u00e1ctica por nuestras ideas preconcebidas. Por ello, aplicar t\u00e9cnicas de agrupaci\u00f3n a este tipo de datos puede desvelarnos estructuras subyacentes inesperadas en nuestros datos, y de ah\u00ed que se hable de generaci\u00f3n de conocimiento y exploraci\u00f3n.<\/p>\n<p><a href=\"https:\/\/foqum.io\/wp-content\/uploads\/2023\/07\/hdbscan_clustering_result.png\" data-elementor-open-lightbox=\"yes\" data-elementor-lightbox-title=\"Hdbscan es un potente algoritmo de clusterizaci\u00f3n.\" data-e-action-hash=\"#elementor-action%3Aaction%3Dlightbox%26settings%3DeyJpZCI6MzcyNiwidXJsIjoiaHR0cHM6XC9cL2ZvcXVtLmlvXC9ibG9nXC93cC1jb250ZW50XC91cGxvYWRzXC8yMDIzXC8wN1wvaGRic2Nhbl9jbHVzdGVyaW5nX3Jlc3VsdC5wbmcifQ%3D%3D\"><br \/>\n<img decoding=\"async\" width=\"728\" height=\"528\" src=\"https:\/\/foqum.io\/wp-content\/uploads\/2023\/07\/hdbscan_clustering_result.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/hdbscan_clustering_result.png 728w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/hdbscan_clustering_result-300x218.png 300w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/hdbscan_clustering_result-110x80.png 110w\" sizes=\"auto, (max-width: 728px) 100vw, 728px\" title=\"\">\t\t\t\t\t\t\t\t<\/a><br \/>\nHdbscan es un potente algoritmo de clusterizaci\u00f3n. Fuente: https:\/\/github.com\/scikit-learn-contrib\/hdbscan<\/p>\n<h3>Aprendizaje semi-supervisado y transferencia de aprendizaje<\/h3>\n<p>Cualquier cient\u00edfico de datos se ha enfrentado m\u00faltiples veces a problemas muy similares. Por ejemplo, un cliente puede necesitar clasificar documentos seg\u00fan un an\u00e1lisis de sentimiento (positivo, negativo, neutro), mientras que otro cliente necesita clasificaci\u00f3n de art\u00edculos seg\u00fan tem\u00e1tica deportiva, y un tercero necesita clasificar documentos seg\u00fan su tipolog\u00eda (contratos, n\u00f3minas, informes). Todos estos encargos son variaciones sobre un mismo tema: \u00bftiene sentido repetir todo el trabajo desde cero en cada situaci\u00f3n?<\/p>\n<p>Aunque esta pregunta tiene una aplastante l\u00f3gica comercial, la necesidad surgi\u00f3 antes en el mundo acad\u00e9mico. Y la realidad es que no s\u00f3lo se puede ahorrar tiempo y dinero, sino que es posible conseguir mejores resultados \u00abreciclando\u00bb modelos. Y, puestos a reciclar\u2026 \u00bfpodemos hacer uso de fuentes de datos externas al problema?<\/p>\n<p>Aprendizaje por transferencia, transferencia de aprendizaje o transfer learning es uno de los avances m\u00e1s significativos en los \u00faltimos a\u00f1os en machine learning. Tuvo su origen en las competiciones de computer vision, y la idea es sencilla: imaginemos que nuestro problema es clasificar dos categor\u00edas de imagen para las que nuestro dataset es pobre. El procedimiento ser\u00e1 primero entrenar un clasificador general utilizando otro dataset diferente, m\u00e1s amplio y conocido. Partiendo de este modelo, adaptamos los par\u00e1metros al nuevo problema, pero sin partir de cero. La intuici\u00f3n nos dice que muchos patrones necesarios para clasificar cualquier tipo de im\u00e1genes ser\u00e1n comunes (detecci\u00f3n de l\u00edneas, c\u00edrculos, gradientes de color).<\/p>\n<p>Esta t\u00e9cnica supuso una revoluci\u00f3n en computer vision, y s\u00f3lo muy recientemente\u2014 a partir de 2018\u2014lleg\u00f3 al procesamiento de texto, como comentaremos m\u00e1s adelante. En t\u00e9rminos m\u00e1s tangibles, la transferencia de aprendizaje pone en tus manos los modelos m\u00e1s avanzados del mercado, antes s\u00f3lo al acceso de gigantes tecnol\u00f3gicos.<\/p>\n<p><a href=\"https:\/\/foqum.io\/wp-content\/uploads\/2023\/07\/patrones.png\" data-elementor-open-lightbox=\"yes\" data-elementor-lightbox-title=\"patrones\" data-e-action-hash=\"#elementor-action%3Aaction%3Dlightbox%26settings%3DeyJpZCI6MzczMywidXJsIjoiaHR0cHM6XC9cL2ZvcXVtLmlvXC9ibG9nXC93cC1jb250ZW50XC91cGxvYWRzXC8yMDIzXC8wN1wvcGF0cm9uZXMucG5nIn0%3D\"><br \/>\n<img decoding=\"async\" width=\"1360\" height=\"492\" src=\"https:\/\/foqum.io\/wp-content\/uploads\/2023\/07\/patrones.png\" alt=\"\" loading=\"lazy\" srcset=\"https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/patrones.png 1360w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/patrones-300x109.png 300w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/patrones-1024x370.png 1024w, https:\/\/foqum.io\/blog\/wp-content\/uploads\/2023\/07\/patrones-768x278.png 768w\" sizes=\"auto, (max-width: 1360px) 100vw, 1360px\" title=\"\">\t\t\t\t\t\t\t\t<\/a><br \/>\nVisualizaci\u00f3n de los patrones aprendidos por un modelo de clasificaci\u00f3n de imagen. Las im\u00e1genes m\u00e1s a la izquierda corresponden a capas m\u00e1s iniciales (los patrones crecen en complejidad en capas m\u00e1s profundas). Estos patrones pueden ser \u00fatiles para clasificar nuevas categor\u00edas de im\u00e1genes, justificando intuitivamente el aprendizaje por transferencia. Fuente: https:\/\/distill.pub\/2017\/feature- visualization\/ (lectura recomendada).<\/p>\n<h3>Aprendizaje por refuerzo<\/h3>\n<p>El aprendizaje por refuerzo o reinforcement learning es otro paradigma de machine learning, y se centra en el desarrollo de modelos de toma de decisi\u00f3n que deben ser capaces de maximizar una recompensa a lo largo del tiempo.<br \/>\nGeneralmente estos sistemas comienzan conociendo poco de su entorno, con el que se familiarizan mediante un proceso exhaustivo de \u00abprueba y error\u00bb. El entrenamiento del modelo equilibrar\u00e1 la pura exploraci\u00f3n\u2014decisiones inesperadas, potencialmente equivocadas que exponen al modelo a situaciones desconocidas \u2014 y la optimizaci\u00f3n de las decisiones en base a las experiencias conocidas.<br \/>\nEl aprendizaje por refuerzo es particularmente \u00fatil en entornos ricos en informaci\u00f3n de recompensa. Por ejemplo, el videojuego Pac-Man aumenta la puntuaci\u00f3n cada vez que se \u00abcome\u00bb un punto, teniendo adem\u00e1s muy bien definida la condici\u00f3n de derrota. En 2013, DeepMind present\u00f3 un excelente trabajo<sup>3<\/sup> donde consegu\u00edan superar un gran conjunto de juegos de Atari mediante t\u00e9cnicas de aprendizaje por refuerzo y deep learning.<br \/>\nSin embargo, en entornos\u2014tal vez m\u00e1s realistas\u2014donde las recompensas est\u00e1n m\u00e1s espaciadas en el tiempo, estos algoritmos tienen m\u00e1s problemas. Por ejemplo, el juego Montezuma\u2019s Revenge se convirti\u00f3 en una bestia negra del aprendizaje por refuerzo, e hicieron falta t\u00e9cnicas inspiradas en la curiosidad<sup>4<\/sup> para poder finalmente dominarlo.<\/p>\n<h3>Redes neuronales y aprendizaje profundo<\/h3>\n<p>Existe una gran variedad de familias de algoritmos, como las m\u00e1quinas de vectores de soporte, los \u00e1rboles de decisi\u00f3n, modelos bayesianos y un largu\u00edsimo etc\u00e9tera. Entre todas ellas destacan las redes neuronales artificiales y el aprendizaje profundo o deep learning, tan de actualidad y responsables de muchos de los \u00faltimos avances.<\/p>\n<p>En realidad, las redes neuronales artificiales son un concepto ya antiguo y sorprendentemente accesible. Una red neuronal no es m\u00e1s que un elemento de software que recibe una lista de valores num\u00e9ricos sobre los que aplica una sencilla funci\u00f3n matem\u00e1tica (t\u00edpicamente: copiar la suma de lo recibido o devolver cero si el resultado es negativo) y pasa este resultado a otras neuronas con las que se conecta. No es necesaria mayor sofisticaci\u00f3n. Como en todos los sistemas complejos, la riqueza surge de la interacci\u00f3n entre m\u00faltiples elementos simples.<\/p>\n<p>Como hemos mencionado, estas redes son ya antiguas, pero hubo que esperar hasta el algoritmo de back-propagation y las GPU para que su entrenamiento fuera realmente eficiente.<\/p>\n<p>T\u00edpicamente las redes neuronales se organizan en capas, y hablamos de aprendizaje profundo cuando tenemos m\u00e1s de un par de dichas capas de neuronas (un modelo actual puede llegar a cientos de capas).<\/p>\n<p>El procedimiento de entrenamiento es tan simple como intuitivo: se parte de un ejemplo conocido (es decir, dados unos valores num\u00e9ricos de entrada conocemos los valores num\u00e9ricos de salida esperados) y se compara, dado el modelo actual, los valores de salida reales con los esperados.<\/p>\n<p>A partir de aqu\u00ed se realizan peque\u00f1os ajustes en los par\u00e1metros del modelo para que los valores reales y esperados sean un poco m\u00e1s similares. No vamos a entrar en detalle\u2014abajo tienes mejores fuentes para ello\u2014pero basta decir que el misterio consiste en realizar estos ajustes de forma ordenada, desde el final al principio (de ah\u00ed back-propagation) y aplicando derivadas (tarea de la que afortunadamente se encarga el software en nuestro nombre).<\/p>\n<h2>Aprendiendo a comunicarse<\/h2>\n<h2>Procesamiento del Lenguaje Natural<\/h2>\n<p>\u00abLenguaje natural\u00bb hace referencia al lenguaje humano\u2014en contraste, por ejemplo, con el lenguaje inform\u00e1tico que encontramos en programaci\u00f3n.<\/p>\n<p>El lenguaje est\u00e1 en el coraz\u00f3n del pensamiento mismo, por lo que no sorprende que ya fil\u00f3sofos como Descartes o Wittgenstein se dedicaran a reflexionar sobre el lenguaje y la relaci\u00f3n entre idiomas. Con la llegada de la computadora, surgi\u00f3 un inter\u00e9s inmediato en crear modelos que permitieran la comunicaci\u00f3n entre ordenadores y humanos. As\u00ed, por ejemplo, Chomsky realiz\u00f3 trabajos sobre gram\u00e1ticas que tuvieron gran influencia en el campo.<\/p>\n<p>Pero el campo sufri\u00f3 el mismo exceso de entusiasmo que tanto da\u00f1o hizo en machine learning. Por ejemplo, en 1954 investigadores de la universidad de Georgetown predijeron que la traducci\u00f3n autom\u00e1tica ser\u00eda un problema resuelto \u00a1en cuesti\u00f3n de tres a\u00f1os! Esto se tradujo en una crisis de expectativas y un freno dr\u00e1stico en la inversi\u00f3n.<\/p>\n<p>Durante d\u00e9cadas el campo estuvo dominado por complejos modelos0020\u00abexpertos\u00bb basados en reglas y gram\u00e1ticas o, al contrario, por sencillos modelos estad\u00edsticos. Tal vez el mejor ejemplo de esto \u00faltimo sea la familia de algoritmos bag of words. La idea clave de estos algoritmos es describir un texto como la colecci\u00f3n (desordenada) de las palabras que lo componen, t\u00edpicamente eliminando las palabras m\u00e1s y menos comunes.<\/p>\n<p>L\u00f3gicamente hubo intentos de aplicar al mundo del lenguaje las novedosas t\u00e9cnicas de redes neuronales artificiales y deep learning ya a finales del siglo XX. Pero todas estas t\u00e9cnicas estaban limitadas por un problema fundamental: \u00bfc\u00f3mo debe traducirse un texto a lenguaje m\u00e1quina?<\/p>\n<h3>Vectores de palabra<\/h3>\n<p>Traducir una fotograf\u00eda a lenguaje inform\u00e1tico es sencillo. Basta con dividir la imagen en peque\u00f1as regiones (p\u00edxeles) y traducir la intensidad lum\u00ednica (en cada canal de color) por un n\u00famero. Hacer algo similar con el lenguaje no estan sencillo. En primer lugar, \u00bfcu\u00e1l es el p\u00edxel del lenguaje? \u00bfEs cada palabra esa unidad fundamental? \u00bfO hay que describir el texto letra por letra? Ambas opciones son, en realidad, viables, as\u00ed como aproximaciones intermedias m\u00e1s habituales en los \u00faltimos algoritmos.<\/p>\n<p>La idea m\u00e1s sencilla es codificar el texto utilizando un vocabulario. Contamos las palabras por decenas de miles, y las letras por decenas. Para visualizar esto, pensemos en el ADN, que se puede describir como un texto escrito por cuatro letras (A, C, G, T) que forman palabras (grupos de tres letras). \u00abVectorizar\u00bb estas letras es, por tanto, sencillo. Por ejemplo, en vez de A, podemos escribir (1, 0, 0,0), en vez de C (0, 1, 0, 0), en vez de G (0, 0, 1, 0) y en vez de T (0, 0, 0, 1).<\/p>\n<p>Podr\u00edamos hacer lo mismo, pero en este caso traduciendo \u00abpalabras\u00bb gen\u00e9ticas, que simbolizan amino\u00e1cidos (que forman las prote\u00ednas). Ya que existen 20 amino\u00e1cidos fundamentales, podr\u00edamos utilizar un vocabulario de longitud 21 (con un espacio extra para palabras especiales). As\u00ed, si nuestro primer amino\u00e1cido es alanina, y se escribe GCA, podr\u00edamos traducir esa secuencia como (1, 0, 0, \u2026, 0). Y esta idea se puede ampliar hasta vocabularios de decenas de miles de palabras. Las limitaciones de la idea son evidentes. Por un lado, manejar vectores de cuatro elementos es razonable. Trabajar con vectores de 60.000 elementos, un poco menos<\/p>\n<p>Adem\u00e1s, supongamos que nuestro vocabulario lo componen las palabras {pera, manzana, bal\u00f3n, barco}. La distancia matem\u00e1tica entre \u00abpera\u00bb (1, 0, 0, 0) y \u00abmanzana\u00bb (0, 1, 0, 0) es la misma que entre \u00abpera\u00bb y \u00abbarco\u00bb (0, 0, 0, 1), ya que estos vectores son iguales en dos posiciones y se diferencian en una unidad en otras dos. No importa el orden.La idea revolucionaria (cuyo germen, una vez m\u00e1s, se encuentra a mediados de siglo XX), consiste en utilizar vectores \u00abdensos\u00bb para describir una palabra. As\u00ed, cada posici\u00f3n de un vector ya no se corresponde a un \u00edndice de diccionario. Podemos pensar que cada posici\u00f3n nos describe una cualidad de la palabra.<\/p>\n<p>Por ejemplo, la primera posici\u00f3n podr\u00eda ser la relaci\u00f3n de la palabra con los alimentos, la segunda su \u00abredondez\u00bb y la tercera su relaci\u00f3n con medios de transporte.<\/p>\n<p>As\u00ed, \u00abmanzana\u00bb podr\u00eda ser (0.9, 0.7, 0.1). Esto permite que, de forma simult\u00e1nea, \u00abmanzana\u00bb sea similar a \u00abpera\u00bb (0.9, 0.5, 0.0), aunque tambi\u00e9n un poco similara \u00abbal\u00f3n\u00bb (0.2, 0.9, 0.2) y muy diferente a \u00abbarco\u00bb (0.0, 0.2, 0.8).<\/p>\n<p>De forma crucial, los vectores de palabra (llamados tambi\u00e9n word embeddings) nos abren la puerta a reutilizar conocimiento, ya que los vectores que son \u00fatiles para vectorizar mis textos pueden ser \u00fatiles a otras personas, incluso trabajando sobre distintos corpus documentales. Los word embeddings son uno de los avances fundamentales en la historia del procesamiento de lenguaje natural, y el germen del aprendizaje por transferencia en este campo<sup>5 6<\/sup>.<\/p>\n<h3>Aprendizaje por transferencia en NLP<\/h3>\n<p>Como vimos en la historia del machine learning, aprendizaje por transferencia es un avance clave mediante el que se consigue extrapolar conocimiento entre distintos dataset, lo cual hace posible trabajar con grandes modelos y pocos recursos. El aprendizaje por transferencia naci\u00f3 en el contexto del an\u00e1lisis de imagen, donde resulta casi natural tratar de reutilizar un clasificador de imagen en otro contexto.<\/p>\n<p>En 2018 se produjo un avance fundamental<sup>7<\/sup>, que consigui\u00f3 aplicar los conceptos de transferencia de aprendizaje completa\u2014aplicada a la arquitectura neuronal completa\u2014al campo de NLP. Este trabajo propone entrenar, en primer lugar, un modelo de lenguaje, a partir del cual se completa el modelo de clasificaci\u00f3n de texto (o el modelo apropiado para la tarea de texto correspondiente).<\/p>\n<p>Un modelo de lenguaje no es m\u00e1s que un modelo capaz de predecir la palabra correspondiente en un contexto dado. Por ejemplo, esto es lo que utilizan nuestros tel\u00e9fonos m\u00f3viles para ayudarnos a predecir la siguiente palabra en un mensaje.<\/p>\n<p>Los avances que ocurrieron a continuaci\u00f3n fueron espectaculares. En Foqum seguimos de cerca este excitante y abrumador panorama de avances tecnol\u00f3gicos para poner a tu disposici\u00f3n los \u00faltimos avances con las m\u00e1ximas garant\u00edas de eficacia, simplicidad y seguridad.<\/p>\n<h2>Aplicaciones y Ejemplos<\/h2>\n<p>Es una realidad ya irreversible que el machine learning ha llegado para quedarse y, en muchos casos, adaptarse a estas tecnolog\u00edas es una obligaci\u00f3n que determina el futuro de las empresas.<\/p>\n<p>No, los nuevos algoritmos no van a hacer prescindibles a los humanos. Somos m\u00e1s necesarios que nunca. Al tiempo que se automatizan tareas surgen nuevas necesidades y oportunidades. Muchas de las aplicaciones m\u00e1s interesantes de la inteligencia artificial est\u00e1n orientadas a asistirnos en nuestro trabajo, no a reemplazarnos.<\/p>\n<p>Sin embargo, los algoritmos ser\u00e1n sin duda una herramienta fundamental para optimizar los recursos humanos, que actualmente se desperdician en tareas de alto coste y bajo valor como la clasificaci\u00f3n de documentos o la extracci\u00f3n de informaci\u00f3n. Estos algoritmos tambi\u00e9n nos pueden ayudar a poner datos infrautilizados en valor. As\u00ed, la digitalizaci\u00f3n y procesado inteligente de bases de datos hist\u00f3ricas es una oportunidad com\u00fan.<\/p>\n<p>El rango de aplicaciones del machine learning puede resultar sorprendente y abrumador, y es esencial para entender las empresas m\u00e1s exitosas de la actualidad. Por ejemplo, la visi\u00f3n por computador es esencial en los algoritmos de conducci\u00f3n asistida de Tesla, pero tambi\u00e9n es clave en cadenas de alimentaci\u00f3n (para distinguir, por ejemplo, productos maduros o da\u00f1ados).<\/p>\n<p>La clasificaci\u00f3n de im\u00e1genes se ha aplicado a campos tan dispares y exigentes como la astrof\u00edsica o la medicina.<\/p>\n<p>Los procesos industriales modernos hacen un uso intensivo de machine learning. Desde la optimizaci\u00f3n de rutas y recursos a la monitorizaci\u00f3n inteligente de maquinaria de precisi\u00f3n para realizar mantenimiento predictivo\u2014minimizando costes de reparaci\u00f3n y la inactividad en f\u00e1brica.<\/p>\n<p>Amazon ser\u00eda irreconocible sin su servicio de sugerencia de productos de inter\u00e9s, ubicuo en la venta online. Sistemas similares determinan nuestro ocio, por ejemplo, a trav\u00e9s de la pre-selecci\u00f3n de contenido en Netflix y otros servicios de streaming.<\/p>\n<p>La detecci\u00f3n de fraude es una necesidad casi universal en el mundo digital, y una prioridad de primer orden para la banca online e intermediarios de venta. Tambi\u00e9n es universal el deseo de adelantarse a los clientes insatisfechos que acaban abandonando un servicio (churn prediction).<\/p>\n<p>Y todo esto sin hablar de los servicios de b\u00fasqueda online, mapas y sistemas de guiado, traductores, asistentes de voz, etc. Nos hayamos dado cuenta o no, vivimos en un mundo tecnol\u00f3gico dominado por algoritmos.<\/p>\n<p>Veamos ahora algunos casos de uso en el contexto del procesamiento de lenguaje natural.<\/p>\n<h3>Clasificaci\u00f3n de texto: an\u00e1lisis de sentimiento, tem\u00e1tica y spam bots<\/h3>\n<p>La clasificaci\u00f3n de texto es, sin duda, una de las necesidades m\u00e1s habituales de los clientes empresariales en machine learning. Sin embargo, no siempre resulta intuitivo darnos cuenta de qu\u00e9 necesidades encajan en esta categor\u00eda.<\/p>\n<p>Un caso com\u00fan es el an\u00e1lisis de sentimiento y su impacto en la imagen de marca. An\u00e1lisis de sentimiento no es m\u00e1s que asignar un sentimiento (positivo, negativo y neutro t\u00edpicamente) a un texto. Por ejemplo, podemos clasificar una serie de tuits en los que se menciona una marca, clasific\u00e1ndolos seg\u00fan estas categor\u00edas. Esto puede ser el fundamento de un interesante sistema de monitorizaci\u00f3n de mercado, donde se identifiquen tendencias y donde se pueda evaluar el impacto de operaciones de marketing e imagen.<\/p>\n<p>La clasificaci\u00f3n tem\u00e1tica es tan com\u00fan como variada. Podemos necesitar clasificar art\u00edculos period\u00edsticos seg\u00fan secci\u00f3n, o tal vez necesitemos clasificar documentos hospitalarios seg\u00fan distingas categor\u00edas cl\u00ednicas.<\/p>\n<p>Finalmente, los clasificadores de texto pueden ser una herramienta fundamental para apoyarnos en la escalabilidad de nuestros servicios. Por ejemplo, es ya sabido que cualquier comunidad online (ya a trav\u00e9s de chats, comentarios, cr\u00edticas, etc.) va a generar una ingente cantidad de contenido no deseado. Nos enfrentamos a bots de publicidad, as\u00ed como a trolls que generan incre\u00edbles cantidades de contenido t\u00f3xico que asfixian a los elementos honestos de la comunidad. Por si esto fuera poco, nos podemos enfrentar incluso a responsabilidades legales si no disponemos de las herramientas de moderaci\u00f3n adecuadas.&nbsp;<\/p>\n<p>Un clasificador de texto puede ser una excelente herramienta de primer nivel ante un reto semejante, generando alertas para revisi\u00f3n especializada y tomando medidas preventivas ante los casos m\u00e1s negativos.<\/p>\n<h3>Entidades nombradas: palabras clave<\/h3>\n<p>Otra de las tareas cl\u00e1sicas en procesamiento de texto es la identificaci\u00f3n de entidades. Por ejemplo, podemos estar interesados en localizar todaslas fechas de un documento, as\u00ed como todos los nombres de empresas o cantidades num\u00e9ricas.<\/p>\n<p>Esta idea se puede generalizar a nuevos conceptos. Por ejemplo, en el mundo m\u00e9dico podemos crear un algoritmo que identifique todas las menciones a patolog\u00edas en un documento.<\/p>\n<h3>Similitud documental<\/h3>\n<p>Cualquier persona con un corpus documental amplio se ha visto en la necesidad de encontrar documentos relacionados con una secuencia de t\u00e9rminos, con un p\u00e1rrafo o con otro documento. Esto se conoce como similitud documentaly es una necesidad absoluta en campos como el derecho, donde la b\u00fasquedade sentencias relevantes es una tarea constante y cr\u00edtica.<\/p>\n<h3>Reconocimiento \u00f3ptico de caracteres<\/h3>\n<p>Muchos casos de uso reales parten de una necesidad com\u00fan: la digitalizaci\u00f3n de documentos f\u00edsicos. Esto es lo que se conoce como reconocimiento \u00f3ptico de caracteres, u OCR, por sus siglas en ingl\u00e9s.<\/p>\n<p>La digitalizaci\u00f3n de documentos es una medida esencial para traducir un coste (almacenamiento de documentos de baja accesibilidad) en un valor.<\/p>\n<h3>Resumizaci\u00f3n y mucho m\u00e1s<\/h3>\n<p>La lista completa contin\u00faa, encontrando respuesta para todas las necesidades. Por ejemplo, tenemos casos de uso m\u00e1s descriptivos, como la identificaci\u00f3n de conceptos clave (otro complemento id\u00f3neo para nuestro hipot\u00e9tico sistema de monitorizaci\u00f3n de mercado). Tambi\u00e9n tenemos usos m\u00e1s en el l\u00edmite de la tecnolog\u00eda, como pueden ser la resumizaci\u00f3n de texto, la generaci\u00f3n autom\u00e1tica de contenido, el parafraseo de texto, etc. Sin duda, un campo apasionante en continuo crecimiento.<\/p>\n<h2>\u00c9tica y Responsabilidad<\/h2>\n<p>Ninguna gu\u00eda actual sobre machine learning puede estar completa sin unas palabras sobre \u00e9tica y responsabilidad.<\/p>\n<p>Como hemos visto, los algoritmos definen el mundo moderno, para bien o para mal, y de forma ya irreversible. Como toda tecnolog\u00eda, su impacto puede ser tanto positivo como negativo, por tanto, es nuestra responsabilidad ser conscientes de los riesgos y abusos del machine learning.<\/p>\n<p>\u00c9sta es una conversaci\u00f3n importante, que suele desviarse hacia cuestiones sensacionalistas, como la futura revoluci\u00f3n de las m\u00e1quinas (sobre la que han comentado personas de la talla de Stephen Hawkins<sup>8<\/sup>) o el dichoso trolley (ya sabes, ese famoso coche que puede elegir entre matar un perro superdotado o girar o acabar con la vida de una viejecita de 102 a\u00f1os).<\/p>\n<p>En realidad, deber\u00edamos estar hablando de cuestiones como privacidad<sup>9<\/sup>, representaci\u00f3n y transparencia. Por ejemplo, son notables los abusos que se han producido con tecnolog\u00edas de reconocimiento facial. Desde su abuso por la polic\u00eda en EEUU (donde, por ejemplo, utilizaron im\u00e1genes de famosos como sustituto a descripciones de sospechosos<sup>10<\/sup>) a represi\u00f3n racial en China.<sup>11<\/sup><\/p>\n<p>Tambi\u00e9n debemos estar alerta frente al oportunismo y las pseudociencias. Aqu\u00ed se pueden enmarcar muchas iniciativas m\u00e1s o menos bienintencionadas para atajar la pandemia de Covid-19, o algoritmos de que prometen resolver la selecci\u00f3n de personal mediante el an\u00e1lisis de breves fragmentos de v\u00eddeo<sup>12<\/sup>. No hace falta decir que esta es una promesa imposible y que acaba discriminando a los grupos habituales.<\/p>\n<p>Un aspecto que el usuario de algoritmos debe tener en cuenta es el hecho de que los algoritmos reproducen los sesgos de los datos que le ofrezcamos. Que nuestro algoritmo no tenga sesgos, y que nosotros tampoco los tengamos no sirve de nada si los sesgos se infiltran en nuestros datos, algo m\u00e1s dif\u00edcil de evitar de lo que parece.<\/p>\n<p>Un ejemplo ya famoso es el servicio de reconocimiento de imagen de Amazon, con m\u00e9tricas formidables para hombres blancos\u2026 y desastrosas cuando se aplica a mujeres negras<sup>13<\/sup>. Sin duda, un reflejo de un dataset de entrenamiento mal construido\u2014 como vemos, un resultado racista no implica necesariamente una motivaci\u00f3n racista, por lo que todos debemos estar en guardia ante este problema.<\/p>\n<p><sup>1<\/sup>Rosenblatt, Frank (1957). \u201cThe Perceptron\u2014a perceiving and recognizing automaton\u201d. Report 85-460-1. Cornell Aeronautical Laboratory.<\/p>\n<p><sup>2<\/sup>https:\/\/en.wikipedia.org\/wiki\/AI_winter<\/p>\n<p><sup>3<\/sup>https:\/\/deepmind.com\/research\/publications\/playing-atari-deep-reinforcement- earning<\/p>\n<p><sup>4<\/sup>https:\/\/eng.uber.com\/go-explore\/<\/p>\n<p><sup>5<\/sup>https:\/\/www.tensorflow.org\/tutorials\/text\/word_embeddings<\/p>\n<p><sup>6<\/sup>https:\/\/ruder.io\/word-embeddings-1\/<\/p>\n<p><sup>7<\/sup>https:\/\/nlp.fast.ai\/classification\/2018\/05\/15\/introducing-ulmfit.html<\/p>\n<p><sup>8<\/sup>https:\/\/www.bbc.com\/news\/technology-30290540<\/p>\n<p><sup>9<\/sup>https:\/\/bit.ly\/32syob6<\/p>\n<p><sup>10<\/sup>https:\/\/www.nbcnews.com\/news\/us-news\/nypd-used-celebrity-doppelg-ngers-fudge-facial-recognition-results-researchers-n1006411<\/p>\n<p><sup>11<\/sup>https:\/\/bit.ly\/32yRRqD<\/p>\n<p><sup>12<\/sup>https:\/\/wapo.st\/2Q7a9fR<\/p>\n<p><sup>13<\/sup>https:\/\/www.bbc.com\/news\/technology-47117299<\/p>\n","protected":false},"excerpt":{"rendered":"<p>El aprendizaje autom\u00e1tico es uno de los campos tecnol\u00f3gicos que  [&#8230;]<\/p>\n","protected":false},"author":1,"featured_media":3663,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"footnotes":""},"categories":[129],"tags":[],"class_list":["post-3662","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-machine-learning"],"acf":[],"_links":{"self":[{"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/posts\/3662","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/comments?post=3662"}],"version-history":[{"count":0,"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/posts\/3662\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/media\/3663"}],"wp:attachment":[{"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/media?parent=3662"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/categories?post=3662"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/foqum.io\/es\/wp-json\/wp\/v2\/tags?post=3662"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}