Introducción al machine learning, primera exploración

Dialéktico
Compartir

CONTENIDO

Si hay notación matemática, se recomienda la visualización de este contenido en una computadora

Como primera parada en nuestro paso a través de las parcelas del machine learning, vamos a detenernos un poco, mirar a nuestro alrededor, y echar un vistazo al mapa: ¿qué es machine learning?, ¿para qué sirve?, ¿qué tipos de machine learning existen?, algunos ejemplos, sus componentes principales, entre otras particularidades cuyo conocimiento es conveniente para sortear el terreno y poder adentrarnos de lleno en sus misterios.

NivelPR
¿Qué necesitaremos para nuestra primera exploración?
Travel Bag

Dado que es tu primera vez por estos lares, en esta ocasión el inventario es bastante ligero:

Tentempié: algún alimento para amenizar la travesía

Snack INM 3

Y es todo. Este recorrido en particular contendrá conceptos poco técnicos, solo te recomiendo algún comestible para acompañar, y poner suma atención a todo lo que verás a continuación.


Nota: a lo largo de nuestras travesías me referiré al machine learning también como aprendizaje de máquinas, aprendizaje automático, o aprendizaje artificial.


¿Qué es machine learning?

Pergamino_3

Antes que nada, empecemos definiendo nuestro objeto de estudio y tierra de futuras aventuras (y desgracias).

El machine learning es una rama de las ciencias computacionales y matemáticas que estudia y desarrolla técnicas para la creación de sistemas capaces de concretar uno o más objetivos mediante algoritmos no explícitamente programados, a través de un proceso de aprendizaje que consiste en la extracción automática de patrones de conjuntos de datos.

IN L1 2
D7 IN

Para mostrar este concepto de una manera más digerible, explicaré poco a poco diferentes términos clave que lo conforman.

Comencemos hablando sobre el fenómeno central con el que estaremos lidiando durante toda nuestra travesía: el aprendizaje.

Aprendizaje en machine learning

En el contexto del machine learning, el aprendizaje se refiere al hecho de que una máquina sea capaz de realizar una tarea o más tareas, y mejorar en su ejecución mediante el procesamiento de datos; es decir, se da a través de la experiencia, justo como hacemos nosotros en nuestra vida diaria.

IN K1 2

Exacto. Como cuando mejoramos en la realización de nuestras actividades cotidianas, en machine learning las computadoras mejoran en la ejecución de sus objetivos conforme a los datos que les damos y sus intentos por alcanzar exitosamente sus metas.

Un ejemplo clásico de esto es un sistema capaz de reconocer gatos. Para lograr que una computadora aprenda cómo diferenciar un gato de otros animales, le tenemos que proporcionar cúmulos de imágenes etiquetadas, es decir, grupos de imágenes en las que le señalemos cuáles son de gatos y cuáles no (justo como lo haríamos con un bebé).

Blog1 1
Fig. 1.3.1 A través del aprendizaje automático, las computadoras aprenden de forma no muy diferente a los seres humanos. En el ejemplo mencionado, le indicamos a la computadora cuáles imágenes corresponden a gatos y cuáles no con el fin de que logre diferenciar unas de otras.

Mediante el procesamiento de estos datos (las imágenes y sus correspondientes pixeles), y la consideración de sus errores y éxitos (la cantidad de gatos que la máquina reconoce de forma correcta o incorrecta), la máquina incrementará progresivamente su capacidad de diferenciar gatos de otros animales. Esto indica que la computadora aprende conforme analiza los datos que le proporcionamos, y esto es en esencia la definición y meta del machine learning.

IM2
Fig. 1.3.2 Un modelo de aprendizaje automático puede lograr reconocer objetos dado el diferenciamiento de patrones en imágenes. En nuestro ejemplo, un algoritmo logra identificar gatos de entre diferentes animales procesando imágenes etiquetadas, en las que se le señala cuáles corresponden a gatos y cuáles no.

De forma resumida, podemos aseverar que el machine learning es una rama de la ciencia que busca desarrollar y/o implementar técnicas para generar aprendizaje en máquinas, es decir: mejorar sus capacidades en el cumplimiento de objetivos conforme a los datos que le proveemos.

Como último punto sobre su definición, enfatizaré el antes mencionado reconocimiento de patrones: los patrones son tendencias o comportamientos que muestran los datos, los cuales son la clave para el aprendizaje; estos patrones se modelan matemáticamente. Abordaremos esto con más detalle en otros tópicos del curso, principalmente en los apartados de matemáticas.

Para ilustrar el alcance de este tipo de algoritmos, en la Figura 1.3.3 se pueden apreciar diferentes ejemplos de productos inteligentes creados mediante técnicas de aprendizaje automático:

IN IM3
Fig. 1.3.3 Ejemplos de aplicaciones del machine learning.

Estos son solo una diminuta porción del racimo de posibilidades que ofrece el machine learning: sus aplicaciones qpermean gran parte de nuestra vida diaria, especialmente en los entornos digitales.

HistoricFrame 1

El término machine learning fue utilizado por primera vez por el ingeniero Arthur L. Samuel en 1959, en un artículo llamado «Some Studies in Machine Learning Using the Game Checkers«. En su texto abordaba los procedimientos para lograr que una computadora aprenda a jugar el juego de mesa «damas inglesas». Sobre los resultados expresó lo siguente: «se ha realizado suficiente trabajo para verificar el hecho de que una computadora puede ser programada para aprender a jugar mejor que las personas que escribieron el programa».

HistoricFrameBottom 1

Machine learning vs algoritmos convencionales

Dada esta definición del machine learning, se puede distinguir un enorme diferenciador que tiene respecto a la forma en que ofrecen soluciones los programas informáticos convencionales, ya que en estos últimos se establecen reglas que la computadora debe seguir para ejecutar una tarea, y que no cambian salvo que el programador decida realizar alguna edición del código computacional que las establece.

En un algoritmo de machine learning, en cambio, su eficiencia cumpliendo sus objetivos cambia a la par que procesa datos.

Un ejemplo de esto es una computadora que ha sido programada para entablar algún tipo de diálogo con usuarios. Una forma de hacer esto, es con un programa que muestre respuestas predefinidas por el programador dado un texto de entrada específico.

En cambio, un algoritmo de machine learning puede aprender a responder procesando información de conversaciones, y sus respuestas pueden variar conforme «lea» más de estas, como se ejemplifica en la figura 1.3.5.

Speaking 3
Fig. 1.3.5 La operación de una computadora que realiza una tarea a través de aprendizaje automático se ve modificada con relación a los datos que consume. En este ejemplo, una computadora que ha leído (procesado) cierto tipo de conversaciones en español, donde se puede notar la influencia de expresiones locales, ha aprendido a responder de una manera que podría cambiar en cuanto procese otras pláticas nuevas. Es importante notar cómo el contexto o los factores culturales determinan el comportamiento de una IA en un campo como el lenguaje, ya que incluso se han suscitado casos de computadoras racistas o sexistas al ser entrenadas con información sesgada.

Por lo tanto, a través del aprendizaje automático se generan programas que funcionan a partir de estructuras matemáticas dinámicas, es decir, que cambian automáticamente a la par que procesan información: estos programas se adaptan y varían su rendimiento con el consumo de datos nuevos.

A1 IN

Hoy en día varios autores se refieren al machine learning como una rama de la inteligencia artificial, e incluso de las ciencias cognitivas. En este curso aceptaremos la convención general de que el machine learning es inteligencia artificial, porque sus avances se desprenden del estudio de esta.

Sin embargo, la inteligencia es aún un concepto de diversos tintes, y no se tienen métricas concretas bajo un acuerdo común para su medición (hasta donde yo sé), por lo que podríamos discernir entre si estos sistemas son realmente inteligentes o no. Desde mi perspectiva, las computadoras aún no son inteligentes per se, pero esto es un tema que da para un extenso debate. Lo dejo a tu criterio.

Contesta la siguiente pregunta

1 / 1

¿Cómo es que una máquina aprende mediante algoritmos de machine learning?

Tu puntación es

La puntuación media es 84%

0%

Nuestra exploración está por terminar, antes solo haremos hincapié en los tipos de machine learning existentes, y otros aspectos adicionales que dejaré a tu disposición.

Tipos de machine learning

Ahora que sabemos la definición del aprendizaje automático, es importante conocer cuáles son sus principales tipos.

El machine learning se divide en las siguientes 5 categorías principales:

  • Aprendizaje supervisado (supervised learning).
  • Aprendizaje no supervisado (not supervised learning).
  • Aprendizaje semi-supervisado (semi-supervised learning).
  • Aprendizaje por refuerzo (reinforcement learning).
  • Aprendizaje auto-supervisado (self-supervised learning).

Estas divisiones están dadas principalmente por la forma en que se entrega al algoritmo los datos a procesar, y cómo los digiere, siendo el aprendizaje supervisado una de las categorías que goza de mayor popularidad en la actualidad.

Exploraremos cada una de estas formas en siguientes lecciones, y si lo deseas puedes echar un vistazo más detallado en el artículo opcional sobre tipos de machine learning.


Con lo que hemos visto hasta aquí, tenemos una introducción bastante sustanciosa a lo que es el machine learning. Debajo tocaré tres breves aspectos más que te darán una visión más amplia de sus componentes, objetivos, y modelos. Si lo deseas, puedes saltar aquí a tu siguiente aventura:

Ir al final


Componentes principales del machine learning

Existen ciertos ingredientes de un flujo de aprendizaje de máquinas que son clave para su efectiva aplicación en la solución de problemas, aquellos elementos característicos que te ayudarán a identificar los puntos medulares un sistema de este tipo:

1. Un conjunto de datos: este imprescindible elemento es el cúmulo de datos del que se obtendrán patrones, es decir, a partir de los cuales aprenderá la computadora. Es sin duda el componente más esencial y característico de toda la ciencia de datos (en nuestro ejemplo, el conjunto de datos es el grupo de imágenes de gatos y otros animales).

2. Un algoritmo para transformar los datos: es la lógica utilizada para procesar los datos y generar el aprendizaje del modelo (en nuestro ejemplo, el algoritmo sería el conjunto de operaciones realizadas bajo una lógica para que la máquina logre reconocer gatos con éxito).

3. Modelo matemático: es la función matemática resultante de la etapa de aprendizaje generada por el algoritmo. Esta permite realizar los cálculos para que la máquina realice sus tareas (en el ejemplo citado, el modelo matemático resultante es una función que, dada una nueva imagen, genera un valor numérico que indique si la imagen es un gato o no).

4. Métricas de rendimiento: cálculos que nos señalarán qué tan bien está funcionando nuestro modelo, o en otras palabras, qué tanto podemos confiar en sus resultados (en nuestro ejemplo, podemos calcular qué tantas imágenes son reconocidas de forma correcta e incorrecta por el modelo; esta sería una sencilla métrica de rendimiento).

M3 IN 2

Contesta las siguientes preguntas

1 / 2

¿Cuál de los siguientes no es un tipo de aprendizaje de máquinas?

2 / 2

¿Cuáles de los siguientes se consideran elementos clave para el desarrollo de una solucion mediante machine learning? Marca todos los que apliquen.

Tu puntación es

La puntuación media es 75%

0%

Principales usos del machine learning

De acuerdo a la literatura, podemos enunciar cinco principales tipos de uso para los cuales se invoca el aprendizaje automático, los cuales conoceremos muy a fondo en futuras exploraciones, y que deberás identificar en tu día a día como experto en el área.

Principales usos del machine learning:

  • Clasificación: como en nuestro ejemplo de reconocimiento de imágenes de gatos, consiste en categorizar datos. Otro ejemplo de este enfoque sería un algoritmo cuya tarea sea clasificar películas por su género, como terror o fantasía.
  • Regresión: trata sobre hacer estimaciones numéricas. Por ejemplo, se pueden generar modelos que respondan a preguntas como: ¿cuál es el precio de un teléfono celular de acuerdo a sus características?, o ¿cuál será el número de visitantes a un centro comercial el día de mañana?
  • Agrupación: crear grupos de datos de acuerdo a sus similitudes. Por ejemplo, agrupar animales conforme a sus rasgos genéticos.
  • Reducción de dimensionalidad: tiene como objetivo reducir las dimensiones de los datos, ayudándonos a filtrar y mantener aquellos subconjuntos que sean matemáticamente más relevantes.
  • Generación (modelos generativos): este caso de uso ha sido ampliamente impulsado en años recientes, y se centra en la creación de nuevos contenidos o respuestas basadas en una amplia gama de entradas. Un ejemplo de esto es ChatGPT o Llama, los cuales pueden a su vez generar soluciones que incluyan las categorías antes mencionadas.

Esto es solo parte de los usos más frecuentes en la actualidad, estas aplicaciones están principalmente destinadas a la investigación científica y la inteligencia de negocios.

Algoritmos de aprendizaje automático más utilizados

Por último, te mostraré una lista con los algoritmos de machine learning más frecuentes en el ámbito de la ciencia de datos, puede que en este momento no te parezcan muy significativos sus nombres, pero con el tiempo no solo los conocerás, sino que también aprenderás a utilizarlos.

Algoritmos de machine learning más utilizados:

  • Regresión lineal.
  • Regresion logística.
  • Red neuronal artificial.
  • Máquina de soporte vectorial.
  • K-medias.
  • Sistemas de recomendación.
  • Árbol de decisión.
  • Bosques aleatorios.
  • Impulso (Boosting).
  • Clasificador Bayesiano.
  • Análisis de componentes principales.
  • Macro Modelos de Lenguaje (LLM).

Entre estos, las redes neuronales artificiales y las LLMs son los que presentan su mayor auge en nuestros tiempos. Todos los algoritmos mencionados y sus características serán objeto de estudio en otras exploraciones, así que no te preocupes si no estás familiarizado con algunos.

Eso es todo por ahora. A partir de aquí, nos adentraremos en una primera sección ya no introductoria en la que aprenderemos sobre los datos, su extracción, manipulación y transformación para el machine learning.

siguiente

OPCIONAL:

Tipos de machine learning

DEJA TUS DUDAS O COMENTARIOS

Suscríbete
Notíficame de
guest

0 Comentarios
Más viejo
Más nuevo Más votado
Respuestas entre líneas
Ver todos los comentarios
0
¿Dudas, sugerencias, o comentarios? Deja un mensaje.x