Es permitir a las computadoras y máquinas simular el aprendizaje, la comprensión, la resolución de problemas, la toma de decisiones, la creatividad y la autonomía para uso y facilitar la vida de todos los humanos.

Cole Stryker es un editor y escritor que vive en Los Ángeles, California. Es autor sobre IA con IBM desde 2017junto con Eda Kavlokoglu.
Las aplicaciones y dispositivos equipados con IA pueden ver e identificar objetos. Pueden comprender y responder al lenguaje humano. Pueden aprender de nueva información y experiencia sobre temas determinados. Pueden hacer recomendaciones detalladas a usuarios y expertos. Pueden actuar de forma independiente, reemplazando la necesidad de intervención o inteligencia humana (un ejemplo clásico es un automóvil autónomo).
Pero en 2024, la mayoría de los investigadores y profesionales de la IA (y la mayoría de los titulares relacionados con la IA) se centrarán en los avances en la IA generativa (gen AI), una tecnología que puede crear textos, imágenes, vídeos y otros contenidos originales. Por qué? Porque es lo que más demanda comercial tiene. Y para hacer cosas que las personas no pueden hacen ni tan rápido, ni tan acertado, ni tan efectivo.
Para comprender completamente la IA generativa, es importante comprender primero las tecnologías sobre las que se construyen las herramientas de IA generativa: aprendizaje automático (ML) y aprendizaje profundo.
Una forma sencilla de pensar en la IA es como han surgido a lo largo de más de 70 años una serie de conceptos anidados o derivados.

Directamente debajo de la IA, tenemos el aprendizaje automático, que implica la creación de modelos entrenando un algoritmo para hacer predicciones o decisiones basadas en datos. Abarca una amplia gama de técnicas que permiten a las computadoras aprender y hacer inferencias basadas en datos sin estar programadas explícitamente para tareas específicas.
Existen muchos tipos de técnicas o algoritmos de aprendizaje automático, incluida la regresión lineal, la regresión logística, los árboles de decisión, el bosque aleatorio, las máquinas de vectores de soporte (SVM), los k vecinos más cercanos (KNN), la agrupación en clústeres y más. Cada uno de estos enfoques se adapta a diferentes tipos de problemas y datos.
Pero uno de los tipos más populares de algoritmo de aprendizaje automático se llama red neuronal (o red neuronal artificial). Las redes neuronales siguen el modelo de la estructura y función del cerebro humano. Una red neuronal consta de capas interconectadas de nodos (análogas a las neuronas) que trabajan juntas para procesar y analizar datos complejos. Las redes neuronales se adaptan bien a tareas que implican identificar patrones y relaciones complejos en grandes cantidades de datos.
La forma más simple de aprendizaje automático se llama aprendizaje supervisado, que implica el uso de conjuntos de datos etiquetados para entrenar algoritmos para clasificar datos o predecir resultados con precisión. En el aprendizaje supervisado, los humanos emparejan cada ejemplo de entrenamiento con una etiqueta de salida. El objetivo es que el modelo aprenda la ruta entre entradas y salidas en los datos de entrenamiento, de modo que pueda predecir las etiquetas de datos nuevos e invisibles.

IA versus aprendizaje automático
Aprendizaje profundo
El aprendizaje profundo es un subconjunto del aprendizaje automático que utiliza redes neuronales de múltiples capas, llamadas redes neuronales profundas, que simulan más fielmente el complejo poder de toma de decisiones del cerebro humano.
Las redes neuronales profundas incluyen una capa de entrada, (al menos tres pero generalmente cientos de capas ocultas), y una capa de salida, a diferencia de las redes neuronales utilizadas en los modelos clásicos de aprendizaje automático, que generalmente tienen solo una o dos capas ocultas.
Estas múltiples capas permiten el aprendizaje no supervisado: pueden automatizar la extracción de características de conjuntos de datos grandes, sin etiquetar y no estructurados, y hacer sus propias predicciones sobre lo que representan los datos.
Como el aprendizaje profundo no requiere intervención humana, permite el aprendizaje automático a una escala enorme. Es muy adecuado para el procesamiento del lenguaje natural (PNL), la visión por computadora y otras tareas que implican la identificación rápida y precisa de patrones y relaciones complejos en grandes cantidades de datos. Alguna forma de aprendizaje profundo impulsa la mayoría de las aplicaciones de inteligencia artificial (IA) en nuestras vidas hoy en día.
Redes profundas y neutrales

El aprendizaje profundo también permite:
• Aprendizaje semisupervisado, que combina el aprendizaje supervisado y no supervisado mediante el uso de datos etiquetados y no etiquetados para entrenar modelos de IA para tareas de clasificación y regresión.
• Aprendizaje autosupervisado, que genera etiquetas implícitas a partir de datos no estructurados, en lugar de depender de conjuntos de datos etiquetados para señales de supervisión.
• Aprendizaje por refuerzo, que aprende mediante prueba y error y funciones de recompensa en lugar de extraer información de patrones ocultos.
• Transferir aprendizaje, en el que el conocimiento adquirido a través de una tarea o conjunto de datos se utiliza para mejorar el rendimiento del modelo en otra tarea relacionada o conjunto de datos diferente.
.
IA generativa
La IA generativa, a veces llamada «IA gen», se refiere a modelos de aprendizaje profundo que pueden crear contenido original complejo, como texto extenso, imágenes de alta calidad, video o audio realista y entre otras cosas, en respuesta a una solicitud o solicitud de un usuario.
En un alto nivel, los modelos generativos codifican una representación simplificada de sus datos de entrenamiento y luego se basan en esa representación para crear un nuevo trabajo que es similar, pero no idéntico, a los datos originales.
Los modelos generativos se han utilizado durante años en estadística para analizar datos numéricos. Pero durante la última década, evolucionaron para analizar y generar tipos de datos más complejos. Esta evolución coincidió con la aparición de tres tipos sofisticados de modelos de aprendizaje profundo:
• Codificadores automáticos variacionales o VAE, que se introdujeron en 2013 y crearon modelos que podían generar múltiples variaciones de contenido en respuesta a un mensaje o instrucción.
• Modelos de difusión, vistos por primera vez en 2014, que añaden «ruido» a las imágenes hasta que son irreconocibles y luego eliminan el ruido para generar imágenes originales en respuesta a indicaciones.
• Transformadores (también llamados modelos de transformadores), que se entrenan con datos secuenciados para generar secuencias extendidas de contenido (como palabras en oraciones, formas en una imagen, cuadros de un video o comandos en código de software). Los transformadores son el núcleo de la mayoría de las herramientas de IA generativa que generan titulares en la actualidad, incluidas ChatGPT y GPT-4, Copilot, BERT, Bard y Midjourney.
Mezcla de Experts | Podcast

Cómo funciona la IA generativa
En general, la IA generativa opera en tres fases:
1. Formación, para crear un modelo básico.
2. Tuning,( entonar) para adaptar el modelo a una aplicación específica.
3. Generación, evaluación y más ajustes, para mejorar la precisión.
Capacitación
La IA generativa comienza con un «modelo básico»; un modelo de aprendizaje profundo que sirve como base para múltiples tipos diferentes de aplicaciones de IA generativa.
Los modelos básicos más comunes en la actualidad son los modelos de lenguaje grande (LLM), creados para aplicaciones de generación de texto. Pero también existen modelos básicos para la generación de imágenes, vídeos, sonido o música, y modelos básicos multimodales que soportan varios tipos de contenidos.
Para crear un modelo básico, los profesionales entrenan un algoritmo de aprendizaje profundo en enormes volúmenes de datos relevantes sin procesar, no estructurados y sin etiquetar, como terabytes o petabytes de datos, texto, imágenes o videos de Internet. El entrenamiento produce una red neuronal de miles de millones de parámetros (representaciones codificadas de las entidades, patrones y relaciones en los datos) que pueden generar contenido de forma autónoma en respuesta a indicaciones.
Este es el modelo básico.
Este proceso de formación requiere un uso intensivo de recursos informáticos, mucho tiempo y dinero. Requiere miles de unidades de procesamiento de gráficos (GPU) agrupadas y semanas de procesamiento, todo lo cual normalmente cuesta millones de dólares. Los proyectos de modelos básicos de código abierto, como Llama-2 de Meta, permiten a los desarrolladores de IA de generación evitar este paso y sus costos.
Sintonización
A continuación, el modelo debe ajustarse a una tarea de generación de contenido específica. Esto se puede hacer de varias formas, incluyendo:
• Ajuste fino, que implica alimentar el modelo con datos etiquetados específicos de la aplicación: preguntas o indicaciones que probablemente reciba la aplicación y las correspondientes respuestas correctas en el formato deseado.
• Aprendizaje reforzado con retroalimentación humana (RLHF), en el que los usuarios humanos evalúan la precisión o relevancia de los resultados del modelo para que el modelo pueda mejorarse a sí mismo. Esto puede ser tan simple como hacer que las personas escriban o respondan las correcciones a un chatbot o asistente virtual.
Generación, evaluación y más tuning
Los desarrolladores y usuarios evalúan periódicamente los resultados de sus aplicaciones de IA generativa y ajustan aún más el modelo, incluso una vez por semana, para lograr una mayor precisión o relevancia. Por el contrario, el modelo básico en sí se actualiza con mucha menos frecuencia, quizás cada año o 18 meses.
Otra opción para mejorar el rendimiento de una aplicación de IA es la generación aumentada de recuperación (RAG), una técnica para ampliar el modelo básico para utilizar fuentes relevantes fuera de los datos de entrenamiento para perfilar los parámetros y obtener una mayor precisión o relevancia.
Beneficios de la IA
La IA ofrece numerosos beneficios en diversas industrias y aplicaciones. Algunos de los beneficios más comúnmente citados incluyen:
• Automatización de tareas repetitivas.
• Más y más rápido conocimiento de los datos.
• Mejora de la toma de decisiones.
• Menos errores humanos.
• Disponibilidad 24hrs x7dias semana.
• Reducción de riesgos físicos.
Automatización de tareas repetitivas
La IA puede automatizar tareas rutinarias, repetitivas y a menudo tediosas, incluidas tareas digitales como la recopilación, el ingreso y el preprocesamiento de datos, y tareas físicas como la selección de existencias en el almacén y los procesos de fabricación. Esta automatización libera para realizar trabajos más creativos y de mayor valor.
Toma de decisiones mejorada
Ya sea que se utilice para respaldar la toma de decisiones o para una toma de decisiones totalmente automatizada, la IA permite predicciones más rápidas y precisas, asi como decisiones confiables basadas en datos. Combinada con la automatización, la IA permite a las empresas aprovechar las oportunidades y responder a las crisis a medida que surgen, en tiempo real y sin intervención humana.
Menos errores humanos
La IA puede reducir los errores humanos de varias maneras; desde guiar a las personas a través de los pasos adecuados de un proceso,- hasta señalar errores potenciales antes de que ocurran y automatizar completamente los procesos sin intervención humana. Esto es especialmente importante en sectores como el de la atención sanitaria, donde, por ejemplo, la robótica quirúrgica guiada por IA permite una precisión constante.
Los algoritmos de aprendizaje automático pueden mejorar continuamente su precisión y reducir aún más los errores a medida que se exponen a más datos y «aprenden» de la experiencia.
Disponibilidad y consistencia las 24 horas del día
La IA está siempre activa, disponible las 24 horas del día y ofrece un rendimiento constante en todo momento. Herramientas como los chatbots de IA o los asistentes virtuales pueden aligerar las demandas de personal para servicio o atención al cliente. En otras aplicaciones, como el procesamiento de materiales o las líneas de producción,- la IA puede ayudar a mantener una calidad de trabajo y niveles de producción constantes cuando se utiliza para completar tareas repetitivas o tediosas.
Riesgo físico reducido
Al automatizar trabajos peligrosos (como el control de animales, el manejo de explosivos, la realización de tareas en aguas profundas del océano, grandes altitudes o en el espacio exterior), la IA puede eliminar la necesidad de poner a los trabajadores humanos en riesgo de sufrir lesiones o algo peor. Si bien aún no se han perfeccionado, los automóviles y otros vehículos autónomos ofrecen el potencial de reducir el riesgo de lesiones a los pasajeros.
Comentarios recientes