Data Science - Que son las Inteligencias Artificiales Generativas

Gotas de agua en una telaraña, emulando la presencia de los datos o dispositivos en la Web. Fotografía de Jimmy R. Coste Yost

En este artículo:

  • Contexto antológico
  • Que son las AIG
  • Como funcionan
  • Herramientas más populares 
  • Aplicación en distintas profesiones.

Contexto

En este mundo tan cambiante hemos visto varias revoluciones industriales en apenas los ultimos 50 años, cuando normalmente pasaban varias decadas entre una revolución y otra.

Y aunque es cierto que ese es el caso que entre la 3ra Revolución Industrial y la 4ta, las minirevoluciones que se dan en el medio son de apreciar. Por mencionar el hito que Merco, cuando aun esta vigente la Tercera Revolucion Industrial la llegada del ordenador y los Softwares Ofimaticos, así como la llegada de la Internet y la reproducción de audio y vídeo en linea vía web.

Y ya tambien con la Cuarta Revolución Industrial, tambien tenemos nuestros hitos a destacar. La llegada de la Web 2.0 y 3.0 con la gran variedad de palancas que conllevan. Entre estas, estan las Redes Sociales y el Internet de las Cosas. Estas hicieron "quebrar" algunas compañías emprendedoras.

¿Porqué?

Debido a que junto a la Inmótica y el Internet de las Cosas, las redes sociales, operadas por miles,  decenas de miles y despues centenas de miles de usuarios y dispositivos, por todo el mundo, de manera simultanea, pusieron al limite las bases de datos estructuradas, SQL. Así como el volumen de los datos, al poderse enviar fotos y videos junto a los mensajes. Simplemente el costo de mantener cientos o miles de servidores fucionando, era insostenible.

De ahi surgieron las bases de datos no estructuradas y la Big Data, pues no se podría sostener con las bases de datos tradicionales. Imaginense cuando las redes sociales y el Internet de las Cosas fueron usadas por los Millones, Decenas de millones y finalmente miles de millones de usuarios y dispositivos. 

En servidores que pudieran reproducirse a voluntad, para poder alojar la información segun el volumen variara y a la vez, permitir el acceso a los datos segun el comportamiento de los usuarios. De ahi que la Nube entra en juego. Arquitecturas de servidores virtuales que pudieran "reproducirse" a demanda a bajo costo y de manera cuasi automatica, es lo que se conoce como "Infraestructura como Servicio" IaaS, sin mencionar que para muchos servicios arquitecturas como "Plataformas como Servicio" PaaS y "Software como Servicio" SaaS, simplificaban ademas la gestión en la Nube, integrando justo los elementos que hacian falta. 

Y para manejar tal volumen de datos y poder extraer información util, entonces se requeriría análisis de datos avanzados, la propiamente Ciencia de datos fortalecida por sistemas automaticos y autonomos de seguir analizando al información, de manera agil aprendiendo por si misma, con aprendizaje de máquina supervisado y no supervisado. De ahi que surge una de las palancas de la 4ta Revolución Industrial que es la Inteligencia Artificial, con el machine Learning y de este úiltimo, el Deep Learning. Y del Deep Learning y las redes neuronales, las Inteligencias Artificiales Generativas o GAI por sus siglas en ingles.

Toda una evolución, No?

¿Pero que son las GAI? 

Existen varias definiciones segun fui consultando. Pero trataré de aportar valor aqui. La Inteligencia Artificial Generativa es un campo fascinante que busca reproducir las capacidades humanas de creación y generación de contenido. Las inteligencias artificiales generativas, GAI, se refieren a la capacidad de las computadoras para aprender y crear algo nuevo.  

Las AIG son auténticas maravillas tecnológicas diseñadas para crear contenido de manera autónoma. Estas inteligencias artificiales no solo procesan información, sino que también tienen la capacidad de generar nuevas ideas, textos, imágenes o incluso música. Su función principal radica en aprender patrones a partir de grandes cantidades de datos y utilizar este conocimiento para crear contenido original.


Como funcionan

En términos sencillos, las AIG funcionan en tres pasos: entrenamiento, generación y ajuste. Se nutren de datos para aprender patrones, luego pueden generar nuevo contenido basándose en ese aprendizaje. Este proceso permite que estas IA sean capaces de realizar tareas creativas y generativas en áreas como la redacción, el diseño gráfico y la creación de música.

Los modelos de Inteligencia Artificial Generativa operan analizando grandes cantidades de datos y aprendiendo patrones para generar nuevo contenido. Estos modelos constan de una arquitectura codificador-decodificador y emplean técnicas como redes neuronales recurrentes, transformadores y GANs (Redes Generativas Adversarias). 

Su funcionamiento se puede explicar de manera sencilla de esta forma:

Entrenamiento:

  • Primero, la IA se entrena con grandes cantidades de datos. Por ejemplo, si es un modelo de lenguaje como GPT-3, se le alimenta con toneladas de texto de internet para que aprenda patrones y estructuras del lenguaje.
  • Para modelos generativos de imágenes, se utilizan conjuntos de imágenes para que la IA aprenda a reconocer características y estilos visuales.

Generación:

  • Una vez entrenada, la IA puede crear contenido nuevo por sí misma. Por ejemplo, si es un modelo de lenguaje, se le proporciona una frase o un contexto, y genera texto coherente basándose en lo que ha aprendido durante el entrenamiento.
  • Si es un modelo generativo de imágenes, podría tomar una imagen de entrada y generar una versión modificada o completamente nueva.

Ajuste y Mejora:

  • Algunas IA permiten ajustar parámetros para personalizar la salida. Por ejemplo, se podrían cambiar palabras clave en una frase para alterar la respuesta de un modelo de lenguaje.
  • Durante el uso, la IA puede mejorar sus respuestas con el tiempo a medida que se le proporciona más retroalimentación y datos de entrenamiento.

Herramientas más populares

Entre las herramientas líderes en este espacio, encontramos nombres que resuenan en la comunidad tecnológica. GPT-3 de OpenAI destaca en la generación de texto, mientras que DALL-E asombra con su capacidad para crear imágenes únicas. En el ámbito musical, AIVA y MuseNet son fuentes de creatividad sonora. Estas herramientas, entre muchas otras, están allanando el camino hacia una nueva era de posibilidades generativas, como son DeepArt y StyleGAN. La Inteligencia Artificial Generativa encuentra aplicaciones en campos como el arte, la música, la escritura y el diseño, posibilitando la creación de contenido original y diverso.

Aquí tienen una lista de 50 Inteligencias Artificiales generativas populares, agrupadas por diferentes categorías:

Texto:

  • OpenAI's GPT-3.5
  • OpenAI's GPT-4 
  • Google's BERT
  • Google's T5
  • Facebook's RoBERTa
  • OpenAI's GPT-J
  • EleutherAI's GPT-Neo
  • Hugging Face's Transformers Library
  • Microsoft's Turing-NLG
  • Salesforce's CTRL

Imágenes:

  • NVIDIA's DALL-E
  • DeepArt.io
  • RunwayML
  • DeepDream by Google
  • Neural Style Transfer
  • DeepArt Effects
  • Artbreeder
  • StyleGAN
  • StyleGAN2
  • StyleGAN3 

Música:

  • AIVA
  • Google's Magenta
  • IBM Watson Beat
  • Jukedeck
  • Amper Music
  • OpenAI's MuseNet
  • Melodrive
  • Sony's Flow Machines
  • Humtap
  • Endlesss

Video:

  • RunwayML Video Tools
  • Deepfake technology
  • Google's DeepMind for Video Understanding
  • IBM Watson Media
  • VideoGAN
  • VQ-VAE-2 for video compression
  • NVIDIA's SPADE for video-to-video synthesis
  • DeepArt Effects (also for video)
  • Video-to-Video Synthesis (Vid2Vid)
  • Deep Video Portraits

Otros:

  • OpenAI's Codex for code generation
  • OpenAI's DALL-E 2 (hypothetical as of my last update)
  • Google's AutoML
  • Salesforce's Einstein
  • IBM Watson for Healthcare
  • OpenAI's ChatGPT (for conversation and text-based tasks)
  • OpenAI's InstructGPT (for instruction following)
  • DeepMind's AlphaGo (for game playing)
  • Amazon's Alexa (for voice-based tasks)
  • OpenAI's CLIP (for vision and language tasks)

Estas son solo algunas de las inteligencias artificiales generativas populares en diversas categorías al momento. 


Aplicaciones en distintas profesiones

Las Inteligencias Artificiales Generativas (GAI) tienen aplicaciones significativas en diversas profesiones, mejorando eficiencia, creatividad y toma de decisiones. Las AIG están impactando diversas profesiones de manera revolucionaria. Desde la medicina, donde asisten en diagnósticos y generación de informes, hasta el diseño, donde crean arte visual y prototipos innovadores. En la educación, ofrecen asistencia personalizada, y en la atención al cliente, los chatbots alimentados por AIG agilizan respuestas y soluciones.  Aquí hay algunas áreas donde las GAI están haciendo un impacto:

Medicina:

  • Diagnóstico Médico: GAI puede analizar imágenes médicas para detectar patrones y ayudar en el diagnóstico de enfermedades.
  • Generación de Informes: Ayudan a crear informes médicos detallados a partir de datos clínicos, facilitando la documentación.

Creatividad y Diseño:

  • Generación de Arte: En áreas como diseño gráfico, GAI como DALL-E pueden crear imágenes únicas y creativas.
  • Diseño de Productos: GAI puede ayudar en la generación de ideas y prototipos para productos innovadores.

Escritura y Contenido:

  • Redacción Automática: GAI, como GPT-3, es capaz de generar contenido escrito de alta calidad, desde artículos hasta redacciones creativas.
  • Edición de Texto: Pueden ayudar en la corrección gramatical y mejorar la coherencia del texto.

Desarrollo de Software:

  • Generación de Código: Algunas GAI pueden asistir en la creación de código, proporcionando sugerencias y automatizando partes del proceso de desarrollo.

Finanzas:

  • Análisis de Datos: GAI puede analizar grandes conjuntos de datos financieros para identificar patrones y tendencias.
  • Predicción de Mercado: Ayudan en la predicción de movimientos del mercado y en la toma de decisiones financieras.

Educación:

  • Asistencia Educativa: GAI puede ofrecer tutorías personalizadas, responder preguntas de los estudiantes y proporcionar retroalimentación.
  • Generación de Contenido Educativo: Facilitan la creación de materiales educativos y ejercicios.

Servicio al Cliente:

  • Chatbots: GAI se utiliza en sistemas de chat para responder preguntas frecuentes y proporcionar asistencia al cliente de manera eficiente.

Entretenimiento:

  • Creación de Música y Arte: GAI puede generar música, arte visual y otros contenidos creativos.
  • Generación de Escenarios: Ayuda en la creación de escenarios y tramas para videojuegos y películas.

Recursos Humanos:

  • Selección de Candidatos: GAI puede analizar currículos y ayudar en la selección inicial de candidatos.
  • Asesoramiento de Recursos Humanos: Ofrece asesoramiento en la gestión de personal y toma de decisiones.

Estas son solo algunas de las muchas aplicaciones posibles de las GAI en distintas profesiones. Es importante destacar que, aunque estas tecnologías ofrecen beneficios significativos, también plantean desafíos éticos y requieren un uso cuidadoso para garantizar resultados precisos y equitativos.

Recapitulando

En el corazón de las AIG yace un potencial ilimitado. Estas inteligencias artificiales no solo son herramientas creativas, sino también socios colaborativos en el avance de diversas industrias. Sin embargo, con este poder viene la responsabilidad. La ética en el uso de estas tecnologías es fundamental para asegurar que sus aplicaciones beneficien a la sociedad en su conjunto. Mientras celebramos las maravillas actuales, también miramos hacia el futuro, donde las AIG seguirán sorprendiéndonos y redefiniendo los límites de la creatividad tecnológica. En este universo generativo, el único límite es nuestra imaginación. ¡Bienvenidos a la era de las Inteligencias Artificiales Generativas!


Fuente: 

ELTECNIQUITO Press / DataCampOpenAI Blog / AI Weekly / Google AI Blog

Comentarios