Por: Luis Escalante, Máster en Inteligencia Artificial – Publicis Global Delivery
(De Pantallazo.com.co)
¿Has oído hablar de ChatGPT, Midjourney, Dall-e y otras herramientas para generar texto, imágenes y videos?, ¿has escuchado que la Inteligencia Artificial (IA) remplazaría a los humanos en el trabajo?
La IA se refiere a la simulación de la inteligencia humana en máquinas que están programadas para «pensar» como los humanos e imitar sus acciones y/o procesos, y que pueden aprender a tomar decisiones de manera autónoma.
Con el concepto de IA, el paradigma de la codificación cambió. El Aprendizaje Automático (AA) se planteó como un subcampo de la IA para proporcionar una serie de datos de entrada y las respuestas esperadas, una serie de reglas que nos permiten obtener la correspondencia entre los datos de entrada y salida. Con el AA, se creó el Aprendizaje Profundo para imitar el cerebro humano a través de lo que se llama arquitecturas de Redes Neuronales o Redes Neuronales Artificiales.
Modelos de aprendizaje automático utilizan técnicas estadísticas para ayudar a la máquina a «aprender» cómo mejorar progresivamente en una tarea sin necesidad de haber sido programada específicamente para ella. En cambio, los algoritmos de aprendizaje automático utilizan datos históricos como entrada para predecir nuevos valores de salida a través de subcategorías que ayudarán a resolver diferentes problemas, como aprendizaje supervisado, aprendizaje no supervisado y aprendizaje por reforzamiento.
Por su parte, el Aprendizaje Profundo es un tipo de aprendizaje automático que hace que las entradas pasen a través de una arquitectura de red neuronal biológicamente inspirada que contiene varias capas ocultas a través de las cuales se procesan los datos, lo que permite a la máquina «profundizar» en su aprendizaje, establecer conexiones y ponderar la entrada para obtener los mejores resultados.
Hay diferentes arquitecturas de redes neuronales (convolucionales, recurrentes, generativas adversarias, transformadoras), con sus fortalezas y debilidades, pero no nos detendremos hoy en su descripción.
La IA generativa, propiamente, surge del uso de estos algoritmos de aprendizaje profundo para generar nuevos datos similares a un conjunto de datos dado. Las Redes Neuronales Generativas (GANs), los Modelos Autorregresivos y los Autocodificadores Variacionales (VAEs) básicamente hacen generación de imágenes, como objetos realistas, animales, personas, etc., para áreas como los videojuegos, el arte y la realidad virtual.
También encontramos generadores de texto coherentes y significativos, así como historias, poesía, nuevos artículos, y más allá. Podríamos decir que la combinación de varios modelos nos puede dar la capacidad de crear herramientas como ChatGPT, donde los humanos pueden sentir una interacción más natural, como si estuvieran hablando con otra persona.
En este punto, entran en juego los Modelos de Lenguaje Amplio (MLA), especialmente para comprender y generar un lenguaje natural. El secreto es que estos modelos se entrenan con cantidades masivas de datos de texto de diferentes fuentes para predecir la probabilidad de la siguiente palabra en una secuencia basada en las palabras anteriores. Este proceso se repite millones de veces, lo que permite que el modelo aprenda los patrones y las relaciones entre las palabras y frases en el idioma en el que se entrena.
Una vez entrenado el modelo, se puede utilizar para una variedad de tareas. Por ejemplo, GPT-3 (Generative Pre-Trained Transformer-3) ha demostrado generar texto humano de alta calidad en diversos dominios.
El éxito de los MLA ha sido impulsado por una gran cantidad de datos y recursos informáticos potentes, lo que permite que los modelos comprendan estructuras de lenguaje complejas y generen texto coherente y fluido que a menudo es difícil de distinguir del texto escrito por humanos, algo que en el pasado impedía que la IA evolucionara rápidamente.
Sin embargo, debemos ser conscientes de algunas implicaciones éticas y responsabilidades del uso de todas estas tecnologías, como el potencial de esos modelos para generar contenido sesgado o dañino y la posibilidad de su mal uso en áreas como campañas de desinformación, ciberataques y lo que se llama “deep fakes” (falsedades profundas), donde básicamente una persona puede suplantar a otra. Además, la privacidad de los datos es algo que debemos tener en alta prioridad. No podemos compartir datos sensibles hasta corroborar de que estarán seguros.
La IA no está reemplazando el trabajo humano. No tienen intencionalidad, no tienen comprensión humana y no tienen instintos, al menos por ahora. Hoy en día, se utiliza principalmente para optimizar el trabajo, realizar tareas de manera más eficiente, también es una gran oportunidad para evolucionar y seguir aprendiendo cuál es la mejor manera de utilizar esas tecnologías a nuestro favor.