Guía de IA: un vistazo a los conceptos clave y los principales actores de la IA

Fuente: Techcrunch

Recopilación: Babbitt

Fuente de la imagen: generada por la herramienta de IA ilimitada

La inteligencia artificial (IA) parece estar en todos los rincones de la vida moderna, desde la música y los medios hasta los negocios y la productividad, e incluso las citas. Hay tantas cosas que es difícil mantenerse al día. Este artículo cubrirá todo, desde los últimos grandes desarrollos en IA hasta los términos y las empresas que necesita saber para mantenerse actualizado sobre el estado de las cosas en este campo de rápido movimiento.

Primero, ¿qué es la inteligencia artificial?

La inteligencia artificial, también conocida como aprendizaje automático, es un sistema de software basado en redes neuronales, una técnica que en realidad fue pionera hace décadas pero que recientemente floreció gracias a nuevos y poderosos recursos informáticos. Actualmente, la IA ha logrado un reconocimiento efectivo de voz e imágenes, así como la capacidad de generar imágenes y voz sintéticas. Los investigadores están trabajando para hacer que la inteligencia artificial sea capaz de navegar por la web, pedir boletos, ajustar recetas y más.

Pero si le preocupa un aumento de máquinas al estilo Matrix, no se preocupe. ¡Hablaremos de eso más tarde!

Esta guía de IA consta de dos partes principales:

  • Primero, los conceptos más básicos que necesita comprender y los conceptos importantes más recientes.
  • Luego, describa los principales actores de la IA y por qué son importantes.

IA 101

Crédito de la imagen: Andrii Shyp/Getty Images

Una de las locuras de la IA es que, si bien sus conceptos básicos se remontan a más de 50 años, hasta hace poco, incluso las personas con conocimientos tecnológicos, estaban familiarizadas con sus conceptos. Así que no te preocupes si te sientes perdido, todo el mundo lo está.

Seamos claros en una cosa desde el principio: si bien se llama "inteligencia artificial", el término es un poco engañoso. Actualmente no existe una definición unificada de inteligencia, pero lo que hacen estos sistemas definitivamente se parece más a una calculadora que a un cerebro, excepto que la entrada y salida de esta calculadora es más flexible. La IA podría ser como un "coco artificial": es inteligencia de imitación.

Los siguientes son términos básicos que encontrará en cualquier discusión sobre IA.

Redes neuronales

Nuestros cerebros están compuestos en gran parte por células interconectadas llamadas neuronas que se entrelazan para formar redes complejas que realizan tareas y almacenan información. La gente ha estado tratando de recrear este increíble sistema en software desde la década de 1960, pero la potencia de procesamiento requerida no estuvo ampliamente disponible hasta hace 15 o 20 años, cuando las GPU permitieron que florecieran las redes neuronales definidas numéricamente.

Esencialmente, son solo muchos puntos y líneas: los puntos son los datos y las líneas son las relaciones estadísticas entre esos valores. Al igual que en el cerebro, esto puede crear un sistema multifuncional que recibe rápidamente una entrada, la pasa a través de la red y produce una salida. Este sistema se llama modelo.

Modelo

Un modelo es la colección real de código que toma la entrada y devuelve la salida. La similitud en la terminología con los modelos estadísticos, o sistemas de modelado que simulan procesos naturales complejos, no es accidental. En IA, un modelo puede referirse a un sistema completo como ChatGPT, o casi cualquier construcción de IA o aprendizaje automático, sin importar lo que haga o produzca. Los modelos vienen en varios tamaños, lo que significa cuánto espacio de almacenamiento ocupan y cuánta potencia informática requieren para funcionar. Y todo depende de cómo se entrenó el modelo.

tren

Para crear un modelo de IA, las redes neuronales que forman la base del sistema están expuestas a un montón de información llamada conjunto de datos o corpus. Al hacerlo, estas vastas redes crean una representación estadística de esos datos. Este proceso de capacitación es el más intensivo desde el punto de vista computacional, lo que significa que lleva semanas o meses en computadoras enormes y de alta potencia. La razón de esto no es solo que las redes son complejas, sino que los conjuntos de datos pueden ser muy grandes: miles de millones de palabras o imágenes deben analizarse y representarse en enormes modelos estadísticos. Por otro lado, una vez que se entrena un modelo, se puede usar mucho más pequeño y menos exigente, un proceso llamado inferencia.

Crédito de la imagen: Google

Inferencia

Cuando el modelo realmente funciona, lo llamamos inferencia, y el significado tradicional de la palabra es mucho más: establecer una conclusión razonando sobre la evidencia disponible. Por supuesto, esto no es exactamente una "inferencia", pero estadísticamente conecta puntos en los datos que ingiere, en realidad predice el siguiente punto. Por ejemplo, diga "completa la siguiente secuencia: rojo, naranja, amarillo..." encontrará que estas palabras corresponden al comienzo de la lista que ingiere, es decir, los colores del arcoíris, y extrapola el siguiente elemento hasta que tenga produjo el resto de la parte de la lista.

La inferencia suele ser mucho menos costosa desde el punto de vista computacional que el entrenamiento: piense en ello como navegar por un catálogo de tarjetas en lugar de ensamblarlo. Los modelos grandes aún deben ejecutarse en supercomputadoras y GPU, pero los modelos más pequeños pueden ejecutarse en teléfonos inteligentes o dispositivos más simples.

Inteligencia Artificial Generativa

Todo el mundo habla de IA generativa, un término amplio que simplemente se refiere a modelos de IA que generan resultados sin procesar como imágenes o texto. Algunas IA resumen, algunas reorganizan, algunas reconocen, etc., pero las IA que realmente generan algo (si "crea" o no es discutible) son especialmente populares en este momento. Recuerde, el hecho de que la IA haya generado algo no significa que sea correcto, ¡ni siquiera que refleje la realidad! Es solo que no existe hasta que lo pides, como una historia o una pintura.

Palabras candentes en este momento

Más allá de lo básico, estos son los términos de IA más relevantes para mediados de 2023.

Modelo de lenguaje grande (LLM)

Los modelos de lenguaje a gran escala son la forma de inteligencia artificial más influyente y ampliamente utilizada en la actualidad. Los modelos de lenguaje a gran escala se entrenan en casi todos los textos que componen la web y la mayor parte de la literatura en inglés. Ingerir todo esto da como resultado un modelo base enorme (siga leyendo). Los LLM pueden conversar y responder preguntas en lenguaje natural e imitar documentos escritos de varios estilos y tipos, como lo demuestran herramientas como ChatGPT, Claude y LLaMa.

Si bien estos modelos son sin duda impresionantes, debe tenerse en cuenta que siguen siendo motores de reconocimiento de patrones, y cuando responden a una pregunta, están tratando de completar el patrón que ha identificado, ya sea que ese patrón refleje o no la realidad. Los LLM a menudo alucinan en sus respuestas, como veremos en breve.

Si quieres saber más sobre LLM y ChatGPT, haz clic aquí.

Modelo de base

Entrenar un modelo enorme desde cero en un conjunto de datos enorme es costoso y complejo, por lo que no desea hacer más de lo necesario. Los modelos base son modelos grandes desde cero que requieren supercomputadoras para ejecutarse, pero a menudo, al reducir la cantidad de parámetros, se pueden reducir a contenedores más pequeños. Puede pensar en estos como el número total de puntos que el modelo tiene que manejar, que pueden llegar a ser de millones, miles de millones o incluso billones en estos días.

sintonia FINA

Un modelo base como GPT-4 es inteligente, pero también es generalista por diseño: absorbe todo, desde Dickens hasta Wittgenstein y las reglas de Dungeons and Dragons, pero si desea que se base en su currículum, escriba una carta de presentación, estos son inútiles Afortunadamente, es posible ajustar el modelo realizando un entrenamiento adicional en el modelo utilizando un conjunto de datos especializado. Por ejemplo, resulta que hay varios miles de solicitudes de empleo. Esto le da al modelo una mejor comprensión de cómo ayudar al usuario en ese dominio sin descartar el conocimiento general que obtuvo del resto de los datos de entrenamiento.

El aprendizaje reforzado a partir de la retroalimentación humana (RLHF) es un tipo especial de ajuste fino del que escuchará mucho: utiliza datos de humanos que interactúan con LLM para mejorar sus habilidades de comunicación.

Difusión

*A partir de un documento sobre técnicas avanzadas de posdifusión, puede ver cómo reproducir imágenes a partir de datos con mucho ruido. *

La generación de imágenes se puede hacer de varias maneras, pero la más exitosa es la difusión, la técnica en el corazón de Stable Diffusion, Midjourney y otras IA generativas populares. El modelo de difusión se entrena mostrándole imágenes que se van degradando gradualmente añadiendo ruido digital hasta que no queda nada de la imagen original. Al observar esto, el modelo de difusión también aprende a realizar el proceso a la inversa, agregando gradualmente detalles al ruido puro para formar una imagen definida arbitrariamente. Hemos comenzado a ir más allá de eso en gráficos, pero la tecnología es sólida y relativamente fácil de entender, por lo que desaparecerá bastante rápido.

Alucinación

Inicialmente, esto era un problema de algunas imágenes en el entrenamiento que se convertían en resultados irrelevantes, por ejemplo, edificios que parecían estar hechos de perros debido a la prevalencia excesiva de imágenes de perros en el conjunto de entrenamiento. Ahora se dice que la IA es alucinante porque no tiene datos suficientes o contradictorios en su conjunto de entrenamiento, simplemente inventa cosas.

Una IA a la que se le pide que cree arte original o incluso derivado es una alucinación. Por ejemplo, se le podría pedir a un LLM que escriba un poema de amor al estilo de Yogi Berra, y lo haría felizmente, aunque tal cosa no exista en su conjunto de datos. Pero eso puede ser un problema cuando se requiere una respuesta fáctica; el modelo presentará con confianza una respuesta mitad real, mitad ilusión. Actualmente no hay una manera fácil de saber cuál es cuál además de verificarlo usted mismo, ya que el modelo en sí mismo no sabe qué es "verdadero" o "falso", solo está tratando de completar un patrón lo mejor que puede.

AGI o Inteligencia Artificial Fuerte

La Inteligencia Artificial General (AGI), o Inteligencia Artificial Fuerte, no es realmente un concepto bien definido, pero la explicación más simple es que es una inteligencia lo suficientemente poderosa no solo para hacer lo que hace la gente, sino también para ser como nosotros. Aprende y mejora tú mismo. A algunos les preocupa que este ciclo de aprendizaje, integración de estas ideas y luego aprendizaje y crecimiento más rápido sea un ciclo que se perpetúe a sí mismo y conduzca a un sistema superinteligente que no se puede restringir ni controlar. Algunos incluso han propuesto retrasar o limitar los estudios para prevenir esta posibilidad.

Es un pensamiento terrible. Y películas como The Matrix y The Terminator han explorado lo que podría suceder si la inteligencia artificial se saliera de control y tratara de exterminar o esclavizar a la humanidad. Pero estas historias no se basan en la realidad. La apariencia de inteligencia que vemos en cosas como ChatGPT es impresionante, pero tiene poco en común con el razonamiento abstracto y la actividad dinámica de múltiples dominios que asociamos con la inteligencia "real".

Si bien es casi imposible predecir desarrollos futuros, puede ser útil imaginar a AGI como un viaje espacial interestelar: todos entendemos el concepto y parecemos estar trabajando para lograrlo, pero al mismo tiempo, todavía hay un largo camino por recorrer para lograrlo. él. ¡Al igual que AGI, nadie lo hará por accidente debido a los enormes recursos y el progreso científico básico requerido!

Es divertido pensar en AGI, pero no hay necesidad de buscar problemas porque, como han señalado los comentaristas, a pesar de sus limitaciones, AI ya representa una amenaza real y significativa en la actualidad. Nadie quiere Skynet, pero no se necesita una superinteligencia con armas nucleares para hacer un daño real: la gente está perdiendo sus trabajos y siendo estafada hoy. Si no podemos resolver estos problemas, ¿qué posibilidades tenemos contra el T-1000?

Mejores jugadores en inteligencia artificial

IA abierta

Crédito de la imagen: Leon Neal/Getty Images

Si hay un nombre familiar en IA, es OpenAI. OpenAI, como sugiere su nombre, es una organización que tiene la intención de realizar investigaciones y hacer que los resultados estén más o menos disponibles públicamente. Desde entonces, se ha reestructurado en una empresa con fines de lucro más tradicional que brinda acceso a modelos de lenguaje avanzados como ChatGPT a través de API y aplicaciones. Está dirigido por Sam Altman, un multimillonario tecnológico que, sin embargo, ha hecho sonar la alarma sobre los posibles riesgos de la inteligencia artificial. OpenAI es un líder reconocido en el campo de los LLM, pero también realiza investigaciones en otras áreas.

###microsoft

Como era de esperar, Microsoft ha realizado una parte justa de la investigación de IA, pero al igual que otras empresas, más o menos no ha logrado traducir sus experimentos en productos importantes. Su movimiento más inteligente fue una inversión temprana en OpenAI, que condujo a una asociación exclusiva a largo plazo con la empresa que ahora impulsa a sus agentes conversacionales de Bing. Aunque sus propias contribuciones son menores y de aplicación menos directa, la empresa tiene una fuerza investigadora considerable.

Google

Conocido por sus lanzamientos a la luna, Google de alguna manera perdió la oportunidad de la IA, a pesar de que sus investigadores inventaron la tecnología que conduce directamente a la explosión de la IA actual: los transformadores. Ahora está tratando de desarrollar sus propios LLM y otros agentes, pero claramente se está poniendo al día después de pasar la mayor parte de la última década impulsando el concepto obsoleto de los "asistentes virtuales" de IA. El CEO Sundar Pichai ha dicho repetidamente que la compañía está firmemente detrás de la IA en búsqueda y productividad.

antrópico

Después de la salida de OpenAI de la apertura, Dario y Daniela Amodei lo abandonaron para iniciar Anthropic, con la intención de desempeñar el papel de una organización de investigación de IA abierta y éticamente considerada. Con la cantidad de efectivo que tienen disponible, son serios competidores de OpenAI, incluso si sus modelos (como Claude) aún no son tan populares o conocidos.

Crédito de la imagen: Bryce Durbin/TechCrunch

Estabilidad

Controvertido pero inevitable, Stability representa el género de código abierto de implementaciones de IA "lo que quieras" que recopilan todo en Internet y hacen que los modelos generativos de IA que entrena estén disponibles de forma gratuita, siempre que posea el hardware para ejecutarlo. Esto encaja muy bien con la filosofía de "la información quiere ser libre", pero también acelera proyectos éticamente dudosos como generar imágenes pornográficas y usar propiedad intelectual sin consentimiento (a veces simultáneamente).

Elon Musk

Musk no fue la excepción, expresó abiertamente sus preocupaciones sobre la IA desbocada, y algunas uvas amargas después de que sus primeras contribuciones a OpenAI tomaron direcciones que no le gustaban. Si bien Musk no es un experto en el tema, como de costumbre, sus travesuras y comentarios generan mucho revuelo (es signatario de la carta de "pausa de IA" antes mencionada), y está tratando de construir su propia presencia de investigación.

Ver originales
El contenido es solo de referencia, no una solicitud u oferta. No se proporciona asesoramiento fiscal, legal ni de inversión. Consulte el Descargo de responsabilidad para obtener más información sobre los riesgos.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
  • Anclado
Comercie con criptomonedas en cualquier lugar y en cualquier momento
qrCode
Escanee para descargar la aplicación Gate.io
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)