Un registro de visita de un académico occidental al laboratorio de IA en China: humildad, apertura, sin hablar de filosofía, solo quiere entrenar mejores modelos

robot
Generación de resúmenes en curso

Autor: Florian Brand

Traductor: Shen Chao TechFlow

Resumen de Shen Chao: El artículo tiene como contexto que SAIL (una alianza mediática que une a los principales escritores de IA en Substack, incluyendo a Nathan Lambert, Sebastian Raschka, ChinaTalk, entre otros) organizó una visita a laboratorios de IA en China. El autor Florian acompañó al grupo y visitó más de una docena de empresas como Moon Shadow, Xiaomi, MiniMax, Zhipu, Meituan, Alibaba, Ant, Modao, Lingyi Wanwu, Yushu, entre otras, y escribió esta percepción.

Florian Brand es un estudiante de doctorado en la Universidad de Trier en Alemania y en el Centro Alemán de Investigación en Inteligencia Artificial (DFKI), con enfoque en aplicaciones y evaluación de grandes modelos de lenguaje.

No es muy conocido, pero tiene cierta visibilidad en círculos de IA de código abierto, y también resulta interesante ver la ecología de IA en China desde la perspectiva de un profesional extranjero.

Texto principal:

Hace aproximadamente 10 días, tuve la suerte de visitar junto con los colegas de SAIL varios laboratorios de IA en China. Como alguien que visitó China y Estados Unidos por primera vez en seis meses, encontré fascinantes las diferencias entre ambos lugares, pero aún más interesante fue lo que tenían en común.

Lo que más me impresionó fue que todos los investigadores de IA que conocí eran muy humildes.

Elogiaban mucho a otros laboratorios y colegas. DeepSeek fue mencionado con frecuencia, probablemente porque unos días antes de nuestra visita habían lanzado un modelo, y la gente hablaba con verdadera admiración de los artículos de DeepSeek.

Muchos investigadores son amigos cercanos, provienen de la misma universidad o comparten la misma ciudad natal. Discuten abiertamente sobre su trabajo, y sus resultados de investigación se publican en artículos unos meses después.

Esta es una de las mayores diferencias con el mundo occidental de IA. En Estados Unidos, el ambiente suele ser más como un juego de suma cero. Los laboratorios son muy cautelosos con su posicionamiento. Los investigadores piensan en la competencia, algunos tienen una alta autoevaluación. Los líderes se insultan y atacan en memorandos filtrados. Esta diferencia puede explicarse con hechos: los laboratorios líderes en EE. UU. son de código cerrado, mientras que muchos laboratorios en China son de código abierto. Los laboratorios chinos son cautelosos con ByteDance y su “Doubao”, que es el chatbot más utilizado y de código cerrado, con una ventaja significativa.

Al mismo tiempo, el ambiente general es sorprendentemente similar a San Francisco. Los investigadores están extremadamente en línea, leen mucho en Twitter y Xiaohongshu, que se vuelve cada vez más popular. Todos usan Claude Code o su propia CLI para construir el próximo modelo. Algunos monitorean el entrenamiento durante nuestras reuniones, observando cómo sube la curva de recompensas. Piensan en escalar aún más, se quejan de la falta de potencia computacional. Están frustrados con el estado actual de los benchmarks.

Su principal enfoque es entrenar mejores modelos. Esto difiere de San Francisco, donde los investigadores piensan en los impactos políticos o filosóficos de la IA. No consideran el desempleo masivo, la clase baja permanente, o si sus modelos tienen conciencia. Solo quieren entrenar modelos excelentes.

Cuando escuchan que usaste sus modelos, sus ojos brillan. Desean arreglar todos los defectos de los modelos actuales en la próxima generación. Trabajan toda la noche para lanzar modelos y aún aparecen en la oficina después.

La mayoría de los investigadores que conocí son muy jóvenes, muchos tienen poco más de 20 o alrededor de 25 años. Algunos son estudiantes de pregrado, pero más comúnmente están en doctorado y trabajan en la industria. Coinciden en que, en comparación con la academia, la industria ahora es más interesante, y comparto mucho esa opinión, porque he hecho exactamente lo mismo. Los laboratorios valoran mucho la adquisición de talento, reclutan activamente pasantes y estudiantes de posgrado; algo que no hacen los laboratorios occidentales.

El optimismo de los investigadores también se extiende a la población general, que parece ser más optimista respecto a la tecnología y el futuro de la IA y los robots. En el viaje, alguien contó historias de sus padres y abuelos usando Doubao y DeepSeek para hacer todo tipo de cosas, incluso discutir teoremas matemáticos. Esto es claramente diferente en Occidente, donde la gente común desconfía de la IA.

En general, este viaje me permitió entender un poco mejor este ecosistema. Es imposible comprender en unos días una civilización tan vasta. Como firme defensor de los ecosistemas abiertos de IA y de la investigación abierta, soy muy optimista sobre el futuro de ambos, y espero que en el futuro haya mucha colaboración internacional.

Quiero agradecer a todas las increíbles personas que conocí en Moon Shadow, Xiaomi, MiniMax, Zhipu, Meituan, Alibaba, Ant Lingxi, Modao, Lingyi Wanwu, Yushu y otros lugares. Gracias por su tiempo y cálida bienvenida. También agradezco a SAIL por organizar este viaje, y a todos los escritores y periodistas que participaron. Estoy muy agradecido de haber conocido a tantas personas sobresalientes y ambiciosas en tan poco tiempo.

Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado