Donald Trump y Nvidia, la Inteligencia se les escapa
Aunque EEUU está al frente de los avances tecnológicos sobre el desarrollo de la Inteligencia Artificial (y seguirá estándolo por muchos años), está perdiendo la carrera allí donde más importa, en las aplicaciones al mundo real.
- 🧠 Las IA chinas destacan en matemáticas, razonamiento y programación/ingeniería, y ya superan a muchos competidores occidentales en estas áreas.
- ⚖️ Las diferencias en marcos éticos entre IA chinas y occidentales pueden influir en las respuestas; es importante evaluar críticamente lo que se recibe.
- 👀 No confiar ciegamente en IA: si los periodistas deben verificar fuentes, quienes usan IA deberían chequear todo varias veces para corregir errores.
- 📈 Se estima que las IA chinas ya alcanzan el 90% del rendimiento de Occidente y podrían cerrar el año cerca del 99%, con comentarios de Jensen Huang sobre estar “nanosegundos” detrás.
- 💸 Los costos operativos de DeepSeek y Qwen serían solo 1-5% de los de sus pares norteamericanos, haciéndolos muy competitivos para trabajos masivos.
- 🧮 Los precios por millón de tokens varían por proveedor: GPT-5.2, Claude Opus, Grok y Gemini tienen rangos para input y output; DeepSeek V3.2 y Qwen 2.5 también muestran cifras específicas.
- 🧭 Enfoque de desarrollo: EE. UU. apostó por grandes LLMs cerrados, mientras China enfatizó usos personalizados y modelos abiertos; actualmente el 36% de las apps de LLM se crean en China.
- 🤝 Irónicamente, Trump y Jensen Huang son vistos como impulsores del avance chino en IA.
- ⚖️ La historia de exportaciones de chips muestra guerras comerciales y controles: prohibiciones, acuerdos de ingreso y respuestas chinas como la restricción a importaciones de ciertos procesadores.
- 🌍 Huawei planea ascender en la competencia con Ascend (950/950DT, 960, 970) para igualar o acercarse a Nvidia, pero existen dudas sobre si lograrán ese rendimiento.
- 🇦🇷 En Argentina, el ranking de desarrollo de IA es 47º (2024), con aspiraciones a ser el cuarto polo global de IA, pero los avances han sido limitados.
- 🚀 En resumen: el modelo chino de desarrollo de IA es más eficiente y rentable y podría tener un mayor impacto en la vida diaria, aunque persisten dudas y tensiones geopolíticas.
Dejando de lado los sistemas específicos (caso Cava, Suno, Descript o Grammarly, entre otros) los que somos usuarios de DeepSeek o Qwen, entre otros sistemas de Inteligencia Artificial (IA), sabemos que los chinos son “mejores” que los occidentales para lo que tenga que ver con matemáticas y razonamiento puro, estando a la par y en algunos casos superando a los peso pesado del mundo virtual, Claude, GTP, Gemini y Grok en lo que tiene que ver con cuestiones de programación e ingeniería. Es decir, son ¨mejores” en ciencias duras (podemos agregar también en su comprensión de distintos idiomas).
Donde todavía están algo por detrás, a pesar de que vienen cerrando la brecha de una manera impresionante, es en razonamientos profundos, tareas complejas (multimodales), la resolución de cuestiones académicas y la magnitud de sus bases de datos (las “nuestras” están más al tanto de lo que pasa).
Otro punto que las diferencia es que las limitaciones morales y éticas impuestas a sus algoritmos le pueden dar cierto gustito “woke” y similares a las que fueron creadas de este lado del planeta (por supuesto que algunas más que otras), es más que evidente que nunca podremos calificar de “anticomunistas” a las del otro.
Pero bueno, esto tiene que ver con la política, el marketing y el control social, lugares donde se supone no deberían tocar estos mecanismos, que a su vez, se supone, deberían ayudarnos con respuestas neutras, así que siempre conviene tenerlo en mente cuando recurrimos a ellos (esto se suma a la probabilidad de respuestas erróneas e incompletas.
Recuerde, nunca confíe del todo en una IA. Si los periodistas deben contar con al menos dos fuentes confiables, quienes usan estos mecanismos es mejor que chequeen todo tal menos tres veces (todos tenemos anécdotas graciosas sobre los disparates que nos contestaron, pero si usted y los miles que fueron por el mismo camino no lo corrigen, el sistema va a seguir calculando que esa es la respuesta correcta).
Ahora sí, volviendo a los chinos. A grandes rasgos podemos decir que sus modelos ya superaron el 90% de performance de los norteamericanos y muy probablemente terminen el año al 99%. A fines de septiembre del año pasado, Jensen Huang, el mandamás de Nvidia afirmó que China estaba apenas unos “nanosegundos detrás” (no años, ni meses ni días) de Occidente en el desarrollo de la IA.
A principios de noviembre, el 6, volvió a la carga en una entrevista con Financial Times al afirmar que “China va a ganar la guerra de la IA”. Si bien esto fue una manera de presionar a los EEUU buscando regulaciones más laxas, menores costos de energía, y sobre todo que Donald Trump lo autorizara a exportar sus procesadores a China, la noticia derrumbó las acciones de su empresa, por lo que rápidamente publicó un tuit tratando de calmar las aguas.
Nvidia ha sabido jugar susu cartas para presionar al gobierno norteamericano para seguir ganando dinero - Nota de noviembre del año pasado.
Pero no es esto lo que lo hace “temible” al desarrollo chino de la IA (dejemos la geopolítica de lado).
Se estima que los costos operativos de DeepSeek y Qwen son apenas el 1-5%, de los de sus pares norteamericanos. Esto los vuelve imbatibles al momento de apelar a ellos para trabajos masivos o de presupuestos limitados. Recuerde que más allá del uso gratuito que hacemos todos, los sistemas de IA se “alquilan” para desarrollos particulares, que es de donde sacan la plata.
La unidad básica de medida para el procesamiento de textos en la industria de IA es el “token”, que son cuatro caracteres (incluye acentos y signos). Por ejemplo, si escribo “Hola Chat”, son 3 tokens, uno por la palabra Hola, uno por Chat y uno por los símbolos “”. Si el sistema me contesta “Muy bien, Dionisio” son 4 tokens. Si avanzo y escribo “Quería preguntarte como están hoy el climat.” (note los dos errores ortográficos y el punto final), son 15 tokens.
El costo por millón de tokens para OpenAI GTP 5.2 (la versión más nueva) va de u$s1.5 a U$D 3.5 cuando preguntamos (Input) y de u$s 14 a U$D 28 cuando nos responde (Output). Para Claude Opus es de u$s 3-26 y u$s 1-75; para Grox 4 de u$s 3-5 y u$s15-25 y para Gemini 2.5 Flash de u$s 0.08-2.5 y u$s 0.30-15 (si bien el Gemini no es el “mejor”, es el mas barato y esta “aprendiendo” muy rápido, así que muchos lo consideran el caso a seguir en Occidente).
¿Qué pasa con los chinos? Para dar solo dos ejemplos: el Input de DeepSeek V3.2 va deu$s 0.07 a u$s 0.28 y su output de u$s 0.27 a U$D 1.10. El Qwen 2.5 de Alibaba está en u$s 0.10-0.22 y u$s 0.30-1.00.
¿Cómo llegaron a esta situación? Los norteamericanos han venido apostando a la creación de grandes modelos de lenguaje abstracto (LLMs), avanzando de lo general a lo particular y apostando a que los modelos cerrados y la competencia eran el camino para el mayor desarrollo. Los chinos en cambio arrancaron con usos personalizados - robots, vehículos, ciudades, etc.- y modelos abiertos que aceleraron la adopción de investigadores y consumidores de sus sistemas. Hoy el 36% de las Apps de LLM se están creando en China.
Lo irónico es que la culpa de todo esto la tuvieron los propios yanquis.
Donald Trump y Jensen Huang, sin quererlo, los principales impulsores del avance china en IA.
El 7 de octubre de 2022 Joe Biden prohibió la exportación a China de los procesadores A100 y H100 de Nvidia, los más avanzados de la época, buscando frenar su desarrollo de IA, especialmente en el ámbito militar. Hasta ese momento los chinos dependían en gran medida de la tecnología occidental, si bien, más por paranoia que por una cuestión fáctica, habían comenzado a desarrollar algunos procesadores propios, ante el temor que los de Nvidia tuvieran “alguna sorpresita”.
La prohibición fue el puntapié que catalizó las fuerzas de Huawei -el mayor jugador chino del sector-, Biren, Cambricon y sobre todo el estado Chino para desarrollar lo más rápidamente su propia industria de microchips (serie Ascend) y lograr la autosuficiencia, a la par que abandonaban el modelo occidental por el propio (más centrado en la optimización de recursos y software).
Hoy una unidad de procesamiento alto de Nvidia (H100/200) cuesta entre u$s25,000-40,000, la de Huawei (Ascend 910C/D) va de u$s 12,000 a u$s 16,000. Es cierto que la china es más lenta (60-70% de la H200; la capacidad de procesar información) y su ancho de banda menor (3.2 TB/s frente a 4.8 TB/s; la capacidad de transmitir información) pero además de ser más barata, consume la mitad de la energía (350W frente a 700W). Así que menos termina siendo más, cuando se utiliza mejor.
Piense un minuto en los autos. Mientras los yanquis aman las maquinas monstruosas, con motores inmensos capaces de consumir cantidades bestiales de combustible, aunque no sean tan potentes los orientales prefieren vehículos más chicos, cómodos y eficientes. Lo mismo pasó aquí.
Según el Rankig Tortoise (el mas presitigioso del sector, junto al Stanford Global AI Vibrancy, que no nos menciona), Argentina ocupa el lugar 47, debajo de España, Brasil, Chile y Mexico por el desarrollo de la Inteligencia Artificial (data de 2024). Un poco lejos del cuarto lugar con el que sueñan en el gobierno. Tras la carta de intención no vinculante de octubre pasado, que se intentó vender como un “fait accompli”, lo que siguió es… nada de nada.
El chat de OpenAI, el sistema más popular, recibe unos 200-300 millones de visitas diarias, fue lanzado en noviembre de 2022, el costo de las instalaciones originales se estima entre u$s320-500 millones y su “entrenamiento” inicial fue de u$s 5-6 millones.
Gemini de Google apareció bajo en nombre de Brad en marzo 2023 y recibe entre 55-62 millones de visitas, la compañía invirtió casi U$D 1.000 millones y el entrenamiento orilló u$s192 millones. Hoy, con la estrategia de Google de integrarlo a su buscador y los equipos que funcionan bajo Android, es el que más crece.
Grok de X, diciembre de 2024, 8-10 millones de visitantes (ocupa el segundo lugar en crecimiento), Elon Musk “se puso” con u$s 3.000-4.000 millones y u$s107 millones para el entrenamiento.
Ahora el auto chiquito. Cuando en enero del año pasado DeepSeek pateó el tablero (si quiere un nombre para seguir y recordar: Manus) el costo de su infraestructura fue de u$s50-120 millones y los costos de aprendizaje u$s5,6 millones. Ya tienen 22-40 millones de usuarios diarios y es la tercer máquina que más rápidamente crece -el chat se está quedando atrás y para fin de año Gemini podría superarlo).
En la actualidad, el costo mas grande para estas empresas de IA es el del mantenimiento y la depreciación de sus equipos que va del 40% al 60% de los totales. Siguen el gasto en personal (40-60%) y finalmente la energía (20-30%) cuya incidencia está creciendo -y cae “personal”, a medida que las maquinas pasan de una estructura de “aprendizaje” o una de “inferencias”. En los tres casos, los orientales están mejor parados que los occidentales (estoy dejando de lado la cuestión de los subsidios e incentivos del gobierno).
“Dentro de poco tiempo se va a licitar un sistema de vuelos espaciales mediante el cual, desde una plataforma, que quizá se instale en Córdoba, esas naves van a salir de la atmósfera, se van a remontar a la estratósfera, y desde ahí elegirán el lugar donde quieran ir, de tal forma que en una hora y media podremos estar en Japón, Corea o en cualquier parte del mundo” Carlos Menem, Salta, 7 de marzo de 1996. Nótese la "O" caída y la cara de los funcionarios. Los argentinos estamos acostumbrados a los sueños/declaraciones faraónicos/irresponsables de nuestros gobernantes
Lejos, con los viajes estratosféricos a Oriente de Carlos Menem, el Tren Bala de Néstor Kirchner a Córdoba o el puente Zarate-Nueva Palmira de Mauricio Macri, queda entonces el sueño de Javier Milei de convertir a la Argentina en el cuarto polo mundial de Inteligencia Artificial (los polos son siempre dos).
Si bien en Huawei afirman que en los próximos meses lanzan el Ascend 950 y para fin de año el 950DT que los pondría por primera vez en paridad con los Nvidia de generación Hopper (los H100/200), a fin del 2027 el Ascend 960 a nivel de la generación Blackwell (B100/200) y al terminar el 2028 el Ascend 970 que alcanzaría la generación Rubin de Nvidia (aun no salieron a la luz), la realidad es que hay muchas dudas.
Pero acá las dudas no importan. No importa que para cuestiones “de punta” los norteamericanos sigan liderando, porque el modelo chino de desarrollo de la IA está probando ser más eficiente, barato y redituable y por lo tanto el que posiblemente más impactará en nuestra vida diaria.
No está claro si hubo alguna filtración previa sobre el acuerdo de Nvidia y el Gobierno yanqui para exportar H200 a China. Lo que es claro es que desde entonces los inversores no están de parabienes con la firma.
Pero ¿dónde queda Nvidia en todo esto? Que Huang y su gente son brillantes, no hay dudas. Cuando en 2022 Estados Unidos prohibió la exportación de los Chips más avanzados a China (los H200), Nvidia siguió haciendo negocios con los H20, cuya potencia es de apenas un sexto de la de los hermanos mayores y fueron la base del desarrollo “blando” (software) de los mecanismo de IA en China Nvidia (la participación de AMD es menor, por eso no la menciono).
En abril del año pasado, en los primeros días de su guerra comercial con el mundo, Trump prohibió todas las exportaciones de chips a China. Huang actuó rápidamente y logró en julio un inusual (o sin precedentes) acuerdo, por el cual la empresa se comprometió a compartir con el gobierno de los EEUU. el 15% de todos los ingresos sobre los H20 que se exportaran a China, con lo cual pudo retornar a ese mercado.
Lian Wenfeng, fundador, CEO y controlante con el 84% de las de DeepSeek acciones (99% a travez de suus otras corporaciones). Demostró que con poca plata y sin necesidad de la tecnología yanqui se podia posicionar en los primros puestos del mundo de la Inteligencia Artifical.
A mediados de agosto Pekín respondió sugiriendo a las empresas chinas que dejaran de usar estos procesadores, en septiembre llegó la orden concreta a los peso pesados de la tecnología china -Alibaba, Tencent y ByteDance- para que dejaran de usarlos y en octubre la aduana comenzó a decomisar los envíos de H20. En noviembre, Nvidia reportaba que el “market share” de sus ventas en China había caído a cero, que sus inventarios habían crecido a 700,000 unidades y que estaba a punto de perder ordenes por u$s30.000 millones.
En los primeros días de diciembre, Huang y Trump llegaron a un nuevo acuerdo, por el cual el gobierno yanqui se quedaba con el 25% de las ventas sobre los H200 a China.
Reconociendo la realidad -que les salió “el tiro por la culata” y China se está independizando y avanzando en IA más de lo que sus expertos habían estimado-, la necesidad de volver a hacer que China dependa de la tecnología norteamericana, los pedidos de J. Huang, y/o incluso la idea de un endulzante para la visita de Trump a Pekín en abril, hace apenas unas horas el Departamento de Comercio de los Estados Unidos anuncio que liberaba, bajo un marco caso por caso, la exportación de los H200 a China.
La respuesta de Pekín fue casi inmediata y no la que se esperaba. Las autoridades aduaneras Chinas anunciaron que los N200 no están autorizados a ingresar al país. En castellano y como hubiera dicho el inmortal Diego: "que se las metan bien..." (en realidad van a autorizar algunas importaciones para investigación y desarrollo, solo si es algo “absolutamente necesario”).