Modelos de IA abiertos frente a cerrados

Kai-Fu Lee, Fundador y CEO | 01.AI | Presidente | Sinovation Ventures

El Dr. Kai-Fu Lee es el fundador y CEO de 01.AI, una empresa de inteligencia artificial con sede en Pekín centrada en el desarrollo de grandes modelos de lenguaje y en la transformación de la IA en el ámbito empresarial, la cual fue creada y respaldada por su firma de capital riesgo tecnológico, Sinovation Ventures. Anteriormente, dirigió las operaciones de Google en China y ocupó cargos directivos en Microsoft. El Dr. Lee es el autor del bestseller del New York Times y del Wall Street Journal titulado AI Superpowers, obra que examina el papel de Estados Unidos y China en el futuro de la inteligencia artificial, así como su impacto en la sociedad. El Dr. Lee se formó como científico informático en Estados Unidos y ha desarrollado su carrera profesional en la intersección del desarrollo tecnológico estadounidense y chino.


Usted ha navegado la intersección entre la tecnología, la cultura y la geopolítica en Estados Unidos y China durante décadas. ¿Cómo define hoy la soberanía en IA y por qué es importante?

La soberanía implica varias cosas. En primer lugar, significa tener control sobre las propias tecnologías. En segundo lugar, significa garantizar que los datos —un activo crítico para toda empresa— no sufran filtraciones. Esta inquietud está muy extendida en la mayoría de los países, aunque quizás en menor medida en Estados Unidos, dada su mayor aceptación de la nube privada. No obstante, en todo el mundo, las empresas están profundamente preocupadas ante la posibilidad de que sus datos confidenciales se conviertan en un insumo que enriquezca un modelo general propiedad de otro país.

También existe la cuestión de la idoneidad. Un modelo entrenado en un país tiende a incorporar los valores de ese país, y es posible que dichos valores no sean aplicables en otros lugares. Tener control sobre el modelo permite a la empresa ajustarlo con precisión para adaptarlo a las necesidades de la organización. Alojar el modelo en la nube de un tercero limita significativamente esa capacidad.

En todo el mundo, las empresas están profundamente preocupadas de que los datos confidenciales se conviertan en un insumo que enriquezca un modelo general propiedad de otro país.


Cuando Pekín, Bruselas y Washington hablan, cada uno, de la soberanía en IA, ¿están hablando de lo mismo?

No del todo. Existen varios niveles. El primero es la idoneidad: todo país desea un modelo que refleje su idioma, su cultura y sus normas jurídicas. En algunos países islámicos, cuestiones como el matrimonio entre personas del mismo sexo, el consumo de alcohol o las directrices religiosas se abordan de manera muy distinta a como se haría en los Estados Unidos. Garantizar el cumplimiento de las leyes, la religión y la cultura locales constituye una preocupación legítima y universal.

El segundo nivel es la ambición competitiva. Algunos países sienten la necesidad de desarrollar su propio modelo para tener la oportunidad de ocupar una posición relevante en esta carrera tecnológica. China, evidentemente, posee esa ambición; y Japón, Singapur, Arabia Saudita y la India han manifestado la suya. Esto es admirable, aunque en ocasiones resulta excesivamente ambicioso. Entrenar desde cero un modelo de propósito general de vanguardia no es una opción viable para todos los países. Estados Unidos cuenta con recursos ingentes; China dispone de recursos sustanciales; la mayoría de los demás países, no.

La alternativa práctica —y, a mi juicio, la más acertada para casi todos los países ajenos a Estados Unidos y China— consiste en tomar un modelo de código abierto de referencia y continuar su entrenamiento para adaptarlo al idioma, los valores y la normativa específicos de cada país. Esta «continuación del entrenamiento» difiere del simple «ajuste fino» (fine-tuning); implica tratar el modelo de código abierto como un producto aún inacabado. Cabe compararlo con la compra de una pizza congelada a la que se le añaden ingredientes propios para terminar de hornearla al gusto personal. El resultado es un producto adaptado al contexto local, ya sea una pizza al estilo indio o al estilo japonés. Y, lo que es crucial, el coste representa tan solo un pequeño porcentaje —apenas unos pocos puntos porcentuales— de lo que supondría entrenar el modelo desde cero: unos pocos millones de dólares, en lugar de varios cientos de millones.

La alternativa práctica —y, a mi juicio, la correcta para casi todos los países fuera de Estados Unidos y China— consiste en adoptar un modelo de código abierto líder y continuar entrenándolo para el idioma, los valores y las regulaciones específicos del país.


¿Cuál ha sido el efecto real de los controles de exportación de Estados Unidos en el desarrollo de la IA en China?

Es un arma de doble filo, y el veredicto aún está por verse. Las restricciones a la exportación de GPU son solo una cara de la ecuación. La otra cara es que las empresas chinas son sumamente pragmáticas. Si se las consulta, la gran mayoría no intenta superar a Anthropic ni a OpenAI. Las empresas chinas saben que no pueden gastar cincuenta mil millones de dólares en el entrenamiento de modelos masivos. Por ello, con las GPU que tienen a su disposición —algunas de producción nacional y no tan escalables—, se preguntan: ¿qué podemos hacer con excelencia dentro de estas limitaciones?

La respuesta ha sido una rigurosa eficiencia ingenieril. DeepSeek es el ejemplo más destacado. Cuando las personas se ven limitadas pero están motivadas, innovan sorteando dichas limitaciones. Optimizan las arquitecturas, se desprenden de las dependencias de CUDA[1] y buscan alcanzar un rendimiento que sea muy bueno, en lugar de aspirar a ser, de manera definitiva, los mejores. Las empresas chinas invierten menos del diez por ciento de lo que gastan las principales compañías estadounidenses en el entrenamiento de modelos; sin embargo, logran producir modelos con una capacidad de entre el 90 y el 95 por ciento de la de sus homólogos estadounidenses, situándose tan solo entre seis y nueve meses por detrás de ellos.

Existe, además, una razón estructural por la que las empresas chinas han adoptado el código abierto. Al no poder imponerse basándose en un modelo de código cerrado, optan por compartir. Su funcionamiento se asemeja al de un grupo de estudio: no se trata de una colaboración explícita en la que las personas se reúnen físicamente, sino de una dinámica en la que cada uno construye sobre los lanzamientos públicos de los demás, elevando así la competencia colectiva. Las empresas estadounidenses, por el contrario, actúan más como investigadores individuales: cada una está convencida de que ganará el Premio Nobel, por lo que mantienen su know-how en estricto secreto. Las empresas chinas, en cambio, se comportan como un grupo consciente de que ninguno de sus miembros ganará el Premio Nobel de forma individual, pero que, al aunar sus esfuerzos, pueden acercarse colectivamente a ese objetivo.

La cuestión estratégica de fondo reside en determinar si la primera empresa que logre alcanzar la IGA (Inteligencia General Artificial) acabará dominándolo todo, o si, por el contrario, cuatro empresas estadounidenses y dos chinas llegarán a ese punto con apenas unos meses de diferencia entre sí, dedicándose cada una a atender un ecosistema distinto. Si observamos la trayectoria histórica, los modelos de código abierto han ido a la zaga de los modelos de código cerrado con un desfase de entre seis y nueve meses. Del mismo modo, los modelos chinos han seguido a los estadounidenses con un margen similar. Si este patrón se mantiene, es posible que la carrera no concluya con un único vencedor que aplaste al resto de los competidores. No obstante, esto es algo que aún está por ver.

Las empresas chinas invierten menos del diez por ciento de lo que gastan las principales compañías estadounidenses en capacitación; sin embargo, producen modelos con una capacidad de entre el 90 y el 95 por ciento, situándose entre seis y nueve meses por detrás de sus homólogas estadounidenses.


¿Qué determinará, en última instancia, el modelo dominante? ¿Llegar tarde a la IA —o a la soberanía en IA— sitúa necesariamente a los países o a las empresas en una situación de desventaja?

La idea de que la «IA general (AGI) aplastará a todos» es improbable, aunque no imposible. Si las empresas estadounidenses terminan convirtiéndose en las dominantes, mi apuesta es que será debido a los ecosistemas empresariales que construyan, y no porque hayan cruzado un umbral tecnológico que haya vuelto irrelevante al resto.

La primera analogía es Windows. Windows no triunfó porque ninguna otra empresa pudiera haber creado un sistema operativo similar; triunfó porque se desarrollaron aplicaciones sobre él, las empresas confiaron en él y los ingresos generados por ello financiaron su desarrollo posterior, consolidando así su posición. Ese ciclo virtuoso es real y poderoso. Ya se observa con iniciativas como el «Project Glasswing» de Anthropic, que ofrece acceso exclusivo a las principales empresas tecnológicas estadounidenses para el lanzamiento de su potente modelo Mythos. Claude Code también está transformando la forma en que se escribe el software. Las empresas pagarán sumas considerables por ello. Esos ingresos financian una mayor capacidad de cómputo, lo cual, a su vez, financia el desarrollo de modelos aún mejores.

Llegar tarde al ámbito de la IA —o al de la soberanía en IA— no sitúa automáticamente a los países ni a las empresas en una situación de desventaja. De hecho, los modelos de código abierto generan una ventaja significativa para quienes se incorporan tardíamente al mercado.

La segunda analogía es la del iPhone frente a Android. La tensión surge cuando la IA alcanza el mercado de consumo masivo a escala global. Los modelos estadounidenses tienen precios fijados para mercados de alto poder adquisitivo. Cuando se ejecutan herramientas avanzadas sobre una infraestructura cerrada, los costos resultan considerables. Los modelos chinos, por el contrario, pueden costar entre una sexta y una décima parte de esa cifra. Por consiguiente, cuando esta tecnología llegue a las poblaciones de China, la India y otros mercados emergentes, es posible que el modelo estadounidense de código cerrado quede simplemente fuera del alcance económico de gran parte de esa demanda.

El código abierto puede ganar en alcance y adopción, mientras que el código cerrado gana en margen y control del ecosistema.

El resultado podría parecerse mucho al escenario de iPhone frente a Android. Apple obtiene beneficios extraordinarios —quizás más que todos los fabricantes de Android juntos—, pero Android posee una huella global mucho mayor en términos de base de usuarios. El código abierto podría imponerse en cuanto a alcance y adopción, mientras que el código cerrado lo haría en márgenes y control del ecosistema. En ese contexto, llegar tarde no significa ser irrelevante; significa elegir el camino adecuado en función de los recursos, los objetivos y los mercados propios.


¿Deberían preocuparse las empresas y los países de que un pequeño número de plataformas lo dominen todo?

No creo que terminemos con una sola opción, y esto se debe en gran medida a que el código abierto es hoy imparable. La historia sugiere que veremos una o dos plataformas dominantes de código cerrado coexistiendo con un ecosistema de código abierto de gran envergadura. Linux frente a Windows. iPhone frente a Android. Predigo que la IA seguirá un patrón similar.

Lo importante es reconocer que esta dinámica podría manifestarse de manera diferente en las distintas capas. La capa de modelos plantea un tipo de competencia; la capa de agentes, otro. Los ecosistemas abiertos, como OpenClaw, se están convirtiendo en la plataforma de elección en el nivel de los agentes, y transforman fundamentalmente la economía del acceso y la adopción.

OpenClaw, combinado con modelos de código abierto, permite a empresas y desarrolladores crear potentes flujos de trabajo impulsados ​​por IA sin quedar cautivos de una única pila tecnológica propietaria. Esto resulta especialmente importante para aquellos países, empresas y desarrolladores que no pueden permitirse el coste de las plataformas cerradas a gran escala.

Considero que el desenlace más probable no es una concentración total, sino la coexistencia: uno o más ecosistemas cerrados con sólidos modelos de negocio, junto a un gran ecosistema abierto con un alcance global mucho más amplio. El enfoque abierto podría resultar menos rentable; sin embargo, será más accesible, lo que hará muy difícil detener su avance. La concentración solo se torna peligrosa cuando existe una única opción. Los ecosistemas abiertos, como OpenClaw, garantizan que tal monopolio no llegue a producirse.

Los ecosistemas abiertos, como OpenClaw, se están convirtiendo en la plataforma de elección a nivel de agente.


Usted ha argumentado que China posee ventajas estructurales en IA física, dispositivos y manufactura. ¿Cuán duraderas son esas ventajas?

El hardware es un juego completamente distinto al del software. Cuando se lanzó el iPhone, las empresas estadounidenses gozaban de casi todas las ventajas: diseño, ingeniería de software y alcance de mercado. El papel de China se centraba en la manufactura. Foxconn ganaba dinero, pero solo una fracción de lo que ganaba Apple.

Esa ya no es la situación actual. China posee ahora la cadena de suministro y el ecosistema necesarios para fabricar prácticamente cualquier producto de hardware. Además, China fabrica a un coste sustancialmente inferior al de Estados Unidos: desde teléfonos y ordenadores personales hasta robots, dispositivos de manufactura y nuevos formatos como gafas, relojes y grabadoras portátiles. Empresas como Huawei, Xiaomi y ByteDance se dedican activamente a la fabricación de dispositivos. La barrera que en el pasado protegía el dominio estadounidense en el sector del hardware ya no existe tal y como la conocíamos.

Existe un dato relacionado que merece la pena destacar. Estamos entrando en una era en la que la inteligencia artificial estará cada vez más impulsada por la voz. La potencia de los grandes modelos de lenguaje (LLM) reside en nuestra capacidad para interactuar con ellos a través del lenguaje; de ​​hecho, el reconocimiento de voz se acerca ya a la perfección. Los dispositivos capaces de registrar las interacciones ambientales, las conversaciones en el entorno laboral y las reuniones generan una categoría de datos fundamentalmente nueva. Yo utilizo a diario una grabadora de ByteDance. Todas las reuniones que se celebran en mi empresa son capturadas, transcritas y analizadas por un gran modelo de lenguaje. No me resulta posible asistir a todas las reuniones en persona, pero gracias a ese análisis basado en la IA, puedo asistir a ellas de manera virtual. Se trata de una herramienta que ofrece una perspectiva operativa de una profundidad extraordinaria.

El argumento de fondo es que China posee una ventaja cultural en lo que respecta a la generación de datos a gran escala. En la etapa de la «IA 1.0», China gozaba de una ventaja en materia de datos gracias a su inmensa población y al volumen de uso de sus usuarios. En la «IA 2.0» —impulsada por los grandes modelos de lenguaje— esa ventaja se desplazó, dado que los datos de entrenamiento se extraían mayoritariamente de la internet pública, un entorno en el que los datos en lengua inglesa presentaban una calidad particularmente elevada. Sin embargo, ahora que se están generando nuevos datos a través del audio, el vídeo y las interacciones en el mundo físico, la ventaja de China resurge; en parte debido a la escala, y en parte porque existe una menor resistencia cultural a la grabación y a la captura de datos de la que cabría encontrar en Europa o en Estados Unidos.

A esto se suma un mandato gubernamental centrado explícitamente en el uso de la IA para transformar el sector manufacturero. La economía de China sigue siendo, fundamentalmente, de base manufacturera, en lugar de estar basada en el conocimiento. La prioridad pública del Consejo de Estado de China es la implementación de la IA en fábricas y entornos industriales. Dicho mandato genera una demanda, un enfoque y una alineación de la financiación que no existen en el mismo grado en otros lugares. Además, los inversores de capital riesgo chinos se muestran más dispuestos a financiar proyectos de hardware, precisamente porque consideran que China posee una ventaja competitiva en este ámbito: el coste de fabricar hardware es menor, el capital requerido es, por tanto, inferior y la velocidad de ejecución es mucho mayor.

Los capitalistas de riesgo chinos están más dispuestos a financiar emprendimientos de hardware, precisamente porque creen que China tiene la ventaja en ese ámbito.


¿Cuáles son los errores más trascendentales que observa que cometen los países en su concepción de la soberanía en materia de IA?

Para los países, el error más evidente consiste en creer que las únicas dos opciones son aceptar un modelo estadounidense o construir uno desde cero. Esas no son las opciones correctas. Las verdaderas alternativas son: en primer lugar, adoptar una plataforma estadounidense líder de código cerrado, siendo plenamente conscientes de las concesiones en materia de soberanía que ello conlleva; en segundo lugar, tomar un modelo de código abierto y continuar entrenándolo para adaptarlo a su idioma, sus valores y sus requisitos normativos, a una fracción del costo y con una posibilidad realista de éxito. Construir desde cero para competir con Estados Unidos y China constituye una tercera vía, pero exige emprender el camino con plena lucidez ante el hecho de que, para la mayoría de los países, es improbable que prospere.


[1] CUDA (Compute Unified Device Architecture) es una plataforma de computación paralela y una interfaz de programación de aplicaciones propietaria que permite a las empresas utilizar procesadores gráficos para acelerar masivamente las tareas informáticas intensivas en datos.