Jueves, 30 de abril de 2026 Jue 30/04/2026
RSS Contacto
MERCADOS
Cargando datos de mercados...
Economía

La IA china que piensa en imágenes, no en palabras, desafía a EE UU

La IA china que piensa en imágenes, no en palabras, desafía a EE UU
Artículo Completo 806 palabras
Ante las restricciones impuestas por Estados Unidos que limitan su acceso a tecnología avanzada, SenseTime está apostando fuerte por el código abierto con un nuevo modelo optimizado para funcionar con chips fabricados en China.
Zeyi YangSoftware y Cómputo30 de abril de 2026los robots comprender mejor el mundo físico en el futuro.

Con chips chinos

Al igual que el último modelo insignia de DeepSeek, SenseTime afirma que el U1 puede funcionar con chips de fabricación china. "Varios fabricantes de chips chinos ya han optimizado la compatibilidad con nuestro nuevo modelo", comenta Lin. El día del lanzamiento, diez diseñadores de chips chinos, entre ellos Cambricon y Biren Technology, anunciaron que su hardware es compatible con el U1.

Esa flexibilidad es importante porque los controles de exportación estadounidenses restringen el acceso de las empresas chinas a los chips de IA más avanzados del mundo, en particular a los utilizados para el entrenamiento, que actualmente son desarrollados principalmente por empresas occidentales como Nvidia. "Seguiremos impulsando el entrenamiento con chips más diversos", afirma Lin. Sin embargo, también reconoce que SenseTime "quizás necesite usar los mejores chips para garantizar la velocidad de nuestra iteración".

SenseTime lanzó U1 de forma gratuita en Hugging Face y GitHub, otra señal de cómo las empresas chinas se están convirtiendo en algunas de las contribuyentes más activas a la IA de código abierto.

el reconocimiento facial y la conducción autónoma. Pero cuando ChatGPT y otros sistemas de IA impulsados por el procesamiento del lenguaje natural se convirtieron en tendencia en la industria tecnológica, SenseTime comenzó a luchar para obtener beneficios y cayó detrás de nuevas startups chinas como DeepSeek y MiniMax.

SenseTime confía en que la publicación de SenseNova-U1 para que cualquiera pueda utilizarla le ayude a alcanzar a las empresas de IA nacionales y occidentales. Lin afirma que la empresa tomó finalmente la decisión el año pasado de centrarse en el código abierto debido a los útiles comentarios que recibe de los investigadores, lo que le permite iterar con mayor rapidez. "Hoy en día, ser de código abierto o cerrado no es el factor ganador, sino la velocidad de iteración", explica Lin.

El código abierto también ayuda a SenseTime a seguir colaborando con investigadores internacionales sin interferencias geopolíticas. En los últimos años, el gobierno de Estados Unidos ha sancionado repetidamente a la empresa por acusaciones de que su tecnología de reconocimiento facial ayudaba a alimentar sistemas de vigilancia utilizados para vigilar y detener a uigures y otros grupos minoritarios en la región china de Xinjiang. Por ello, las empresas estadounidenses tienen prohibido invertir en SenseTime y venderle determinadas tecnologías sin licencia. SenseTime ha negado las acusaciones.

modelos de código abierto actualmente en el mercado. Su rendimiento es comparable al de los principales modelos chinos de código cerrado, como Qwen de Alibaba y Seedream de ByteDance, pero aún está por detrás de líderes del sector como GPT-Image-2.0, que se lanzó hace apenas una semana.

Pero la principal ventaja de este modelo es su capacidad para generar imágenes mucho más rápido que todos los demás. Se basa en una innovadora estructura técnica llamada NEO-Unify, que SenseTime presentó a principios de este año.

La nueva arquitectura del modelo, que podría mejorar la eficiencia y el rendimiento, es lo que distingue a U1, afirma Adina Yakefu, investigadora de IA en Hugging Face. "Este es un enfoque más ambicioso, ya que aún enfrenta importantes desafíos prácticos. Es positivo que hayan decidido liberar el código fuente para que la comunidad pueda explorarlo y probarlo de forma más amplia". El modelo también es lo suficientemente ligero como para ejecutarse en computadoras y smartphones, lo que lo hace potencialmente útil en muchos escenarios.

Lin afirma que la técnica desarrollada por SenseTime será especialmente útil en robótica. Cuando un robot intenta procesar el mundo visual, necesita organizar una enorme cantidad de información. "Tiene que pensar: '¿Cómo debo lidiar con todo el desorden en esta habitación? Si hay una máquina compleja frente a mí, ¿qué botón debo presionar?'. Todo esto son formas de información, y deben integrarse en el juicio interno del modelo", explica. Dado que puede comprender imágenes de forma nativa, Lin confía en que la tecnología de SenseTime ayudará a los robots a actuar más rápido y cometer menos errores en entornos complejos.

China está experimentando un auge en el desarrollo de robots humanoides. Si bien SenseTime no desarrolla actualmente sus propios robots, Lin afirma que colabora estrechamente con ACE Robotics, una empresa emergente liderada por otro cofundador de SenseTime. Además, está desarrollando modelos especializados en comprensión geoespacial, es decir, en la creación de simulaciones del mundo real.

Artículo originalmente publicado enWIRED.Adaptado por Alondra Flores.

Fuente original: Leer en Wired - Negocios
Compartir