DeepSeek, la empresa china de inteligencia artificial, presentó a comienzos de mes sus dos nuevos modelos V3.2 que prometen igualar el rendimiento de GPT-5 de OpenAI pero con un coste un 70 por ciento inferior. Los dos modelos se llaman DeepSeek-V3.2-Base y DeepSeek-V3.2-Chat. La compañía confirmó que ambos sistemas están disponibles de forma totalmente gratuita para cualquier persona que quiera usarlos.
El secreto detrás de estos modelos es un mecanismo técnico llamado atención dispersa. Este sistema permite que la inteligencia artificial procese información de forma más eficiente, reduciendo drásticamente el coste de entrenar los modelos sin perder calidad en las respuestas. Los ingenieros de DeepSeek explican que así se consigue que cada dólar invertido en computación rinda mucho más que en arquitecturas tradicionales. Las pruebas realizadas por la empresa muestran que V3.2 iguala o supera GPT-5 en tareas de razonamiento, programación y análisis de textos complejos. OpenAI cobra entre 20 y 200 dólares mensuales por el acceso a GPT-5 según el plan elegido.
La estrategia de DeepSeek amenaza directamente el modelo de negocio de OpenAI, Google y otras empresas occidentales que cobran suscripciones por sus servicios de inteligencia artificial. La compañía china no ha revelado cómo planea ganar dinero con estos modelos gratuitos, pero algunos analistas creen que buscan captar millones de usuarios primero y monetizar después con servicios premium. Mientras tanto, Sam Altman se enfrenta a pérdidas de 8000 millones de dólares en OpenAI porque solo el 5 por ciento de usuarios paga por ChatGPT, según confirmó recientemente.
DeepSeek entrena sus modelos con menos GPUs que OpenAI
Los números técnicos revelan el golpe que supone este lanzamiento. DeepSeek entrenó sus modelos V3.2 usando menos de 2000 GPUs, mientras que OpenAI necesitó más de 10.000 GPUs para entrenar GPT-5. Esta diferencia en infraestructura explica cómo la empresa china logra ofrecer sus sistemas gratis manteniendo costes operativos bajos. Las pruebas independientes confirman que ambos modelos rinden igual en la mayoría de tareas cotidianas que los usuarios realizan con ChatGPT. La tecnología de atención dispersa también permite que los modelos funcionen más rápido en dispositivos con menos potencia.














