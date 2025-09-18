El bajo costo reportado por la startup china DeepSeek contrasta con los cientos de millones que invierten rivales en Estados Unidos y reaviva el debate sobre la carrera global por la IA

DeepSeek reveló que el estreno de su modelo R1 tuvo un costo mucho menor que las cifras reportadas por sus rivales estadounidenses, según un artículo que podría reavivar el debate sobre la posición de China en la carrera global por la inteligencia artificial.

El anuncio de la compañía sobre sistemas de IA de bajo costo, realizado en enero, provocó que inversionistas globales vendieran acciones tecnológicas por el temor de que los nuevos modelos pudieran desafiar el dominio de firmas como Nvidia.

El estudio sobre los costos de entrenamiento de R1 apareció en un artículo en la revista académica Nature, publicada el miércoles.

El documento, donde el fundador Liam Wenfeng figura como autor, señala que el modelo R1, especializado en razonamiento, costó 294,000 dólares entrenarlo y requirió 512 chips Nvidia H800.

Sam Altman, director ejecutivo de OpenAI, comentó en 2023 que el entrenamiento de modelos fundamentales había costado mucho más de 100 millones de dólares, aunque su compañía no ha revelado cifras detalladas de sus desarrollos.

El entrenamiento de modelos de lenguaje a gran escala, como los que impulsan chatbots de IA, implica costos elevados por la operación de clústeres de chips de alto rendimiento durante semanas o meses para procesar enormes volúmenes de texto y código.

Algunas afirmaciones de DeepSeek sobre sus costos y la tecnología utilizada han sido cuestionadas por empresas y autoridades en Estados Unidos.

En un documento adicional que acompañó al artículo de Nature, la compañía reconoció por primera vez que posee chips A100 y que los utilizó en las etapas iniciales de desarrollo. Durante esa fase, R1 se entrenó durante un total de 80 horas en un clúster de 512 chips H800.

Previamente se había informado que una de las razones por las que DeepSeek logró atraer a talento destacado en China fue que era una de las pocas empresas del país que operaba un clúster de supercomputación con chips A100.