Hogar >  Noticias >  La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

by Matthew Mar 19,2025

El nuevo chatbot de Deepseek cuenta con una introducción impresionante: "Hola, fui creado para que puedas preguntar cualquier cosa y obtener una respuesta que incluso te sorprenda". Esta IA, un producto de la startup china Deepseek, se ha convertido rápidamente en un importante jugador del mercado, incluso contribuyendo a una caída significativa en el precio de las acciones de Nvidia.

Prueba de Speeek Imagen: ensigame.com

El éxito de Deepseek proviene de sus innovadores métodos de arquitectura y capacitación. Las tecnologías clave incluyen:

  • Predicción múltiple (MTP): en lugar de predecir palabras individualmente, MTP pronostica múltiples palabras simultáneamente, aumentando la precisión y la eficiencia.
  • Mezcla de expertos (MOE): esta arquitectura utiliza múltiples redes neuronales, acelerando la capacitación y mejorando el rendimiento. Deepseek V3 utiliza 256 redes, activando ocho para cada token.
  • Atención latente múltiple (MLA): MLA se centra en piezas de oraciones cruciales, extrayendo repetidamente detalles clave para minimizar la pérdida de información y garantizar la comprensión matizada.
Deepseek v3 Imagen: ensigame.com

El reclamo inicial de Deepseek de solo un costo de entrenamiento de $ 6 millones para Deepseek V3, usando solo 2048 GPU, es engañoso. El semianálisis reveló una infraestructura mucho más extensa: aproximadamente 50,000 GPU NVIDIA Hopper (incluidos 10,000 H800, 10,000 H100 y H20 adicionales) distribuidos en múltiples centros de datos. Esto se traduce en una inversión de servidor de aproximadamente $ 1.6 mil millones y gastos operativos cerca de $ 944 millones.

Una subsidiaria de High-Flyer, un fondo de cobertura chino, Deepseek posee sus centros de datos, fomentando la velocidad de control e innovación. Este enfoque autofinanciado mejora la flexibilidad y la toma de decisiones. La compañía atrae a los mejores talentos, con algunos investigadores ganando más de $ 1.3 millones anuales, principalmente reclutando de universidades chinas.

Veterano Imagen: ensigame.com

Si bien la cifra de $ 6 millones de Deepseek solo refleja los costos de GPU previos al entrenamiento, ignorando la investigación, el refinamiento, el procesamiento de datos e infraestructura, la compañía ha invertido más de $ 500 millones en desarrollo de IA. Su estructura magra permite una innovación eficiente en comparación con competidores más grandes y burocráticos.

Veterano Imagen: ensigame.com

El éxito de Deepseek destaca el potencial competitivo de las compañías de IA independientes bien financiadas. Sin embargo, sus logros se basan en una inversión sustancial, avances tecnológicos y un equipo fuerte. Las reclamaciones de eficiencia presupuestaria revolucionaria son exageradas. Aún así, los costos de Deepseek siguen siendo significativamente más bajos que los competidores; Por ejemplo, el modelo R1 de Deepseek costó $ 5 millones para entrenar, mientras que ChatGPT4 costó $ 100 millones.

Juegos de tendencia Más >