DeepSeek

DeepSeek
Información sobre la plantilla
Empresa con sede en China
Oficinas de DeepSeek en Beijing.jpg
Empresa dedicada a la inteligencia artificial y tecnologías de la información
Fundación:Mayo 2023
País:Bandera de la República Popular China China
Sede:Hangzhou, Zhejian
FundadorLiang Wenfeng
Ejecutivo principalLiang Wenfeng
Productos:DeepSeek-V3

DeepSeek-R1
DeepSeek App
DeepSeek Platform API
DeepSeek Coder

DeepSeek LLM
Sitio web
[www.deepseek.com]

DeepSeek (nombre en mandarín: 深度求索, pinyin: Shēndù Qiúsuǒ, en español: Búsqueda Profunda) es una empresa china privada de inteligencia artificial y startup que se ha hecho conocida por desarrollar modelos de lenguaje de código abierto. Fundada en mayo de 2023 por Liang Wenfeng y financiada en gran parte por el fondo de cobertura High-Flyer tambien cofundado por Wenfeng. DeepSeek ha lanzado varios modelos de IA, incluyendo DeepSeek-V3 y su más reciente versión, DeepSeek-R11.

DeepSeek es también el nombre de su chat de IA, una alternativa propia a Copilot, Gemini y compañía.

DeepSeek destaca por ser accesible y económico en comparación con otros modelos de IA, como los de OpenAI. Su modelo R1, en particular, ha sido elogiado por su capacidad de razonamiento y resolución de problemas, ofreciendo un rendimiento comparable al modelo o1 de OpenAI pero a un costo mucho menor.

Además, el asistente para dispositivos moviles de DeepSeek ha ganado popularidad al ser la aplicación gratuita más descargada en la App Store de EE.UU., superando incluso a ChatGPT. Su enfoque en el código abierto permite a cualquier persona ver cómo funciona internamente y usarlo con libertad.

Se suele tener la falsa percepción de que una de las cosas a favor del código privado y opaco de la mayoría de desarrolladoras de IA es que la calidad de sus productos es superior. Sin embargo, DeepSeek es una prueba de que el código abierto puede igualar e incluso superar en unos aspectos a estas empresas.

Al momento de viralizarse el modelo chino de inteligencia artificial de la empresa por su calidad comparada con otros modelos comerciales y de código cerrado el presidente de Estados Unidos, Donald Trump, calificó el fenómeno como una "llamada de alarma" para las empresas de ese país que deberán concentrarse en "competir para ganar". El auge de DeepSeek representa un avance significativo para el gobierno de China en su esfuerzo por lograr la independencia tecnológica de Occidente.

Otro cuestión que llamó la atención sobre empresa china es la afirmación de sus creadores de que su modelo de IA fue producido a una fracción del costo de otros modelos en la vanguardia de la industria como el ChatGPT de OpenAI, porque utiliza menos chips de tecnología avanzada.

Productos

DeepSeek ha desarrollado varios modelos de inteligencia artificial que han captado la atención por su rendimiento y accesibilidad.

  • DeepSeek-V3: Este modelo fue lanzado a finales de diciembre de 2024 y ha sido un gran avance en velocidad de inferencia. DeepSeek-V3 utiliza un sistema de "mezcla de expertos" que divide su gran modelo en numerosos submodelos especializados. Aunque tiene un total de 671 mil millones de parámetros, solo utiliza 37 mil millones a la vez, lo que mejora la eficiencia.
  • DeepSeek-R1: Lanzado el 20 enero de 2025, este modelo ha sido comparado con los modelos de razonamiento de OpenAI. DeepSeek-R1 es conocido por su capacidad de razonamiento y resolución de problemas, y ha sido elogiado por su rendimiento en una variedad de benchmarks. Además, es accesible a un costo mucho menor que otros modelos similares. Fue entrenado con solo 5,5 millones de dólares y utilizando una cantidad mucho menor de chips Nvidia en comparación con otras empresas.
  • DeepSeek Coder: Un modelo diseñado para tareas de programación y desarrollo de software.
  • DeepSeek LLM: Un modelo de lenguaje grande utilizado para una variedad de aplicaciones de procesamiento de texto.
  • Janus-Pro-7B: Este modelo multimodal, lanzado el 27 enero de 2025, puede procesar varios tipos de medios. Es una extensión de los modelos anteriores y ha sido diseñado para manejar tareas más complejas y diversas.

Estos modelos han sido desarrollados con un enfoque en la eficiencia y el costo, lo que permite a DeepSeek ofrecer capacidades avanzadas de IA a un precio accesible

La empresa tambien ha puesto a disposición de los usuarios:

  • DeepSeek App: Una aplicación que permite a los usuarios interactuar con los modelos de IA de DeepSeek a través de su teléfono o computadora. La aplicación ha sido muy popular y ha llegado a la cima de las listas de aplicaciones en varias tiendas.
  • DeepSeek Platform API: Una plataforma que permite a los desarrolladores integrar los modelos de IA de DeepSeek en sus propias aplicaciones y servicios.

Fundador

Liang Wenfeng fundador de DeepSeek nació en Guangdong, China en 1985, Liang se especializó en Ingeniería electrónica y de comunicaciones en la Universidad de Zhejiang y obtuvo un máster en Ingeniería de la información y las comunicaciones. Antes de fundar DeepSeek en 2023, Liang estableció un fondo de cobertura llamado High-Flyer Quantitative Investment Management en 2015, que utiliza técnicas de aprendizaje automático para el comercio de acciones. A diferencia de muchos de los empresarios de IA estadounidenses que vienen de Silicon Valley, Liang tiene antecedentes en el sector financiero.

Durante un simposio en Beijing en enero de 2025 Liang declaró que el sector de IA de China "no puede continuar siendo un seguidor", refiriendose a la importancia de que China debe desarrollar capacidades propias y avanzadas para competir globalmente en el mercado de las IA. Liang subrayó que con el talento adecuado y los recursos, cualquier país podría emprender proyectos similares y desafiar el liderazgo actual en IA.

Liang Wenfeng fue preguntado sobre por qué el modelo DeepSeek sorprendió a tantos en Silicon Valley durante una entrevista en TechCrunch el 26 de enero de 2025. Respondió que la sorpresa se debió a la capacidad de DeepSeek para desarrollar modelos avanzados de IA con recursos limitados y a un costo mucho menor en comparación con sus competidores estadounidenses.

Repercuciones de DeepSeek en el mercado financiero

  • Caída en las acciones de Nvidia: Fue la empresa que sufrió el peor golpe. Las acciones de Nvidia, una de las principales empresas de chips para IA, cayeron más del 17% en un solo día, concretamente el 27 de enero de 2025, lo que representa una pérdida de aproximadamente $600 mil millones en valor de mercado. Esta caída se debió a la preocupación de los inversores sobre la competencia que representa DeepSeek.
  • Impacto en otros gigantes tecnológicos: Otros gigantes tecnológicos como BroadcomBroadcom y Alphabet (empresa matriz de Google) también experimentaron caídas significativas en sus acciones. La incertidumbre sobre el futuro de la demanda de chips y otros componentes tecnológicos debido a la competencia de DeepSeek contribuyó a esta situación.

Fuentes