DeepSeek: Innovación de bajo costo, pero de alto impacto
… o cómo convertir la escasez de recursos en motor para la innovación
Una de las quejas más frecuentes de los equipos de innovación es la falta de recursos para para poder cumplir con las exigencias de tiempo y alcance de sus proyectos. Sin embargo, las limitaciones de recursos no siempre son un obstáculos para el desarrollo de soluciones exitosas. El caso de DeepSeek, el modelo de inteligencia artificial que que acaba de irrumpir y está cambiando las reglas de juego de esta naciente industria, es un excelente ejemplo. Una solución “fuera de la caja” impulsada por las limitaciones de acceso a tecnologías de punta así como los bajos montos de inversión ha puesto de cabeza tanto a la comunidad tecnológica como a los mercados financieros.
DeepSeeek: inteligencia artificial desarrollada de forma inteligente
DeepSeek fue desarrollada por Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd., una startup china llamada fundada en 2023 por Liang Wenfeng, cofundador del fondo de cobertura cuantitativo High-Flyer.
Según sus desarrolladores, el chatbot solo costó US$5,6 millones, frente a los US$5.000 millones que gastó el año pasado OpenAI en ChatGPT. El enorme diferencial de costo se debe a que a su modelo de IA ha sido entrenado con 2.000 chips especializados, en comparación con los 16.000 que han requerido los otros modelos. Tan solo la semana pasada Meta anunció una inversión de $65 mil millones para construir un centro de datos del tamaño de Manhattan y Elon Musk anunció anteriormente que emplearía 100 mil chips de Nvidia que para su compañía de inteligencia artificial, xAI.
¿Cuáles han sido los resultados?
Aunque DeepSeek R1 todavía no alcanza la potencia de las versiones más recientes de ChatGPT o Antrophic, por ejemplo, las mediciones comparativas con los modelos anteriores de estas han sido sorprendentes. En evaluaciones como la American Invitational Mathematics Examination (AIME) 2024, DeepSeek R1 obtuvo una puntuación del 79,8%, superando ligeramente al modelo OpenAI o1-1217, que alcanzó un 79,2%. Asimismo, en la prueba MATH-500, DeepSeek R1 logró un 97,3%, superando al 96,4% de OpenAI o1-1217.
Ahora lo más notable de esto es que cuesta $0,55 por millón de tokens de entrada y $2,19 por millón de tokens de salida. En cambio, OpenAI cuesta $15 por millón de tokens de entrada y $60 por millón de tokens de salida. Eso es el 3,5% del costo de ejecución de los modelos O1 de OpenAI.
Menos recursos, más ingenio
A partir de octubre de 2022, el gobierno estadounidense restringió el acceso de las empresas chinas de inteligencia artificial a chips de última generación como el H100 de Nvidia, limitando la capacidad de DeepSeek para desarrollar modelos similares a los de OpenAI, Antrophic, Google y Meta.
Para superar esta barrera, los ingenieros de DeepSeek idearon métodos más eficientes para entrenar sus modelos tales como esquemas de comunicación personalizados entre chips y reducción del tamaño de los campos para ahorrar memoria. Para lograr esto DeepSeek se basó en un enfoque de “Mezcla de Expertos”, o Mixture of Experts (MoE), que en lugar de activar todos el sistema para cada solicitud, el modelo selecciona de manera inteligente cuáles “expertos” del modelo deben actuar. En otras palabras, en lugar de desperdiciar energía activando cada neurona, DeepSeek hace que las neuronas adecuadas trabajen en los problemas adecuados.
Esto es lo realmente ingenioso. Cómo utilizar el análisis y pensamiento crítico para cubrir las deficiencias tecnológicas y financieras. Algo que muy probablemente no hubiera ocurrido de haber tenido más presupuesto y acceso a los chips que les fueron restringidos.
Innovación de bajo costo, o frugal
La innovación de bajo costo, o frugal, como también se le conoce, denota un nuevo estado mental: uno que ve las restricciones de recursos no como una desventaja sino como una oportunidad, y otro que favorece la agilidad por encima de la eficiencia. Este tipo de innovaciones no busca superar con sofisticación o tecnologías superiores lo que ya existe en el mercado, sino resolver un problema fundamental de la manera más efectiva y eficiente. Sus desarrolladores o diseñadores no están enfocados en un reto intelectual para satisfacer su ego, sino en la búsqueda de la solución más viable para la empresa y que resuelva los problemas de sus clientes.
He visto en distintos proyectos cómo el equipo se diluye en discusiones interminables para defender sus privilegios, para exigir más presupuesto, solicitar más equipos y talento, en vez de preocuparse en cómo resolver las cosas con lo que tienen a la mano. Peor aún, he visto proyectos que se paralizan porque sus líderes consideran que no tienen todo lo que han solicitado, sin ni siquiera haber intentado mecanismos alternativos.
El profesor Gary Hamel decía en una entrevista reciente que «la innovación nace de la brecha entre las altas aspiraciones y los bajos recursos, y eso obliga a pensar de nuevas maneras». Según esto, también podríamos decir que la verdadera innovación se da precisamente por la existencia de esa brecha entre aspiraciones y recursos, y no cuando se tiene todo a la mano.
El caso de DeepSeek ejemplifica claramente cómo la innovación de bajo costo puede superar las restricciones de recursos y desafiar las productos y servicios existentes. Su enfoque en la optimización de recursos demuestra que es posible desarrollar soluciones avanzadas sin inversiones exorbitantes, abriendo nuevas oportunidades para empresas y países con recursos limitados.
En la innovación sucede una extraña paradoja: si se cuenta con recursos excesivos se puede terminar haciendo más de lo que se necesita, lo que demora y encarece su desarrollo; pero cuando se tienen recursos escasos también se puede apelar al ingenio y la creatividad para sortear las limitaciones.
Grandes retos exigen grandes recursos, pero tal vez el más grande de todos no sea el dinero, sino el ingenio.
Si te gustó el artículo, no dejes de suscribirte al newsletter y compartirlo con tus colegas y amigos. También puedes dejar tus comentarios y opiniones más abajo.
Fuentes:
El podcast de Big Technology: The DeepSeek Reckoning in Silicon Valley
Vox: DeepSeek is bad for Silicon Valley. But it might be great for you.
VentureBeat: Open-source DeepSeek-R1 uses pure reinforcement learning to match OpenAI o1 — at 95% less cost
Excelente Rubén. Este nuevo mundo apenas comienza. Un abrazo