Mucho se ha hablado de la hipótesis del bosque oscuro aplicada a la web, y cómo la recolección masiva de datos públicos para entrenar LLMs desincentiva la publicación de contenido.
Poco se ha hablado de cómo eso va a afectar al código abierto.
La noticia de la semana fue que el creador de Tailwind CSS, un framework polémico pero ampliamente utilizado para maquetar aplicaciones web, rechazó un pull request que introducía un archivo llms.txt¹, porque las "IA"s consumiendo su documentación habían tenido un impacto crítico en su negocio y había tenido que despedir al 75 % de la plantilla:
I totally see the value in the feature and I would like to find a way to add it.
But the reality is that 75% of the people on our engineering team lost their jobs here yesterday because of the brutal impact AI has had on our business.
[...] Traffic to our docs is down about 40% from early 2023 despite Tailwind being more popular than ever. The docs are the only way people find out about our commercial products, and without customers we can't afford to maintain the framework.
Aunque en términos absolutos el impacto fue relativamente pequeño (sin ánimo de menospreciar a las personas afectadas, "el 75 % de la plantilla" en este caso son 3 de 4), las reacciones no se hicieron esperar. Google, Vercel y otras grandes empresas encontraron dinero que se había perdido entre los pliegues del sofá y anunciaron en la web de pornografía infantil antes conocida como Twitter que patrocinarían el proyecto.
Sorprendentemente, en el pull request no hubo muchísimo drama porque el autor prefirió explicar su punto de vista en sucesivos vídeos de TikTok. El signo de los tiempos, supongo.
Pero lo que me ha llevado a escribir esto ha sido un post en LinkedIn de un desarrollador bastante prolífico anunciando que "todo su nuevo código sería de código cerrado en adelante":
All my new code will be closed-source from now on. I've contributed millions of lines of carefully written OSS code over the past decade, spent thousands of hours helping other people. If you want to use my libraries (1M+ downloads/month) in the future, you have to pay.
Aquí hay varias cosas que están pasando.
Por un lado, la ilusión de principios de siglo de que lo digital tiene coste cero se ha roto. Prueba de ello es la crisis que está sufriendo el ecosistema Python por ejemplo. Los números de PyPI, el Python Package Index, son espectaculares:
2025 was another eventful year for PyPI! Critical security enhancements, powerful new org features, a better overall user experience, and transparent security incident response 🎉👏 Thank you, PyPI team & community! Learn more on our blog: blog.pypi.org/posts/2025-1...
Y sin embargo, la Python Software Foundation lleva meses pendiente de un hilo porque sus ingresos, principalmente patrocinios de empresas, no alcanzan a cubrir sus gastos. La comunidad se ha puesto las pilas y ha donado medio millón de dólares, lo cual es un hito inmenso, pero no va a ser suficiente.
¿Dónde están las empresas de IA, apoyando esta infraestructura crítica sin la cual no podrían existir? La respuesta es ya conocida²: ocupadas perdiendo miles de millones de dólares.
Por otro lado, esto va mucho más allá de lo material. La gran mayoría de código abierto nunca ha sido sostenible. Alguien lo ha escrito y lo ha publicado por factores de motivación intrínsecos, y por objetivamente es la forma más eficaz de consumir y producir software, o simplemente porque podía.
Solo hemos empezado a hablar de la "sostenibilidad" del código abierto cuando se ha empezado a ver la enorme asimetría entre personas produciéndolo y empresas consumiéndolo.
¡Consumir código abierto no está libre de efectos secundarios! Lo sabe bien la gente de ffmpeg, a quienes la gente de Google informa de vulnerabilidades pero ni apoyan financieramente el proyecto ni mandan parches arreglando dichas vulnerabilidades. O el mantenedor de libxml2, que dejó de mantener el proyecto porque estaba harto de investigadores de Google Project Zero "respirándoles en la nuca":
I just stepped down as libxslt maintainer and it's unlikely that this project will ever be maintained again. It's even more unlikely with Google Project Zero, the best white-hat security researchers money can buy, breathing down the necks of volunteers.
Ha habido y hay intentos, nobles todos ellos, de intentar hacer algo para mitigar este problema desde lo material. Muchos de ellos se han malogrado (Gratipay, Tidelift) y algunos aún sobreviven (Open Source Pledge). Pero siguen siendo una gota en el océano.
Las licencias de código abierto son claras: haz con esto lo que quieras, con tal de que salga mi nombre en algún sitio. Pero este regalo que Obijuan llamó "patrimonio tecnológico de la humanidad" se sustentaba en un pacto implícito: no arruinar la motivación de quienes producen código abierto.
El recurso más escaso del mundo del software es la atención de los mantenedores. Y lo estamos sobreexplotando.
En resumen:
El código abierto "comunitario" está asediado por las empresas más poderosas del mundo, que exigen respuesta rápida a problemas de seguridad y ofrecen muy poco a cambio.
El código abierto "corporativo" ve como una categoría entera de modelos de negocio se ha esfumado completamente, puesto que las "IA"s evitan a sus usuarios tener que ir a la documentación y web oficiales.
¿Qué nos depara el futuro?
Por el lado corporativo, coincido con esto:
My prediction: a new marketplace emerges, built for agents. Want your agent to use Tailwind? Prisma? Pay per access. Libraries become APIs with meters. The old model: free code -> human attention -> monetization. The new model: pay at the gate or your agent doesn't get in.
Vamos a ver cómo muchos proyectos de código abierto acaban siendo SDKs que llaman a una API controlada por la compañía.
Por otro lado, creo que en algún momento los repositorios de código abierto, empezando por PyPI, se darán cuenta de que no pueden cargar con los costes de infraestructura e introducirán un canon a las tecnológicas más grandes. Anaconda ya lo vio venir hace años y no sé a qué esperan los demás.
El código abierto comunitario, por otro lado, seguirá siendo el 90 % de cualquier software. Pero pienso que el reemplazo generacional cada vez será más difícil. El código abierto ha sido tradicionalmente desarrollado por señores blancos con mucho tiempo libre o personas queer con un TDAH loquísimo. Todos tenemos cada vez menos tiempo libre, nadie parece estar pudiendo comprarse una casa para vivir, y las personas LGTBQ+ vuelven a estar amenazadas por el auge mundial del fascismo ultraderechista.
Llevamos ya unos años entrando en una fase post-código abierto. Las "IA"s no han hecho más que acelerar esa tendencia.
Pero de esto seguiremos hablando otro día.
¹El famoso archivo llms.txt supuestamente ayuda a las "IA"s a consumir documentación técnica. Según un comentario en LinkedIn que no he sido capaz de volver a encontrar, no parece que realmente las LLMs lo estén consumiendo. Si es así (acepto evidencia en contra), sería un poco como los MCPs, "el primer protocolo en la historia con más desarrolladores que usuarios".
²Respuesta alternativa: ocupadas diciendo tonterías, como que el código "ahora" es efímero y que las bibliotecas ya no sirven.