An opinionated list of Python frameworks, libraries, tools, and resources
DeepClaude: combiné Claude Code con DeepSeek V4 Pro en mi loop de agentes y los números me desconcertaron DeepSeek V4 Pro resuelve correctamente el 94% de las tareas de razonamiento profundo en mi loop… pero el costo de latencia lo hace inutilizable para el 60% de mis casos de agente. Sí, leíste bien. Y eso cambia completamente la narrativa de "combinar modelos es siempre mejor". El martes a la
Specsmaxxing: escribí mis specs en YAML para mis agentes y esto cambió (y esto no) Una spec en YAML para un agente de IA es básicamente como el plano de obra que le dejás al albañil cuando no podés estar presente. Si el plano está bien, el tipo levanta exactamente lo que querés. Si el plano tiene un solo detalle ambiguo — "pared al fondo" sin medidas — el tipo toma una decisión, y cuando volvés,
Barman reemplaza a pgbackrest: migré mis backups de Postgres en producción y esto encontré El fin de semana que migré de Vercel a Railway — el mismo que mencioné cuando hablé de cold starts — pasé casi doce horas leyendo logs de Postgres que nunca había tenido que leer tan en serio. No era un tutorial. Era producción real, datos reales, y la pregunta de fondo era siempre la misma: si esto explot
Kimi K2.6 vs Claude vs GPT-5.5: lo puse contra mis casos reales de coding y los números me sorprendieron Estaba mirando un PR que había pedido Claude Sonnet 3.7 que refactorizara — un servicio de ingesta de datos en TypeScript con tres capas de async mal encadenadas — cuando vi el thread de Hacker News sobre Kimi K2.6. El claim era directo: Kimi K2.6 le gana a Claude y a GPT-5.5 en coding benchm