CursosWorkshop IAEmpresasPreciosBlogNewsletter
  • Cursos
  • Workshop IA
  • Empresas
  • Precios
  • Blog
  • Newsletter
Suscríbete

Suscríbete a nuestra newsletter

No te pierdas los avances que realmente merecen la pena:

Suscribiéndote aceptas la política de privacidad
  • Cursos
  • Empresas
  • Comunidades
  • Blog
  • Tarjeta regalo
  • Newsletter
  • Soporte
  • Tienda
  • ConfAiBot
  • Contacta
  • Aviso legal
  • Condiciones generales
  • Política de privacidad
  • Política de cookies
Por qué PostgreSQL es la mejor base de datos, ¡por fin se estandariza el AGENTS.md! y chunking de embeddings

Por qué PostgreSQL es la mejor base de datos, ¡por fin se estandariza el AGENTS.md! y chunking de embeddings

21 de agosto de 2025

Suscríbete a nuestra newsletter

No te pierdas los avances que realmente merecen la pena:

Suscribiéndote aceptas la política de privacidad

¡Hola!

Resumen de este email:

  • Por qué Postgres es la mejor base de datos (+ curso de Embeddings automáticos en Postgres)
  • Cómo hacer chunking de los embeddings
  • ¡Por fin ha llegado el estándar AGENTS.md!

Tiempo estimado de lectura: 3 minutos.

🐘 Por qué Postgres es la mejor base de datos

Postgres, por defecto, es una base de datos SQL, pero también puedes utilizarla como NoSQL (tiene soporte nativo para json), como una clave valor, como un motor de búsqueda fulltext…

Hasta aquí podríamos entender que es una base de datos vitaminadas, pero es que es mucho más que eso.

Y lo es gracias a las extensiones y a la comunidad que tiene.

Con extensiones (algunas creadas por grandes empresas como Timescale o Supabase), Postgres también es capaz de:

✔︎ Hacer peticiones HTTP Con extensiones como pgsql-http (síncrono) o pg_net (asíncrono) es capaz de hacer llamadas a otros servidores.

✔︎ Tener un sistema de CRON Gracias a pg_cron, puedes configurar que cada X tiempo se ejecute una función.

Si lo combinas con la capacidad de HTTP, puedes simplificar mucho tu stack.

✔︎ Ser un sistema de colas MQ SQS, RabbitMQ… están muy bien, pero si no tenemos experiencia con ellos y nos queremos meter en el mundo de los sistemas de colas de mensajería, con pgmq podemos tenerlo dentro del propio Postgres.

Todo de forma nativa a la base de datos (todo funciona mediante tablas que se crea en su propio esquema).

¡Hasta tiene sistema de retries!

Además, con otras extensiones puede ser una base de datos timeseries, de grafos, geoespacial (con PostGIS, muy utilizado en la industria).

Por estos motivos, si tenemos que escoger una base de datos generalista a día de hoy, nos quedamos con Postgres.

Además, si combinas peticiones http, con crones y sistema de colas, puedes delegar en la base de datos la generación de embeddings. Esto hace que añadir funcionalidades que tengan que ver con la IA sea mucho más rápido y sencillo.

Si quieres aprender cómo hacer estas combinaciones y delegar (o ser consciente de por qué no) esta generación a la base de datos, acabamos de publicar al 100% el curso de Embeddings automáticos en Postgres en el plan standard.

✂️ Cómo hacer chunking de los embeddings

Si te has metido en el mundo de los embeddings y RAG, seguramente te has hecho la pregunta de cuál es la mejor estrategia a seguir para hacer chunking de embeddings.

Aquí sentimos traerte malas noticias, pero no hay una regla de oro a seguir para ello. Hay que recurrir a la clásica prueba y error dado al no-determinismo de estos sistemas.

Este martes pasado estuvimos en directo con Jesús Serrano, que en su empresa tienen un CMS que utiliza media España (Mediaset, RTVE, eldiario.es, prensa ibérica…) donde nos contó cómo han implementado la funcionalidad de poder preguntar por contenidos anteriores y similares. Puedes verlo aquí.

Es código Python, pero con una arquitectura de software y tipado, cosa que pasa pocas veces e ilusiona. 🥹

🤖 ¡Por fin ha llegado el estándar AGENTS.md!

OpenAI + Google + Cursor se han juntado para reconocer este fichero (sea en la raíz o en directorios anidados) y añadir esa información al contexto del agente.

Es markdown puro.

La pena es que, por ahora (aunque seguramente en breves le añadan soporte nativo), Claude Code no tiene compatibilidad.

Pero es tan sencillo como ejecutar este comando y ya estaría: mv CLAUDE​.md AGENTS​.md && ln -s AGENTS​.md CLAUDE​.md

Luego recuerda añadir el CLAUDE​.md a tu gitignore, y ya tendríamos las reglas estandarizadas.

Ahora a ver si se ponen de acuerdo para estandarizar el fichero de conexión a MCPs.

Mañana a las 9h CEST, en el Café con Codely, comentaremos esta noticia y muchas más. Puedes seguirlo en YouTube o Twitch.

Y ya que has llegado hasta esta parte de la newsletter, te dejo aquí el chiste de la semana, qué sé que lo estabas esperando:

> Tenía un problema programando en C, así que decidí utilizar Java. Ahora tengo un AbstractProblemFactory. 😂

¡Un saludo!

SuscríbeteInicia sesión