¡Buenas!
Resumen de este email:
- Dominio vs Infraestructura (+ curso de Embeddings automáticos en Postgres publicado en plan Standard)
- Hoy sale ChatGPT 5 y novedades de OpenAI
- Novedades de ManagerPro
Tiempo estimado de lectura: 4 minutos.
⚡ Dominio vs Infraestructura
Parece que es algo que solemos tener bastante claro:
- Qué va en dominio: La lógica de nuestro negocio.
- Qué va en infraestructura: Todo lo demás (guardar en bd, llamara una API…).
Pero a veces hay matices, líneas grises, donde se puede llegar a complicar.
Una de esas líneas es la generación de embeddings.
La generación de embeddings es la transformación de datos (texto, imágenes, audios…) en vectores numéricos que capturan su significado semántico, permitiendo operaciones como búsquedas por similitud.
Resumidamente: Transformar unos datos para luego poder buscar por ellos de forma semántica.
En lugar de hacer: SELECT * FROM products WHERE color = 'red' and price < 100; se podría hacer SELECT * FROM products WHERE embeddings <=> 'de color rojo y menos de 100 € de precio'.
Para generar este embedding, hemos de hacer una llamada a un LLM de generación de éstos.
Entonces, fácil, ¿no? Creamos una interfaz en dominio para la generación de embedding y luego en infraestructura la implementación.
Ojalá el debate se acabara allí.
- ¿Tiene que saber nuestro dominio del concepto de embeddings? ¿Nuestra entidad ha de tener ese campo?
- ¿Se genera en el insert o de forma asíncrona?
- ¿No es cómo un índice y se puede delegar todo en base de datos?
Aquí hay muchas decisiones que tomar. Algunas mejores que otras. Ninguna perfecta.
Depende el caso, una irá mejor que otra.
Nuestra recomendación: Si puede ser, que sea asíncrono, intentando ensuciar el dominio lo menos posible.
Una de las formas de conseguir eso, es delegarlo todo a la base de datos. Ojo aquí que no se puede hacer con todas las bases de datos.
Una con la que sí que se puede es con Postgres, ya que permite hacer llamadas HTTP con sus triggers + tiene sistema de colas para poder hacerlo más escalable.
Conclusión: No siempre es clara la línea entre qué es dominio y qué infraestructura, pero conocer al 100% las herramientas que utilizamos nos puede ayudar a saber donde poner cada cosa.
Si quieres saber cómo llevar toda esa lógica a Postgres, acabamos de publicar en Codely Pro Standard el curso de Embeddings automáticos en Postgres. 😊
- Comparamos diferentes formas de generarlos
- Trigger vs colas mq vs eventos de dominio
- De la forma más escalable
🆕 Hoy sale ChatGPT 5 y novedades de OpenAI
Ayer la gente de OpenAI puso un tweet con el siguiente texto: LIVE5TREAM THURSDAY 10AM PT.
Así que lo más probable, es que hoy, a las 19h CEST, conozcamos GPT-5. Y esperamos que no sea un salto incremental, sino un golpe en la mesa para que se vea que OpenAI sigue llevando la delantera.
Porque además, el martes pasado, lanzaron sus modelos open source (¡por fin algo open de OpenAI!). Parecían modelos muy potentes, pero ahora que han pasado un par de días y la gente los has podido poner en benchmarks, no son tan tops como parecían.
Todo esto y más, lo comentaremos mañana a las 9h CEST en el Café con Codely. Puedes seguirlo en YouTube o Twitch.
💥 Novedades de ManagerPro
Esta semana, en la newsletter de ManagerPro hemos publicado un post sobre cómo conseguir aumentar en número de personas de tu equipo. Algo que suele ser bastante complicado ya que la respuesta por defecto suele ser un no.
También hemos acabado de publicar el curso de Gestión de conflictos: Errores comunes. Un curso donde aprenderás a reconocer los errores más frecuentes en la gestión de conflictos para poder evitarlos. Todo con ejemplos reales y situaciones simuladas.
Puedes darte de alta en ManagerPro desde aquí. 😊
Y ya que has llegado hasta esta parte de la newsletter, te dejo aquí el chiste de la semana, qué sé que lo estabas esperando:
> ¿Pero qué haces tirando esos portátiles al río? – ¡Pero mira como beben los PCs en el rio!. 😂
¡Un saludo!