Saltar al contenido
Field Notes28 de marzo de 20261 min read

Los embeddings son una opinión

Una misma frase tiene embeddings distintos según el modelo que los genera.

Una misma frase tiene embeddings distintos según el modelo que los genera.

Una misma frase tiene embeddings distintos según el modelo que los genera. No son representaciones objetivas del significado — son la interpretación estadística de un corpus específico.

Dos modelos de embedding pueden posicionar "el banco del río" y "el banco del dinero" de formas completamente distintas en el espacio vectorial. Uno puede haberlos aprendido principalmente en contextos financieros; el otro, en literatura.

Esto tiene consecuencias directas en retrieval. Tu vector store no almacena "el significado" de tus documentos — almacena la opinión de un modelo sobre cómo representarlos. Cambiar el modelo de embedding invalida todos los vectores existentes.

Implicación práctica: elige el modelo de embedding antes de construir el índice, documenta la decisión, y trata el modelo de embedding como una dependencia crítica del sistema — no como un detalle de implementación.