Presentando Citai: el motor RAG que construí en 6 artículos — y que ahora podés probar gratis
Durante los últimos 6 artículos compartí cómo construí cada pieza de un motor RAG de producción:...
Full article excerpt tap to expand
try { if(localStorage) { let currentUser = localStorage.getItem('current_user'); if (currentUser) { currentUser = JSON.parse(currentUser); if (currentUser.id === 1593262) { document.getElementById('article-show-container').classList.add('current-user-is-article-author'); } } } } catch (e) { console.error(e); } Martin Palopoli Posted on Apr 28 Presentando Citai: el motor RAG que construí en 6 artículos — y que ahora podés probar gratis #ai #python #rag #showdev Durante los últimos 6 artículos compartí cómo construí cada pieza de un motor RAG de producción: búsqueda híbrida, cross-encoder reranking, streaming SSE, multi-tenancy, cache semántico y detección de idioma. Hoy presento el producto terminado: Citai (cite + AI) — un motor de conocimiento con citación verificable que cualquiera puede probar gratis en citai.ai. La serie completa Si llegás a este artículo primero, acá está todo lo que construí y documenté: Pipeline RAG — búsqueda híbrida (pgvector + BM25), cross-encoder reranking, MMR diversity Deploy en producción — Docker multi-stage, Nginx, DigitalOcean, zero-downtime deploys Multi-tenancy — planes, cuotas atómicas, rate limiting con Redis, aislamiento de datos Streaming SSE — desde el LLM hasta el navegador pasando por Nginx, protocolo custom de 10 eventos Cache semántico + FAQ — 3 capas de ahorro que reducen ~40% el costo de LLM Detección de idioma — heurística ES/EN/PT sin APIs externas, reglas de contenido Cada artículo tiene código real del proyecto. Nada inventado para el tutorial. Qué es Citai Citai = cite + AI. Un motor de conocimiento donde cada respuesta cita la fuente exacta (página, documento, párrafo). La idea nació de una frustración: los chatbots corporativos que dicen "según nuestros documentos..." pero nunca te muestran dónde. No podés verificar nada. No podés confiar. Citai resuelve eso: subís tus documentos (PDF, DOCX, TXT, o URLs), el sistema los procesa, y cuando alguien pregunta, la respuesta viene con la referencia exacta. Si dice "ver página 15 del manual", podés ir a la página 15 y verificar. Para quién es Empresas con documentación interna: manuales, políticas, procedimientos que nadie lee Equipos de soporte: base de conocimiento que responde antes que el humano Educación: material de estudio con respuestas verificables Salud y legal: donde citar la fuente no es opcional, es obligatorio Cualquier caso donde la respuesta sin fuente no alcanza. Lo que incluye (y que ya mostré cómo funciona) Búsqueda híbrida de 3 etapas Lo que describí en el artículo #1 es exactamente lo que corre en producción: Query → Vector (pgvector) + BM25 (tsvector) → RRF merge (70/30) → Cross-encoder rerank → MMR diversity (λ=0.6) → Top 5-10 fuentes con citación exacta Enter fullscreen mode Exit fullscreen mode No es "cosine similarity y listo". Es un pipeline completo con reranking que mejora la relevancia un 25-40% sobre búsqueda vectorial pura. Confianza calibrada Cada respuesta tiene un score de confianza (0-100%) basado en los scores del cross-encoder. Si la confianza es baja, el sistema lo dice. No inventa. "No encontré información suficiente en la documentación disponible para responder con certeza." Enter fullscreen mode Exit fullscreen mode Eso es más valioso que una respuesta inventada con tono seguro. Widget embebible Una línea de código: <script src="https://citai.ai/widget.js" data-api-key="sk-..." data-base-url="https://citai.ai" ></script> Enter fullscreen mode Exit fullscreen mode Shadow DOM (no contamina tus…
This excerpt is published under fair use for community discussion. Read the full article at DEV Community.