Convierte conversaciones sensibles en
modelos de IA entrenados — sin el riesgo
UNCASE es un framework open-source que transforma conocimiento experto en datos sintéticos seguros, los enruta a cualquier proveedor LLM y produce adaptadores LoRA listos — todo con cero exposición de PII, trazabilidad completa y cumplimiento integrado.
El Problema
Míralo en Acción — Elige Tu Industria
Cada demo lanza un sandbox aislado en vivo con seeds precargados para una industria específica. Explora la API, inspecciona las estructuras de seeds y genera conversaciones de ejemplo — sin instalar nada.
Ventas Automotrices
Conversaciones de ventas de vehículos — precios, pruebas de manejo, financiamiento e intercambios.
Consulta Médica
Diálogos paciente-doctor — síntomas, diagnóstico, planes de tratamiento y seguimiento.
Asesoría Legal
Conversaciones abogado-cliente — revisión de casos, opciones legales y cumplimiento normativo.
Asesoría Financiera
Sesiones de asesoría financiera — revisión de portafolio, evaluación de riesgo y planificación.
Soporte Industrial
Soporte técnico para manufactura — diagnósticos, mantenimiento y seguridad.
Tutoría Educativa
Interacciones tutor-estudiante — explicaciones, ejercicios y evaluación de aprendizaje.
Cómo funcionan los demos
Cada sandbox incluye conversaciones seed curadas para demostrar el pipeline de esa industria. Son ejemplos genéricos — no datos reales.
En producción, creas seeds adaptados a tu organización — tus flujos de trabajo, terminología, herramientas y reglas de cumplimiento. Cada seed es parametrizado y versionado.
Los sandboxes de demo se autodestruyen después de 30 minutos. No persisten datos. Cada uno corre en una MicroVM aislada en la nube — completamente separada de entornos de producción.
Cero exposición de PII. Trazabilidad completa. Privacy score = 0.00 en cada conversación generada.
Pipeline
Del Conocimiento Experto al Adaptador LoRA
5 capas. Cero datos reales. Cada paso entrega valor de forma independiente.
Motor de Seeds
Conversaciones reales → eliminación de PII (Presidio + SpaCy) → escaneo adversarial PromptShield (inyección, jailbreak, extracción, tóxico, solicitud de PII) → SeedSchema v1 capturando patrones de razonamiento y reglas del dominio.
Parser y Validador
Importación multi-formato (CSV, JSONL — auto-detecta OpenAI/ShareGPT/UNCASE) → objetos Conversation validados con trazabilidad.
Evaluador de Calidad
9 métricas con gate: ROUGE-L ≥0.65, Factual ≥0.90, TTR ≥0.55, Coherencia ≥0.85, Fidelidad Semántica ≥0.60 (LLM-as-Judge), Drift de Embedding ≥0.40 (similitud coseno), Validez de Tool Calls ≥0.90, Privacy =0.00, Memorización <0.01.
Generador Sintético
Generación paralela con LiteLLM con control de concurrencia por semáforo, reintento inteligente con temperatura escalada, y extracción JSON estructurada — las conversaciones incluyen tool_calls y tool_results.
Pipeline LoRA
Entrenamiento LoRA/QLoRA con DP-SGD (ε ≤8.0) → adaptador de 50-150MB, costo de $15-45 USD.
Motor de Seeds
Conversaciones reales → eliminación de PII (Presidio + SpaCy) → escaneo adversarial PromptShield (inyección, jailbreak, extracción, tóxico, solicitud de PII) → SeedSchema v1 capturando patrones de razonamiento y reglas del dominio.
Flujo de Datos
Transformación Real de Datos
Observa cómo un seed del dominio automotive.sales fluye a través de las 5 capas.
Conocimiento Experto
Arquitectura
Pipeline de 5 Capas. Cero Datos Reales. Control Total.
Del conocimiento experto a adaptadores LoRA listos para producción — cada capa opera de forma independiente, cada paso es auditable, y ningún dato real toca el pipeline.
Las métricas de calidad mejoraron un 32% con optimización de seeds — cero PII detectado en 40K conversaciones sintéticas
Capa 0 — Motor de Seeds
Convierte conversaciones de expertos en estructuras de seeds abstractas — eliminación de PII vía Presidio + SpaCy, protección contra entradas adversariales vía PromptShield, capturando patrones de razonamiento sin datos sensibles.
Diseño Agnóstico al Dominio
El mismo pipeline funciona en salud, finanzas, legal, educación y manufactura — un framework, cualquier industria.
Seed Configuration
Define conversation structure — min/max turns, expected flow, and quality thresholds. Seeds control every aspect of generated data.
Generation Quality
Track quality metrics across synthetic conversation batches — composite scores must pass all six hard gates.
0
Seeds Processed
0
Domains Active
0%
Quality Pass Rate
seed_financiamiento_001
12.5%seed_triage_rural_012
8.3%seed_due_diligence_007
15.1%Multi-Domain Processing
Process seeds across all six industry namespaces simultaneously — each domain carries its own constraints and quality thresholds.
Cumplimiento Regulatorio
GDPR, HIPAA, LFPDPPP, AI Act, CCPA — UNCASE está diseñado para cumplir con todas las principales regulaciones de privacidad simultáneamente. Cada certificación de calidad se ancla criptográficamente en Polygon PoS para auditabilidad a prueba de manipulación.
Capacidades
Todo lo que Necesitas para Desplegar IA Conforme
LLM Gateway, PromptShield, Connector Hub y 106+ endpoints de API — todo construido con privacidad, evaluación semántica y auditabilidad como requisitos no negociables.
Garantía de Cero PII
Detección dual con Presidio NER + patrones regex más escaneo adversarial PromptShield (5 categorías de amenazas: inyección, jailbreak, extracción, tóxico, solicitud de PII). El Privacy Interceptor escanea todo el tráfico LLM en tiempo real. El privacy score debe ser 0.00 — sin excepciones.
Gateway LLM Universal
Enruta solicitudes a cualquier proveedor LLM a través de una sola API. Intercepción de privacidad en cada llamada — modo auditoría, advertencia o bloqueo. Generación consciente del proveedor con claves API cifradas en reposo.
Hub de Conectores
Ingesta conversaciones desde exportaciones de WhatsApp, webhooks, CRMs y fuentes personalizadas. La abstracción BaseConnector facilita agregar nuevos orígenes de datos.
6 Industrias Reguladas
Automotriz, médica, legal, finanzas, industrial, educación — cada una con plantillas de seeds específicas del dominio, umbrales de calidad y reglas de cumplimiento. Extensible a cualquier vertical regulada.
Generación Aumentada con Herramientas
Los seeds definen herramientas invocables (cotizador, simulador_credito, consultas CRM). Las conversaciones sintéticas incluyen tool_calls y tool_results realistas.
Entrenamiento con Privacidad Diferencial
DP-SGD con epsilon ≤ 8.0. Tasa de éxito de ataque de extracción < 1%. Garantías matemáticas de privacidad a lo largo del fine-tuning. Integridad semántica verificada pre-entrenamiento vía EmbeddingDriftMetric y SemanticFidelityMetric.
Trazabilidad Completa
Cada conversación sintética se rastrea hasta su seed de origen vía seed_id. Pista de auditoría completa desde el conocimiento experto hasta el adaptador entrenado — requerido para cumplimiento regulatorio.
10+ Formatos de Chat
Importa y exporta en ChatML, Alpaca, ShareGPT, LLaMA, Mistral, Qwen, OpenAI y más. Parser multi-formato con auto-detección para integración fluida.
106+ Endpoints REST API
Cobertura completa de API en 24 routers: seeds, generación, evaluación, proveedores, conectores, gateway, plantillas, herramientas, importaciones, sandboxes, conocimiento, uso, auditoría, costos, webhooks, pipeline, jobs, organizaciones y monitoreo de salud. Versionado en /api/v1/.
Sandboxes E2B en la Nube
Generación paralela en MicroVMs aisladas — un sandbox por seed, ~2s de arranque. Despliega 20 sandboxes concurrentes para máximo rendimiento. Fallback automático a generación local cuando E2B no está configurado.
Contenedores de Demo Instantáneo
Levanta una instancia UNCASE completamente configurada para cualquier vertical de industria en segundos. Seeds precargados, API corriendo, docs Swagger — se autodestruye después de 5-60 minutos. Cero instalación requerida.
Evaluación Semántica y LLM-as-Judge
9 métricas de calidad incluyendo SemanticFidelityMetric nativo (rúbrica LLM-as-Judge de 4 dimensiones), EmbeddingDriftMetric (similitud coseno con fallback TF-IDF), y ToolCallValidatorMetric. Más evaluación Opik en sandbox para detección de alucinaciones, coherencia GEval y relevancia de respuestas.
Marketplace de Plugins
6 plugins oficiales y 30 herramientas específicas por dominio en todas las industrias. Registro de plugins extensible con ciclo de vida de instalación/desinstalación. Cada dominio tiene 5 herramientas especializadas (cotizador, simulador, CRM, etc.).
Base de Conocimiento
Sube documentos de dominio (hechos, procedimientos, terminología, referencia) con chunking automático del lado del servidor. Búsqueda de texto completo entre chunks. Almacenamiento persistente en PostgreSQL con aislamiento a nivel de organización.
Auditoría y Cumplimiento
Pista de auditoría inmutable para cada acción de API — seeds creados, evaluaciones ejecutadas, modelos entrenados. Políticas de retención de datos con TTLs configurables. Trazabilidad completa de cumplimiento desde seed hasta adaptador.
Seguimiento de Costos LLM
Desgloses de costos por organización y por trabajo a través de todos los proveedores LLM. Estimaciones de precios conscientes del proveedor. Líneas de tiempo de costos diarios y medición de uso con granularidad a nivel de evento.
Stack de Observabilidad
Exportación de métricas Prometheus + dashboards Grafana preconstruidos. Tasa de solicitudes, percentiles de latencia, tasas de error y endpoints principales — todo listo con el perfil de observabilidad de Docker Compose.
Beneficios
Por Qué UNCASE Importa
73% de los proyectos de fine-tuning fracasan por obstáculos de privacidad, calidad o regulación. UNCASE elimina los tres.








Open Source
Gratis y Open Source
No vendemos software. Vendemos una experiencia de instalación a medida, consultoría técnica y preparación para certificaciones regulatorias. El software es y siempre será gratuito.
El framework completo es 100% gratuito — para siempre
- Pipeline SCSF completo de 5 capas
- 106+ endpoints de API REST
- LLM Gateway con interceptor de privacidad
- Conectores de WhatsApp y webhooks
- 6 namespaces de industria
- 10+ formatos de exportación para chat
- Evaluación de calidad (9 métricas incl. semántica y embedding)
- Sandboxes E2B en la nube (tu API key)
- Demos instantáneos por industria
- CLI completo (seed, parse, evaluate, generate, train)
- SDK Python integrado
- Docker Compose con perfiles (ML, GPU, observabilidad)
- Soporte comunitario vía GitHub
Organizaciones
Instalación a medida, consultoría técnica y preparación para certificaciones regulatorias.
$499 USD
Desde + complementos opcionales
- Todo lo de Comunidad incluido
- Instalación y configuración en tu infraestructura
- Creación del namespace de tu industria/dominio
- Ingeniería de seeds con tu equipo de dominio
- Configuración de proveedores LLM y conectores
- Documentación de auditoría para cumplimiento regulatorio
- Sesiones 1:1 de ingeniería de seeds
- Desarrollo de conectores a medida (CRM, EHR, etc.)
- Soporte prioritario con SLA definido
- Revisión de arquitectura y optimización de pipeline
Modalidades de servicio
Implementación Asistida
Proyecto únicoPonemos UNCASE en marcha contigo. Instalación, configuración de tu entorno (Docker, Railway, AWS, on-premise), creación de tu primer namespace con seeds reales de tu dominio, y onboarding hands-on para tu equipo.
Acompañamiento 1:1
Retainer mensualSesiones mensuales de ingeniería de seeds con tu equipo de dominio. Refinamos semillas, calibramos umbrales de calidad, desarrollamos conectores para tus fuentes de datos, y generamos la documentación de cumplimiento que tus reguladores requieren.
A Tu Medida
Alcance personalizadoInfraestructura gestionada, despliegue on-premise, integración de proveedores LLM privados, o horas de ingeniería dedicadas. Diseñamos el alcance según lo que tu organización necesita.
Nuestros precios se ajustan automáticamente según tu ubicación usando paridad de poder adquisitivo, para que equipos en todas partes puedan acceder a los servicios de UNCASE a un precio justo.
No vendemos software — vendemos una experiencia de instalación a medida, consultoría técnica y preparación para certificaciones regulatorias. El framework siempre será gratuito.
¿Tu industria no está regulada o no tienes restricciones de privacidad? Prueba Astrapp
FAQ
Preguntas frecuentes
Preguntas comunes sobre UNCASE, el pipeline SCSF y la generación de datos sintéticos con privacidad primero.
Roadmap
The Journey That Shaped Us
From a small home setup to building solutions for global clients, our journey reflects passion, persistence, and continuous growth. Every milestone has shaped who we are today.
Fundación del Proyecto
Arquitectura del repositorio, diseño de SeedSchema v1, y el whitepaper técnico estableciendo la metodología SCSF (Synthetic Conversational Seed Framework).
Capas 0-1: Motor de Seeds y Parser
Motor de Seeds con eliminación de PII via Presidio + SpaCy. Parser multi-formato soportando CSV, JSONL con auto-detección de formatos OpenAI, ShareGPT y UNCASE.
Capas 2-3: Evaluador y Generador
Sistema inicial de evaluación de calidad con 6 gates (ROUGE-L, Fidelidad Factual, TTR, Coherencia, Privacidad, Memorización) — luego expandido a 9 métricas. Generación sintética con LiteLLM con tool_calls y tool_results.
Capa 4 + API REST Completa
Fine-tuning LoRA/QLoRA con garantías de privacidad DP-SGD. API REST completa cubriendo todo el pipeline. Despliegue Docker Compose con PostgreSQL y MLflow.
LLM Gateway y Hub de Conectores
Gateway LLM Universal con intercepción de privacidad en todo el tráfico. Provider Registry con claves API cifradas con Fernet. Conectores WhatsApp y webhook. Privacy Interceptor con modos auditoría/advertencia/bloqueo. Dashboard UI.
Sandboxes Paralelos y Demos Instantáneos
Generación paralela con MicroVMs E2B — un sandbox por seed, hasta 20 concurrentes. Contenedores de demo instantáneo para 6 verticales de industria. Sandboxes de evaluación Opik LLM-as-judge. Streaming SSE en tiempo real. Exportación de artefactos antes de auto-destrucción.
Marketplace de Plugins y Persistencia de Conocimiento
Registro de plugins con 6 plugins oficiales y 30 herramientas específicas por dominio. Base de conocimiento con chunking del lado del servidor y búsqueda de texto completo. Medición de uso en todos los endpoints. Sistema de entrega de webhooks con payloads firmados con HMAC.
Auditoría, Costos y Observabilidad
Logging de auditoría inmutable con pista de cumplimiento. Seguimiento de costos LLM por organización y trabajo. Políticas de retención de datos. Stack de observabilidad Prometheus + Grafana. 1,160+ tests al 73% de cobertura en 24 routers API.
Calidad Semántica y Defensa Adversarial
SemanticFidelityMetric (LLM-as-Judge con rúbrica de 4 dimensiones), EmbeddingDriftMetric (similitud coseno con fallback TF-IDF), ToolCallValidatorMetric — expandiendo gates de calidad de 6 a 9. Escaner adversarial PromptShield con 5 categorías de amenazas. Orquestador de pipeline paralelo con concurrencia por semáforo. Reintento inteligente con temperatura escalada.
Certificación de Calidad On-Chain
Hashing criptográfico de evaluaciones de calidad de Capa 2 anclado en un ledger blockchain público. Cada certificación de calidad — las 9 métricas, score compuesto, linaje del seed y timestamp — se hashea en un árbol Merkle y su raíz se publica on-chain. Prueba a prueba de manipulación, verificable independientemente, de que la evaluación se realizó con resultados específicos en un momento específico. Ningún regulador o auditor necesita confiar en UNCASE — verifican on-chain.
SDK, Servidor MCP y Lanzamiento Público
SDK Python para acceso programático. Servidor MCP (Model Context Protocol) para integración con IDEs. Plantillas de seeds específicas por dominio para las 6 industrias. Parser avanzado de WhatsApp y conector CRM. Lanzamiento público de la plataforma UNCASE completa con documentación completa, guías de onboarding y despliegue listo para producción.
PyPI, Hub Comunitario y Plataforma SaaS
Paquete PyPI con extras opcionales (ml, privacy, all). Fórmula Homebrew. Marketplace comunitario de seeds para plantillas de dominio compartidas. Plataforma SaaS multi-tenant con infraestructura gestionada, RBAC, autenticación JWT, integración de facturación y niveles de precios basados en uso. Documentación para desarrollo de plugins de terceros y guías para contribuidores.
Comienza a Construir IA Privacy-First Hoy
Despliega el pipeline completo, conecta tus fuentes de datos, enruta a cualquier proveedor LLM y produce adaptadores LoRA conformes — todo sin exponer un solo dato.
