MOSAIC
El primer clasificador que aprende de tu estructura de carpetas y clasifica documentos largos donde los sistemas actuales fallan. Sin etiquetado manual. Sin esquemas predefinidos.
El problema que nadie resolvió
Existe una clase de documentos que ningún sistema actual clasifica bien: aquellos donde el tipo no puede determinarse en la primera página. El sello discriminativo está repartido a lo largo del documento — en la cláusula 7, en el artículo 18, en la combinación de obligaciones que aparece recién en la página 12.
Un lector que solo ve el inicio falla. Un lector que ve las primeras ocho páginas también falla. Los sistemas actuales alcanzan entre 40% y 73% en este tipo de documentos. MOSAIC alcanza 92.2%.
Cómo funciona
MOSAIC aplica un enfoque propietario de reducción progresiva de hipótesis. En lugar de clasificar el documento contra todos los tipos posibles de una vez, el sistema elimina candidatos progresivamente usando observadores especializados de coste creciente — hasta que la decisión se vuelve trivial.
Por qué es diferente
Aprende de tus carpetas
No requiere etiquetar documentos uno a uno, ni esquemas del vendor. MOSAIC destila el conocimiento tácito que ya existe en tu estructura de directorios — la clasificación que un experto perfeccionó durante años de práctica operativa.
Honestidad epistémica
Cuando la evidencia es insuficiente, MOSAIC declara el documento ambiguo en lugar de forzar una clasificación con baja confianza. En entornos regulados, una señal de revisión humana vale más que una clasificación incorrecta presentada con seguridad.
Decisiones auditables
Cada clasificación cita la evidencia concreta: qué paso la resolvió, qué fragmento del documento fue determinante y con qué nivel de confianza. No una distribución de probabilidad anónima — una justificación trazable para auditoría.
Nuevos tipos en días
Agregar un tipo de documento no requiere reentrenar el pipeline completo. Basta crear una carpeta con ejemplos representativos. Los competidores requieren semanas o meses de reentrenamiento.
Detecta errores de archivado
MOSAIC detecta automáticamente documentos mal archivados y los marca para corrección, mejorando el orden documental como subproducto del despliegue.
Costo proporcional a la dificultad
Los documentos fáciles se resuelven gratis en menos de 1ms. Solo los genuinamente difíciles escalan a pasos costosos. Costo promedio en producción: $0.000056.
Comparativa de clasificadores
MOSAIC es un clasificador de documentos, no un sistema OCR. Evaluado sobre corpus real AEAT-Legal: 2,037 documentos tributarios en español, 14 tipos, 96.6% de documentos difíciles.
| Clasificador | Accuracy Global | Docs Difíciles | Latencia | Auditable | Admite Incertidumbre | Nuevo Tipo |
|---|---|---|---|---|---|---|
| Regex puro | ~65% | ~35% | <10ms | SÍ | NO | Días |
| Clasificador de ventana corta | 90.0% | 91.3% | 93ms | NO | NO | Meses |
| Clasificador de ventana larga | ~87% | ~87% | 350ms | NO | NO | Meses |
| Ensemble concatenado | ~87% | ~85% | 380ms | NO | NO | Meses |
| LLM directo (sin reducción) | ~83% | 58.0% | >3s | ~ | NO | Días |
| MOSAIC | 91.25% | 92.2% | 1.1ms | SÍ | SÍ | Días |
“El único clasificador que simultáneamente resuelve documentos de señal distribuida con alta precisión, justifica cada decisión citando evidencia del texto, admite incertidumbre cuando no puede determinar el tipo, y es robusto al ruido de archivado del mundo real.”
Casos de uso
Despachos tributarios y jurídicos
Clasificación automática de expedientes, contratos y escrituras notariales donde la tipología emerge de cláusulas distribuidas a lo largo del documento, no del encabezado.
Procesamiento de documentación crediticia
Pólizas, contratos de préstamo, informes de tasación. Documentos donde el tipo de producto financiero aparece en la combinación de cláusulas, no en el inicio.
Gestión documental de procedimientos
Cualquier organismo con documentos organizados en carpetas por tipo puede desplegar MOSAIC sin etiquetado previo — solo con su estructura de archivos existente.
¿Listo para clasificar documentos con precisión real?
Implanta MOSAIC sobre tu estructura de carpetas existente y obtén resultados desde el primer día, sin etiquetado, sin integraciones complejas y con un coste por documento casi imperceptible.