Logo XGen-AI Smart Documents SL
Clasificador de Documentos

MOSAIC

El primer clasificador que aprende de tu estructura de carpetas y clasifica documentos largos donde los sistemas actuales fallan. Sin etiquetado manual. Sin esquemas predefinidos.

91.25%Accuracy GlobalCorpus real AEAT-Legal
92.2%Accuracy DAICDocs de señal distribuida
1.1msLatencia Mediana74.7% resuelto sin IA
0Docs AnotadosSolo carpetas existentes

El problema que nadie resolvió

Existe una clase de documentos que ningún sistema actual clasifica bien: aquellos donde el tipo no puede determinarse en la primera página. El sello discriminativo está repartido a lo largo del documento — en la cláusula 7, en el artículo 18, en la combinación de obligaciones que aparece recién en la página 12.

Un lector que solo ve el inicio falla. Un lector que ve las primeras ocho páginas también falla. Los sistemas actuales alcanzan entre 40% y 73% en este tipo de documentos. MOSAIC alcanza 92.2%.

Cómo funciona

MOSAIC aplica un enfoque propietario de reducción progresiva de hipótesis. En lugar de clasificar el documento contra todos los tipos posibles de una vez, el sistema elimina candidatos progresivamente usando observadores especializados de coste creciente — hasta que la decisión se vuelve trivial.

74.7%de documentos se resuelven en menos de 1ms, sin coste de API
5%requieren razonamiento profundo — solo sobre ~2 candidatos finales, no sobre todo el espacio de tipos
$0.000056coste efectivo por documento en producción real

Por qué es diferente

#

Aprende de tus carpetas

No requiere etiquetar documentos uno a uno, ni esquemas del vendor. MOSAIC destila el conocimiento tácito que ya existe en tu estructura de directorios — la clasificación que un experto perfeccionó durante años de práctica operativa.

~

Honestidad epistémica

Cuando la evidencia es insuficiente, MOSAIC declara el documento ambiguo en lugar de forzar una clasificación con baja confianza. En entornos regulados, una señal de revisión humana vale más que una clasificación incorrecta presentada con seguridad.

Decisiones auditables

Cada clasificación cita la evidencia concreta: qué paso la resolvió, qué fragmento del documento fue determinante y con qué nivel de confianza. No una distribución de probabilidad anónima — una justificación trazable para auditoría.

+

Nuevos tipos en días

Agregar un tipo de documento no requiere reentrenar el pipeline completo. Basta crear una carpeta con ejemplos representativos. Los competidores requieren semanas o meses de reentrenamiento.

x

Detecta errores de archivado

MOSAIC detecta automáticamente documentos mal archivados y los marca para corrección, mejorando el orden documental como subproducto del despliegue.

o

Costo proporcional a la dificultad

Los documentos fáciles se resuelven gratis en menos de 1ms. Solo los genuinamente difíciles escalan a pasos costosos. Costo promedio en producción: $0.000056.

Comparativa de clasificadores

MOSAIC es un clasificador de documentos, no un sistema OCR. Evaluado sobre corpus real AEAT-Legal: 2,037 documentos tributarios en español, 14 tipos, 96.6% de documentos difíciles.

ClasificadorAccuracy GlobalDocs DifícilesLatenciaAuditableAdmite IncertidumbreNuevo Tipo
Regex puro~65%~35%<10msNODías
Clasificador de ventana corta90.0%91.3%93msNONOMeses
Clasificador de ventana larga~87%~87%350msNONOMeses
Ensemble concatenado~87%~85%380msNONOMeses
LLM directo (sin reducción)~83%58.0%>3s~NODías
MOSAIC91.25%92.2%1.1msDías

El único clasificador que simultáneamente resuelve documentos de señal distribuida con alta precisión, justifica cada decisión citando evidencia del texto, admite incertidumbre cuando no puede determinar el tipo, y es robusto al ruido de archivado del mundo real.

Casos de uso

Legal / Fiscal

Despachos tributarios y jurídicos

Clasificación automática de expedientes, contratos y escrituras notariales donde la tipología emerge de cláusulas distribuidas a lo largo del documento, no del encabezado.

Banca y Seguros

Procesamiento de documentación crediticia

Pólizas, contratos de préstamo, informes de tasación. Documentos donde el tipo de producto financiero aparece en la combinación de cláusulas, no en el inicio.

Administración Pública

Gestión documental de procedimientos

Cualquier organismo con documentos organizados en carpetas por tipo puede desplegar MOSAIC sin etiquetado previo — solo con su estructura de archivos existente.

¿Listo para clasificar documentos con precisión real?

Implanta MOSAIC sobre tu estructura de carpetas existente y obtén resultados desde el primer día, sin etiquetado, sin integraciones complejas y con un coste por documento casi imperceptible.