Detectando duplicados.
Eliminando ruido.
DetecTicket usa embeddings de lenguaje y ángulo del coseno para identificar tickets duplicados y relacionados en tu base de datos, sin reglas manuales.
Construido sobre vectores,
no promesas.
Los equipos de soporte reciben cientos de tickets por semana. Muchos describen el mismo problema con palabras distintas. DetecTicket convierte cada descripción en un punto del espacio vectorial y mide el ángulo entre ellos: cuanto menor el ángulo, mayor la similitud semántica.
Sin reglas frágiles, sin diccionarios, sin sinónimos hardcodeados. Solo geometría del lenguaje.
¿Por qué DetecTicket?
Cada ticket se convierte en un vector de 384 dimensiones. La similitud emerge de la geometría del lenguaje, no de listas de palabras clave ni expresiones regulares.
El modelo paraphrase-multilingual-MiniLM-L12-v2 fue entrenado en 50+ idiomas. Detecta duplicados en español, inglés, y más sin configuración adicional.
Los ángulos de corte para "duplicado", "relacionado" y "diferente" son parámetros en base de datos. Se calibran en tiempo real desde el panel de configuración.
El modelo de embeddings corre completamente en el servidor Node.js con @xenova/transformers. Sin APIs externas, sin costos por token, sin latencia de red.
¿Cómo funciona?
Cuatro pasos desde el texto hasta el resultado — todo en el servidor, sin APIs externas.
Escribe manualmente o selecciona tickets guardados en la base de datos.
Cada ticket se transforma en un vector de 384 dimensiones con MiniLM-L12-v2.
Se calcula θ = arccos(⟨u,v⟩ / ‖u‖·‖v‖) para cada par posible.
El ángulo determina si el par es Duplicado, Relacionado o Diferente.
Similitud
geométrica.
El ángulo entre dos vectores de embedding captura la similitud semántica con una sola operación. Un ángulo θ cercano a 0° indica tickets prácticamente idénticos; cercano a 90° indica temas completamente distintos.
La similitud porcentual se calcula como (1 − θ/(π/2)) × 100%, convirtiendo el ángulo en un porcentaje intuitivo.
Construido con las herramientas de hoy.
Modelo multilingüe de embeddings de oraciones. 384 dimensiones, rápido y preciso en español.
ML / NLPBackend en ESM con pool de conexiones MySQL, caché de embeddings y API REST.
BackendFrontend SPA con CSS Modules, React Router y componentes de visualización de resultados.
FrontendBase de datos relacional con tablas para tickets, comparaciones, sesiones y configuración.
Base de datosFórmula θ = arccos(⟨u,v⟩ / ‖u‖·‖v‖). Similitud = (1 − θ/(π/2)) × 100%.
MatemáticaThresholds 0.95 rad (duplicado) y 1.20 rad (relacionado) calibrados para texto en español.
ConfigEmpieza a detectar
duplicados ahora.
Abre la app, agrega tus tickets y obtén resultados en segundos. Sin configuración, sin registro.
Abrir DetecTicket →