Detección semántica de tickets

Detectando duplicados.
Eliminando ruido.

DetecTicket usa embeddings de lenguaje y ángulo del coseno para identificar tickets duplicados y relacionados en tu base de datos, sin reglas manuales.

0Dimensiones
0Idiomas
0On-premise
O(n²)Comparaciones
Agencia & Tecnología

Construido sobre vectores,
no promesas.

Los equipos de soporte reciben cientos de tickets por semana. Muchos describen el mismo problema con palabras distintas. DetecTicket convierte cada descripción en un punto del espacio vectorial y mide el ángulo entre ellos: cuanto menor el ángulo, mayor la similitud semántica.

Sin reglas frágiles, sin diccionarios, sin sinónimos hardcodeados. Solo geometría del lenguaje.

θángulo
Nuestros Principios

¿Por qué DetecTicket?

01 /
Vectores, no reglas

Cada ticket se convierte en un vector de 384 dimensiones. La similitud emerge de la geometría del lenguaje, no de listas de palabras clave ni expresiones regulares.

02 /
Multilingüe por diseño

El modelo paraphrase-multilingual-MiniLM-L12-v2 fue entrenado en 50+ idiomas. Detecta duplicados en español, inglés, y más sin configuración adicional.

03 /
Umbrales ajustables

Los ángulos de corte para "duplicado", "relacionado" y "diferente" son parámetros en base de datos. Se calibran en tiempo real desde el panel de configuración.

04 /
Sin dependencias de la nube

El modelo de embeddings corre completamente en el servidor Node.js con @xenova/transformers. Sin APIs externas, sin costos por token, sin latencia de red.

El Proceso

¿Cómo funciona?

Cuatro pasos desde el texto hasta el resultado — todo en el servidor, sin APIs externas.

01
Ingresa tus tickets

Escribe manualmente o selecciona tickets guardados en la base de datos.

02
Embedding semántico

Cada ticket se transforma en un vector de 384 dimensiones con MiniLM-L12-v2.

03
Ángulo del coseno

Se calcula θ = arccos(⟨u,v⟩ / ‖u‖·‖v‖) para cada par posible.

04
Clasificación por umbral

El ángulo determina si el par es Duplicado, Relacionado o Diferente.

La Fórmula

Similitud
geométrica.

El ángulo entre dos vectores de embedding captura la similitud semántica con una sola operación. Un ángulo θ cercano a 0° indica tickets prácticamente idénticos; cercano a 90° indica temas completamente distintos.

La similitud porcentual se calcula como (1 − θ/(π/2)) × 100%, convirtiendo el ángulo en un porcentaje intuitivo.

Ángulo del Coseno
θ=arccos(
⟨u, v⟩
‖u‖ · ‖v‖
)
Stack Tecnológico

Construido con las herramientas de hoy.

MiniLM-L12-v2

Modelo multilingüe de embeddings de oraciones. 384 dimensiones, rápido y preciso en español.

ML / NLP
Node.js + Express

Backend en ESM con pool de conexiones MySQL, caché de embeddings y API REST.

Backend
React + Vite

Frontend SPA con CSS Modules, React Router y componentes de visualización de resultados.

Frontend
MySQL (Railway)

Base de datos relacional con tablas para tickets, comparaciones, sesiones y configuración.

Base de datos
Ángulo del coseno

Fórmula θ = arccos(⟨u,v⟩ / ‖u‖·‖v‖). Similitud = (1 − θ/(π/2)) × 100%.

Matemática
Umbrales calibrados

Thresholds 0.95 rad (duplicado) y 1.20 rad (relacionado) calibrados para texto en español.

Config

Empieza a detectar
duplicados ahora.

Abre la app, agrega tus tickets y obtén resultados en segundos. Sin configuración, sin registro.

Abrir DetecTicket →