Sistema automatizado de sanciones y aplicación de infracciones

Introducción

El Sistema Automatizado de Sanciones representa el motor de aplicación de normas que transforma la detección de infracciones en acciones concretas de moderación, proporcionando consecuencias coherentes, proporcionales y progresivas para las infracciones de las reglas sin requerir la intervención manual constante de los administradores. Este sistema sofisticado analiza la gravedad de cada infracción, realiza un seguimiento del historial acumulado de sanciones, calcula duraciones adecuadas para las restricciones y aplica automáticamente silenciamientos temporales que impiden que los reincidentes continúen con comportamientos disruptivos.

A diferencia de los enfoques simples de moderación binaria, que o bien expulsan permanentemente a los usuarios o no hacen nada, el sistema automatizado de sanciones implementa una aplicación gradual de las normas que distingue entre niveles de gravedad, reconoce a los reincidentes y aplica restricciones proporcionales a la falta. Un usuario que publica contenido limítrofe una sola vez recibe una consecuencia mínima, mientras que los usuarios que infringen repetidamente reglas graves se enfrentan a restricciones cada vez más estrictas que proporcionan señales claras de corrección de conducta sin recurrir de inmediato a expulsiones permanentes.

El sistema funciona de forma totalmente automática una vez configuradas las reglas, ejecutando acciones de aplicación de normas en cuestión de milisegundos tras detectar infracciones. Cada sanción se registra con total transparencia, lo que permite a los administradores auditar decisiones, revisar patrones de infracción y verificar que la aplicación de normas se ajusta a los estándares de la comunidad. La combinación de automatización (gestionar las infracciones rutinarias de forma coherente) y transparencia (permitir la supervisión humana de los casos límite) crea una moderación que es a la vez eficiente y responsable.

Cómo funciona

Detección y clasificación de infracciones

Cuando cualquier sistema de análisis de contenido (detección NSFW, análisis de sentimiento, detección de spam, aplicación de idioma, filtro de malas palabras, reglas de contenido prohibido) identifica una infracción, genera un informe de infracción que contiene el tipo de infracción, la puntuación de confianza, el motivo detallado y la marca de tiempo. Este informe se envía de inmediato al motor de decisiones (microservicio telegram_decision), que determina la medida de aplicación adecuada.

El motor de decisiones primero clasifica la infracción en categorías de gravedad según el tipo:

Gravedad alta (restricción base de 30 minutos):

Contenido pornográfico (confianza de detección NSFW ≥ umbral)

Gravedad media-alta (restricción base de 15 minutos):

Contenido sexual o subido de tono (detección NSFW por debajo del umbral pornográfico, pero por encima del umbral de contenido subido de tono)

Gravedad media (restricción base de 5 minutos):

Lenguaje tóxico (análisis de sentimiento: toxicidad)
Amenazas (análisis de sentimiento: detección de amenazas)
Contenido spam (detección de patrones de spam)
Publicación de enlaces de invitación (contenido prohibido: enlaces de invitación)
Adición de bots no autorizados (contenido prohibido: otros bots)

Gravedad baja (restricción base de 1 minuto):

Palabrotas (análisis de sentimiento: detección de palabrotas)
Insultos (análisis de sentimiento: detección de insultos)
Infracciones de idioma (aplicación de idioma)
Coincidencias del filtro de malas palabras (lista personalizada de malas palabras)
Mensajes reenviados (contenido prohibido: reenvíos)
Tipos de medios prohibidos (vídeos, GIFs, audio, archivos, texto)

Esta clasificación garantiza que la duración del castigo refleje la gravedad de la infracción: publicar pornografía recibe una restricción 30 veces más larga que usar palabrotas, representando con precisión la seriedad relativa de las infracciones.

Cálculo del castigo acumulativo

El sistema no se limita a aplicar duraciones base de forma aislada. En su lugar, registra el historial acumulado de castigos de cada usuario y aumenta las restricciones para los reincidentes. Cuando ocurre una nueva infracción, el motor de decisiones:

Recupera el tiempo total de castigo del usuario en todas las infracciones anteriores
Calcula la nueva duración del castigo como: new_duration = base_duration + (cumulative_past_duration * escalation_factor)
Añade la nueva infracción al historial permanente del usuario
Aplica la restricción calculada

Por ejemplo, la primera infracción por palabrotas de un usuario podría recibir una restricción de 1 minuto (duración base). Si vuelve a infringir las normas cuando ya tiene 1 minuto de castigo acumulado, la segunda infracción recibe aproximadamente 1,5 minutos. Una tercera infracción con 2,5 minutos acumulados recibe aproximadamente 2 minutos. La duración del castigo aumenta con cada infracción, proporcionando señales de corrección de conducta cada vez más fuertes.

Este enfoque acumulativo reconoce que los errores aislados merecen un trato indulgente, mientras que el incumplimiento persistente de las normas requiere una intervención más firme. Los usuarios que infringen las normas de forma reiterada acaban enfrentándose a restricciones de 15 a 30 minutos incluso por infracciones de baja gravedad, lo que hace que seguir infringiendo las normas sea cada vez más costoso en términos de capacidad de participación.

Aplicación automática de restricciones

Una vez calculada la duración del castigo, el sistema aplica de inmediato una restricción de Telegram al usuario en el grupo afectado. La restricción impide que el usuario:

Envíe mensajes
Envíe archivos multimedia
Envíe stickers y GIFs
Envíe encuestas
Añada vistas previas de páginas web
Cambie la información del chat

El usuario permanece en el grupo y puede ver los mensajes, pero no puede participar hasta que expire la restricción. Este enfoque de "tiempo fuera" proporciona corrección de conducta sin la permanencia de una expulsión: los usuarios reciben una señal clara de que su comportamiento fue inaceptable, conservando la oportunidad de volver y participar de forma adecuada.

La restricción tiene una duración limitada y expira automáticamente sin requerir la intervención de un administrador. Cuando transcurre la duración del castigo, Telegram elimina automáticamente la restricción del usuario, permitiéndole reanudar su participación normal. Esta automatización elimina la necesidad de que los administradores rastreen y levanten restricciones manualmente.

Eliminación de mensajes

Simultáneamente a la aplicación de restricciones, el sistema elimina del chat el mensaje infractor. Esta eliminación inmediata cumple varios propósitos:

Evita que otros miembros vean contenido inapropiado
Detiene la propagación de spam o enlaces maliciosos
Mantiene el ambiente de la comunidad al eliminar contenido disruptivo
Proporciona al infractor una respuesta clara sobre qué fue inaceptable

La eliminación se produce en milisegundos desde la detección de la infracción, minimizando la exposición al contenido problemático. En grupos con mucho tráfico, otros miembros a menudo nunca llegan a ver los mensajes infractores, porque la eliminación ocurre más rápido que los ciclos de actualización de mensajes de la mayoría de los usuarios.

Exención de administradores

El sistema de castigos incluye una protección crítica para administradores que garantiza que los administradores del grupo nunca sean restringidos, independientemente del contenido que publiquen. Antes de aplicar cualquier restricción, el motor de decisiones verifica si el usuario tiene estado de administrador en el grupo.

Si el usuario es administrador, el sistema:

Registra la infracción en las estadísticas (por transparencia)
Elimina el mensaje (si la eliminación está configurada)
NO aplica ninguna restricción ni castigo
Registra la exención de administrador en los registros de infracciones

Esta protección es absoluta: los administradores no pueden silenciarse accidentalmente a sí mismos ni a sus coadministradores mediante el sistema automatizado. La exención reconoce que los administradores deben conservar la capacidad de gestionar sus grupos, incluso si ocasionalmente publican contenido que infringiría las normas para los miembros habituales (por ejemplo, publicar un ejemplo de spam para demostrar qué evitar, compartir capturas de pantalla de infracciones que se están debatiendo, etc.).

Registro de infracciones y transparencia

Cada infracción y castigo se registra permanentemente en registros detallados visibles a través de los paneles de User Intelligence y Group Statistics. Los registros incluyen:

Marca de tiempo exacta de la infracción
Tipo y categoría de la infracción
Puntuación de confianza (para infracciones basadas en detección)
Motivo detallado que explica qué activó la detección
Duración del castigo aplicado
Tiempo de castigo acumulado después de esta infracción
Si el usuario fue realmente restringido (o exento como administrador)

Este registro exhaustivo garantiza total transparencia y responsabilidad. Los administradores pueden revisar exactamente por qué ocurrió cada restricción, verificar que los castigos coincidan con la gravedad de la infracción e identificar patrones en el comportamiento de los miembros que podrían servir para ajustar la estrategia de moderación.

Configuración

Activar los castigos automatizados

El sistema de castigos funciona automáticamente ante cualquier infracción detectada por las funciones habilitadas. No hay interruptores independientes para "activar castigos": el castigo forma parte de la aplicación de las reglas. Sin embargo, la severidad y el comportamiento de los castigos dependen de los ajustes de detección que hayas configurado:

Ve a la página de administración de tu grupo
Ve a las pestañas Configuración > Moderación con AI y Protección básica
Activa las funciones de detección que quieres aplicar:
- Detección de contenido NSFW → Castiga el contenido pornográfico/sexual
- Análisis de sentimiento → Castiga el lenguaje tóxico, las groserías, los insultos y las amenazas
- Detección de patrones de spam → Castiga los mensajes de spam
- Aplicación de idioma → Castiga los mensajes en el idioma incorrecto
- Filtro de malas palabras → Castiga las palabras prohibidas personalizadas
- Reglas de contenido prohibido → Castiga tipos de medios, reenvíos y enlaces de invitación

Cada función habilitada envía las infracciones al sistema de castigos, que aplica automáticamente las restricciones correspondientes.

Ajustar la severidad de los castigos mediante umbrales

Aunque las duraciones base de los castigos están fijadas según el tipo de infracción, puedes influir indirectamente en la frecuencia y severidad de los castigos ajustando los umbrales de detección:

Aplicación más estricta (más castigos):

Un umbral de detección NSFW más bajo (0.60-0.70) detecta más contenido
Un umbral de análisis de sentimiento más bajo (0.60-0.70) detecta más toxicidad
Un umbral de detección de spam más bajo (0.60-0.70) detecta más spam

Aplicación más flexible (menos castigos):

Un umbral NSFW más alto (0.80-0.90) solo detecta infracciones evidentes
Un umbral de sentimiento más alto (0.80-0.90) solo detecta toxicidad clara
Un umbral de spam más alto (0.80-0.90) solo detecta spam evidente

Ajustar el umbral no cambia la duración de los castigos, pero determina con qué frecuencia se activan. Los umbrales más estrictos implican restricciones más frecuentes (incluido contenido dudoso), mientras que los umbrales más flexibles reservan los castigos para infracciones inequívocas.

Modos de solo eliminación

Algunas funciones ofrecen modos de "solo eliminar" que retiran el contenido infractor sin aplicar restricciones de castigo:

Aplicación de idioma:

El interruptor "Modo de solo eliminación" elimina los mensajes en el idioma incorrecto sin castigar a los usuarios
Útil cuando los miembros olvidan de verdad los requisitos de idioma o cometen errores inocentes

Filtro de malas palabras:

La opción "Solo eliminar (sin castigo)" elimina los mensajes que contienen malas palabras sin aplicar restricciones
Adecuado cuando el filtro podría generar falsos positivos o la comunidad prefiere una aplicación más suave

Estos modos mantienen la eliminación del contenido (preservando el ambiente de la comunidad) y evitan restricciones potencialmente severas por infracciones de baja gravedad.

Supervisar la actividad de castigos

Para revisar cómo está funcionando el sistema de castigos:

Ve a la pestaña Estadísticas de tu grupo
Selecciona la subpestaña "Estadísticas del grupo"
Revisa métricas como:
- Total de castigos administrados
- Tiempo total de castigo (en minutos)
- Duración media de los castigos
- Tasa de castigos por cada 1,000 mensajes
- Desglose por tipo de infracción

Estas estadísticas muestran si la frecuencia de los castigos coincide con tus expectativas y si ciertos tipos de infracción dominan la actividad de aplicación.

Escenarios del mundo real

Escenario 1: Aplicación progresiva para un infractor reincidente

Un usuario se une a una comunidad e inmediatamente publica un comentario ligeramente tóxico. El análisis de sentimiento detecta toxicidad con una confianza de 0,73 (por encima del umbral de 0,70), lo que activa una restricción de 5 minutos. El mensaje se elimina y el usuario queda silenciado durante 5 minutos.

Cuando la restricción expira, el usuario publica otro comentario tóxico. Su tiempo de sanción acumulado es ahora de 5 minutos. La nueva infracción recibe aproximadamente 7 minutos de restricción (5 de base + escalamiento basado en los 5 acumulados). El tiempo acumulado total pasa a ser de 12 minutos.

El usuario continúa con un tercer comentario tóxico. Con 12 minutos acumulados, la tercera infracción recibe aproximadamente 10 minutos de restricción. El acumulado total pasa a ser de 22 minutos.

Para la cuarta infracción, el usuario se enfrenta a restricciones de más de 15 minutos por lo que comenzó como faltas de 5 minutos. Las consecuencias crecientes hacen que seguir infringiendo las normas sea cada vez más costoso, lo que ofrece un fuerte incentivo para corregir el comportamiento. Con el tiempo, el usuario adapta su conducta o su clasificación de spam aumenta hasta el punto en que AI Spam Intelligence lo elimina automáticamente.

Escenario 2: Respuesta proporcional a la gravedad

Dos usuarios infringen las normas: el Usuario A publica una grosería límite (baja gravedad), el Usuario B publica contenido pornográfico (alta gravedad). Ninguno tiene infracciones previas.

El Usuario A recibe una restricción de 1 minuto por groserías: un breve tiempo de espera que aporta corrección sin ser excesivamente punitivo para una primera infracción que implica lenguaje leve.

El Usuario B recibe una restricción de 30 minutos por pornografía: un tiempo de espera considerable que refleja la gravedad de publicar contenido sexualmente explícito.

Las sanciones drásticamente diferentes (1 minuto frente a 30 minutos) reflejan niveles de gravedad drásticamente distintos. El sistema reconoce correctamente que no todas las infracciones son iguales y calibra la aplicación de las normas de forma proporcional.

Escenario 3: Protección del administrador

Un administrador de grupo está explicando las normas de la comunidad a los miembros y publica un mensaje de ejemplo que contiene groserías para demostrar qué no está permitido: "Don't post messages like 'this is f***ing stupid' - keep discussions respectful."

El sistema de análisis de sentimiento detecta la grosería en el mensaje de ejemplo y genera un informe de infracción. Sin embargo, el motor de decisiones verifica que el remitente tiene estado de administrador y lo exime de la restricción.

La infracción aparece en las estadísticas (lo que muestra que el sistema de detección está funcionando), pero no se aplica ninguna restricción. El administrador puede seguir explicando las normas sin silenciarse accidentalmente, mientras que el registro garantiza transparencia sobre la exención aplicada.

Escenario 4: Historial acumulado entre tipos de infracción

Un usuario tiene el siguiente historial de infracciones:

Día 1: Groserías (1 min) - acumulado: 1 min
Día 3: Imagen NSFW (30 min) - acumulado: 31 min
Día 5: Mensaje de spam (5 min + escalamiento) - acumulado: 37 min
Día 7: Infracción de idioma (1 min + escalamiento) - acumulado: 40 min

Para el Día 7, incluso una infracción de idioma de baja gravedad recibe una sanción escalada porque el historial acumulado del usuario en todos los tipos de infracción es de 40 minutos. El sistema reconoce que un usuario que infringe reiteradamente varias normas diferentes es un problema persistente, independientemente de los tipos específicos de infracción.

Esta acumulación entre tipos garantiza que los usuarios no puedan eludir el escalamiento diversificando sus infracciones (publicar contenido tóxico, luego spam, luego NSFW, etc. para reiniciar el escalamiento). El sistema de sanciones registra el patrón total de infracciones, no los patrones por categoría individual.

Escenario 5: Modo de solo eliminación para ajuste cultural

Una comunidad internacional quiere mantener el inglés como idioma principal, pero tiene muchos hablantes no nativos que ocasionalmente publican por accidente en sus idiomas nativos. Los administradores quieren aplicar la norma de idioma sin castigar a los miembros por errores honestos.

Activan la aplicación de la norma de idioma con "modo de solo eliminación". Cuando los usuarios publican mensajes que no están en inglés, el contenido se elimina de inmediato (manteniendo el entorno en inglés), pero no se aplica ninguna restricción punitiva (reconociendo que probablemente se trata de errores y no de infracciones malintencionadas).

Los miembros reciben información de que sus mensajes fueron eliminados (lo que enseña la norma de idioma), pero pueden volver a intentarlo inmediatamente en inglés sin esperar a que termine una restricción. Esta aplicación suave de las normas mantiene los estándares al tiempo que se adapta a las curvas de aprendizaje.

Buenas prácticas

Confía en el sistema de escalamiento

Resiste la tentación de intervenir manualmente en el escalamiento de sanciones para usuarios con historiales extensos de infracciones. El escalamiento acumulativo del sistema está diseñado para proporcionar señales de corrección cada vez más firmes: los usuarios que siguen infringiendo las normas después de múltiples sanciones escaladas demuestran que no cambiarán su comportamiento con medidas suaves.

Si un usuario acumula más de 100 minutos de sanción acumulada y sigue infringiendo las normas, ese patrón indica que no le interesa respetar las reglas de la comunidad. En ese punto, considera aplicar una expulsión permanente en lugar de continuar con restricciones automatizadas.

Revisa las exenciones de administradores

Revisa periódicamente las estadísticas de infracciones para ver si los administradores están generando infracciones. Aunque los administradores están exentos de sanciones, las infracciones frecuentes por parte de admins pueden indicar:

El admin está probando los sistemas de detección (esperado y aceptable)
El admin está publicando ejemplos de infracciones con fines educativos (esperado y aceptable)
El admin realmente infringe las reglas con frecuencia (problemático: los admins deben dar ejemplo de buen comportamiento)

Usa los datos de exención para asegurarte de que los administradores mantengan estándares de comportamiento, aunque estén protegidos frente a las sanciones.

Calibra mediante estadísticas

Usa tu panel de Estadísticas del grupo para verificar que la frecuencia de sanciones coincida con tus intenciones:

Si la tasa de sanciones es muy alta (10+ por cada 1K mensajes), considera si los umbrales son demasiado estrictos
Si la tasa de sanciones es muy baja (<1 por cada 1K mensajes), considera si los umbrales son demasiado permisivos
Si predominan tipos específicos de infracción (90%+ de un solo tipo), eso puede indicar una mala calibración del umbral

La calibración basada en datos garantiza que la aplicación de normas se ajuste a las necesidades reales de la comunidad.

Comunica las sanciones a los miembros

Incluye información sobre el sistema automatizado de sanciones en tu mensaje de bienvenida y en la descripción del grupo:

"Este grupo utiliza moderación automatizada. Las infracciones de las reglas de la comunidad conllevan restricciones temporales. Las infracciones repetidas conllevan restricciones cada vez más largas. Los administradores pueden revisar todas las sanciones en caso de disputas."

La transparencia sobre la aplicación automatizada de normas ayuda a los miembros a entender que las restricciones no son ataques personales por parte de los administradores: son consecuencias automáticas de infringir las reglas.

Usa los modos de solo eliminación de forma estratégica

Los modos de solo eliminación tienen sentido para:

Reglas que son preferencias culturales más que límites críticos (requisitos de idioma)
Comunidades con muchos miembros nuevos o en proceso de aprendizaje (aplicación suave)
Infracciones que pueden tener altas tasas de falsos positivos (palabras prohibidas con solapamiento de jerga)

No uses el modo de solo eliminación para infracciones graves (contenido NSFW, amenazas, spam): estas requieren restricciones sancionadoras para crear una corrección de comportamiento significativa.

Vigila el abuso del sistema

Presta atención a usuarios que intenten manipular el sistema de sanciones:

Publicar infracciones justo antes de que expiren las restricciones para evitar el tiempo de espera del escalamiento
Usar varias cuentas para evitar el historial acumulativo de sanciones
Publicar contenido ambiguo que apenas queda por debajo de los umbrales de detección

Aborda los intentos sistemáticos de eludir la aplicación de normas con expulsiones permanentes en lugar de continuar con ciclos de restricciones automatizadas.

Integración con otras funciones

Base para AI Spam Intelligence

Cada sanción contribuye al historial de infracciones del usuario, que alimenta la puntuación de riesgo de AI Spam Intelligence. Los usuarios con un historial amplio de sanciones reciben calificaciones de spam más altas y, cuando esa calificación supera 0,75, AI Spam Intelligence los elimina automáticamente del grupo.

Esto crea una progresión: las sanciones automatizadas gestionan las infracciones rutinarias → los infractores persistentes acumulan historial de sanciones → AI reconoce el patrón → la eliminación automática evita que continúe la interrupción.

Mecanismo de aplicación para todos los sistemas de detección

El sistema de sanciones funciona como el mecanismo de aplicación compartido para todas las funciones de detección. En lugar de que cada función implemente su propia lógica de sanciones, todas alimentan el motor de decisión centralizado, que garantiza una aplicación coherente entre los distintos tipos de infracción.

Esta centralización evita conflictos (varias restricciones simultáneas), garantiza que la escalada funcione entre categorías de infracción y mantiene un registro y una transparencia coherentes.

Elemento disuasorio frente al contenido prohibido

La combinación de eliminación inmediata + restricción hace que infringir las reglas sobre contenido prohibido tenga un coste suficiente como para disuadir las infracciones casuales. Los usuarios aprenden rápidamente que publicar tipos de contenido multimedia restringidos provoca la eliminación inmediata y un tiempo de espera, lo que crea un condicionamiento conductual contra futuras infracciones.

El efecto disuasorio es especialmente fuerte en las infracciones de baja gravedad (restricciones de 1 minuto), que no son lo bastante severas como para generar resentimiento, pero sí lo bastante molestas como para desalentar la repetición.

Fuente de datos para las estadísticas del grupo

Los registros de sanciones crean los datos en bruto que impulsan los análisis de las estadísticas del grupo. Los administradores pueden ver:

Qué tipos de infracción ocurren con mayor frecuencia
Cómo evolucionan las tasas de sanciones con el tiempo
Si ciertos miembros acumulan una proporción desmedida de infracciones
Qué tan eficaz es la aplicación de sanciones para reducir las reincidencias

Esta información orienta la estrategia de moderación y ayuda a identificar áreas en las que la cultura de la comunidad podría necesitar atención más allá de la aplicación automatizada.

Uso avanzado

Comprender las matemáticas de la escalada

La fórmula de escalada sigue aproximadamente: new_duration ≈ base_duration * (1 + (cumulative_minutes / 10))

Esto significa:

0 acumulados → 1x duración base
10 acumulados → ~2x duración base
20 acumulados → ~3x duración base
50 acumulados → ~6x duración base
100 acumulados → ~11x duración base

Los usuarios con historiales de infracciones extremos (más de 100 minutos) se enfrentan a una escalada masiva que hace que incluso las infracciones menores resulten en restricciones de 20 a 30 minutos. Esta progresión garantiza que los infractores persistentes acaben enfrentándose a consecuencias lo bastante severas como para corregir su comportamiento o activar la eliminación de spam por AI.

Identificar anomalías en los patrones de castigo

Presta atención a patrones inusuales en los datos de castigos:

Todas las infracciones provienen de un solo usuario: Podría indicar acoso dirigido o que el usuario realmente no entiende las reglas
Infracciones concentradas en horarios específicos: Podría indicar oleadas de ataques de spam o problemas específicos de una zona horaria
Aumento repentino de un tipo específico de infracción: Podría indicar una configuración incorrecta del umbral de detección o una nueva táctica de spam

Usa estos patrones para ajustar la configuración o investigar causas más profundas, en lugar de limitarte a aceptar las cifras brutas de castigos.

Ajuste temporal de umbrales durante eventos

Considera endurecer temporalmente los umbrales (reducir los valores) durante periodos vulnerables:

Después de añadir el bot a un grupo grande nuevo (mayor riesgo inicial de spam)
Durante oleadas conocidas de campañas de spam
Durante eventos controvertidos que puedan aumentar la tensión

Luego vuelve a relajar los umbrales a la normalidad una vez que pase el periodo de alto riesgo. Este ajuste dinámico proporciona protección adicional cuando es necesario, sin aplicar una moderación excesiva de forma permanente.

Revisión manual de restricciones largas

Cuando un usuario recibe una restricción muy larga (más de 20 minutos), considera revisar manualmente su historial de infracciones para comprobar que la escalada sea adecuada:

Comprueba si el castigo acumulado proviene de muchas infracciones menores o de unas pocas graves
Verifica que las infracciones sean reales y no falsos positivos
Considera si el usuario merece empezar de cero (si tuvo infracciones hace meses, pero su comportamiento reciente ha sido correcto)

Aunque la automatización gestiona correctamente la mayoría de los casos, las restricciones extremadamente largas pueden justificar una verificación humana.

Implementación técnica

El sistema de sanciones funciona a través del microservicio telegram_decision, que recibe informes de infracciones de todos los servicios de detección y determina las acciones de aplicación adecuadas.

Cuando llega una infracción, el servicio de decisión:

Consulta la base de datos para obtener el historial de sanciones del usuario
Suma el tiempo total acumulado de sanción de todas las infracciones anteriores
Calcula la nueva duración de la sanción usando la duración base según la gravedad + la fórmula de escalado
Verifica que el usuario no sea administrador del grupo
Llama a la Telegram API para restringir al usuario durante la duración calculada
Llama a la Telegram API para eliminar el mensaje infractor
Registra la infracción en la base de datos con todos los detalles

La restricción se implementa mediante el método restrictChatMember de la API de Telegram con un parámetro de tiempo de espera. Telegram elimina automáticamente la restricción del usuario cuando vence el tiempo de espera, sin que el bot tenga que realizar ninguna acción de seguimiento.

Todos los registros de infracciones se almacenan con campos de detalles JSONB que conservan el contexto completo de cada infracción, incluidas las puntuaciones de confianza, los motivos de detección, la marca de tiempo, la duración de la sanción y si la restricción se aplicó realmente. Este registro exhaustivo permite realizar análisis históricos detallados y auditorías.

El motor de decisión implementa limitación de frecuencia para evitar el spam de sanciones: si un usuario genera varias infracciones en cuestión de segundos (por ejemplo, al publicar una avalancha de spam), el sistema agrupa las infracciones para evitar aplicar decenas de restricciones simultáneas.

Privacidad y manejo de datos

El sistema de sanciones procesa y registra:

Identificadores de usuario: ID de usuario de Telegram e ID del grupo
Detalles de la infracción: Tipo, confianza, motivo, marca de tiempo
Acciones de sanción: Duración, si se aplicó, totales acumulados
Metadatos del mensaje: No el contenido completo, solo indicadores de infracción

Los registros de infracciones no almacenan el texto completo del mensaje, sino únicamente las infracciones específicas detectadas (por ejemplo, "el análisis de sentimiento detectó toxicidad con una confianza de 0,85" en lugar de almacenar el mensaje tóxico completo). Esto minimiza el impacto en la privacidad a la vez que mantiene la transparencia en la aplicación de normas.

Los registros de sanciones son visibles para los administradores del grupo a través de los paneles de Estadísticas e Inteligencia de usuarios. Los registros no son accesibles públicamente ni se comparten fuera de la interfaz administrativa.

Los usuarios no reciben una notificación directa de sus totales acumulados de sanciones (para evitar que manipulen el sistema), pero pueden deducir la escalada al experimentar restricciones más prolongadas por infracciones repetidas.

Todos los datos de sanciones se conservan permanentemente con fines de análisis y auditoría. Los patrones históricos de infracciones contribuyen a las evaluaciones de riesgo de spam y ayudan a los administradores a comprender las tendencias de comportamiento de los miembros a largo plazo.

Solución de problemas

"Los usuarios reciben restricciones, pero no parece que hayan infringido las reglas"

Posibles causas:

Umbral de detección configurado demasiado bajo (detecta contenido en el límite)
Falso positivo del sistema de detección
Infracción válida que interpretaste de otra manera

Solución: Revisa la infracción específica en el informe de Inteligencia de usuario para ver la puntuación de confianza y el motivo detallado. Si la confianza está en el límite (0.50-0.70), considera aumentar el umbral de detección. Si es claramente un falso positivo, es poco frecuente pero posible; verifica que la configuración de detección sea adecuada para el tipo de tu comunidad.

"Los usuarios se quejan de que las restricciones son demasiado severas"

Posibles causas:

La escalada está funcionando según lo previsto para infractores reincidentes
Las duraciones base pueden no coincidir con las expectativas de la comunidad
Los usuarios no entienden el sistema de aplicación gradual de sanciones

Solución: Explica a los usuarios que las restricciones aumentan con las infracciones repetidas: lo que empieza como 1 minuto se convierte en 5+ minutos para infractores persistentes. Revisa el historial de infracciones del usuario para verificar que la escalada sea adecuada. Considera si tu comunidad preferiría una aplicación de sanciones solo con eliminación para ciertos tipos de infracción.

"Un administrador se silenció accidentalmente a sí mismo"

Posibles causas:

El usuario en realidad no tiene estado de administrador en el grupo de Telegram (solo en el panel del bot)
Error en la detección de administradores (extremadamente raro)

Solución: Verifica que el usuario tenga permisos reales de administrador en la configuración del grupo de Telegram (no solo en el panel del bot). La exención solo se aplica a administradores a nivel de Telegram. Si realmente es administrador y recibió una restricción, se trata de un error; repórtalo para que se investigue.

"Las sanciones no aumentan para los infractores reincidentes"

Posibles causas:

Las infracciones están repartidas en varios grupos (cada grupo se registra por separado)
Se está viendo al usuario equivocado (nombre de usuario similar)
Problema de base de datos que impide el cálculo acumulativo

Solución: La escalada de sanciones es por usuario y por grupo: las infracciones en el Grupo A no aumentan las sanciones en el Grupo B. Verifica que estés viendo el usuario correcto y el grupo correcto. Si un usuario realmente tiene varias infracciones en un grupo sin ninguna escalada, esto indica un fallo del sistema que debe reportarse.

"Las restricciones muy largas (30+ minutos) parecen excesivas"

Posibles causas:

El usuario tiene un historial amplio de infracciones (funciona según lo previsto)
Se produjeron varias infracciones en rápida sucesión (cálculo acumulativo)
Tipo de infracción grave (la pornografía tiene una duración base de 30 minutos)

Solución: Revisa el historial completo de infracciones del usuario para entender su tiempo acumulado de sanción. Los usuarios con más de 100 minutos de historial se enfrentan a una escalada extrema por diseño. Si esto parece inapropiado, considera si el usuario merece empezar de cero o si su patrón indica que, en su lugar, debería ser expulsado permanentemente.

Conclusión

El Sistema de Castigos Automatizados transforma la detección de infracciones en una aplicación efectiva de normas de conducta mediante una escalada inteligente, consecuencias proporcionales a la gravedad y una transparencia integral. Al aplicar automáticamente restricciones que aumentan con las infracciones repetidas, el sistema ofrece una respuesta clara que orienta a los miembros hacia un comportamiento acorde con las reglas, sin requerir una intervención manual constante por parte de los administradores.

El equilibrio entre automatización (gestionar de forma coherente la aplicación rutinaria de las normas) y transparencia (permitir la revisión administrativa de todas las decisiones) crea una moderación tan eficiente como responsable. Los usuarios reciben consecuencias inmediatas por las infracciones, los administradores mantienen una visibilidad total de las medidas aplicadas y los reincidentes se enfrentan a restricciones progresivas que generan fuertes incentivos para corregir su comportamiento.

Combinado con AI Spam Intelligence (que elimina automáticamente a los infractores persistentes) y el registro integral de infracciones (que permite una estrategia de moderación basada en datos), el sistema de castigos crea un ecosistema completo de aplicación de normas que protege a las comunidades y minimiza al mismo tiempo la carga administrativa. Activa hoy las funciones de detección para poner en marcha la aplicación automatizada de castigos y disfrutar de una moderación coherente, proporcional y transparente que escala con el tamaño y la complejidad de tu comunidad.

Enlaces rápidos

Sistema automatizado de sanciones y aplicación de infracciones

Introducción

Cómo funciona

Detección y clasificación de infracciones

Cálculo del castigo acumulativo

Aplicación automática de restricciones

Eliminación de mensajes

Exención de administradores

Registro de infracciones y transparencia

Configuración

Activar los castigos automatizados

Ajustar la severidad de los castigos mediante umbrales

Modos de solo eliminación

Supervisar la actividad de castigos

Escenarios del mundo real

Escenario 1: Aplicación progresiva para un infractor reincidente

Escenario 2: Respuesta proporcional a la gravedad

Escenario 3: Protección del administrador

Escenario 4: Historial acumulado entre tipos de infracción

Escenario 5: Modo de solo eliminación para ajuste cultural

Buenas prácticas

Confía en el sistema de escalamiento

Revisa las exenciones de administradores

Calibra mediante estadísticas

Comunica las sanciones a los miembros

Usa los modos de solo eliminación de forma estratégica

Vigila el abuso del sistema

Integración con otras funciones

Base para AI Spam Intelligence

Mecanismo de aplicación para todos los sistemas de detección

Elemento disuasorio frente al contenido prohibido

Fuente de datos para las estadísticas del grupo

Uso avanzado

Comprender las matemáticas de la escalada

Identificar anomalías en los patrones de castigo

Ajuste temporal de umbrales durante eventos

Revisión manual de restricciones largas

Implementación técnica

Privacidad y manejo de datos

Solución de problemas

"Los usuarios reciben restricciones, pero no parece que hayan infringido las reglas"

"Los usuarios se quejan de que las restricciones son demasiado severas"

"Un administrador se silenció accidentalmente a sí mismo"

"Las sanciones no aumentan para los infractores reincidentes"

"Las restricciones muy largas (30+ minutos) parecen excesivas"

Conclusión

Artículos relacionados

Bloquear bots porno de Telegram: guía del filtro de contenido NSFW

Análisis de sentimiento y detección de toxicidad

Inteligencia de spam con AI y evaluación de riesgo de usuarios