Sistema de Punição Automatizada e Aplicação de Violações
Introdução
O Sistema Automatizado de Punições representa o mecanismo de aplicação que transforma a detecção de violações em ações concretas de moderação, oferecendo consequências consistentes, proporcionais e progressivas para violações de regras sem exigir intervenção manual constante dos administradores. Esse sistema sofisticado analisa a gravidade de cada violação, acompanha o histórico cumulativo de punições, calcula durações de restrição adequadas e aplica automaticamente silenciamentos temporários que impedem infratores reincidentes de continuar com comportamentos disruptivos.
Ao contrário de abordagens simples de moderação binária, que banem usuários permanentemente ou não fazem nada, o sistema automatizado de punições implementa uma aplicação gradual que distingue níveis de gravidade, identifica infratores reincidentes e aplica restrições proporcionais à infração. Um usuário que publica conteúdo limítrofe uma única vez recebe uma consequência mínima, enquanto usuários que violam repetidamente regras graves enfrentam restrições cada vez mais rígidas, que fornecem sinais claros de correção comportamental sem recorrer imediatamente a banimentos permanentes.
O sistema opera de forma totalmente automática depois que as regras são configuradas, executando ações de aplicação em milissegundos após detectar violações. Cada punição é registrada com total transparência, permitindo que administradores auditem decisões, revisem padrões de violação e verifiquem se a aplicação está alinhada aos padrões da comunidade. A combinação de automação (lidando com violações rotineiras de forma consistente) e transparência (permitindo supervisão humana de casos extremos) cria uma moderação que é ao mesmo tempo eficiente e responsável.
Como funciona
Detecção e classificação de violações
Quando qualquer sistema de análise de conteúdo (detecção de NSFW, análise de sentimento, detecção de spam, aplicação de idioma, filtro de palavrões, regras de conteúdo proibido) identifica uma violação, ele gera um relatório de violação contendo o tipo da violação, a pontuação de confiança, o motivo detalhado e o carimbo de data e hora. Esse relatório é enviado imediatamente ao mecanismo de decisão (microsserviço telegram_decision), que determina a ação de aplicação adequada.
O mecanismo de decisão primeiro classifica a violação em categorias de gravidade com base no tipo:
Alta gravidade (restrição base de 30 minutos):
- Conteúdo pornográfico (confiança da detecção de NSFW ≥ limite)
Gravidade média-alta (restrição base de 15 minutos):
- Conteúdo sexual/sugestivo (detecção de NSFW abaixo do limite de pornografia, mas acima do limite de conteúdo sugestivo)
Gravidade média (restrição base de 5 minutos):
- Linguagem tóxica (análise de sentimento - toxicidade)
- Ameaças (análise de sentimento - detecção de ameaças)
- Conteúdo de spam (detecção de padrões de spam)
- Publicação de links de convite (conteúdo proibido - links de convite)
- Adições de bots não autorizados (conteúdo proibido - outros bots)
Baixa gravidade (restrição base de 1 minuto):
- Palavrões (análise de sentimento - detecção de palavrões)
- Insultos (análise de sentimento - detecção de insultos)
- Violações de idioma (aplicação de idioma)
- Correspondências no filtro de palavrões (lista personalizada de palavrões)
- Mensagens encaminhadas (conteúdo proibido - encaminhamentos)
- Tipos de mídia proibidos (vídeos, GIFs, áudio, arquivos, texto)
Essa classificação garante que a duração da punição reflita a gravidade da violação — publicar pornografia resulta em uma restrição 30 vezes mais longa do que usar palavrões, representando com precisão a seriedade relativa das infrações.
Cálculo de punição cumulativa
O sistema não aplica simplesmente durações base de forma isolada. Em vez disso, ele acompanha o histórico cumulativo de punições de cada usuário e aumenta as restrições para reincidentes. Quando ocorre uma nova violação, o mecanismo de decisão:
- Recupera o tempo total de punição do usuário em todas as violações anteriores
- Calcula a nova duração da punição como:
new_duration = base_duration + (cumulative_past_duration * escalation_factor) - Adiciona a nova violação ao histórico permanente do usuário
- Aplica a restrição calculada
Por exemplo, a primeira violação por palavrões de um usuário pode receber uma restrição de 1 minuto (duração base). Se ele violar novamente as regras já tendo 1 minuto de punição cumulativa, a segunda violação receberá aproximadamente 1,5 minuto. Uma terceira violação com 2,5 minutos cumulativos receberá aproximadamente 2 minutos. A duração da punição aumenta a cada violação, fornecendo sinais de correção comportamental cada vez mais fortes.
Essa abordagem cumulativa reconhece que erros isolados merecem tratamento mais brando, enquanto quebras de regras persistentes exigem uma intervenção mais firme. Usuários que violam as regras extensivamente acabam enfrentando restrições de 15 a 30 minutos mesmo por violações de baixa gravidade, tornando a violação contínua cada vez mais custosa em termos de capacidade de participação.
Aplicação automática de restrições
Depois que a duração da punição é calculada, o sistema aplica imediatamente uma restrição do Telegram ao usuário no grupo afetado. A restrição impede que o usuário:
- Envie mensagens
- Envie arquivos de mídia
- Envie stickers e GIFs
- Envie enquetes
- Adicione prévias de páginas da web
- Altere informações do chat
O usuário permanece no grupo e pode ver as mensagens, mas não pode participar até que a restrição expire. Essa abordagem de "timeout" oferece correção comportamental sem a permanência de um banimento — os usuários recebem um sinal claro de que seu comportamento foi inaceitável, mantendo a oportunidade de retornar e participar de forma adequada.
A restrição tem limite de tempo e expira automaticamente sem exigir ação do administrador. Quando a duração da punição termina, o Telegram remove automaticamente a restrição do usuário, permitindo que ele retome a participação normal. Essa automação elimina a necessidade de os administradores acompanharem e removerem restrições manualmente.
Exclusão de mensagens
Simultaneamente à aplicação das restrições, o sistema exclui do chat a mensagem infratora. Essa remoção imediata tem várias finalidades:
- Impede que outros membros vejam conteúdo inadequado
- Interrompe a disseminação de spam ou links maliciosos
- Mantém o ambiente da comunidade ao remover conteúdo disruptivo
- Fornece feedback claro ao infrator sobre o que foi inaceitável
A exclusão acontece em milissegundos após a detecção da violação, minimizando a exposição a conteúdo problemático. Em grupos com alto volume de mensagens, outros membros muitas vezes nem chegam a ver mensagens infratoras, porque a remoção ocorre mais rápido do que os ciclos de atualização de mensagens da maioria dos usuários.
Isenção de administradores
O sistema de punição inclui uma proteção crítica para administradores, garantindo que administradores do grupo nunca sejam restringidos, independentemente do conteúdo que publiquem. Antes de aplicar qualquer restrição, o mecanismo de decisão verifica se o usuário tem status de administrador no grupo.
Se o usuário for administrador, o sistema:
- Registra a violação nas estatísticas (para transparência)
- Exclui a mensagem (se a exclusão estiver configurada)
- NÃO aplica nenhuma restrição ou punição
- Registra a isenção do administrador nos registros de violação
Essa proteção é absoluta — administradores não podem silenciar acidentalmente a si mesmos ou seus coadministradores por meio do sistema automatizado. A isenção reconhece que administradores precisam manter a capacidade de gerenciar seus grupos, mesmo que ocasionalmente publiquem conteúdo que violaria as regras para membros comuns (por exemplo, postar um exemplo de spam para demonstrar o que evitar, compartilhar capturas de tela de violações em discussão etc.).
Registro de violações e transparência
Cada violação e punição é registrada permanentemente em registros detalhados visíveis nos painéis de Inteligência do Usuário e Estatísticas do Grupo. Os registros incluem:
- Carimbo de data e hora exato da violação
- Tipo e categoria da violação
- Pontuação de confiança (para violações baseadas em detecção)
- Motivo detalhado explicando o que acionou a detecção
- Duração da punição aplicada
- Tempo de punição cumulativo após esta violação
- Se o usuário foi de fato restringido (ou isento como administrador)
Esse registro abrangente garante transparência e responsabilidade completas. Administradores podem revisar exatamente por que cada restrição ocorreu, verificar se as punições correspondem à gravidade da violação e identificar padrões no comportamento dos membros que possam orientar ajustes na estratégia de moderação.
Configuração
Ativando punições automatizadas
O sistema de punições funciona automaticamente para qualquer violação detectada pelos recursos ativados. Não há opções separadas para "ativar punições" — a punição é inerente à aplicação das regras. No entanto, a severidade e o comportamento das punições são influenciados pelas configurações de detecção que você definiu:
- Acesse a página de gerenciamento do seu grupo
- Vá para as abas Configurações > Moderação por AI e Proteção Básica
- Ative os recursos de detecção que você deseja aplicar:
- Detecção de conteúdo NSFW → Pune conteúdo pornográfico/sexual
- Análise de sentimento → Pune linguagem tóxica, palavrões, insultos, ameaças
- Detecção de padrões de spam → Pune mensagens de spam
- Aplicação de idioma → Pune mensagens no idioma errado
- Filtro de palavras proibidas → Pune palavras proibidas personalizadas
- Regras de conteúdo proibido → Pune tipos de mídia, encaminhamentos, links de convite
Cada recurso ativado envia violações para o sistema de punições, que aplica automaticamente as restrições apropriadas.
Ajustando a severidade das punições por meio de limites
Embora as durações base das punições sejam fixas de acordo com o tipo de violação, você pode influenciar indiretamente a frequência e a severidade das punições ajustando os limites de detecção:
Aplicação mais rigorosa (mais punições):
- Um limite menor de detecção de NSFW (0.60-0.70) identifica mais conteúdo
- Um limite menor de análise de sentimento (0.60-0.70) identifica mais toxicidade
- Um limite menor de detecção de spam (0.60-0.70) identifica mais spam
Aplicação mais tolerante (menos punições):
- Um limite maior de NSFW (0.80-0.90) identifica apenas violações evidentes
- Um limite maior de sentimento (0.80-0.90) identifica apenas toxicidade clara
- Um limite maior de spam (0.80-0.90) identifica apenas spam evidente
O ajuste dos limites não altera a duração das punições, mas determina com que frequência elas são acionadas. Limites mais rigorosos significam restrições mais frequentes (inclusive para conteúdo limítrofe), enquanto limites mais tolerantes reservam as punições para violações inequívocas.
Modos de apenas exclusão
Alguns recursos oferecem modos de "apenas exclusão", que removem o conteúdo infrator sem aplicar restrições de punição:
Aplicação de idioma:
- A opção "Modo de apenas exclusão" remove mensagens no idioma errado sem punir os usuários
- Útil quando os membros realmente se esquecem dos requisitos de idioma ou cometem erros inocentes
Filtro de palavras proibidas:
- A opção "Apenas excluir (sem punição)" remove mensagens que contêm palavras proibidas sem aplicar restrições
- Adequado quando o filtro pode gerar falsos positivos ou quando a comunidade prefere uma aplicação mais branda
Esses modos mantêm a remoção de conteúdo (preservando o ambiente da comunidade), ao mesmo tempo que evitam restrições potencialmente severas para violações de baixa gravidade.
Monitorando a atividade de punições
Para analisar como o sistema de punições está operando:
- Vá para a aba Estatísticas do seu grupo
- Selecione a subaba "Estatísticas do grupo"
- Analise métricas, incluindo:
- Total de punições aplicadas
- Tempo total de punição (em minutos)
- Duração média das punições
- Taxa de punição por 1.000 mensagens
- Detalhamento por tipo de violação
Essas estatísticas mostram se a frequência das punições corresponde às suas expectativas e se determinados tipos de violação predominam na atividade de aplicação das regras.
Cenários do Mundo Real
Cenário 1: Aplicação Escalonada para Reincidente
Um usuário entra em uma comunidade e publica imediatamente um comentário levemente tóxico. A análise de sentimento detecta toxicidade com 0,73 de confiança (acima do limite de 0,70), acionando uma restrição de 5 minutos. A mensagem é excluída e o usuário fica silenciado por 5 minutos.
Depois que a restrição expira, o usuário publica outro comentário tóxico. O tempo acumulado de punição agora é de 5 minutos. A nova violação recebe aproximadamente 7 minutos de restrição (5 de base + escalonamento com base nos 5 acumulados). O tempo acumulado total passa a ser de 12 minutos.
O usuário continua com um terceiro comentário tóxico. Com 12 minutos acumulados, a terceira violação recebe aproximadamente 10 minutos de restrição. O total acumulado passa a ser de 22 minutos.
Na quarta violação, o usuário já enfrenta restrições de mais de 15 minutos por infrações que começaram com 5 minutos. As consequências escalonadas tornam a continuidade das violações cada vez mais custosa, oferecendo um forte incentivo à correção de comportamento. Com o tempo, o usuário adapta seu comportamento ou sua classificação de spam aumenta até o ponto em que o AI Spam Intelligence o remove automaticamente.
Cenário 2: Resposta Proporcional à Gravidade
Dois usuários violam as regras: o Usuário A publica palavrões no limite do aceitável (baixa gravidade), o Usuário B publica conteúdo pornográfico (alta gravidade). Nenhum dos dois tem violações anteriores.
O Usuário A recebe uma restrição de 1 minuto por palavrões — uma pausa breve que proporciona correção sem ser excessivamente punitiva para uma primeira infração envolvendo linguagem leve.
O Usuário B recebe uma restrição de 30 minutos por pornografia — uma pausa substancial que reflete a natureza séria de publicar conteúdo sexualmente explícito.
As punições drasticamente diferentes (1 minuto versus 30 minutos) refletem os níveis de gravidade drasticamente diferentes. O sistema reconhece corretamente que nem todas as violações são iguais e calibra a aplicação das regras de forma proporcional.
Cenário 3: Proteção de Administradores
Um administrador do grupo está explicando as regras da comunidade aos membros e publica uma mensagem de exemplo contendo palavrões para demonstrar o que não é permitido: "Não publiquem mensagens como 'isso é uma p***a de estupidez' — mantenham as discussões respeitosas."
O sistema de análise de sentimento detecta os palavrões na mensagem de exemplo e gera um relatório de violação. No entanto, o mecanismo de decisão verifica que o remetente tem status de administrador e o isenta da restrição.
A violação aparece nas estatísticas (mostrando que o sistema de detecção está funcionando), mas nenhuma restrição é aplicada. O administrador pode continuar explicando as regras sem se silenciar acidentalmente, enquanto o registro garante transparência de que a isenção ocorreu.
Cenário 4: Histórico Cumulativo Entre Tipos de Violação
Um usuário tem o seguinte histórico de violações:
- Dia 1: Palavrões (1 min) - acumulado: 1 min
- Dia 3: Imagem NSFW (30 min) - acumulado: 31 min
- Dia 5: Mensagem de spam (5 min + escalonamento) - acumulado: 37 min
- Dia 7: Violação de idioma (1 min + escalonamento) - acumulado: 40 min
No Dia 7, até mesmo uma violação de idioma de baixa gravidade recebe punição escalonada porque o histórico acumulado do usuário em todos os tipos de violação é de 40 minutos. O sistema reconhece que um usuário que viola repetidamente várias regras diferentes é um problema persistente, independentemente dos tipos específicos de violação.
Essa acumulação entre tipos garante que os usuários não consigam contornar o escalonamento diversificando suas violações (publicando conteúdo tóxico, depois spam, depois NSFW etc. para redefinir o escalonamento). O sistema de punição acompanha o padrão total de violações, não os padrões de categorias individuais.
Cenário 5: Modo Somente Exclusão para Ajuste Cultural
Uma comunidade internacional quer manter o inglês como idioma principal, mas tem muitos falantes não nativos que ocasionalmente publicam em seus idiomas nativos por acidente. Os administradores querem aplicar a regra de idioma sem punir membros por erros honestos.
Eles ativam a aplicação da regra de idioma com "modo somente exclusão." Quando os usuários publicam mensagens que não estão em inglês, o conteúdo é removido imediatamente (mantendo o ambiente em inglês), mas nenhuma restrição punitiva é aplicada (reconhecendo que provavelmente são erros, e não violações maliciosas).
Os membros recebem feedback de que suas mensagens foram removidas (ensinando a regra de idioma), mas podem tentar novamente imediatamente em inglês, sem esperar por um tempo de restrição. Essa aplicação mais suave mantém os padrões enquanto acomoda curvas de aprendizado.
Boas práticas
Confie no sistema de escalonamento
Resista à tentação de intervir manualmente no escalonamento de punições para usuários com históricos extensos de violações. O escalonamento cumulativo do sistema foi projetado para fornecer sinais de correção cada vez mais fortes — usuários que continuam violando regras após várias punições escalonadas demonstram que não vão modificar o comportamento com medidas brandas.
Se um usuário acumular mais de 100 minutos de punição cumulativa e continuar violando regras, esse padrão indica que ele não está interessado em seguir as regras da comunidade. Nesse ponto, considere um banimento permanente em vez de continuar com restrições automatizadas.
Revise as isenções de administradores
Verifique periodicamente as estatísticas de violações para ver se administradores estão gerando violações. Embora administradores sejam isentos de punição, violações frequentes por admins podem indicar:
- O admin está testando sistemas de detecção (esperado e aceitável)
- O admin está publicando exemplos de violações para fins educativos (esperado e aceitável)
- O admin realmente viola regras com frequência (problemático — admins devem servir de exemplo de bom comportamento)
Use os dados de isenção para garantir que administradores mantenham padrões de comportamento, mesmo estando protegidos contra punições.
Calibre com base nas estatísticas
Use o painel de Estatísticas do Grupo para verificar se a frequência de punições corresponde às suas intenções:
- Se a taxa de punições estiver muito alta (10+ por 1K mensagens), considere se os limites estão rígidos demais
- Se a taxa de punições estiver muito baixa (<1 por 1K mensagens), considere se os limites estão permissivos demais
- Se tipos específicos de violação dominarem (90%+ de um único tipo), isso pode indicar uma calibração inadequada dos limites
A calibração orientada por dados garante que a aplicação das regras esteja alinhada às necessidades reais da comunidade.
Comunique as punições aos membros
Inclua informações sobre o sistema automatizado de punições na sua mensagem de boas-vindas e na descrição do grupo:
"Este grupo usa moderação automatizada. Violações das regras da comunidade resultam em restrições temporárias. Violações repetidas resultam em restrições cada vez mais longas. Administradores podem revisar todas as punições em caso de contestação."
A transparência sobre a aplicação automatizada ajuda os membros a entenderem que as restrições não são ataques pessoais dos administradores — são consequências automáticas de violações das regras.
Use modos de apenas exclusão de forma estratégica
Modos de apenas exclusão fazem sentido para:
- Regras que são preferências culturais, e não limites críticos (exigências de idioma)
- Comunidades com muitos membros novos ou em aprendizado (aplicação branda)
- Violações que podem ter altas taxas de falsos positivos (palavras proibidas com sobreposição de gírias)
Não use apenas exclusão para violações graves (conteúdo NSFW, ameaças, spam) — elas exigem restrições punitivas para gerar uma correção comportamental significativa.
Monitore abusos do sistema
Fique atento a usuários que tentam manipular o sistema de punições:
- Publicar violações imediatamente antes de as restrições expirarem para evitar o tempo de espera do escalonamento
- Usar várias contas para evitar o histórico cumulativo de punições
- Publicar conteúdo limítrofe que quase não atinge os limites de detecção
Trate tentativas sistemáticas de contornar a aplicação das regras com banimentos permanentes, em vez de continuar com ciclos automatizados de restrição.
Integração com Outros Recursos
Base para a Inteligência de Spam com AI
Cada punição contribui para o histórico de violações do usuário, que alimenta a pontuação de risco da Inteligência de Spam com AI. Usuários com um histórico extenso de punições recebem classificações de spam mais altas e, quando essa classificação ultrapassa 0.75, a Inteligência de Spam com AI os remove automaticamente do grupo.
Isso cria uma progressão: punições automatizadas lidam com violações rotineiras → infratores persistentes acumulam histórico de punições → a AI reconhece o padrão → a remoção automática evita novas interrupções.
Mecanismo de Aplicação para Todos os Sistemas de Detecção
O sistema de punições funciona como o mecanismo de aplicação compartilhado para todos os recursos de detecção. Em vez de cada recurso implementar sua própria lógica de punição, todos alimentam o mecanismo de decisão centralizado, que garante uma aplicação consistente entre os tipos de violação.
Essa centralização evita conflitos (várias restrições simultâneas), garante que a escalada funcione entre categorias de violação e mantém registros e transparência consistentes.
Elemento Dissuasório para Conteúdo Proibido
A combinação de exclusão imediata + restrição torna a violação das regras de conteúdo proibido custosa o suficiente para dissuadir violações casuais. Os usuários aprendem rapidamente que publicar tipos de mídia restritos resulta em remoção imediata e suspensão temporária, criando um condicionamento comportamental contra futuras violações.
O efeito dissuasório é particularmente forte para violações de baixa gravidade (restrições de 1 minuto), que não são severas a ponto de causar ressentimento, mas são incômodas o suficiente para desencorajar a repetição.
Fonte de Dados para Estatísticas do Grupo
Os registros de punições geram os dados brutos que alimentam as análises de Estatísticas do Grupo. Os administradores podem ver:
- Quais tipos de violação ocorrem com mais frequência
- Como as taxas de punição evoluem ao longo do tempo
- Se membros específicos são responsáveis por um número desproporcional de violações
- Quão eficaz é a aplicação das regras na redução de reincidências
Essas informações orientam a estratégia de moderação e ajudam a identificar áreas em que a cultura da comunidade pode precisar de atenção além da aplicação automatizada das regras.
Uso avançado
Entendendo a matemática da escalada
A fórmula de escalada segue aproximadamente: new_duration ≈ base_duration * (1 + (cumulative_minutes / 10))
Isso significa:
- 0 acumulado → 1x a duração base
- 10 acumulados → ~2x a duração base
- 20 acumulados → ~3x a duração base
- 50 acumulados → ~6x a duração base
- 100 acumulados → ~11x a duração base
Usuários com históricos extremos de violações (mais de 100 minutos) enfrentam uma escalada enorme, fazendo com que até violações leves resultem em restrições de 20 a 30 minutos. Essa progressão garante que infratores persistentes acabem enfrentando consequências severas o suficiente para corrigir o comportamento ou acionar a remoção de spam por AI.
Identificando anomalias nos padrões de punição
Fique atento a padrões incomuns nos dados de punição:
- Todas as violações de um único usuário: Pode indicar assédio direcionado ou que o usuário realmente não entende as regras
- Violações concentradas em horários específicos: Pode indicar ondas de ataque de spam ou problemas específicos de fuso horário
- Aumento repentino em um tipo específico de violação: Pode indicar configuração incorreta do limite de detecção ou uma nova tática de spam
Use esses padrões para ajustar as configurações ou investigar causas mais profundas, em vez de simplesmente aceitar os números brutos de punição.
Ajuste temporário de limites durante eventos
Considere restringir temporariamente os limites (reduzindo os valores) durante períodos vulneráveis:
- Após adicionar o bot a um novo grupo grande (maior risco inicial de spam)
- Durante ondas conhecidas de campanhas de spam
- Durante eventos controversos que possam aumentar as tensões
Depois, volte os limites ao normal quando o período de alto risco passar. Esse ajuste dinâmico oferece proteção extra quando necessário, sem aplicação excessiva permanente.
Revisão manual de restrições longas
Quando um usuário recebe uma restrição muito longa (20+ minutos), considere revisar manualmente o histórico de violações dele para verificar se a escalada é adequada:
- Verifique se a punição acumulada vem de muitas violações leves ou de poucas violações graves
- Confirme se as violações são reais e não falsos positivos
- Considere se o usuário merece um recomeço (se teve violações meses atrás, mas o comportamento recente foi adequado)
Embora a automação trate corretamente a maioria dos casos, restrições extremamente longas podem justificar uma verificação humana.
Implementação técnica
O sistema de punições opera por meio do microsserviço telegram_decision, que recebe relatórios de violações de todos os serviços de detecção e determina as ações de aplicação apropriadas.
Quando uma violação chega, o serviço de decisão:
- Consulta o banco de dados para obter o histórico de punições do usuário
- Soma o tempo total acumulado de punição em todas as violações anteriores
- Calcula a nova duração da punição usando a duração base definida pela gravidade + a fórmula de escalonamento
- Verifica se o usuário não é um administrador do grupo
- Chama a API do Telegram para restringir o usuário pela duração calculada
- Chama a API do Telegram para excluir a mensagem infratora
- Registra a violação no banco de dados com todos os detalhes
A restrição é implementada por meio do método restrictChatMember da API do Telegram, com um parâmetro de tempo limite. O Telegram remove automaticamente a restrição do usuário quando o tempo limite expira, sem exigir nenhuma ação de acompanhamento do bot.
Todos os registros de violação são armazenados com campos de detalhes JSONB, que preservam o contexto completo de cada violação, incluindo pontuações de confiança, motivos da detecção, carimbo de data/hora, duração da punição e se a restrição foi efetivamente aplicada. Esse registro abrangente permite análises históricas detalhadas e auditoria.
O mecanismo de decisão implementa limitação de taxa para evitar spam de punições — se um usuário gerar várias violações em poucos segundos (por exemplo, ao publicar uma enxurrada de spam), o sistema agrupa as violações para evitar a aplicação de dezenas de restrições simultâneas.
Privacidade e tratamento de dados
O sistema de punições processa e registra:
- Identificadores de usuário: ID do usuário no Telegram e ID do grupo
- Detalhes da violação: Tipo, confiança, motivo, data e hora
- Ações de punição: Duração, se foi aplicada, totais acumulados
- Metadados da mensagem: Não o conteúdo completo, apenas indicadores de violação
Os registros de violações não armazenam o texto completo da mensagem — apenas as violações específicas detectadas (por exemplo, "a análise de sentimento detectou toxicidade com confiança de 0.85", em vez de armazenar a mensagem tóxica completa). Isso minimiza o impacto na privacidade, mantendo a transparência da aplicação das regras.
Os registros de punições ficam visíveis para os administradores do grupo por meio dos painéis de Estatísticas e Inteligência do Usuário. Os registros não são acessíveis publicamente nem compartilhados fora da interface administrativa.
Os usuários não são notificados diretamente sobre seus totais acumulados de punições (para evitar que tentem burlar o sistema), mas podem perceber a escalada ao sofrer restrições mais longas por violações repetidas.
Todos os dados de punições são mantidos permanentemente para fins de análise e auditoria. Padrões históricos de violações contribuem para avaliações de risco de spam e ajudam os administradores a entender tendências de comportamento dos membros a longo prazo.
Solução de problemas
"Usuários sendo restringidos, mas não parecem ter violado as regras"
Possíveis causas:
- Limite de detecção definido muito baixo (capturando conteúdo limítrofe)
- Falso positivo do sistema de detecção
- Violação que era válida, mas que você interpretou de outra forma
Solução: Analise a violação específica no relatório de Inteligência do Usuário para ver a pontuação de confiança e o motivo detalhado. Se a confiança estiver em uma faixa limítrofe (0.50-0.70), considere aumentar o limite de detecção. Se for claramente um falso positivo, isso é raro, mas possível — verifique se as configurações de detecção são adequadas ao tipo da sua comunidade.
"Usuários reclamando que as restrições são severas demais"
Possíveis causas:
- A escalada está funcionando conforme projetado para infratores reincidentes
- As durações base podem não corresponder às expectativas da comunidade
- Os usuários não entendem o sistema de aplicação gradual
Solução: Explique aos usuários que as restrições aumentam com violações repetidas — o que começa como 1 minuto passa para 5+ minutos para infratores persistentes. Revise o histórico de violações do usuário para verificar se a escalada é adequada. Considere se a sua comunidade preferiria uma aplicação somente com exclusão para certos tipos de violação.
"Administrador silenciou a si mesmo por acidente"
Possíveis causas:
- O usuário não tem de fato status de administrador no grupo do Telegram (apenas no painel do bot)
- Bug na detecção de administradores (extremamente raro)
Solução: Verifique se o usuário tem direitos reais de administrador nas configurações do grupo do Telegram (não apenas no painel do bot). A isenção se aplica apenas a administradores no nível do Telegram. Se ele realmente for administrador e tiver sido restringido, isso é um bug — reporte para investigação.
"As punições não estão aumentando para infratores reincidentes"
Possíveis causas:
- As violações estão distribuídas entre vários grupos (cada grupo acompanha separadamente)
- Visualização do usuário errado (nome de usuário semelhante)
- Problema no banco de dados impedindo o cálculo cumulativo
Solução: A escalada de punição é por usuário e por grupo — violações no Grupo A não aumentam punições no Grupo B. Verifique se você está olhando o usuário correto e o grupo correto. Se um usuário realmente tiver várias violações em um grupo sem escalada, isso indica uma falha do sistema que deve ser reportada.
"Restrições muito longas (30+ minutos) parecem excessivas"
Possíveis causas:
- O usuário tem um histórico extenso de violações (funcionando conforme projetado)
- Várias violações ocorreram em rápida sucessão (cálculo cumulativo)
- Tipo de violação grave (pornografia tem duração base de 30 minutos)
Solução: Revise o histórico completo de violações do usuário para entender o tempo cumulativo de punição dele. Usuários com mais de 100 minutos de histórico enfrentam escalada extrema por padrão. Se isso parecer inadequado, considere se o usuário merece um recomeço ou se o padrão de comportamento indica que ele deveria ser banido permanentemente.
Conclusão
O Sistema Automatizado de Punições transforma a detecção de violações em uma aplicação eficaz de regras de comportamento por meio de escalonamento inteligente, consequências proporcionais à gravidade e transparência abrangente. Ao aplicar automaticamente restrições que aumentam conforme as violações se repetem, o sistema oferece um feedback claro que orienta os membros a seguirem as regras, sem exigir intervenção manual constante dos administradores.
O equilíbrio entre automação (para lidar com a aplicação rotineira das regras de forma consistente) e transparência (permitindo a revisão administrativa de todas as decisões) cria uma moderação ao mesmo tempo eficiente e responsável. Os usuários recebem consequências imediatas por violações, os administradores mantêm visibilidade total sobre as ações de aplicação das regras, e infratores reincidentes enfrentam restrições progressivas que criam fortes incentivos para corrigir o comportamento.
Combinado com a AI Spam Intelligence (que remove automaticamente infratores persistentes) e o registro abrangente de violações (que viabiliza uma estratégia de moderação baseada em dados), o sistema de punições cria um ecossistema completo de aplicação de regras que protege comunidades enquanto minimiza a carga administrativa. Ative os recursos de detecção hoje mesmo para acionar a aplicação automatizada de punições e desfrutar de uma moderação consistente, proporcional e transparente, que acompanha o crescimento e a complexidade da sua comunidade.