Aplicação e Detecção de Idioma

Manter a consistência de idioma em grupos do Telegram atende a vários objetivos: garantir que os membros da comunidade possam se comunicar de forma eficaz, preservar a coesão cultural, cumprir regulamentações regionais e evitar mensagens de spam publicadas em idiomas inesperados. O bot Discuse oferece detecção automática sofisticada de idioma, que identifica e gerencia mensagens escritas em idiomas fora dos padrões de comunicação definidos pela sua comunidade.

Entendendo a detecção automática de idioma

O sistema de aplicação de idioma utiliza modelos de aprendizado de máquina treinados especificamente para identificar idiomas a partir de amostras de texto. Diferentemente de uma simples detecção de conjunto de caracteres, que poderia confundir russo com búlgaro ou misturar chinês simplificado e tradicional, a rede neural do bot analisa padrões linguísticos, estruturas gramaticais e vocabulário para classificar o texto com precisão em um dos 33 idiomas compatíveis.

O microsserviço discuse_language processa todas as mensagens de texto quando a aplicação de idioma está ativada. A análise ocorre em tempo real, normalmente sendo concluída em 30 a 50 milissegundos, garantindo que não haja atraso perceptível na entrega das mensagens. O sistema exige um mínimo de 10 caracteres para realizar uma detecção de idioma confiável — mensagens muito curtas, como "ok" ou "thanks", ignoram a análise, pois não fornecem contexto suficiente para uma classificação precisa.

O que torna esse sistema particularmente eficaz é seu mecanismo de pontuação de confiança. Em vez de simplesmente declarar "isto é francês", a AI gera uma pontuação de confiança entre 0.0 e 1.0 indicando o grau de certeza sobre sua classificação. Uma pontuação de 0.95 significa 95% de confiança, enquanto 0.60 sugere apenas certeza moderada. Essa abordagem mais refinada permite que o sistema lide adequadamente com casos ambíguos, evitando falsos positivos em mensagens com conteúdo em vários idiomas, terminologia técnica ou nomes próprios que poderiam confundir métodos de detecção mais simples.

Idiomas suportados e recursos de detecção

O mecanismo de detecção de idiomas oferece suporte a 33 idiomas que abrangem as principais famílias linguísticas do mundo, garantindo ampla aplicabilidade em comunidades diversas no mundo todo. Cada idioma é identificado por códigos padrão ISO 639-1 de duas letras, o padrão internacional para representação de idiomas.

Os idiomas suportados incluem: árabe (ar), bengali (bn), búlgaro (bg), chinês (zh), croata (hr), tcheco (cs), dinamarquês (da), holandês (nl), inglês (en), estoniano (et), finlandês (fi), francês (fr), alemão (de), grego (el), guzerate (gu), hebraico (he), hindi (hi), húngaro (hu), indonésio (id), italiano (it), japonês (ja), coreano (ko), letão (lv), lituano (lt), macedônio (mk), polonês (pl), português (pt), romeno (ro), russo (ru), eslovaco (sk), espanhol (es), sueco (sv) e turco (tr).

Essa cobertura linguística representa mais de 5 bilhões de falantes nativos e secundários no mundo todo, abrangendo os principais idiomas de comunicação da maioria das comunidades do Telegram. O sistema lida automaticamente com variações de escrita — por exemplo, o detector de chinês reconhece caracteres simplificados e tradicionais, enquanto o detector de sérvio processa tanto o alfabeto cirílico quanto o latino.

O mecanismo de detecção demonstra uma sofisticação especial com idiomas que compartilham características semelhantes. Ele distingue com precisão idiomas intimamente relacionados, como tcheco e eslovaco, ou croata e sérvio, analisando diferenças sutis de gramática e vocabulário que uma simples correspondência de palavras-chave deixaria passar. Essa precisão evita falsos positivos que poderiam frustrar usuários escrevendo em idiomas próximos, mas distintos.

Configuração da aplicação de idioma

Configurar a aplicação de idioma requer duas etapas de configuração: ativar o sistema e selecionar o idioma designado da sua comunidade. O painel web oferece controles intuitivos que tornam esse processo simples até mesmo para administradores que não estão familiarizados com códigos de idioma ou tecnologia de detecção.

O interruptor principal identificado como "Enable Language Guard" ativa todo o sistema de aplicação de idioma. Quando desativado, o bot não faz nenhuma verificação de idioma, independentemente das outras configurações. Quando ativado, o sistema começa a analisar todas as mensagens de texto, comparando os idiomas detectados com o padrão que você definiu. Esse botão oferece controle rápido para comunidades que talvez precisem suspender temporariamente a aplicação de idioma durante eventos especiais ou discussões multilíngues.

Depois de ativar a aplicação de idioma, os administradores selecionam o idioma designado em um menu suspenso pesquisável que mostra todos os 33 idiomas compatíveis. A interface exibe tanto o nome completo do idioma quanto seu código ISO — por exemplo, "English (en)" ou "Spanish (es)" — tornando a seleção clara e sem ambiguidades. A funcionalidade de busca permite filtrar rapidamente digitando nomes de idiomas, o que é especialmente útil para administradores que gerenciam comunidades com idiomas menos comuns.

O sistema aplica verificações de idioma apenas a mensagens com mais de 10 caracteres. Esse limite evita falsos positivos em mensagens curtas que não fornecem contexto suficiente para uma detecção precisa. Confirmações breves como "ok", "yes", "thanks" ou mensagens compostas apenas por emojis passam sem acionar violações de idioma, mantendo o fluxo natural da conversa e, ao mesmo tempo, identificando mensagens mais longas escritas em idiomas inesperados.

Como as violações de idioma são tratadas

Quando o sistema detecta uma mensagem escrita em um idioma diferente do padrão definido, ele a classifica como uma violação de idioma. O tratamento dessas violações segue a mesma estrutura de resposta gradual usada para outras infrações às políticas, garantindo padrões consistentes de moderação da comunidade.

Violações pela primeira vez normalmente resultam na exclusão da mensagem acompanhada de um aviso privado explicando a política de idioma da comunidade. Essa abordagem educativa reconhece que muitas violações acontecem porque novos membros não conhecem as regras do grupo, e não por desrespeito deliberado às políticas. O aviso inclui informações sobre qual idioma foi detectado e qual idioma a comunidade exige, ajudando os usuários a entender exatamente qual comportamento precisa ser ajustado.

O sistema mantém um histórico de detecção para cada usuário, acompanhando a frequência e os padrões de violação. Segundas violações dentro de um período configurado elevam as consequências, podendo implementar restrições temporárias. Um usuário que publique repetidamente em idiomas inesperados pode receber um silenciamento temporário de várias horas, dando tempo para revisar os padrões da comunidade enquanto protege o grupo contra violações contínuas da política.

Infratores recorrentes que demonstram padrões de ignorar os requisitos de idioma enfrentam consequências crescentes, que podem chegar até a remoção da comunidade. A escalada gradual reconhece a diferença entre erros ocasionais e resistência deliberada às políticas, garantindo que usuários realmente problemáticos enfrentem consequências apropriadas, ao mesmo tempo em que perdoa usuários que simplesmente cometeram erros.

Cenários de implementação no mundo real

Diferentes tipos de comunidades se beneficiam da aplicação de regras de idioma de maneiras distintas, com abordagens de configuração que refletem as necessidades e o contexto cultural únicos de cada comunidade.

Comunidades empresariais internacionais frequentemente adotam uma aplicação rigorosa das regras de idioma para manter padrões profissionais de comunicação. Um grupo de chat de funcionários de uma empresa multinacional pode exigir o inglês como idioma comum, garantindo que todos os membros da equipe possam participar das discussões, independentemente de seu idioma nativo. A aplicação de regras de idioma evita a fragmentação que ocorre quando subgrupos começam a conversar em idiomas compreendidos apenas por parte dos membros, mantendo ambientes de comunicação inclusivos.

Grupos de comunidades regionais usam regras de idioma para preservar a identidade cultural e a coesão. Um grupo de uma associação cultural francesa exigiria o uso do francês, criando espaços onde os membros praticam e mantêm suas habilidades linguísticas. Essas comunidades reconhecem que o idioma representa mais do que mera comunicação — ele incorpora valores culturais e identidade. A aplicação dessas regras garante que o grupo cumpra sua missão de preservação cultural e construção de comunidade.

Grupos educacionais de aprendizagem de idiomas aplicam essas regras para criar ambientes imersivos de prática. Uma comunidade de aprendizado de espanhol pode exigir comunicação apenas em espanhol, forçando os alunos a praticar o idioma-alvo em vez de recorrerem aos idiomas nativos quando a comunicação se torna difícil. Essa abordagem de imersão, semelhante à imersão linguística de um intercâmbio, acelera a aquisição do idioma ao remover a opção de voltar à comunicação confortável na língua nativa.

Comunidades de jogos ou hobbies voltadas para regiões específicas usam regras de idioma para gerenciar a participação e manter o caráter da comunidade. Um clã de jogos voltado principalmente a jogadores falantes de árabe pode exigir comunicação em árabe, atraindo naturalmente jogadores que se encaixam no contexto cultural da comunidade e desencorajando aqueles que buscam ambientes linguísticos diferentes. Essa abordagem ajuda as comunidades a manter o caráter e a cultura específicos que cultivam.

Arquitetura técnica e desempenho

O sistema de detecção de idioma opera por meio de uma arquitetura de microsserviços distribuída que equilibra precisão, desempenho e confiabilidade. Entender essa arquitetura ajuda os administradores a compreender os recursos e as limitações do sistema.

Quando uma mensagem chega, o serviço discuse_mixer primeiro verifica se a aplicação de regras de idioma está ativada para o grupo. Se estiver desativada, a mensagem ignora totalmente a análise de idioma e segue diretamente para outras verificações de moderação. Se estiver ativada, o mixer encaminha o conteúdo da mensagem ao microsserviço discuse_language para análise.

O serviço discuse_language implementa um cache inteligente que melhora drasticamente o desempenho para conteúdos repetidos. Ao analisar uma mensagem, o serviço primeiro gera um hash do conteúdo — uma impressão digital única do texto da mensagem. Ele verifica se esse texto exato foi analisado recentemente, recuperando os resultados em cache quando disponíveis. Esse cache persiste por uma hora, o que significa que mensagens idênticas ou repetidas recebem classificação instantânea sem exigir a execução custosa de modelos de aprendizado de máquina.

Para conteúdos que não estão em cache, o serviço encaminha o texto para um modelo especializado de classificação de idioma executado em infraestrutura dedicada. Esse modelo, treinado com milhões de amostras de texto multilíngues, processa a entrada e retorna tanto um código de idioma detectado quanto uma pontuação de confiança. Todo o processo normalmente é concluído em 30-50 milissegundos, rápido o suficiente para que os usuários não percebam nenhum atraso, mesmo durante períodos de alto tráfego.

O sistema emprega tratamento robusto de erros para manter a confiabilidade mesmo quando os componentes enfrentam problemas. Se o classificador de idioma ficar temporariamente indisponível, o sistema registra o erro e permite a passagem da mensagem, em vez de bloquear incorretamente conteúdo legítimo. Essa abordagem de falha aberta prioriza a acessibilidade da comunidade em vez da aplicação rígida das regras, reconhecendo que lacunas temporárias na detecção são preferíveis a falsos positivos que frustram usuários legítimos.

Privacidade e tratamento de dados

O processamento de detecção de idioma envolve a análise do conteúdo das mensagens, o que torna as considerações de privacidade essenciais. O design do sistema prioriza a privacidade dos usuários, ao mesmo tempo em que mantém a funcionalidade necessária para a moderação da comunidade.

A análise do conteúdo das mensagens ocorre inteiramente por meio de sistemas automatizados, sem revisão humana. Nenhum membro da equipe lê suas mensagens nem as dos membros da sua comunidade. O modelo de aprendizado de máquina processa o texto em memória temporária, e o conteúdo é descartado imediatamente após a conclusão da análise. Esse processamento efêmero garante que o conteúdo das mensagens não permaneça em servidores onde poderia ocorrer acesso não autorizado.

O sistema de cache armazena apenas hashes de conteúdo e resultados de detecção, não o texto real das mensagens. Esses hashes funcionam como impressões digitais: eles permitem que o sistema reconheça conteúdo analisado anteriormente sem armazenar o próprio conteúdo. Se alguém obtivesse acesso ao cache, veria códigos de hash anônimos e rótulos de idioma, mas não conseguiria reconstruir o conteúdo original das mensagens a partir desses registros.

Toda a transmissão de dados entre o bot e os serviços de detecção de idioma usa canais criptografados que impedem interceptação ou adulteração. A criptografia emprega protocolos TLS padrão do setor, o mesmo nível de segurança usado por aplicações bancárias e de saúde. Essa criptografia protege o conteúdo tanto em trânsito quanto durante o processamento, mantendo a confidencialidade em todo o fluxo de análise.

Os logs de detecção que registram violações contêm o mínimo de informações pessoais — normalmente apenas IDs de usuário, carimbos de data e hora e resultados de detecção. O sistema não registra o conteúdo completo das mensagens nos registros de violação, apenas o fato de que ocorreu uma violação e qual idioma foi detectado. Esse registro mínimo oferece a responsabilização necessária, ao mesmo tempo em que limita a invasão de privacidade.

Integração com Outros Recursos de Moderação

A aplicação de regras de idioma não funciona de forma isolada, mas se integra ao ecossistema mais amplo de moderação do bot para criar uma proteção abrangente da comunidade. Essa integração gera sinergias que melhoram a eficácia geral da moderação.

O sistema de detecção de spam considera violações de idioma como um dos fatores ao calcular a probabilidade de spam. Mensagens que acionam tanto violações de idioma quanto indicadores de spam recebem pontuações de spam mais altas, pois essa combinação frequentemente caracteriza bots de spam automatizados publicando conteúdo promocional em vários idiomas em diversos grupos. Essa avaliação multifatorial melhora a precisão da detecção de spam ao reconhecer padrões que sistemas individuais poderiam deixar passar.

O sistema de reputação de usuários acompanha violações de idioma junto com outras infrações de políticas. Um usuário com violações anteriores por spam pode enfrentar consequências agravadas por violações de idioma em comparação com um membro que, fora isso, se comporta bem e cometeu um erro isolado. Essa visão holística do comportamento do usuário permite respostas mais justas e mais adequadas ao contexto, distinguindo infratores crônicos de regras de erros ocasionais.

Os recursos de substituição por administradores permitem intervenção manual quando os sistemas automatizados têm dificuldade com casos extremos. Se a mensagem de um usuário contiver conteúdo legítimo no idioma definido, mas incluir texto citado ou termos técnicos que gerem falsos positivos, os administradores podem colocar o usuário na whitelist ou aprovar manualmente mensagens específicas. Essas substituições oferecem a flexibilidade necessária para lidar com cenários complexos do mundo real que confundem a detecção automatizada.

A integração com o sistema mais amplo de punições garante a aplicação consistente de consequências. Violações de idioma seguem a mesma estrutura de escalonamento gradual de outras infrações de políticas, criando uma aplicação previsível e justa que os usuários entendem e que os administradores conseguem gerenciar de forma consistente. Essa consistência na aplicação de consequências reforça os padrões da comunidade, ao mesmo tempo que mantém a confiança dos membros na imparcialidade da moderação.

Limitações e casos extremos

Compreender as limitações do sistema de aplicação de idioma ajuda administradores a definir expectativas adequadas e configurar políticas que levem em conta a complexidade do mundo real.

Mensagens muito curtas (com menos de 10 caracteres) ignoram completamente a detecção. Embora isso evite falsos positivos em confirmações breves, também significa que usuários poderiam, potencialmente, violar políticas de idioma por meio de mensagens muito curtas sem acionar a aplicação das regras. Comunidades que exigem conformidade rigorosa de idioma talvez precisem complementar a aplicação automatizada com moderação manual ocasional para identificar esses casos extremos.

Mensagens em vários idiomas apresentam desafios para qualquer sistema de detecção de idioma. Uma mensagem contendo principalmente conteúdo no idioma designado, com palavras ou expressões ocasionais em outros idiomas, pode gerar falsos positivos ou negativos dependendo da proporção do conteúdo. O sistema classifica com base no idioma predominante, mas mensagens com bastante conteúdo misto podem produzir resultados inconsistentes.

Terminologia técnica, nomes próprios e gírias da internet podem confundir classificadores de idioma. Uma mensagem em inglês discutindo regiões vinícolas francesas pode incluir palavras em francês suficientes para causar uma classificação incorreta. Trechos de código, expressões matemáticas e documentação técnica apresentam desafios semelhantes, pois contêm texto semelhante a linguagem que, na verdade, não representa linguagem natural.

A detecção de idioma exige contexto suficiente para funcionar de forma confiável, e é por isso que existe o mínimo de 10 caracteres. Mensagens mais longas fornecem mais contexto linguístico, melhorando a precisão da classificação. Mensagens próximas ao limite mínimo podem apresentar pontuações de confiança mais baixas e taxas de erro mais altas do que mensagens mais longas, que oferecem um contexto linguístico mais rico para análise.

Idiomas relacionados com alta inteligibilidade mútua impõem desafios de classificação. Distinguir entre idiomas muito semelhantes, como bósnio, croata e sérvio, ou entre norueguês bokmål e dinamarquês, pode ser difícil até mesmo para especialistas humanos. O sistema faz o melhor possível nesses casos, mas pode, ocasionalmente, classificar incorretamente mensagens entre idiomas estreitamente relacionados.

Boas práticas para imposição de idioma

A imposição eficaz de idioma exige uma elaboração cuidadosa de políticas, equilibrando a manutenção da consistência com a experiência do usuário e a inclusão da comunidade.

Comunique claramente as políticas de idioma na descrição do seu grupo e nas mensagens de boas-vindas. Novos membros devem entender os requisitos de idioma antes de publicar suas primeiras mensagens. Essa comunicação proativa reduz as taxas de violação ao estabelecer expectativas claras, em vez de surpreender os usuários com exclusões inesperadas de mensagens.

Considere se a sua comunidade realmente se beneficia de uma imposição rígida de idioma ou se políticas mais flexíveis atendem melhor aos seus objetivos. Comunidades voltadas à preservação cultural podem exigir uma imposição rigorosa, enquanto outras podem preferir permitir discussões multilíngues com um incentivo sutil ao uso do idioma definido. O sistema fornece as ferramentas — cabe aos administradores decidir com que rigor aplicá-las.

Monitore as taxas de falsos positivos por meio dos registros de administradores e do feedback dos membros. Se mensagens legítimas frequentemente acionam violações, isso sugere que a abordagem de imposição talvez precise de ajustes. Talvez a seleção do idioma definido esteja incorreta, ou os padrões reais de comunicação da comunidade sejam diferentes das políticas formais. Analisar os padrões de violação ajuda os administradores a identificar e resolver problemas sistêmicos.

Ofereça processos claros de contestação para membros que acreditam que suas mensagens foram sinalizadas incorretamente. Falsos positivos ocorrem inevitavelmente em qualquer sistema automatizado, e um tratamento ágil das contestações mantém a confiança dos usuários. Quando as contestações revelarem falsos positivos legítimos, considere se ajustes na política ou a inclusão de usuários em uma lista de permissões podem evitar problemas semelhantes para outros membros.

Combine a imposição automatizada com revisões manuais ocasionais, especialmente em comunidades com requisitos de idioma complexos ou com membros multilíngues. Sistemas automatizados lidam com eficiência com a imposição rotineira, enquanto o julgamento humano resolve casos limítrofes que exigem compreensão contextual. Essa abordagem híbrida aproveita a consistência da automação, preservando a flexibilidade humana para situações complexas.

Melhoria contínua e atualizações

Os modelos de detecção de idioma passam por atualizações periódicas que melhoram a precisão e ampliam suas capacidades. Essas melhorias são implantadas automaticamente a partir da infraestrutura de backend, sem exigir nenhuma ação do administrador para aproveitar os recursos aprimorados de detecção.

As atualizações dos modelos incorporam dados de treinamento ampliados que representam o uso contemporâneo da língua, incluindo gírias da internet, neologismos e padrões linguísticos em evolução. A língua evolui continuamente, e os modelos de detecção precisam se adaptar para continuar eficazes. O retreinamento regular garante que o sistema reconheça estilos de comunicação atuais, em vez de ficar cada vez mais defasado.

O feedback dos administradores sobre falsos positivos e erros de detecção retroalimenta os processos de melhoria. Quando várias comunidades relatam problemas de detecção semelhantes, isso indica problemas sistemáticos que podem exigir ajustes no modelo ou atualizações nas orientações de política. Esse ciclo de feedback garante que o uso no mundo real oriente o desenvolvimento do sistema, em vez de preocupações puramente teóricas.

A equipe de desenvolvimento monitora métricas de precisão da detecção em todos os grupos que usam o serviço, identificando idiomas ou contextos em que a precisão fica abaixo dos padrões. Cenários particularmente problemáticos acionam esforços direcionados de melhoria para corrigir fraquezas específicas. Esse monitoramento proativo garante desempenho consistente em todos os idiomas compatíveis, em vez de permitir que alguns fiquem abandonados com baixa precisão.

A aplicação de regras de idioma ajuda a manter um grupo multilíngue legível para seus membros. Entender como a detecção funciona, onde ela é pouco confiável (mensagens muito curtas, texto em vários idiomas) e como definir o idioma esperado e o limite permite aplicá-la sem frustrar usuários legítimos — o comportamento de abertura em caso de falha descrito acima significa que uma interrupção na detecção permite a passagem das mensagens, em vez de bloqueá-las.

Perguntas frequentes

P: O que acontece se alguém publicar uma mensagem misturando vários idiomas?

R: O sistema de detecção de idioma identifica o idioma predominante em mensagens com mistura de línguas. Se a mensagem estiver principalmente no idioma definido por você, com palavras ocasionais de outros idiomas, ela geralmente será permitida. No entanto, mensagens predominantemente em idiomas não definidos serão sinalizadas. O sistema lida de forma inteligente com alternância de códigos linguísticos e expressões multilíngues comuns, mas os usuários devem se comunicar principalmente no idioma configurado.

P: Posso permitir vários idiomas no meu grupo?

R: No momento, é possível configurar um único idioma definido por grupo nas configurações de aplicação de idioma. Se a sua comunidade realmente precisar de comunicação multilíngue, talvez seja melhor desativar completamente a aplicação de idioma ou usar grupos separados para comunidades de idiomas diferentes. O sistema foi criado para grupos que precisam manter consistência linguística, e não para oferecer suporte a vários idiomas em paralelo.

P: A aplicação de idioma funciona para mensagens muito curtas, como "ok" ou "lol"?

R: Não, o sistema exige pelo menos 10 caracteres para realizar uma detecção de idioma confiável. Mensagens muito curtas, mensagens contendo apenas emoji e confirmações breves ignoram automaticamente a análise de idioma. Isso evita falsos positivos em conteúdos curtos demais para serem classificados com segurança, ao mesmo tempo em que ainda identifica mensagens mais longas que violam claramente os requisitos de idioma.

P: Qual é a precisão da detecção de idioma?

R: A detecção de idioma atinge alta precisão (normalmente acima de 90% para mensagens com mais de 10 caracteres) em todos os 33 idiomas suportados. A precisão melhora conforme o tamanho da mensagem aumenta — mensagens mais longas fornecem mais contexto linguístico para uma classificação segura. Dialetos regionais e escrita informal geralmente são bem interpretados, embora linguagem extremamente informal, abreviações excessivas ou muitas gírias possam ocasionalmente confundir o classificador.

P: Os usuários podem recorrer se a mensagem deles for sinalizada incorretamente como estando no idioma errado?

R: Sim, os administradores podem revisar todas as violações de idioma pelo painel e aprovar manualmente mensagens sinalizadas por engano. Se você notar falsos positivos sistemáticos (talvez termos técnicos sendo classificados incorretamente), pode desativar a aplicação de idioma temporária ou permanentemente. O sistema não oferece recursos automáticos, mas a revisão por administradores fornece a supervisão humana necessária para casos específicos.

P: A aplicação de idioma funciona junto com a análise de sentimento e outros filtros?

R: Sim, todos os sistemas de moderação funcionam em conjunto. Uma mensagem precisa passar por todos os filtros ativados para permanecer no grupo. Portanto, se alguém publicar conteúdo tóxico no idioma definido por você, a análise de sentimento o detectará mesmo que a aplicação de idioma permita a mensagem. Se a pessoa publicar conteúdo inofensivo em um idioma não definido, a aplicação de idioma o removerá. Essa abordagem em camadas oferece uma proteção abrangente.

P: A aplicação de idioma detecta idiomas que não estão na lista dos 33 idiomas suportados?

R: O sistema pode identificar idiomas não suportados como "unknown", em vez de fornecer uma classificação específica de idioma. Quando isso acontece, a mensagem não é sinalizada como violação, pois o sistema não consegue determinar com segurança que ela está no idioma errado. Os 33 idiomas suportados cobrem a grande maioria dos usuários do Telegram no mundo todo, mas idiomas muito raros podem não ser detectados.

Links rápidos