个人资料扫描与行为数据库集成

简介

大多数审核系统只关注消息内容，而复杂的垃圾信息团伙往往在发布第一条消息之前，就已经通过用户资料暴露出异常。资料扫描与行为数据库集成系统通过分析用户资料、与外部垃圾信息数据库交叉比对，并在高风险账号扰乱社区之前识别它们，从而提供主动防护。

这项高级功能会在后台自动运行：扫描每位新成员的头像是否包含不当内容，分析个人简介文本中的垃圾信息特征，并查询外部行为数据库，检查该用户是否曾在其他社区因垃圾信息或滥用行为被标记。这种多层防护方式能够发现那些可能通过 CAPTCHA 验证，或未触发基于内容的检测系统的垃圾账号。

与等待违规发生后再处理的被动审核不同，资料扫描可以提前识别潜在问题。一个新加入的用户如果使用 NSFW 头像、个人简介内容可疑，并且在垃圾信息数据库中有记录，就会立即获得更高的风险评分，让管理员能在该账号在群组中发布任何内容之前，基于充分信息采取行动。这种主动策略能显著减少垃圾信息暴露，并保护你的社区免受使用新账号发起的协同攻击。

工作原理

头像扫描

每当用户加入你的某个群组时（或机器人首次遇到某个现有成员时），系统都会通过官方 API 获取其 Telegram 头像，并使用与扫描消息图片相同的 NSFW 检测引擎进行分析。分析会检查头像中是否包含色情内容、性暗示图像、挑逗性内容，以及伪造或篡改过的图片。

检测会生成一个置信度分数（0.0 到 1.0），表示头像包含不当内容的可能性。高置信度检测结果（通常高于 0.7）会使该用户被标记为拥有 NSFW 头像，这一标记会计入其整体垃圾信息风险评估。该标记会显示在用户情报报告中，让管理员能够看到哪些成员存在有问题的头像，即使他们尚未违反消息内容规则。

头像扫描与消息内容扫描彼此独立——你可以在禁用消息图片扫描的情况下启用头像扫描，反之亦然。该功能与消息图片扫描使用同一高级配额，因此头像分析会计入你的每月图片扫描额度。不过，由于头像扫描只会对每位用户执行一次（并会定期刷新），与扫描聊天中发布的每张图片相比，配额消耗非常小。

系统会智能处理没有头像的用户（这在正常用户和垃圾机器人中都很常见）。没有头像本身会对垃圾信息风险计算产生轻微影响，因为许多自动化垃圾账号会跳过个人资料自定义。不过，这一因素本身权重较低——算法会认识到许多真实用户也不会设置头像，因此只有在与其他可疑信号结合时，头像缺失才有实际意义。

简介内容分析

除头像外，系统还会获取并分析用户的简介文本（Telegram 个人资料中的“关于”部分）。简介分析会查找常见的垃圾信息指标，包括推广话术、过多链接、金融索取模式、诈骗关键词，以及其他与垃圾账号相关的文本特征。

简介分析使用模式匹配和关键词检测来识别可疑内容。正常用户通常只会填写简短的个人简介，或保持为空。垃圾账号则经常在简介中填充推广材料、加密货币诈骗话术、联盟链接或复制粘贴的垃圾文本。系统的模式识别能够识别这些典型的垃圾简介，并相应地标记该用户。

与头像一样，简介分析会计入用户情报报告中可见的整体垃圾信息风险分数。拥有明显垃圾信息特征简介内容的用户，即使在发布消息之前，也会获得更高的风险评级，从而支持主动的审核决策。

外部行为数据库集成

头像扫描还会与外部垃圾信息数据库集成，这些数据库汇总了来自许多 Telegram 群组的举报。当用户加入你的群组时，系统会查询这些数据库，检查该用户 ID 是否出现在已知垃圾信息发送者、诈骗者或滥用账号的记录中。

这些外部数据库会收集参与社区提交的报告，记录那些违反规则、发布垃圾信息、参与诈骗或表现出其他问题行为的用户。聚合数据形成了一个协作防御网络，让各社区共享有关恶意行为者的情报，防止同一批垃圾账号反复攻击不同群组。

数据库查询会返回有关该用户是否被举报、存在多少条举报，以及举报了哪些类型的违规行为（垃圾信息、诈骗、滥用等）的信息。这些外部情报会纳入垃圾信息风险计算，对拥有大量负面记录的用户显著提高风险分数，同时对记录干净或没有数据库条目的用户影响极小。

重要的是，系统会将这些数据作为众多信号之一，而不是仅凭外部举报就自动封禁用户。任何举报系统都可能存在误报，因此算法会将数据库标记视为有参考价值但并非决定性的依据。即使用户在垃圾信息数据库中有记录，但在你的特定群组中没有违规，他们仍然可以参与交流，只是会受到更密切的监控。

自动刷新资料

用户资料并不是静态的——垃圾信息发送者可能会在加入群组后更新头像或简介内容，试图显得更像正常用户。为了保持情报的时效性，系统会每 24 小时自动为活跃用户刷新一次个人资料数据。

在刷新周期中，系统会重新扫描头像中的 NSFW 内容，重新分析简介文本中的垃圾信息指标，并重新查询外部数据库以获取更新后的记录。如果用户的资料发生显著变化（例如，他们添加了一个加入时不存在的 NSFW 头像），更新后的风险评估会反映这些新信息。

刷新机制确保即使用户修改了个人资料，基于资料的风险评估也能保持准确。它还能够捕捉账号被盗用的情况——一个此前正常的用户账号被垃圾信息发送者接管后，通常会出现突然的资料变更，从而触发更高的风险分数。

与 AI Spam Intelligence 集成

所有头像扫描数据都会直接输入 AI Spam Intelligence 系统的风险计算算法。用于决定用户是否会被自动移除的垃圾信息评级（0.0 到 1.0）会纳入以下因素：

NSFW 头像状态（是否存在及置信度级别）
简介内容中的垃圾信息指标
外部数据库标记和违规次数
缺少头像（次要因素）
缺少 Telegram 用户名（独立但相关的因素）

这些基于资料的信号会与行为信号（消息模式、违规历史、群组成员特征）结合，生成全面的风险分数。被头像扫描标记的用户会提高初始风险评估，而资料干净的用户则会降低基准风险。

这种集成意味着头像扫描不仅提供信息——在启用 AI Spam Intelligence 时，它还会主动影响执法。资料极其可疑的用户（NSFW 图片 + 垃圾简介 + 大量数据库记录）在刚加入时垃圾信息评级就可能高于 0.75，从而在他们发布任何内容之前触发自动移除。

配置

启用个人资料扫描

个人资料扫描通过群组配置中的两个独立设置运行：

在面板中前往你的群组管理页面
选择“设置”标签页
点击“AI Moderation”子标签页
找到“媒体扫描”部分
启用“扫描用户个人资料图片”开关，以分析头像
启用“扫描用户个人资料文本”开关，以分析简介内容

这两项设置都是免费层级功能，所有群组均可使用，不受订阅等级限制。不过，个人资料图片扫描在实际分析图片时会消耗你订阅计划中的图片扫描额度（文本简介扫描不消耗额度）。

这些设置彼此独立——你可以根据优先级和可用额度，只启用图片扫描而不启用文本扫描，或反之亦然。

了解额度使用情况

个人资料图片扫描会计入你的每月图片扫描额度：

Basic (Free)： 500 次扫描/月
Gold： 2,000 次扫描/月
Platinum： 5,000 次扫描/月
Ultimate： 10,000 次扫描/月

每次个人资料图片分析都会消耗一次扫描额度。系统会在以下情况下扫描个人资料图片：

新用户加入你的群组时（初始扫描）
对活跃用户进行 24 小时刷新周期扫描时
通过用户智能报告手动请求时

对于大多数社区而言，个人资料扫描的额度消耗很少。一个拥有 1,000 名成员的群组，初始分析可能会使用 1,000 次扫描，之后每月持续刷新周期约再使用 1,000 次扫描（假设所有成员都保持活跃）。这样除了规模最大的社区外，所有社区仍会有大量额度可用于消息图片扫描。

如果担心额度问题，你可以启用个人资料文本扫描（免费、无额度消耗），同时保持图片扫描关闭；也可以只在高风险时期（例如预计会出现垃圾信息浪潮时）启用图片扫描。

查看个人资料扫描结果

要查看单个用户的个人资料扫描结果：

从面板前往“User Intelligence”
按姓名、用户名或 ID 搜索该用户
查看他们的智能报告
报告会显示：
- 如果被标记，则显示“NSFW Profile Picture”指示器
- 综合所有个人资料相关信号的垃圾信息评级
- 外部数据库状态（如可用）
- 完整违规历史

个人资料扫描数据会直接显示在现有的智能报告界面中，无需单独视图或额外导航。

外部数据库集成

外部行为数据库集成会自动运行，无需任何配置。系统会在个人资料分析期间查询数据库，并将结果透明地纳入垃圾信息风险计算。

管理员无法禁用外部数据库查询（因为这会让垃圾信息发送者规避检测），但这些数据只是风险评估中的众多因素之一。即使用户在数据库中有负面记录，只要他们在你特定社区中的实际行为保持良好，仍然可以参与群组。

真实场景

场景 1：防范协同垃圾信息攻击

一个加密货币讨论社区遭遇一波诈骗机器人账号同时加入。这些账号具有相似特征：没有头像、个人简介中包含加密货币主题的垃圾信息文本，并且账号创建时间都很新。

资料扫描会立即根据个人简介内容分析标记这些账号。带有垃圾信息特征的简介文本会将它们的风险评分提高到 0.60-0.70 区间，甚至在它们发布消息之前就已如此。再加上缺少头像和用户名句柄，多个账号的垃圾信息评分超过了 0.75 的阈值。

启用 AI Spam Intelligence 后，这些高风险账号会在加入后的几秒内被自动移除，无法发布诈骗链接。少数未达到 0.75 阈值的账号会继续受到监控，一旦它们发布第一条垃圾信息，就会同时触发基于内容的检测，并将风险评分推高到阈值以上，从而被立即移除。

如果没有资料扫描，这些账号本可以成功加入，并在检测发生前发布第一批垃圾信息。资料扫描是在入口处拦截了攻击，而不是事后被动响应。

场景 2：检测被盗账号

一名长期社区成员的账号被黑客入侵，黑客将头像改为 NSFW 内容，并在个人简介中加入垃圾链接。原本的合法用户并不知道自己的账号已被盗。

在下一次 24 小时资料刷新周期中，系统检测到 NSFW 头像和垃圾信息简介，而此前该资料一直是干净的。用户智能分析报告显示，由于资料变更，该账号的垃圾信息评分从 0.15（可信用户）突然上升到 0.68（风险升高）。

管理员在查看智能分析报告时，注意到这个此前可信成员的资料发生了可疑变化。他们通过 Telegram 之外的方式联系该用户，确认账号被盗，并帮助用户加固账号安全，避免其被用于向社区发送垃圾信息。

如果没有自动资料刷新，这个被盗账号会一直显得合法（基于历史行为），直到它开始发布垃圾信息，可能给社区造成严重干扰。

场景 3：误报管理

一名合法的新用户加入了一个艺术社区，头像是一幅展示裸体人物的古典艺术作品——这类艺术具有重要历史意义，但从技术上看包含裸露内容，因此以中等置信度（0.62）触发了 NSFW 检测。

资料扫描标记了该 NSFW 头像，将该用户的初始垃圾信息评分提升到 0.45（仍低于 0.75 的自动踢出阈值）。管理员在查看新成员智能分析报告时注意到这个较高的评分，并手动检查了该用户的资料。

他们判断该头像是古典艺术而非色情内容，并注意到用户的个人简介说明其为艺术史学生。中等置信度评分（0.62 而不是 0.95+）也支持这样的判断：这是边界内容，而不是明显的色情内容。

管理员决定监控该用户，而不是预先封禁。该用户发布了合适的艺术相关内容，积累了正向互动记录；随着行为信号超过最初的资料标记，其垃圾信息评分逐渐下降到 0.25。

这个场景说明，资料扫描提供的是信息，而不是强制自动执行操作，从而允许管理员在边界案例中作出更细致的人为判断。

场景 4：外部数据库关联

一名用户加入了由同一审核团队管理的多个相关游戏社区。在第一个社区中，该用户发布垃圾信息并被封禁。该违规行为被上报到外部行为数据库。

当同一用户加入第二个相关社区（使用同一账号）时，资料扫描会查询外部数据库，并发现第一个社区近期提交的垃圾信息报告。这种跨群组情报会立即将该用户在第二个社区中的垃圾信息评分提升到 0.55，尽管其在本社区尚无违规记录。

升高的风险促使管理员加强监控。当该用户发布第一条消息时，其中包含垃圾链接，并立即被内容扫描检测到。外部数据库标记与实际违规行为相结合，将垃圾信息评分推高到 0.75 以上，从而触发自动移除。

如果没有外部数据库集成，每个社区都必须通过亲身经历独立发现这个垃圾信息发送者。数据库集成基于相关社区提供的情报，实现了主动防护。

场景 5：基于资料的分诊

一个拥有 10,000+ 成员的大型公开社区每天都会收到数十个新的加入请求。手动审核每一位新成员并不现实，但管理员希望重点关注高风险的新成员。

他们实施了一个资料扫描工作流：

所有新成员都会被自动扫描（头像 + 个人简介 + 外部数据库）
管理员每周查看按“最近 7 天加入”筛选的用户智能分析报告
他们重点关注垃圾信息评分高于 0.50 的用户
低于 0.50 的用户接受常规监控，不给予特别关注

这种分诊方法利用资料扫描来识别哪些新成员值得进一步审查，从而高效利用有限的审核资源。高风险资料会得到即时关注，而低风险资料只接受例行监控。

最佳实践

同时启用头像和文本扫描

为了获得最大程度的防护，请同时启用头像扫描和个人简介文本扫描。这两项功能提供互补的情报——垃圾机器人可能使用 NSFW 头像但个人简介看起来正常，反之亦然。同时使用二者可以覆盖更广泛的可疑个人资料。

如果配额限制导致无法启用头像扫描，至少应启用文本扫描（该功能免费且不限量）。仅分析个人简介也能提供相当有价值的垃圾信息检测能力。

将个人资料数据作为参考因素之一

个人资料扫描应为决策提供参考，而不是自动决定结果。被标记为 NSFW 的头像或显示垃圾信息特征的个人简介会提高可疑程度，但并不能证明存在恶意意图。在主要依据个人资料数据做出封禁决定之前，应先查看用户的实际行为。

AI 垃圾信息情报系统会正确地将个人资料标记视为众多信号中的一个。相比在人工判断中过度强调个人资料数据，更应信任算法的综合权衡。

监控高风险新成员

建立定期查看新成员情报报告的流程，例如每周或每两周一次，重点关注垃圾信息评分较高（0.50+）的用户。这种主动监控可以在问题升级之前发现潜在风险，同时避免逐一审核每位新成员带来的负担。

考虑社区背景

不同社区有不同的个人资料规范。艺术类社区中，可能有更多成员的头像会触发中等程度的 NSFW 评分（例如艺术性裸露）。国际化社区中，可能有更多成员出于语言偏好而没有 Telegram 用户名。请根据你所在社区的具体特征来校准预期和阈值。

记录个人资料政策

如果你的社区对个人资料有具体要求（例如“禁止使用 NSFW 头像”），请将其写入群组规则和欢迎消息中。这样可以明确基于个人资料的限制措施，减少采取行动时产生的困惑。

与 CAPTCHA 结合使用

个人资料扫描与 CAPTCHA 验证搭配使用效果非常好。CAPTCHA 可以阻止自动化机器人，而个人资料扫描可以发现那些能通过 CAPTCHA 的人工操作垃圾账号。二者结合可以同时应对自动化和人工垃圾信息操作。

与其他功能的集成

AI 垃圾内容智能识别的基础

资料扫描为垃圾风险评估提供关键的初始数据。新用户加入时，AI 垃圾内容智能识别缺少可用于评估的行为数据（还没有消息，也没有违规记录）。资料扫描弥补了这一空白，提供即时风险指标，使系统能够在用户发布任何内容之前就进行智能分流。

随着用户通过活动积累行为历史，这些行为数据在整体垃圾内容评分中的权重会逐渐超过初始资料评估。系统会自然地从基于资料的评估（面向新用户）过渡到基于行为的评估（面向已有一定历史的用户）。

对内容审核的增强

资料扫描与内容审核相辅相成。被资料扫描标记的用户在发布内容时会受到更高程度的审查。如果某位用户的资料图片包含 NSFW 内容，又发布了处于边界状态的图片内容，这种组合可能会触发违规判定；而资料干净的用户发布相同内容时则可能不会。

这种基于上下文的执行方式能够识别出：表现出多重风险信号的用户，相比只有单一边界行为的用户，应接受更严格的评估。

对 CAPTCHA 验证的补充

CAPTCHA 主要用于阻止自动化机器人账号。资料扫描主要用于发现人工操作的垃圾账号或被盗用的合法账号。两者结合，可以形成纵深防御：

CAPTCHA 阻止：自动化垃圾机器人
资料扫描捕获：人工垃圾内容操作者、被盗用账号、复杂的垃圾内容操作

任何单一功能都无法提供完整保护，但结合使用时，它们能够覆盖垃圾内容策略的完整范围。

外部数据库的数据来源

虽然你的机器人会使用来自外部行为数据库的数据，但它也可以反向贡献数据（如果配置为这样做）。你社区中的违规行为可以上报到数据库，从而帮助保护其他社区免受同一批不良行为者的影响。

这种互惠关系构建了一个协作式反垃圾网络，所有参与的社区都能从共享情报中受益。

高级用法

解读 NSFW 头像置信度分数

头像 NSFW 检测会生成置信度分数，用于反映检测结果的确定程度：

0.95-1.0: 几乎可以确定为不当内容（露骨色情）
0.85-0.94: 极有可能为不当内容（明显的 NSFW 特征）
0.70-0.84: 可能为不当内容（中等置信度）
0.50-0.69: 临界范围（可能是艺术性、带有暗示但不露骨的内容）
0.00-0.49: 干净，或检测置信度较低

可使用这些区间来校准处理方式。分数高于 0.85 通常应立即采取行动，而 0.50-0.69 区间的分数则应先人工审核再做判断。

头像变更检测

关注 User Intelligence 报告中垃圾信息评分在没有新增违规的情况下突然大幅上升的用户。这种模式通常表示资料发生了变化——请检查他们是否将头像更新为 NSFW 内容，或在个人简介中添加了垃圾信息文本。

此前可信用户的资料突然恶化，通常意味着账号被盗用，而不是原用户突然变得恶意。

跨群组模式识别

如果你管理多个社区，请留意在你的多个群组中出现在外部数据库查询结果里的用户。某个用户如果因在你未管理的群组中违规而被数据库标记，可能也会在你的社区中表现出类似模式。

这种跨群组情报有助于识别复杂的垃圾信息操作：它们会在单个群组中谨慎控制行为，但从完整的目标范围来看，就会暴露出模式。

配额优化策略

如果头像扫描可能消耗过多配额，可以考虑：

仅对垃圾信息风险最高的群组启用扫描
禁用自动刷新周期（仅在加入时扫描，而不是每 24 小时扫描一次）
在垃圾信息高发期间临时启用图片扫描，在平静时期禁用
使用个人简介文本扫描（免费）作为主要的资料情报来源

这些策略可以在管理配额消耗的同时，保留资料扫描能力。

手动资料分析

User Intelligence 界面允许管理员手动触发对特定用户的资料分析。在以下情况下可以使用此功能：

调查成员举报的可疑用户
检查此前被标记的用户是否已清理其资料
验证行为突然变化的用户是否发生了资料变更

手动分析可提供按需情报，无需等待自动刷新周期。

技术实现

资料扫描通过 telegram_updater 微服务运行，该服务会持续维护最新的用户资料信息。服务会查询 Telegram 官方 API，以获取头像和简介文本，然后将这些数据分发给相应的分析服务。

头像会发送到 discuse_images 服务（也就是用于分析消息图片的同一套 NSFW 检测引擎），该服务会返回色情内容、性暗示内容、挑逗性内容以及伪造内容等类别的置信度评分。这些评分会存储在数据库中，并与该用户的资料记录关联。

简介文本会通过模式匹配算法进行分析，用于识别垃圾信息关键词、推广话术、诈骗迹象，以及其他与垃圾账号相关的文本标记。分析结果会生成一个二元标记（疑似垃圾信息或干净），并存储在用户资料中。

外部数据库集成通过向参与合作的垃圾信息情报网络发起 API 查询来实现。查询会发送用户的 Telegram ID，并接收该 ID 在数据库网络中关联的违规报告、滥用标记或诈骗活动记录。响应数据会被缓存，以避免重复查询。

资料刷新机制以计划任务（cron job）的形式运行，按批次处理活跃用户，每 24 小时检索一次更新后的资料数据。刷新周期会优先处理近期活跃用户，同时降低不活跃成员的优先级，以优化资源使用。

所有资料扫描结果都会汇入 User Intelligence 数据库，并在那里与行为数据（消息数量、违规记录、群组成员模式）结合，用于计算综合垃圾信息风险评分，该评分会显示在情报报告中。

隐私与数据处理

资料扫描会处理可通过 Telegram 的 API 公开访问的数据：

头像： 从 Telegram 的 CDN 获取（与应用中可见的图片相同）
简介文本： 用户选择展示的公开“关于”信息
用户 ID： 在 Telegram 中使用的公开标识符

系统不会访问任何无法通过公开 API 端点获取的私密信息。所有被分析的数据，任何 Telegram 用户在查看该资料时本来都可以看到。

外部数据库查询只会共享用户的 Telegram ID（一个公开标识符），不会传输消息内容、群组成员关系详情或其他私密信息。数据库响应只会表明该 ID 是否曾被举报，以及被标记的违规类型。

对头像进行 NSFW 检测分析会在服务器端进行，并采用与消息图片分析相同的隐私保护措施。头像会被实时分析，不会被 NSFW 检测服务永久存储（仅保留检测结果）。

资料扫描结果对该用户所在群组的管理员可见。这些数据不会公开访问，也不会与未授权方共享。外部 API 访问仅提供垃圾信息评分，不提供详细的资料分析。

用户无法选择不让其公开资料被分析（因为垃圾信息发送者会立即利用这一点来规避检测）。系统只会分析用户已通过其 Telegram 资料设置选择公开可见的信息。

故障排除

“资料扫描似乎无法识别明显的垃圾账号资料”

可能原因：

功能未在设置中启用（同时检查头像和文本开关）
头像扫描额度已用尽
用户资料不包含可扫描内容（简介为空、没有头像）

解决方案： 确认 Settings > AI Moderation 中的 “Scan User Profile Pictures” 和 “Scan User Profile Text” 都已启用。在 Subscription Status 页面检查你的额度使用情况——如果图片扫描额度已用尽，将不会进行头像分析。请注意，没有头像或简介文本的用户，仅靠资料扫描不会被标记。

“艺术类头像被误判”

可能原因：

NSFW 检测对艺术裸露内容给出了中等置信度
系统无法以完全准确的方式区分艺术作品和色情内容

解决方案： 查看 User Intelligence 报告中的置信度分数。0.50-0.69 范围内的分数通常代表艺术内容，而非色情内容。请将这些中等分数作为人工审核的信号，而不是自动封禁的触发条件。AI Spam Intelligence 系统会将中等置信度分数的权重设得低于高置信度分数，正是为了处理这类情况。

“资料扫描额度消耗得太快”

可能原因：

大型群组有大量成员需要进行初始扫描
成员流动频繁（大量加入/离开会触发重复扫描）
24 小时刷新周期会为庞大的用户群消耗额度

解决方案： 对于大型社区，头像扫描可能会大量消耗额度。可以考虑升级订阅档位以获得更多额度、禁用自动刷新周期（仅在加入时扫描），或只为高风险群组选择性启用头像扫描。如有需要，简介文本扫描不消耗额度，可替代头像扫描。

“外部数据库集成没有显示结果”

可能原因：

用户在外部数据库中没有记录（资料干净、合法用户）
数据库 API 暂时不可用
用户非常新，还没有来得及在任何地方被举报

解决方案： 大多数用户不会有外部数据库记录——只有已知垃圾账号才会出现在这些数据库中。没有数据库记录对合法用户来说是正常且符合预期的。如果你认为某个已知垃圾账号应该出现却没有看到数据库结果，可能是所查询的特定数据库尚未收录该用户的记录。

“User Intelligence 报告显示资料为 NSFW，但资料看起来很干净”

可能原因：

用户在扫描后更换了头像
扫描结果为误判，且尚未刷新
对 NSFW 的判定标准不同

解决方案： 头像可能会在扫描后发生变化。如果还没过 24 小时，你看到的是过期的扫描结果——请等待刷新周期，或手动触发重新扫描。如果扫描结果是误判，它会在下一次刷新时得到纠正。请记住，NSFW 检测包括“擦边”和“暗示性”内容，而不仅仅是露骨色情内容——你对“干净”的理解可能与检测模型的阈值不同。

“资料扫描结果没有出现在 User Intelligence 报告中”

可能原因：

功能刚刚启用（扫描正在进行中）
用户在功能启用前就已加入（尚未被扫描）
报告缓存尚未刷新

解决方案： 资料扫描是异步进行的——从用户加入到扫描结果显示之间可能会有延迟。对于你首次启用该功能时已存在的成员，扫描会在下一次刷新周期内逐步进行（最多 24 小时）。刷新 User Intelligence 页面，确保你查看的是最新数据。

结论

资料扫描与行为数据库集成为抵御复杂垃圾信息活动提供了关键的第一道防线，这类活动往往会避开基于内容的检测触发条件。系统会分析用户通过个人资料透露出的信息，并结合外部数据库中的情报进行关联，从而主动识别高风险账号，而不是等到问题发生后才被动处理。

该功能与 AI 垃圾信息情报集成后，可形成一套全面的风险评估机制，同时考虑用户看起来是什么样的人（基于个人资料）以及他们实际做了什么（基于行为）。这能在多个阶段捕捉垃圾账号——有些账号会因个人资料极其可疑而被立即移除，有些则会被密切监控，并在首次违规后移除；而个人资料干净、行为得当的正常用户则会不受干扰地通过。

资料扫描最适合用于应对协同垃圾信息攻击、被盗账号，以及通过控制群内行为来规避基于内容检测的垃圾信息活动。由于 NSFW 头像检测、简介分析和外部数据库查询都会在用户发送第一条消息之前运行，它们能够提前暴露仅靠消息扫描要到事后才会发现的风险。请在设置 > AI 审核中启用图片和文本扫描以使用该功能。

快捷链接

个人资料扫描与行为数据库集成

简介

工作原理

头像扫描

简介内容分析

外部行为数据库集成

自动刷新资料

与 AI Spam Intelligence 集成

配置

启用个人资料扫描

了解额度使用情况

查看个人资料扫描结果

外部数据库集成

真实场景

场景 1：防范协同垃圾信息攻击

场景 2：检测被盗账号

场景 3：误报管理

场景 4：外部数据库关联

场景 5：基于资料的分诊

最佳实践

同时启用头像和文本扫描

将个人资料数据作为参考因素之一

监控高风险新成员

考虑社区背景

记录个人资料政策

与 CAPTCHA 结合使用

与其他功能的集成

AI 垃圾内容智能识别的基础

对内容审核的增强

对 CAPTCHA 验证的补充

外部数据库的数据来源

高级用法

解读 NSFW 头像置信度分数

头像变更检测

跨群组模式识别

配额优化策略

手动资料分析

技术实现

隐私与数据处理

故障排除

“资料扫描似乎无法识别明显的垃圾账号资料”

“艺术类头像被误判”

“资料扫描额度消耗得太快”

“外部数据库集成没有显示结果”

“User Intelligence 报告显示资料为 NSFW，但资料看起来很干净”

“资料扫描结果没有出现在 User Intelligence 报告中”

结论

相关文章

拦截 Telegram 色情机器人：NSFW 内容过滤指南

情绪分析与有害内容检测

AI 垃圾信息智能与用户风险评估