如何实现一个好的脏话过滤器?

我们中的许多人都需要处理用户输入、搜索查询以及输入文本可能包含亵渎或不受欢迎的语言的情况。通常情况下，这需要过滤掉。

在哪里可以找到各种语言和方言的粗口?

源代码中是否有包含好的列表的api ?或者可能是一个API，用一些参数简单地说“是的，这是干净的”或“不，这是脏的”?

有什么好方法可以捕捉那些试图欺骗系统的人，比如$$、azz或a55?

如果您为PHP提供了解决方案，则会有加分。：）

编辑:回答简单地说，避免程序问题:

我认为，当用户可以使用公共图像搜索来查找添加到敏感社区池的图片时，这种过滤器是有一席之地的。如果他们可以搜索“阴茎”，那么他们可能会得到很多照片，是的。如果我们不想要照片，那么阻止这个词作为搜索词是一个很好的把关者，尽管不可否认这不是一个万无一失的方法。真正的问题是首先获得单词列表。

我指的是一种方法来判断单个令牌是否脏，然后简单地禁止它。我不会费心去阻止那种完全滑稽的“长脖子长颈鹿”的说法。你在那里什么也做不了。：）

当前回答

在我的一次面试中，面试我的公司首席技术官试用了我用Java编写的文字/网页游戏。在整个牛津英语词典的单词列表中，第一个被猜出来的单词是什么?

当然，这是英语中最脏的词。

不知怎的，我还是得到了这份工作，但我后来找到了一个亵渎词列表(和这个一样)，并写了一个快速脚本来生成一个没有所有脏话的新字典(甚至不需要查看列表)。

对于你的特殊情况，我认为比较搜索和真实的单词听起来像一个单词列表的方式。另一种风格/标点符号需要更多的工作，但我怀疑用户会经常使用它，成为一个问题。

2008-11-07 22:36:23

其他回答

防止攻击性用户输入的唯一方法是阻止所有用户输入。

如果你坚持允许用户输入，并且需要审核，那么就加入人工审核员。

2008-11-07 20:42:39

我同意这个主题的徒劳，但如果你必须有一个过滤器，看看宁泽涛的黄杨木:

Boxwood是一个PHP扩展，用于快速替换一段文本中的多个单词。支持区分大小写和不区分大小写的匹配。它要求它所操作的文本被编码为UTF-8。

更多细节请参见这篇博客文章:

快速多字符串替换PHP

使用Boxwood，你可以让你的搜索词列表想多长就多长——搜索和替换算法不会因为单词列表上有更多的单词而变慢。它的工作原理是建立一个包含所有搜索词的三元组，然后只扫描你的主题文本一次，遍历三元组中的元素，并将它们与文本中的字符进行比较。它支持US-ASCII和UTF-8，区分大小写或不敏感的匹配，并具有一些以英语为中心的单词边界检查逻辑。

2010-09-30 09:01:18

也是在游戏后期，但做了一些调查，偶然发现了这里。正如其他人所提到的，如果它是自动化的，这几乎是不可能的，但是如果你的设计/需求可以在某些情况下(但不是所有的时间)涉及人类交互来审查它是否亵渎神明，你可以考虑ML. https://learn.microsoft.com/en-us/azure/cognitive-services/content-moderator/text-moderation-api#profanity是我目前的选择，原因有很多:

支持多种本地化他们不断更新数据库，所以我不必跟上最新的俚语或语言(维护问题) 当有很大的可能性(即90%或更多)时，你可以务实地否认它你可以观察哪个类别会导致一个可能是或不是亵渎的标记，并可以让某人检查它，告诉它是否是亵渎的。

For my need, it was/is based on public-friendly commercial service (OK, videogames) which other users may/will see the username, but the design requires that it has to go through profanity filter to reject offensive username. The sad part about this is the classic "clbuttic" issue will most likely occur since usernames are usually single word (up to N characters) of sometimes multiple words concatenated... Again, Microsoft's cognitive service will not flag "Assist" as Text.HasProfanity=true but may flag one of the categories probability to be high.

当OP询问“a$$”时，这是我通过过滤器传递的结果:，正如你所看到的，它已经确定它不是亵渎的，但它有很高的概率是亵渎的，所以标记为审查(人类交互)的建议。

当概率高的时候，我可以返回“对不起，那个名字已经有人了”(即使没有)，这样对反审查的人来说就不那么冒犯了，如果我们不想整合人工审查，或者返回“您的用户名已经通知到直播运营部门，您可以等待您的用户名审核通过或选择其他用户名”。之类的……

顺便说一下，这个服务的成本/价格对于我的目的来说是相当低的(用户名多久会被更改一次?)，但是，对于OP来说，可能设计需要更密集的查询，并且可能不适合支付/订阅ml服务，或者不能进行人工审查/交互。这完全取决于设计……但如果设计确实符合要求，也许这可以成为OP的解决方案。

如果有兴趣，我可以在将来的评论中列出缺点。

2019-04-25 16:47:47

不喜欢。

因为:

Clbuttic 亵渎不是OMG邪恶亵渎不能被有效地定义大多数人很可能不喜欢被“保护”免受亵渎

编辑:虽然我同意评论者所说的“审查制度是错误的”，但这不是这个答案的本质。

2008-11-07 20:22:31

在我的一次面试中，面试我的公司首席技术官试用了我用Java编写的文字/网页游戏。在整个牛津英语词典的单词列表中，第一个被猜出来的单词是什么?

当然，这是英语中最脏的词。