如何实现一个好的脏话过滤器?

我们中的许多人都需要处理用户输入、搜索查询以及输入文本可能包含亵渎或不受欢迎的语言的情况。通常情况下，这需要过滤掉。

在哪里可以找到各种语言和方言的粗口?

源代码中是否有包含好的列表的api ?或者可能是一个API，用一些参数简单地说“是的，这是干净的”或“不，这是脏的”?

有什么好方法可以捕捉那些试图欺骗系统的人，比如$$、azz或a55?

如果您为PHP提供了解决方案，则会有加分。：）

编辑:回答简单地说，避免程序问题:

我认为，当用户可以使用公共图像搜索来查找添加到敏感社区池的图片时，这种过滤器是有一席之地的。如果他们可以搜索“阴茎”，那么他们可能会得到很多照片，是的。如果我们不想要照片，那么阻止这个词作为搜索词是一个很好的把关者，尽管不可否认这不是一个万无一失的方法。真正的问题是首先获得单词列表。

我指的是一种方法来判断单个令牌是否脏，然后简单地禁止它。我不会费心去阻止那种完全滑稽的“长脖子长颈鹿”的说法。你在那里什么也做不了。：）

淫秽过滤器:坏主意，还是令人难以置信的坏主意?

此外，我们不能忘记Toontown的SpeedChat的不被人知的历史，在那里，即使使用“安全词白名单”，也会导致一个14岁的孩子迅速绕过它: “我想把我的长脖子长颈鹿插到你毛茸茸的白兔子身上。”

底线:最终，对于您实现的任何系统，绝对没有什么可以替代人工评审(无论是同行评审还是其他评审)。你可以随意使用一个基本的工具来消除这种恶意攻击，但对于那些顽固的恶意攻击者，你绝对必须使用一种非基于算法的方法。

一个消除匿名并引入问责制的系统(Stack Overflow在这方面做得很好)也很有帮助，特别是为了帮助对抗约翰·加布里埃尔的G.I.F.T.

你还问你从哪里可以得到亵渎列表来开始你的学习——一个开源项目是Dansguardian——看看他们默认的亵渎列表的源代码。还有一个额外的第三方短语列表，你可以为代理下载，这可能是一个有用的收集点。

编辑:谢谢你对你想要做的事情的澄清。在这种情况下，如果你只是想做一个简单的单词过滤器，有两种方法可以做到。一种方法是创建一个单独的长regexp，其中包含您想要审查的所有禁用短语，并使用它进行regex查找/替换。像这样的正则表达式:

$filterRegex = "(boogers|snot|poop|shucks|argh)"

并使用preg_match()在输入字符串上运行它来批量测试命中，

或preg_replace()来清空它们。

您还可以使用数组加载这些函数，而不是单个的长正则表达式，对于长单词列表，它可能更易于管理。有关如何灵活使用数组的一些好例子，请参阅preg_replace()。

有关其他PHP编程示例，请参阅本页，其中有一个比较高级的用于单词过滤的泛型类，它从经过审查的单词中删除了中间的字母，以及前面的Stack Overflow问题，其中也有一个PHP示例(其中主要有价值的部分是基于sql的过滤单词方法——如果您发现它不必要，可以省去let -speak补偿器)。

你还补充说:“真正的问题是首先获得单词列表。”——除了之前的一些丹斯格尔链接，你可能会发现这个458个单词的。zip很有用。

2008-11-07 20:21:12

不喜欢。

因为:

Clbuttic 亵渎不是OMG邪恶亵渎不能被有效地定义大多数人很可能不喜欢被“保护”免受亵渎

编辑:虽然我同意评论者所说的“审查制度是错误的”，但这不是这个答案的本质。

2008-11-07 20:22:31

坦率地说，我会让他们把“欺骗系统”的字眼去掉，取而代之的是禁止他们，这只是我的想法。但它也使编程更简单。

我要做的是实现一个正则表达式过滤器，像这样:/[\s]dooby (doo?)[\s]/ I，或者这个单词在其他单词上有前缀，/[\s]doob(er|ed|est)[\s]/。这将阻止过滤单词，如assuaged，这是完全有效的，但也需要其他变体的知识，并更新实际的过滤器，如果你学习了一个新的。显然，这些都是例子，但你必须自己决定如何做。

我不会把我知道的所有单词都打出来，尤其是当我并不想知道它们的时候。

2008-11-07 20:25:28

我不知道有什么好的库可以做到这一点，但无论你做什么，都要确保你在让东西通过的方向上犯了错误。我曾经遇到过不允许我使用“mpassell”作为用户名的系统，因为它包含“ass”作为子字符串。这是一种疏远用户的好方法!

2008-11-07 20:26:00

看看CDYNE的亵渎过滤器Web服务

测试网址

2008-11-07 20:27:24

不喜欢。这只会导致问题。我个人有一次使用脏话过滤器的经历是，有一次我在IRC频道上提到我“要去汉考克的桥上呆几个小时”或类似的事情，就被踢/禁止进入。

2008-11-07 20:37:46

防止攻击性用户输入的唯一方法是阻止所有用户输入。

如果你坚持允许用户输入，并且需要审核，那么就加入人工审核员。

2008-11-07 20:42:39

如果你能做一些像Digg/Stackoverflow那样的事情，让用户可以投票/标记淫秽内容……这样做。

然后你所需要做的就是审查那些“淘气”的用户，如果他们违反了规则，就把他们屏蔽掉。

2008-11-07 20:46:59

一个亵渎过滤系统永远不会是完美的，即使程序员很自信，并跟上所有裸露的开发

也就是说，任何“淘气词”列表都可能表现得和其他列表一样好，因为潜在的问题是语言理解，这在当前的技术条件下是相当棘手的

所以，唯一可行的解决方案是双重的:

准备好经常更新你的字典雇佣一个人工编辑来纠正误报(例如:“clbuttic”而不是“classic”)和假阴性(哎呀!错过一个!)

2008-11-07 22:27:08

在我的一次面试中，面试我的公司首席技术官试用了我用Java编写的文字/网页游戏。在整个牛津英语词典的单词列表中，第一个被猜出来的单词是什么?

当然，这是英语中最脏的词。

不知怎的，我还是得到了这份工作，但我后来找到了一个亵渎词列表(和这个一样)，并写了一个快速脚本来生成一个没有所有脏话的新字典(甚至不需要查看列表)。

对于你的特殊情况，我认为比较搜索和真实的单词听起来像一个单词列表的方式。另一种风格/标点符号需要更多的工作，但我怀疑用户会经常使用它，成为一个问题。

2008-11-07 22:36:23

关于“欺骗系统”子问题，您可以在进行搜索之前通过规范化“坏词”列表和用户输入的文本来处理它。例如，使用一系列正则表达式(如果PHP有，可以使用tr)将[z$5]转换为“s”，[4@]转换为“a”，等等，然后将规范化的“坏词”列表与规范化的文本进行比较。请注意，规范化可能会导致额外的假阳性，尽管目前我想不出任何实际情况。

更大的挑战是想出一种方法，让人们在引用“笔比剑更强大”的同时屏蔽“pen is”。

2008-11-08 01:35:13

我同意hanclininto在讨论中发表的文章。我通常使用正则表达式来匹配输入文本。这是徒劳的努力，就像你最初提到的那样，你必须明确地在你的“阻止”列表中解释网络上流行的每一种写作技巧。

另一方面，当其他人在讨论审查的道德问题时，我必须同意在网络上有某种形式是必要的。有些人只是喜欢发表粗俗的文章，因为它可以立即冒犯到很多人，而且作者完全不需要思考。

谢谢你的建议。

HanClinto规则!

2009-02-24 20:30:20

注意本地化问题:在一种语言中是脏话的词在另一种语言中可能是完全正常的词。

目前的一个例子是:ebay使用字典的方法从反馈中过滤“坏词”。如果你试图输入德语翻译的“this was a perfect transaction”(“das war eine perfekte Transaktion”)，ebay将会因为用词不当而拒绝反馈。

为什么?因为“was”的德语单词是“war”，而“war”在ebay的“坏词”词典中。

所以要注意本土化问题。

2010-04-27 12:55:55

我同意这个主题的徒劳，但如果你必须有一个过滤器，看看宁泽涛的黄杨木:

Boxwood是一个PHP扩展，用于快速替换一段文本中的多个单词。支持区分大小写和不区分大小写的匹配。它要求它所操作的文本被编码为UTF-8。

更多细节请参见这篇博客文章:

快速多字符串替换PHP

使用Boxwood，你可以让你的搜索词列表想多长就多长——搜索和替换算法不会因为单词列表上有更多的单词而变慢。它的工作原理是建立一个包含所有搜索词的三元组，然后只扫描你的主题文本一次，遍历三元组中的元素，并将它们与文本中的字符进行比较。它支持US-ASCII和UTF-8，区分大小写或不敏感的匹配，并具有一些以英语为中心的单词边界检查逻辑。

2010-09-30 09:01:18

一旦你有了一个好的MYSQL表，里面有一些你想要过滤的坏单词(我从这个线程中的一个链接开始)，你可以这样做:

$errors = array();  //Initialize error array (I use this with all my PHP form validations)

$SCREENNAME = mysql_real_escape_string($_POST['SCREENNAME']); //Escape the input data to prevent SQL injection when you query the profanity table.

$ProfanityCheckString = strtoupper($SCREENNAME); //Make the input string uppercase (so that 'BaDwOrD' is the same as 'BADWORD').  All your values in the profanity table will need to be UPPERCASE for this to work.

$ProfanityCheckString = preg_replace('/[_-]/','',$ProfanityCheckString); //I allow alphanumeric, underscores, and dashes...nothing else (I control this with PHP form validation).  Pull out non-alphanumeric characters so 'B-A-D-W-O-R-D' shows up as 'BADWORD'.

$ProfanityCheckString = preg_replace('/1/','I',$ProfanityCheckString); //Replace common numeric representations of letters so '84DW0RD' shows up as 'BADWORD'.

$ProfanityCheckString = preg_replace('/3/','E',$ProfanityCheckString);

$ProfanityCheckString = preg_replace('/4/','A',$ProfanityCheckString);

$ProfanityCheckString = preg_replace('/5/','S',$ProfanityCheckString);

$ProfanityCheckString = preg_replace('/6/','G',$ProfanityCheckString);

$ProfanityCheckString = preg_replace('/7/','T',$ProfanityCheckString);

$ProfanityCheckString = preg_replace('/8/','B',$ProfanityCheckString);

$ProfanityCheckString = preg_replace('/0/','O',$ProfanityCheckString); //Replace ZERO's with O's (Capital letter o's).

$ProfanityCheckString = preg_replace('/Z/','S',$ProfanityCheckString); //Replace Z's with S's, another common substitution.  Make sure you replace Z's with S's in your profanity database for this to work properly.  Same with all the numbers too--having S3X7 in your database won't work, since this code would render that string as 'SEXY'.  The profanity table should have the "rendered" version of the bad words.

$CheckProfanity = mysql_query("SELECT * FROM DATABASE.TABLE p WHERE p.WORD = '".$ProfanityCheckString."'");
if(mysql_num_rows($CheckProfanity) > 0) {$errors[] = 'Please select another Screen Name.';} //Check your profanity table for the scrubbed input.  You could get real crazy using LIKE and wildcards, but I only want a simple profanity filter.

if (count($errors) > 0) {foreach($errors as $error) {$errorString .= "<span class='PHPError'>$error</span><br /><br />";} echo $errorString;} //Echo any PHP errors that come out of the validation, including any profanity flagging.


//You can also use these lines to troubleshoot.
//echo $ProfanityCheckString;
//echo "<br />";
//echo mysql_error();
//echo "<br />";

我确信有一种更有效的方法来完成所有这些替换，但我不够聪明，无法找到它(尽管效率不高，但这似乎还可以)。

我认为你应该允许用户注册，并根据需要使用人工过滤和添加到你的亵渎表。尽管这一切都取决于一个假阳性(好的词被标记为坏)和一个假阴性(坏词通过)的成本。这将最终决定您在过滤策略中是积极还是保守。

如果您想使用通配符，我也会非常小心，因为它们有时会比您想要的更麻烦。

2011-08-16 02:33:47

我的结论是，为了创建一个好的脏话过滤器，我们需要三个主要组件，或者至少这是我要做的。他们是:

过滤器:一个针对黑名单、字典或类似的东西进行验证的后台服务。不允许匿名账户报告滥用

奖金，它将以某种方式奖励那些贡献准确的滥用记者和惩罚罪犯，例如暂停他们的帐户。

2012-10-12 02:51:31

我有点晚了，但我有一个解决方案，可能对一些读到这篇文章的人有用。它是用javascript而不是php编写的，但这是有原因的。

完全披露，我写了这个插件…

不管怎样。

我采用的方法是允许用户“选择加入”他们的亵渎过滤。基本上，默认情况下允许使用脏话，但如果我的用户不想读，他们也可以不读。这也有助于解决“l33t sp3@k”问题。

这个概念是一个简单的jquery插件，如果客户端的帐户启用了脏话过滤，服务器就会注入这个插件。从这里开始，就只有几行简单的文字，用来掩盖誓言。

这是演示页面 https://chaseflorell.github.io/jQuery.ProfanityFilter/demo/

<div id="foo">
    ass will fail but password will not
</div>

<script>
    // code:
    $('#foo').profanityFilter({
        customSwears: ['ass']
    });
</script>

结果

***将失败，但密码不会

2012-10-29 03:22:52

虽然我知道这个问题相当古老，但这是一个经常发生的问题……

使用脏话过滤器既有原因，也有明显的需求(见维基百科词条)，但由于非常明显的原因，它们往往达不到100%的准确性;语境和准确性。

这(完全)取决于你想要达到什么目的——最基本的，你可能想要掩盖“七个脏话”，然后……一些企业需要过滤最基本的脏话:基本的脏话、url甚至个人信息等等，但其他企业需要防止非法账户命名(Xbox live就是一个例子)或更多……

用户生成的内容不仅包含潜在的脏话，还可能包含冒犯性的引用:

性行为性取向宗教种族等等……

而且可能是多种语言。迄今为止，Shutterstock已经开发了10种语言的基本脏话列表，但它仍然是基本的，非常面向他们的“标签”需求。网上还有很多其他的列表。

我同意一个公认的答案，即它不是一门被定义的科学，因为语言是一个不断发展的挑战，但90%的捕获率总比0%好。这完全取决于你的目标——你想要达到什么目标，你得到的支持程度，以及删除不同类型的脏话有多重要。

在构建过滤器时，你需要考虑以下元素以及它们与你的项目的关系:

词汇/短语首字母缩写(FOAD/LMFAO等) 误报(像“mishit”、“scunthorpe”和“titsworth”这样的单词、地点和名字) url(色情网站是一个明显的目标) 个人信息(电子邮件，地址，电话等-如适用) 语言选择(默认为英文) 适度(如果有的话，如何与用户生成的内容进行交互，以及可以用它做什么)

你可以很容易地建立一个过滤90%以上的脏话的过滤器，但你永远不会达到100%。这是不可能的。你越想达到100%，就越难……在过去建立了一个复杂的脏话引擎，每天处理超过500K条实时消息，我提供以下建议:

一个基本的过滤器包括:

建立一个适用的脏话列表开发一种处理脏话衍生的方法

一个中等复杂的文件归档器将包括，(除了一个基本的过滤器):

使用复杂的模式匹配来处理扩展派生(使用高级正则表达式) 处理Leetspeak (l33t) 处理误报

一个复杂的过滤器将包括以下一些(除了一个中等的过滤器):

白名单和黑名单短语/术语的朴素贝叶斯推理过滤 Soundex函数(一个词听起来像另一个词) Levenshtein距离阻止人类版主帮助引导过滤引擎通过例子学习，或者在没有指导的情况下匹配不够准确(自我/持续改进的系统) 也许是某种形式的AI引擎

2012-11-19 04:27:21

我用12种语言背诵了2200个坏词:恩，ar, cs, da, de, eo, es, fa, fi, fr, hi, hu, ja, ko, nl, pl, pl, ru, tlh, zh。

MySQL转储，JSON, XML或CSV选项可用。

https://github.com/turalus/openDB

我建议你执行这个SQL到你的数据库，并检查每次当用户输入一些东西。

2017-03-03 08:22:10

也是在游戏后期，但做了一些调查，偶然发现了这里。正如其他人所提到的，如果它是自动化的，这几乎是不可能的，但是如果你的设计/需求可以在某些情况下(但不是所有的时间)涉及人类交互来审查它是否亵渎神明，你可以考虑ML. https://learn.microsoft.com/en-us/azure/cognitive-services/content-moderator/text-moderation-api#profanity是我目前的选择，原因有很多:

支持多种本地化他们不断更新数据库，所以我不必跟上最新的俚语或语言(维护问题) 当有很大的可能性(即90%或更多)时，你可以务实地否认它你可以观察哪个类别会导致一个可能是或不是亵渎的标记，并可以让某人检查它，告诉它是否是亵渎的。

For my need, it was/is based on public-friendly commercial service (OK, videogames) which other users may/will see the username, but the design requires that it has to go through profanity filter to reject offensive username. The sad part about this is the classic "clbuttic" issue will most likely occur since usernames are usually single word (up to N characters) of sometimes multiple words concatenated... Again, Microsoft's cognitive service will not flag "Assist" as Text.HasProfanity=true but may flag one of the categories probability to be high.

当OP询问“a$$”时，这是我通过过滤器传递的结果:，正如你所看到的，它已经确定它不是亵渎的，但它有很高的概率是亵渎的，所以标记为审查(人类交互)的建议。

当概率高的时候，我可以返回“对不起，那个名字已经有人了”(即使没有)，这样对反审查的人来说就不那么冒犯了，如果我们不想整合人工审查，或者返回“您的用户名已经通知到直播运营部门，您可以等待您的用户名审核通过或选择其他用户名”。之类的……

顺便说一下，这个服务的成本/价格对于我的目的来说是相当低的(用户名多久会被更改一次?)，但是，对于OP来说，可能设计需要更密集的查询，并且可能不适合支付/订阅ml服务，或者不能进行人工审查/交互。这完全取决于设计……但如果设计确实符合要求，也许这可以成为OP的解决方案。

如果有兴趣，我可以在将来的评论中列出缺点。

2019-04-25 16:47:47

如何实现一个好的脏话过滤器?

推荐文章

最新文章

标签