- 第77节 我是如何找到日志里的敏感字
-
我是如何找到日志里的敏感字
为了不让某些文章公开发表,网络设置了某些敏感字。你写得文章不管内容如何,但有这些字博客就可能不让你发表,采取这种措施,可能是为了防止某些内容有问题的文章发表,但能否解决问题,我认为是值得怀疑的,看到网上大量有问题的文章在流行就是一种证据。
前些日子,我写了一篇日志就遇到了这个问题,这已不是第一次,心情比以前平静多了。我写的日志题目是《电信诈骗何时休 》,从内容上来看肯定不会有什么问题,但还是让网易博客以“尊敬的用户,由于该篇日志含有敏感关键词,已进入审核流程,需通过审核后才能支持外部访问。我们非常理解您在文章撰写过程中倾注的心血和急于将内容分享给朋友的心情,但为了保证能继续为您提供稳定的服务,希望您能理解。您可以修改本文后重新发布。”为由给莫明其秒地屏蔽了。原指望网易会很快审核完毕,给我一个说法,但几天过去了,不见网易有何动静,看来在这问题上要指望网易是不行的!
指望不上,就只有自己动脑筋想办法。一篇日志那么多字,那几个字是敏感字,网易也不肯公布答案,查起来似乎有些难度,我也曾试图删除一些字,图,重新发表,结果还是上面那句告之:要审核。试了多次,无奈都失败了,难道真没有什么办法了吗?在茫然之余突然想起了在中学读书时就看书知道的一种方法:优选法。什么是优选法,优选法是由我们数学家华罗庚等推广并大量应用在生产实践中的一种方法,简单地讲,是指研究如何用较少的试验次数,迅速找到最优方案的一种科学方法。那么在这里我能不能用这个方法,用最快的速度来找到日志的敏感字呢?我想应该是可以试试的!
这里采用优选法,实际上就是用一种排除的方法,具体如下:我写的日志《电信诈骗何时休 》,从内容上看可以分二部分,上一半讲了诈骗的两个特点。下一半讲了“十种诈骗手法”。我先把上部分复制到写日志里发表,在这里注意一点,因为这是试验,并不想真正发表,你把写日志下面的查看权限调整到:私人,这样你发表了别人是看不到的,事后也可以删除。我把上部分一试,结果是没有问题可以发表。把下部分一试,结果是有问题,要审核。那么事情很明显,敏感字一定出在下部分。当然任何文章不管内容如何,都可以把它一分为二,原则是自己方便,能记住。
接下来把刚才有问题的下部分写的“十种诈骗手法”再一分二进行试验,结果发现上部分“一到五”没有问题,下部分“六到十”有问题。以此类推,把“六到十”再分成二部分:可以分成“六到七”与“八到十”,也可分成“六到八”与“九到十”再进行试验,我用第一种分法试验,结果发现“六到七”有问题。再把“六”与“七”分开试一次,你就发现了问题出在第七段上。第七段是这样的内容:“七。虚假求职信息型。犯罪嫌疑人以“某酒店招聘男女xx,月薪上万元”为名群发短信,当事主与嫌疑人联系时,嫌疑人要求应聘者向指定账号汇入一定数额的报名费,然后再以交纳保险费、服装费等名义要求应聘者继续打钱。”这时你可以根据经验,查找一下,这段话中那几个字最可能是敏感字,把它修改或去掉,试一下能不能发表,能发表了,问题就解决了。你找到修改的字就是这篇文章的敏感字。我找了二次,总算幸运到找到了“公关”两字,把它换成XX,问题就解决了,博文就发表了。如果不能马上找到,那只有再采取前面的方法,把这段话再分开查,最后查到问题在那一句就好办了,再找那个字问题就不大了。日志发表以后,别忘了把你刚才试验的日志全部删除,因为你设置了私人权限,别人是看不到的,丝毫不影响你日志里其他的事!当然这里还有一个问题,为何“公关”两字在这篇日志能发表,在《电信诈骗何时休 》为何不能发表,我想这里面可能还有一个组合问题,看这两个字与什么字组合,也许与“招聘男女”组合不行,就成了敏感字。单独或与其他字组合也许就行。以上只是我初步体会,可能还不完善需要不断实践与总结!
我想敏感字都是网站自己设置的,没有统一的标准,这就是我的日志在网易博客不能发表,而在新浪博客却能发表的原因吧!同样我想也许有这种可能:有的日志在网易博客能发表,在新浪博客就可能不能发表,因此我们不能以此下结论说,那个网站好,那个网站不好。我想无论网站怎么设置,我们也管不了,我们还是依靠自己的力量来解决问题最好!有许多网友与我有同样的遭遇,希望此文能对大家有所帮助!当然我们也希望网易等网站能把敏感字设置得更科学,更合理些,方便大家上网交流!
北风