Controle de SPAM no Mediawiki

From DanBP.org
Jump to: navigation, search

Por Daniel Brooke Peig (8/8/2010)

Problemas de SPAM no MediaWiki

O MediaWiki é o software originalmente desenvolvido para o site Wikipedia e atualmente é um dos aplicativos de distribuição de conteúdo mais populares do mundo. Infelizmente, robôs de envio de SPAM e de promoção de sites exploram o sistema do MediaWiki com o intuito de utilizar a página para postar anuncios e conteúdo indesejado.

A arquitetura padrão do MediaWiki não colabora para a prevenção deste tipo de ataque e, para o efetivo controle são necessárias algumas medidas extras baseadas na instalação de extensões e na configuração do sistema.

Este artigo busca apresentar um conjundo de ferramentas de primeira linha que, apesar de não evitar completamente, oferece uma boa blindagem contra invasores automatizados. Em testes realizados em um WIKI com alta incidência de ataques, foi possível conter completamente a invasão sem a necessidade de bloquer os usuários e edições.

As ferramentas são descritas na sequência e mais adiante é apresentado o arquivo de configuração recomendado para as extensões.

Contents


Continue permitindo atualizações anônimas

Os novos sistemas automáticos de postagem em Forums e WIKIs são capazes de fazer o registro, autenticar a conta através de e-mail e postar seu conteúdo (sim, eles sabem como). Não force os usuários de seu site a passar pela desagradável e burocrática cerimônia de criar um registro para poder colaborar. Eles não devem ser punidos no lugar dos vândalos digitais.


Ferramentas

Bloqueio de edições

Estas ferramentas bloqueiam a edição automatizada por robôs. São eficientes em grande parte dos casos e seu uso é altamente recomendável. Cabe ressaltar que estas medidas não impedem a "visita" do site pelo robô, apenas as modificações nas páginas.


  • DNSBlacklist - Função nativa do MediaWiki, para uso basta adicionar a configuração no LocalSettings.php conforme indicado abaixo. Bloqueia apenas a edição com base em bancos de dados de servidores suspeitos.


  • SimpleAntiSPAM - Extensão que "engana" robôs oferencendo a eles um formulário falso que, quando preenchido invalida a operação. É simples e funciona bem contra os ataques menos sofisticados.


  • Recaptcha - Ferramenta desenvolvida pelo Google para realizar autenticação através de Captchas: imagens que devem ter seu conteúdo digitado para permitir salvar os documentos. É necessário instalar a extensão, criar uma conta no site do Recaptcha e incluir as chaves fornecidas no arquivo LocalSettings.php conforme sugestão abaixo. Nota: Alguns sistemas conseguem burlar o Recaptcha para o registro de usuários novos, portanto não confie apenas nesta medida de prevenção.


  • SpamBlack List - Esta extensão impede salvar modificações que contenham expressões suspeitas. Após instalar a extensão é necessário copiar a lista de palavras bloquadas para a página MediaWiki:Spam-blacklist. Não é preciso preocupar-se em atualizar esta lista com frequência já que as palavras-chave mudam pouco ao longo dos anos. DICA: Não caia na tentação configurar a URL do Wikipedia ou outro site como fonte de palavras-chave. Se isso ocorrer, a cada visita, o servidor vai carregar a lista a partir do site externo compromentendo o desempenho geral do site.


  • TitleBlack List - Esta extensão impede salvar páginas que contenham expressões suspeitas em seu título. Também vale para novos usuários. Após instalar a extensão é necessário copiar a lista de palavras bloquadas para a página MediaWiki:Titleblacklist. Não é preciso preocupar-se em atualizar esta lista com frequência já que as palavras-chave mudam pouco ao longo dos anos.DICA: Não caia na tentação configurar a URL do Wikipedia ou outro site como fonte de palavras-chave. Se isso ocorrer, a cada visita, o servidor vai carregar a lista a partir do site externo compromentendo o desempenho geral do site.


Bloqueio de acesso

Estas ferramentas impedem qualquer acesso de usuários "indesejados" ao WIKI. Nem a visualização da página é permitida. O ponto negativo desta abordagem é que alguns usuários genuínos, que acessam a internet através de Proxy ou outras ferramentas como o tradutor do Google também (e muito provavelmente) poderão ser bloqueados.


  • Bad Behaviour - Este pequeno programa é uma das mais modernas formas de bloquear sistemas automatizados de envio de SPAM. Utiliza como base um algoritmo que analisa se o programa que está acessando a página é realmente um navegador de internet e uma das bases de dados de servidores nocivos mais completas: o httpbl do Project HoneyPot. Para habilitar o suporte ao httpbl é necessário cadastrar-se no HoneyPot, conseguir uma chave de acesso e inseri-la no arquivo settings.ini.


Configuração otimizada das ferramentas

  • MediaWiki SPAM Control Kit - Configurações recomendadas para inclusão no arquivo LocalSettings.php de forma a utilizar o potencial máximo das ferramentas de controle a SPAM.

Atualizações

  • 15/8/2010 - Medidas anti-spam funcionando a duas semanas em um site de grande circulação sem qualquer edição automática no sistema.
Views
Personal tools
ersatz