Dawno, dawno temu… Za górami, za lasami… czytałem sobie tekst Lemat’a o dokuczaniu spamerom i pomyślałem że sam też tak mogę i nawet chcę więc popełniłem skrypcik, który dla losowych słów generował maile. Skrypcik działał z dwa lata na mojej poprzedniej stronie i nie raz zdarzyło się tam jakiejś mendzie zapętlić. Jakoś nie miałem czasu od razu, a później zapomniałem wrzucić go na nową stronie i tak zostało - na pewien czas.

Niedawno przeglądając logi zauważyłem że jakieś spam-boty jednak tęsknią za tą podstroną i postanowiłem ją wskrzesić.

Pomysł jest prosty i polega na generowaniu na pewnej podstronie dużej ilości “z dupy” maili. Oczywiście w robots.txt dajemy Disallow dla tej ścieżki i jeśli bot jest kulturalny to nie będzie tam zaglądał. Crawlery spamerów przeważnie kulturalne nie są więc tam wpadną i się zapętlą zapychając sobie bazę śmieciami - taka baza traci wartość dla klientów spamera, więc przeważnie skutkuje to dodaniem naszej strony na spamerską “black listę - nie crawlować”. Dla mnie cool 😃 (w rzadszych przypadkach spamer może chcieć się zemścić…).

Jeżeli ktoś będzie zainteresowany to mogę udostępnić skrypcik (ma postać szablonu strony dla WordPress’a) - choć zachęcam do samodzielnego napisania własnego - zawsze trudniej będzie spamerom z automatu go przeskoczyć (jak np. antyspam.pl). Należy przy tym zwrócić uwagę na kilka rzeczy:

  • nie zrób sobie kuku - nie generuj fake emaili dla własnych, istniejących domen (bo może się okazać że któryś spamer jednak spróbuje wysłać te setki tysięcy błędnych maili i zrobić Ci DDOS’a zabijając serwer błędnie nadanymi mailami),
  • nie rób innym kuku - nie generuj fake maili w cudzych domenach (no chyba że w domenach Canadian Pharmacy),
  • jeżeli jednak nadal upierasz się przy istniejącej domenie (np. by śledzić statystyki zapytań…) to ustaw rekord MX na hosta z IP 127.0.0.1 - jak dobrze pójdzie spamer sam sobie zrobi DOS’a (spodziewałbym się jednak w takiej sytuacji odwetu) :simple_smile:

Źródło szablonu

Paczkę z szablonem można pobrać tutaj.

Paczka zawiera plik havefun_template.php, który należy umieścić w katalogu szablonu WordPress’a. Ja wykorzystałem w generatorze wp_post z WordPress’a - zmodyfikowania zapytania dla innej bazy nie powinno być zbyt trudne. Samo zapytanie nieco zoptymalizowałem przez co zwraca mniej losowe wyniki (zwraca losowy blok n wierszy z tabeli a nie całkiem losowe elementy) co dla potrzeb tego skryptu jest całkiem OK. Jeżeli pomysł z bazą się nie podoba (bo np. może generować zbyt duże obciążenie) to proponuję wyszukać sobie jakiś generator Lorem ipsum

Miłej zabawy.

Bawiąc się ostatnio nowym szablonem Twenty Thirteen przygotowałem nową wersję pliku havefun_template.php dla tego szablonu.