Viimeisen kuuden kuukauden aikana nk. "spämmiblogit" ovat valitettavasti vihdoin löytäneet tiensä Vuodatus.net:n pariin, ja kohtalaisen isoissa määrin. Päivittän palvelussa suljetaan toistakymmentä kenkiä, laukkuja ja jäljennöskelloja "mainostavia" blogeja.

Nyt tuli mitta täyteen ja nämä blogit pitäisi saada kuriin. Mutta miten?

Keväällä palveluun asennettiin Bad Behavior -niminen laajennos jonka oli tarkoitus estää automatisoidut toimenpiteet palveluun ja pysäyttää siten osa kommenttispämmistä sekä spämmiblogeista. Tämä ei kuitenkaan toiminut, ei alkuunkaan. Syy tähän löytyy siitä että näitä spämmiblogeja ei luokaan mikään automatisoitu tietokone-ohjelma, vaan blogit luo ihminen. Näyttää siltä että blogit luodaan Kiinasta käsin, useasta eri IP-osoitteesta ja niitä syötetään sisään hurjaa vauhtia.

Yksinkertainen ratkaisu olisi toki tässä tapauksessa ajaa blogikirjoitukset aina tallentamisen yhteydessä roskapostifiltterin läpi, tässä tapauksessa Akismetin. Jos Akismet toteaa kirjoituksen olevan roskapostia, suljetaan blogi. Tämä ei kuitenkaan ole kovin hyvä ratkaisu, sillä Akismetkin tekee välillä virheitä ja antaa virheellisiä positiivisia tuloksia. Tällöin voisi oikean bloggaajan kirjoitus aiheuttaa blogin sulkemisen.

Akismet on kuitenkin hyvä aloitus, mutta ei riitä yksinään sillä Akismetin jälkeen tulisi käyttäjälle antaa vielä mahdollisuus niin että blogia ei suljeta heti, vaan sitten jos käyttäjä ei pysty vahvistamaan itseään oikeana kirjoittajana, suljetaan blogi vasta tämän jälkeen. Oikea vahvistus taas lisää käyttäjän whitelistille, jolloin tulevaisuudessa ei tarvita roskapostifiltteriä.

(Klikkaa kuvaa nähdäksesi se suurempana)

Näin voidaan helposti kiertää ongelma joku johtuu Akismetin välillä tekemistä virhearvioista. Kuitenkaan tämä ei poista sitä ongelmaa että jos spämmiblogin tekee oikea ihminen, eikä automatisoitu botti, osaa tämä ihminen ratkoa visuaalisia CAPTCHA-ongelmia siinä missä oikeakin bloggaaja joten ollaan lähtöpisteessä.

Siksi ratkaisu #2: mitä jos varmistus joka esitetään käyttäjälle ei olekaan normaali, visuaalinen CAPTCHA, vaan suomen kieleen perustuva ongelma? Tällöin ulkomaalaiset, joilla ei suomen kielitaitoa ole, eivät pysty tällaista ratkomaan. Toki Google Translate voi tarjota apua, mutta pienellä miettimisellä voisi olla mahdollista tehdä ongelmia jotka vaativat oikeasti suomen kielen osaamista (huono esimerkki: "Mikä on 'heppa'-nimisen eläimen oikea virallinen nimi?). Toki voi olla että esim. lukihäiriöiselle tällaiset voivat tuottaa ongelmia, mutta näitä varten tarjotaan sähköpostiosoite johon lähettämällä mailin ylläpito käy lisäämässä ko. käyttäjän manuaalisesti whitelistalle. Ikävää tämä on niiden käyttäjien kohdalla joille tämä osuu, mutta kuitenkin kyseessä pitäisi olla vain ehkä promille käyttäjistä.

Vai mitä olette mieltä? Onko tällaiseen vielä parempia lähestymistapoja tai onko tällainen liian helposti kierrettävissä?