19.9.2021 lindalii

Eriarvoistavat ennakkoluuloiset algoritmit

Nykyään bittiavaruudessa liikkuvaa dataa lajitellaan monien eri kriteerien mukaisesti. Dataan perustuvaa arviointia käytetään tilanteissa, joissa prosessoitavan datan määrä on niin suurta ja datan avulla tehtäviä päätöksiä ja valintoja niin paljon, että prosessi on kokonaisuudessaan yksinkertaisesti helpompi ohjata algoritmin tehtäväksi. Dataa voidaan lajitella esimerkiksi sen laadun tai välttämättömyyden perusteella, jolloin luokittelumekanismien taustalla on usein pyrkimys jonkinlaiseen standardisointiin, mikä helpottaa datan jatkojalostamista muihin tarkoituksiin. (Christin 2020, 1115.) Datan lajittelun ja jatkojalostamisen kohdalla saatetaan kuitenkin päätyä huomaamattomsti eriarvoistamaan ihmisryhmiä algoritmien pohjatessa toimintalogiikkansa aikaisemmin ihmisten käyttäytymisestä saatuun tietoon, jolloin se saattaa päätyä vahvistamaan ja ylläpitämäänkin valinnoillaan vanhoja eriarvoistavia ja jopa seksistisiä ja rasistisia järjestelmiä.

Useat tutkimukset ovat jo todenneet algoritmien eriarvoistavia toimintakaavoja. Joidenkin tutkimuksien mukaan muun muassa rekrytointialgoritmien on havaittu syrjivän naisia miesten saadessa useammin mainoksia korkeapalkkaisemmista töistä naisiin verrattuna (ks. Datta, Datta & Tschantz 2015). Toiset tutkimukset taas ovat osoittaneet, että matalan tulotason ihmiset näkevät epätodennäköisemmin heille kohdistetuissa mainoksissa mainoksia arvostetuimmista yliopistoista kuin varakkaammat kanssaeläjänsä (Christin 2020, 1115). Myös Google translatessa on havaittu stereotyyppistämistä muun muassa hän-pronominin käännöksissä, joissa kaikki hoitajat luokitellaan naisiksi ja lääkärit miehiksi (Olson 2018). Algoritmit voivat siis olla puolueellisia ja kohdella ihmisiä eriarvoisesti, koska ne pohjaavat toimintansa aikaisempiin toimintatapoihin ja kirjoituksiin, joissa eriarvoistavia malleja on esiintynyt.

Algoritmeja on myös käytetty jo useamman vuoden ennustamaan tulevaisuuden rikoskäyttäytymistä. Tässäkään ei olla tasa-arvon näkökulmasta päästy vielä onnistuneisiin lopputuloksiin. ProPublica julkaisi vuonna 2016 tutkimuksen, jossa he tutkivat yli 7000 Floridassa pidätettyä ihmistä nähdäkseen, millaisen riskinarvioinnin algoritmi heille antoi ja kuinka moni päätyi tekemään uudestaan rikoksen (Agnwin, Larson, Mattu & Kirchner 2016). Tutkimuksissa kävi ilmi, että algoritmi teki suuria virhearviointeja perustuen ihonväriin. Se arvioi virheellisesti erityisesti tummaihoisten syytettyjen tekevän tulevaisuudessa todennäköisemmin rikoksia valkoihoisten. Virhemarginaali oli llähes kaksinkertainen valkoihoisiin verrattuna. (Mp.) Algoritmien käyttö siis selvästi pahentaa ainakin Floridan rikosoikeusjärjestelmän rodullisia ennakkoluuloja.

Sovellus on Northpointe-yrityksen suunnittelema ja se on USA:n yksi käytetyimmistä riskinarviointisovelluksista. Pelkän algoritmin lisäksi haasteena vaikuttaa olevan myös yrityksen omat ennakkoluulot, sillä yritys itse on kieltänyt omien algoritmiensa sisältämät virhetulkinnat. He ovat perustelleet tätä sillä, etteivät he edes kysy ihmisten ihonväriä sovelluksen kehitystutkimuksissaan. Tutkijoiden mukaan perustelut eivät kuitenkaan algoritmin kohdalla ole päteviä, koska algoritmit pystyvät joka tapauksessa tunnistamaan kaavoja, jotka yhdistyvät tiettyihin ihmisryhmittymiin sulkien samalla toisia pois. Tämän lisäksi jotkut yrityksen tutkimuksissa käytetyistä kyselylomakkeen kysymyksistä ovat ollet erittäin kyseenalaisia Niissä on esimerkiksi tiedusteltu vanhempien rikostaustaa, josta on mahdollista olettaa, että ympärillä olevien ihmisen teot on liitetty osaksi myös algoritmin tekemiin rikosten todennäköisyysarviointeihin. (Agnwin, Larson, Mattu & Kirchner 2016.)

Vaikka yhdistävän median ekosysteemit ovat jatkuvassa muutoksessa, yksi asia on varma –kyseessä ei ole mikään neutraalien infrastruktuurien rakennelma. Varhaisvaiheen odotukset siitä, että Web 2.0 -teknologia olisi tuonut käyttäjilleen tasa-arvoa ja yhdenvertaisen pääsyn niin tiedon kuin sosiaalisen pääomankin lähteelle, on osoittautunut utopiaksi (van Dijck 2013, 159). Sosiaalisia alustoja ja algoritmeja tutkinut van Dijck haluaa kuitenkin muistuttaa, että myös verkon eri alustojen ja sovellusten käyttäjillä on valtaa vaikuttaa. Käyttäjä voi halutessaan tietoisesti boikotoida ja vaihtaa alustoja tai sovelluksia sellaisiin, jotka kiinnittävät enemmän huomiota tasa-arvoisiin toimintamalleihin tai käyttäjän yksityisyyden suojaan (mts. 160).

Algoritmien kohdalla tulisi aina muistaa, että ne heijastavat aina niihin syötettävää dataa. Syötettävän datan laatuun taas vaikuttavat taas käyttävjien tuottaman datan lisäksi myös algoritmeja rakentaneiden ihmisten maailmankuvat ja niin ikään myös yhteiskunnassa vallitsevat arvot ja vääristyneet rakennemallit. Yhteiskuntamme ovat monissa asioissa edelleen hyvin ennakkoluuloisia ja vaikuttavat toistamiimme malleihin. Ellemme ole tarkkoja ja valvo tulevaisuudessakin algoritmien sääntelyä ja edellytä niiltä läpinäkyvyyttä, riskinä voi olla, että päädymme niiden käyttöllä ylläpitämään, uusintamaan ja pahimmassa tapauksessa jopa vahvistamaan yhteiskunnallisia ennakkoluuloja ja historian saatoissa muodostuneita vallan epätasapainotiloja. Tämän vuoksi tarvitsemme edelleen entistä enemmän tutkimusta algoritmien toimintavoista. Ne ovat keskeinen osa nykyihmisen arkea, joten niiden mahdollisista tavoista muokata maailmankuvaamme ja ylläpitää tiettyjä vallitsevia eriarvoistavia rakenteita, on tärkeää olla tietoinen.

LÄHTEET

Agnwin, Julia; Larson, Jeff; Mattu, Surya & Kirchner, Lauren 2016. Machine Bias – There’s software used across the country to predict future criminals. And it’s based against blacks. ProPublica. [Viitattu 3.10.2021.]

Christin, Angèle 2020. What data can do: A Typology of Mechanisms. International Journal of Communication 14, s. 1115–1134.

Datta, Amit; Tschantz, Michael Carl & Datta, Anupam 2015. Automated Experiments on Ad Privacy Settings – A tale of Opacity, Choice and Discrimination. Proceedings on Privacy Enhancing Technologies, 1, s. 92–112. Berliini: De Gruyter. [Viitatu 3.10.2021.]

van Dijck, Jose 2013. The Culture of Conncetivity: A Critical History of Social Media. Oxford University Press.

Olson, Parmy 2018. The Algorithms That Helped Google Translate Become Sexist. Forbes, 15.2.20218. [Viitattu 1.10.2021.]

Avainsanat: algoritmit, alustatalous, digiviestintä, eriarvoisuus, läpinäkyvyys, tasa-arvo

Työ ja raha Opiskelu Tasa-arvo Uutiset ja yhteiskunta