perjantai 28. huhtikuuta 2023

Tekoäly ja ihmiskuva

Tekoälyn uudet sovellukset ovat kiihdyttäneet mieliä, ja myös herättäneet vakavaa huolta. Tekoäly nähdään itsenäisenä ja uhkaavana voimana, jopa jokapäiväistä elämäämme häiritsevänä tekijänä, jos ei välittömästi, niin ainakin lähitulevaisuudessa. Tämä asenne meille perin tuttu tekniikan historiasta. Tehtaiden koneet, sähkö, kemia, voimakoneet, kulkuneuvot ja automaatio ovat mullistaneet maailmaamme. Niitä on ihailtu, mutta myös pelätty. Ja aivan hyvästä syystä, sillä ne ovat muuttaneet elämäämme ja hävittäneet suuren määrän perinteisiä ammatteja. Samalla ne ovat myös tehneet elämämme monella tapaa miellyttävämmäksi ja helpommaksi.

Teknologinen muutos on ruhjonut monella tapaa perinteisiä ammatteja. Moottorialukset tekivät purjealusten käyttöön perehtyneet merimiehet tarpeettomiksi. Voimakoneisiin perustuvat liikennevälineet hävittivät perinteisen hevosten ja juhtien voimaan perustuneen kuljetustoiminnan. Koneellistuneet tehtaat vähensivät dramaattisesti käsityömanufaktuurien työvoimaa, ja seuraavassa aallossa automaatio teki saman tehtaiden ammattitaitoisille koneenhoitajille. Halvan paperin valmistus puusta loi 1800-luvulla valtavan painetun median informaatioteollisuuden. Moderni yhteiskuntamme on pitkälle tämän mullistuksen tuottama. Nyt sähköinen media uhkaa koko tiedotusalan tulevaisuutta.

Juuri nyt näemme tekoälyssä samanlaisen muutosvoiman. Se näyttää uhkaavan aivan erityisesti niin sanottua ”luovaa alaa”. Tekoäly pystyy nähtävästi kirjoittamaan uutisia ja lehtiartikkeleja, luomaan romaaneja ja käsikirjoituksia ja tekemään vaikuttavia taideteoksia tai yhtä lailla vaikuttavia väärennöksiä tunnetuista taideteoksista. Se voi tehdä väärennöksiä jopa tunnetuista tai aivan tuntemattomistakin ihmisistä – tai ainakin näitä ihmisiä esittävästä kuva- äänite- ja videomateriaalista. Mistä tässä on oikein kysymys?

Aloitan vastauksen tuttuun tapaani menemällä hieman historiaan. On olemassa mielikuva tekoälystä jonkinlaisena ajattelevana koneena, ja tämä mielikuva perustuu historialliseen erehdykseen. Tuo erehdys syntyi samaan aikaan, kuin syntyivät nykyisen kaltaiset tietokoneet, eli suunnilleen 1950- luvulla. Tietokonealan pioneerit lumoutuivat koneidensa nopeudesta ja laskentakyvystä. He uskoivat tietokoneiden pian voittavan ihmiset myös älykkyyden saralla. Tuon ajan psykologia ja filosofia tukivat tällaista harhaluuloa. Ihmisen ajattelun ja ongelmanratkaisukyvyn uskottiin perustuvan loogiseen päättelyyn. Tietokoneesta käytettiin jopa nimitystä ”sähköaivot”. Vuosikymmenien ajan tekoälyn saavutukset jäivät kuitenkin vaatimattomiksi. Siitä huolimatta usko tietokoneen vähintäänkin piileviin älyllisiin kykyihin säilyi. Täytyyhän tietokoneesta aikanaan tulla ihmistä älykkäämpi, samalla tavalla kuin voimakoneet ovat ihmisiä vahvempia.

Asiassa on vain yksi ongelma. Edes psykologit eivät tiedä, mitä älykkyys tarkkaan ottaen on. Älykkyyttä voidaan toki kuvailla yleisellä tasolla sellaisena ihmisen ominaisuutena, joka auttaa selviytymään yllättävissä tilanteissa. Tiedämme varsin hyvin, ettei tietokoneella ole tällaista kykyä. Täsmällisempi, ja samalla täysin kiistaton älykkyyden luonnehdinta kuuluu: se on kyky selviytyä hyvin älykkyystesteissä. Mutta tietokone ei osaa ratkaista älykkyystestin tehtäviä, koska se ei ymmärrä tehtävien merkitystä tai tarkoitusta. Tietokone on etevä vain tehtävissä, jotka on määritelty suoraan laskemisen, logiikan tai muistamisen käsitteiden avulla.

Entä mitä viime aikoina on tapahtunut? Miksi älyllisesti avuton ja kömpelö tekoäly onkin äkkiä noussut uhkaavaksi voimaksi? Koetan nyt kuvailla, mistä tässä on kysymys. Uuden teknologian ytimenä ovat niin sanotut keinotekoiset hermoverkot (ANN, artificial neural networks). Niissä ei ole mitään uhkaavaa, salaperäistä tai synkkää, ainakaan siinä mielessä, että ne olisivat jonkinlaisia oman aivokudoksemme elektronisia klooneja. Nimitys on puhtaasti vertauskuvallinen. Kyse on järjestelystä, jossa suuri määrä yksinkertaisia laskentayksiköitä eli ”soluja” on kytketty verkkomaiseksi rakenteeksi. (Tästä tulee vielä eräs teknologian nimi, eli konnektionismi). Keinotekoinen hermoverkko voi olla tarkoitukseen rakennettu laite, mutta yleensä se on tietokoneohjelma, joka jäljittelee tällaisen laskentaverkon toimintaa.

Keinotekoiset hermoverkkojen tutkimus kehittyi voimakkaasti 1970-luvulla, ja eräs niistä käytetty nimitys oli perseptroni, siis havaitsija. Tällaiset ohjelmat tai laitteet olivat samalla tavalla rajoitettuja ja tehottomia kuin muutkin tuon ajan tekoälykonseptit. Eli mitään varsinaista läpimurtoa niistäkään ei seurannut. Tällainen hermoverkko on kyllä tehokas ja nopea. Se pystyy esimerkiksi tunnistamaan erilaisia muotoja tai kuvioita. Sitä varten verkko pitää ohjelmoida. Ohjelmointi tarkoittaa, että solujen välisille kytkennöille annetaan sopivia ominaisuuksia. Verkko on ohjelmoitava erikseen jokaista tunnistustehtävää varten. Ja niin kuin ehkä aavistamme, ohjelmointi on hidasta ja hankalaa työtä.

Entä jos tuo soluverkko osaisikin oppia itsekseen ilman, että ihmisen pitäisi sitä opettaa? Ehkä se on mahdollista! Suomalainen tekoälytutkimuksen pioneeri Teuvo Kohonen (1934–2021) kehitti 1980-luvulla niin sanotun itseorganisoituvan kartan (SOM, self organizing map). Se on tietyillä tavoin toimivien yhteen kytkettyjen laskentasolujen verkko. Kun tällaiseen verkkoon syötetään tietoa, esimerkiksi suomenkielen sanoja, sen solut herkistyvät vähitellen niin, että ne alkavat tunnistaa kirjaimia ja jopa sanoja.

Nykyiset kohua herättäneet tekoälyjärjestelmät eivät ole samanlaisia kuin nämä Kohosen verkot, paitsi aivan yleisellä tasolla: ne oppivat itsenäisesti ilman tapauskohtaista ohjelmointia. Kantavana ideana on oppimistulosten takaisinkytkentä. Verkon tuottamia tuloksia verrataan syötettyyn dataan. Esimerkiksi jos verkko tunnistaa oikein sille syötetyn kuvion, oikein toimineiden solujen kytkennät vahvistuvat. Kun oppimisjaksoa toistetaan monia kertoja, verkko herkistyy tunnistamaan samankaltaista dataa ja ohittamaan poikkeavan datan.

Käytännössä asia on tietenkin paljon monimutkaisempi. Tällä teknologialla on tiivis yhteys mm tilastotieteeseen, ja ideoiden kehittymistä voidaan seurata ainakin pari sataa vuotta taaksepäin. Hermosolujen kaltaisia laskentaverkkoja alettiin miettiä jo 1920-luvulla, ja tietokoneiden keksiminen ja ajatus tekoälystä vauhdittivat kehitystä. Erilaisten kilpailevien ideoiden, algoritminen ja käytettyjen termien paljous hämmentävät alaan perehtyvää.

Jos oppivia verkkoja opetetaan rajoitetulla datamäärällä, tulokset voivat olla hyviä. Mutta jos verkkoon syötetäänkin opetusmateriaalista olennaisesti poikkeavaa dataa, verkon algoritmit häiriintyvät ja se saattaa tehdä aivan outoja virheitä. Siksi verkkojen kouluttamiseen tarvitaan hyvin paljon dataa, ja juuri internet on täynnä valmiiksi digitoitua tekstiä, kuvamateriaalia, puhetta ja liikkuvaa kuvaa. Samalla erilaisille tekoälysovelluksille avautuu valtavat mahdollisuudet. Mutta olemme myös uudenlaisessa tilanteessa. Internetissä on valtavia määriä kaikkien ihmisten saatavissa olevaa materiaalia, jonka kohdalla tekijänoikeudet rajoittavat kaupallista hyödyntämistä. Onko tämän materiaalin käyttö tekoälyjen opettamiseen hyväksyttyä tai sallittua? Ainakaan tällaista käyttöä ei voida tällä hetkellä kontrolloida tai estää.

Tekoälyn lisääntyvään käyttöön liittyy myös sen toiminnan luotettavuus – ja kriittisissä sovelluksissa tekoälyn validointi. Voimmeko luottaa tekoälyihin? Vai voivatko ne tehdä outoja tai vaarallisia virheitä. Esimerkiksi itseohjaavien autojen järjestelmät voivat tunnistaa liikennemerkit väärin: kaupallisia mainoksia tai vaalimainoksia on luultu nopeusrajoituksiksi. Pankkien järjestelmät ovat estäneet asiakkaiden lainoja tai sulkeneet tilejä, koska ne ovat tulkinneet väärin asiakkaan nettikäyttäytymistä.

Oma lukunsa on eettinen väärinkäyttö. Kasvojentunnistusohjelmia voidaan käyttää epäilyttävien ihmisten valvontaan, Kiinassa tämä on jo hallituksen käytäntö. Todennäköisesti tällaisia järjestelmiä on myös monilla lentokentillä. Ihmisten nettikäyttäytymistä seurataan laajasti – ja usein heidän suostumuksellaan, onhan monilla muun muassa kauppaketjujen etukortteja ja nettikauppojen ja erilaisten palvelujen tilejä. Voidaan olettaa, että tällaista tietoa vuotaa hallitusten, kaupallisten toimijoiden ja rikollisten ulottuville. On myös ilmaantunut aivan uusi käsite: ”deep fake” eli syvähuijaus. Se tarkoittaa oikeista ihmisistä luotuja virtuaalihahmoja, yleensä tarkoituksena on eriasteinen vahingon tuottaminen tai rikoshyöty.

Eräs valaiseva sovellusesimerkki on tekoälyn tuottama ”valokuva”, joka voitti tunnetun valokuvauskilpailun. Voimme hyvin kuvitella, mistä oli kysymys. Tekoälyn opetusmateriaalina on ollut suuri joukko valokuvauskilpaluissa ja gallerioissa olleita kuvia, ja oppimisen laatukriteereinä on käytetty kuvia, jotka ovat voittaneet palkintoja.

Mitä pitäisi tehdä? Ainakin on syytä olla varovainen. Olen aiemmin kirjoittanut aiheesta tässä blogissa otsikolla Koneiden moraali. Tuon kirjoituksen näkökohdat ovat edelleen päteviä. Osaamme suojautua varsin hyvin tekoälyn toiminnan tuottamilta fyysisiltä vaaroilta ja aineellisilta vahingoilta. Samalla huolellisuudella pitäisi suhtautua aineettomiin, informaation kautta tuleviin uhkiin.

Voimme luonnehtia näitä uusia tekoälyn muotoja seuraavasti: ne tuottavat eräänlaisia tilastollisia malleja tai yhteenvetoja maailmasta, niille annettujen vihjeiden ja rajausten mukaisesti. Nämä mallit eivät kuvaa maailmassa vallitsevia asiantuloja sellaisenaan, vaan ne kuvaavat vain internetin sisältöä. Voimme tietysti ajatella, että internetin sisältö heijastaa maailmaamme, mutta suhde ei varmaankaan ole yksinkertainen. Ihmiset syöttävät internettiin sisältöä erilaisista syistä ja motiiveista, ja lisäksi erilaiset järjestelmät ja koneet syöttävät sinne dataa.

Mutta nyt seuraa tärkeä huomio!!

Uudet tekoälyn muodot tuovat mukanaan aivan uudenlaisen ja syvällisen haasteen tai kysymyksen. Tämä haaste on dramaattinen ja järisyttävä, mutta siihen ei ole kiinnitetty oikeastaan lainkaan huomiota. Se muuttaa radikaalisti kuvaamme siitä, mikä ihminen on ja miten ihminen ajattelee.

Viimeisten vuosikymmenien aikana aivojen tutkimus on vähitellen parantanut ymmärrystämme siitä, miten aivomme toimivat, mitä on ajatteleminen, ja viime kädessä siitä, mikä on ihminen. Tämä ymmärrys ei ole lainkaan sellainen, mikä on juurtunut kulttuuriimme. Olemme täysin toisenlaisia kuin mitä uskomme olevamme.

Aloitetaan vertauskuvasta, ja otetaan tarkasteltavaksi eläinten käyttäytyminen. Isoja ihmisapinoita, ennen kaikkea simpansseja pidetään älykkäinä. Ne käyttäytyvät ihmismäisesti, ja niillä on isot aivot, joiden ajatellaan olevan jonkinlainen merkki älykkyydestä. Apinat osaavat ratkaista erilaisia pulmatehtäviä ja käyttää ja jopa valmistaa sitä varten erilaisia apuvälineitä. On kuitenkin niin, että eräät varislinnut ovat pulmatehtävien ratkaisijoina jopa apinoita etevämpiä. Ja kuitenkin, niiden aivot mahtuisivat helposti teelusikkaan.

Tehdään rohkea johtopäätös. Ihmisten (tai apinoiden tai valaiden tai elefanttien) aivojen suuri koko ei sinänsä tee omistajistaan älykkäitä. Nuo suuret aivot tuottavat enimmäkseen jotain aivan muuta kuin niin sanottua älykkyyttä. Mutta mitä?

Aivotutkimus on vähitellen selvitellyt tätä mysteeriä. Osoittautuu, että aivot ovat ennen kaikkea mallinnus- ja ennustuskone. Ne tuottavat ympäristöämme ja sen tapahtumia kuvaavan ja ennustavan dynaamisen mallin, jonka rakennusaineina ovat aistihavainnot ja muistissa oleva tieto. Se on välttämätöntä, jotta pysyisimme toimimaan ja ylipäätään selviytymään maailmassa. Tämä on toki yleinen piirre. Kaikkien eläinten hermostot toimivat vastaavalla tavalla.

Isojen aivojemme erityismerkitys saa valaistusta tästä havainnosta. Aivoihimme tallentuva muistiaines on tässä hyvin tärkeää, kaikesta kokemastamme jää aivoihin muistijälkiä. Olemme sosiaalisia ja pitkäikäisiä eläimiä, ja toimimme mutkikkaalla tavalla mutkikkaassa ympäristössä. Aivoissamme täytyy olla tilaa tallentaa ja hyödyntää tietoa koko pitkän elämämme ajan. Siksi ne ovat niin suuret, erityisesti ihmisellä, joka on suuriaivoisista eläimistä kyvykkäin. Ihmisen valtava tehokkuus, kyky, kapasiteetti (ja tuhovoima) nojaa myös näppäriin käsiimme ja erityiseen kielikykyymme.

Nyt voimme tehdä rinnastuksen uuden tekoälyn toimintaperiaatteeseen. Ajattelumme, toimintamme ja reaktiomme ovat eräänlaisia tilanteen mukaan tehtyjä vedoksia ja yhteenvetoja muistissamme olevasta kokemusvarannosta. Karkeasti ajatellen aivojemme valtava ja jatkuvasti karttuva muistivarasto vertautuu tekoälyn käytössä olevaan internetin sisältöön.

Olen yllä esittänyt radikaalin oivalluksen, aika kompaktisti, ikään kuin pikajuoksuna. En selitä tarkemmin, siihen tarvittaisiin valtavasti tilaa, ei se tähän blogiin mahtuisi. Eikä asia jankuttamalla parane. Radikaalin ajatuksen pitää antaa upota ja vaikuttaa. Sitten siitä voi ottaa varovasti selvää. Vakuutan kuitenkin, että edellä esitetty perustuu etevimpien aivotutkijoiden vuosikymmenien aikana tuottamiin tuloksiin.

Pohjustan näitä ajatuksia tulevassa kirjassani Robottipuisto. Esseitä ihmisen ja koneen älystä. Toivon, että saan sen pian lukijoideni ulottuville.