Tekoälyn uudet sovellukset ovat kiihdyttäneet
mieliä, ja myös herättäneet vakavaa huolta. Tekoäly nähdään
itsenäisenä ja uhkaavana voimana, jopa jokapäiväistä elämäämme
häiritsevänä tekijänä, jos ei välittömästi, niin ainakin
lähitulevaisuudessa. Tämä asenne meille perin tuttu tekniikan
historiasta. Tehtaiden koneet, sähkö, kemia, voimakoneet,
kulkuneuvot ja automaatio ovat mullistaneet maailmaamme. Niitä on
ihailtu, mutta myös pelätty. Ja aivan hyvästä syystä, sillä ne
ovat muuttaneet elämäämme ja hävittäneet suuren määrän
perinteisiä ammatteja. Samalla ne ovat myös tehneet elämämme
monella tapaa miellyttävämmäksi ja helpommaksi.
Teknologinen muutos on ruhjonut monella tapaa
perinteisiä ammatteja. Moottorialukset tekivät purjealusten
käyttöön perehtyneet merimiehet tarpeettomiksi. Voimakoneisiin
perustuvat liikennevälineet hävittivät perinteisen hevosten ja
juhtien voimaan perustuneen kuljetustoiminnan. Koneellistuneet
tehtaat vähensivät dramaattisesti käsityömanufaktuurien
työvoimaa, ja seuraavassa aallossa automaatio teki saman tehtaiden
ammattitaitoisille koneenhoitajille. Halvan paperin valmistus puusta
loi 1800-luvulla valtavan painetun median informaatioteollisuuden.
Moderni yhteiskuntamme on pitkälle tämän mullistuksen tuottama.
Nyt sähköinen media uhkaa koko tiedotusalan tulevaisuutta.
Juuri nyt näemme tekoälyssä samanlaisen
muutosvoiman. Se näyttää uhkaavan aivan erityisesti niin sanottua
”luovaa alaa”. Tekoäly pystyy nähtävästi kirjoittamaan
uutisia ja lehtiartikkeleja, luomaan romaaneja ja käsikirjoituksia
ja tekemään vaikuttavia taideteoksia tai yhtä lailla vaikuttavia
väärennöksiä tunnetuista taideteoksista. Se voi tehdä
väärennöksiä jopa tunnetuista tai aivan tuntemattomistakin
ihmisistä – tai ainakin näitä ihmisiä esittävästä kuva-
äänite- ja videomateriaalista. Mistä tässä on oikein kysymys?
Aloitan vastauksen tuttuun tapaani menemällä
hieman historiaan. On olemassa mielikuva tekoälystä jonkinlaisena
ajattelevana koneena, ja tämä mielikuva perustuu historialliseen
erehdykseen. Tuo erehdys syntyi samaan aikaan, kuin syntyivät
nykyisen kaltaiset tietokoneet, eli suunnilleen 1950- luvulla.
Tietokonealan pioneerit lumoutuivat koneidensa nopeudesta ja
laskentakyvystä. He uskoivat tietokoneiden pian voittavan ihmiset
myös älykkyyden saralla. Tuon ajan psykologia ja filosofia tukivat
tällaista harhaluuloa. Ihmisen ajattelun ja ongelmanratkaisukyvyn
uskottiin perustuvan loogiseen päättelyyn. Tietokoneesta käytettiin
jopa nimitystä ”sähköaivot”. Vuosikymmenien ajan tekoälyn
saavutukset jäivät kuitenkin vaatimattomiksi. Siitä huolimatta
usko tietokoneen vähintäänkin piileviin älyllisiin kykyihin
säilyi. Täytyyhän tietokoneesta aikanaan tulla ihmistä
älykkäämpi, samalla tavalla kuin voimakoneet ovat ihmisiä
vahvempia.
Asiassa on vain yksi ongelma. Edes psykologit
eivät tiedä, mitä älykkyys tarkkaan ottaen on. Älykkyyttä
voidaan toki kuvailla yleisellä tasolla sellaisena ihmisen
ominaisuutena, joka auttaa selviytymään yllättävissä
tilanteissa. Tiedämme varsin hyvin, ettei tietokoneella ole
tällaista kykyä. Täsmällisempi, ja samalla täysin kiistaton
älykkyyden luonnehdinta kuuluu: se on kyky selviytyä hyvin
älykkyystesteissä. Mutta tietokone ei osaa ratkaista älykkyystestin
tehtäviä, koska se ei ymmärrä tehtävien merkitystä tai tarkoitusta. Tietokone
on etevä vain tehtävissä, jotka on määritelty suoraan
laskemisen, logiikan tai muistamisen käsitteiden avulla.
Entä mitä viime aikoina on tapahtunut? Miksi
älyllisesti avuton ja kömpelö tekoäly onkin äkkiä noussut
uhkaavaksi voimaksi? Koetan nyt kuvailla, mistä tässä on kysymys.
Uuden teknologian ytimenä ovat niin sanotut keinotekoiset
hermoverkot (ANN, artificial neural networks). Niissä ei ole mitään
uhkaavaa, salaperäistä tai synkkää, ainakaan siinä mielessä,
että ne olisivat jonkinlaisia oman aivokudoksemme elektronisia
klooneja. Nimitys on puhtaasti vertauskuvallinen. Kyse on
järjestelystä, jossa suuri määrä yksinkertaisia
laskentayksiköitä eli ”soluja” on kytketty verkkomaiseksi
rakenteeksi. (Tästä tulee vielä eräs teknologian nimi, eli
konnektionismi). Keinotekoinen hermoverkko voi olla tarkoitukseen
rakennettu laite, mutta yleensä se on tietokoneohjelma, joka
jäljittelee tällaisen laskentaverkon toimintaa.
Keinotekoiset hermoverkkojen tutkimus kehittyi
voimakkaasti 1970-luvulla, ja eräs niistä käytetty nimitys oli
perseptroni, siis havaitsija. Tällaiset ohjelmat tai laitteet olivat
samalla tavalla rajoitettuja ja tehottomia kuin muutkin tuon ajan
tekoälykonseptit. Eli mitään varsinaista läpimurtoa niistäkään
ei seurannut. Tällainen hermoverkko on kyllä tehokas ja nopea. Se
pystyy esimerkiksi tunnistamaan erilaisia muotoja tai kuvioita. Sitä
varten verkko pitää ohjelmoida. Ohjelmointi tarkoittaa, että
solujen välisille kytkennöille annetaan sopivia ominaisuuksia.
Verkko on ohjelmoitava erikseen jokaista tunnistustehtävää varten.
Ja niin kuin ehkä aavistamme, ohjelmointi on hidasta ja hankalaa
työtä.
Entä jos tuo soluverkko osaisikin oppia itsekseen
ilman, että ihmisen pitäisi sitä opettaa? Ehkä se on mahdollista!
Suomalainen tekoälytutkimuksen pioneeri Teuvo Kohonen (1934–2021)
kehitti 1980-luvulla niin sanotun itseorganisoituvan kartan (SOM,
self organizing map). Se on tietyillä tavoin toimivien yhteen
kytkettyjen laskentasolujen verkko. Kun tällaiseen verkkoon
syötetään tietoa, esimerkiksi suomenkielen sanoja, sen solut
herkistyvät vähitellen niin, että ne alkavat tunnistaa kirjaimia
ja jopa sanoja.
Nykyiset kohua herättäneet tekoälyjärjestelmät
eivät ole samanlaisia kuin nämä Kohosen verkot, paitsi aivan
yleisellä tasolla: ne oppivat itsenäisesti ilman tapauskohtaista
ohjelmointia. Kantavana ideana on oppimistulosten takaisinkytkentä.
Verkon tuottamia tuloksia verrataan syötettyyn dataan. Esimerkiksi
jos verkko tunnistaa oikein sille syötetyn kuvion, oikein
toimineiden solujen kytkennät vahvistuvat. Kun oppimisjaksoa
toistetaan monia kertoja, verkko herkistyy tunnistamaan
samankaltaista dataa ja ohittamaan poikkeavan datan.
Käytännössä asia on tietenkin paljon
monimutkaisempi. Tällä teknologialla on tiivis yhteys mm
tilastotieteeseen, ja ideoiden kehittymistä voidaan seurata ainakin
pari sataa vuotta taaksepäin. Hermosolujen kaltaisia
laskentaverkkoja alettiin miettiä jo 1920-luvulla, ja tietokoneiden
keksiminen ja ajatus tekoälystä vauhdittivat kehitystä. Erilaisten
kilpailevien ideoiden, algoritminen ja käytettyjen termien paljous
hämmentävät alaan perehtyvää.
Jos oppivia verkkoja opetetaan rajoitetulla
datamäärällä, tulokset voivat olla hyviä. Mutta jos verkkoon
syötetäänkin opetusmateriaalista olennaisesti poikkeavaa dataa,
verkon algoritmit häiriintyvät ja se saattaa tehdä aivan outoja
virheitä. Siksi verkkojen kouluttamiseen tarvitaan hyvin paljon
dataa, ja juuri internet on täynnä valmiiksi digitoitua tekstiä,
kuvamateriaalia, puhetta ja liikkuvaa kuvaa. Samalla erilaisille
tekoälysovelluksille avautuu valtavat mahdollisuudet. Mutta olemme
myös uudenlaisessa tilanteessa. Internetissä on valtavia määriä
kaikkien ihmisten saatavissa olevaa materiaalia, jonka kohdalla
tekijänoikeudet rajoittavat kaupallista hyödyntämistä. Onko tämän
materiaalin käyttö tekoälyjen opettamiseen hyväksyttyä tai
sallittua? Ainakaan tällaista käyttöä ei voida tällä hetkellä
kontrolloida tai estää.
Tekoälyn lisääntyvään käyttöön liittyy
myös sen toiminnan luotettavuus – ja kriittisissä sovelluksissa
tekoälyn validointi. Voimmeko luottaa tekoälyihin? Vai voivatko ne
tehdä outoja tai vaarallisia virheitä. Esimerkiksi itseohjaavien
autojen järjestelmät voivat tunnistaa liikennemerkit väärin:
kaupallisia mainoksia tai vaalimainoksia on luultu
nopeusrajoituksiksi. Pankkien järjestelmät ovat estäneet
asiakkaiden lainoja tai sulkeneet tilejä, koska ne ovat tulkinneet
väärin asiakkaan nettikäyttäytymistä.
Oma lukunsa on eettinen väärinkäyttö.
Kasvojentunnistusohjelmia voidaan käyttää epäilyttävien ihmisten
valvontaan, Kiinassa tämä on jo hallituksen käytäntö.
Todennäköisesti tällaisia järjestelmiä on myös monilla
lentokentillä. Ihmisten nettikäyttäytymistä seurataan laajasti –
ja usein heidän suostumuksellaan, onhan monilla muun muassa
kauppaketjujen etukortteja ja nettikauppojen ja erilaisten palvelujen
tilejä. Voidaan olettaa, että tällaista tietoa vuotaa hallitusten,
kaupallisten toimijoiden ja rikollisten ulottuville. On myös ilmaantunut
aivan uusi käsite: ”deep fake” eli syvähuijaus. Se tarkoittaa oikeista ihmisistä
luotuja virtuaalihahmoja, yleensä tarkoituksena on eriasteinen
vahingon tuottaminen tai rikoshyöty.
Eräs valaiseva sovellusesimerkki on tekoälyn tuottama
”valokuva”, joka voitti tunnetun valokuvauskilpailun. Voimme
hyvin kuvitella, mistä oli kysymys. Tekoälyn opetusmateriaalina on
ollut suuri joukko valokuvauskilpaluissa ja gallerioissa olleita
kuvia, ja oppimisen laatukriteereinä on käytetty kuvia, jotka ovat
voittaneet palkintoja.
Mitä pitäisi tehdä? Ainakin on syytä olla
varovainen. Olen aiemmin kirjoittanut aiheesta tässä blogissa
otsikolla Koneiden moraali. Tuon kirjoituksen näkökohdat ovat
edelleen päteviä. Osaamme suojautua varsin hyvin tekoälyn
toiminnan tuottamilta fyysisiltä vaaroilta ja aineellisilta
vahingoilta. Samalla huolellisuudella pitäisi suhtautua
aineettomiin, informaation kautta tuleviin uhkiin.
Voimme luonnehtia näitä uusia tekoälyn muotoja
seuraavasti: ne tuottavat eräänlaisia tilastollisia malleja tai
yhteenvetoja maailmasta, niille annettujen vihjeiden ja rajausten
mukaisesti. Nämä mallit eivät kuvaa maailmassa vallitsevia
asiantuloja sellaisenaan, vaan ne kuvaavat vain internetin sisältöä.
Voimme tietysti ajatella, että internetin sisältö heijastaa
maailmaamme, mutta suhde ei varmaankaan ole yksinkertainen. Ihmiset
syöttävät internettiin sisältöä erilaisista syistä ja
motiiveista, ja lisäksi erilaiset järjestelmät ja koneet syöttävät
sinne dataa.
Mutta nyt seuraa tärkeä huomio!!
Uudet tekoälyn muodot tuovat mukanaan aivan
uudenlaisen ja syvällisen haasteen tai kysymyksen. Tämä haaste on
dramaattinen ja järisyttävä, mutta siihen ei ole kiinnitetty
oikeastaan lainkaan huomiota. Se muuttaa radikaalisti kuvaamme siitä,
mikä ihminen on ja miten ihminen ajattelee.
Viimeisten vuosikymmenien aikana aivojen tutkimus
on vähitellen parantanut ymmärrystämme siitä, miten aivomme
toimivat, mitä on ajatteleminen, ja viime kädessä siitä, mikä on
ihminen. Tämä ymmärrys ei ole lainkaan sellainen, mikä on
juurtunut kulttuuriimme. Olemme täysin toisenlaisia kuin mitä
uskomme olevamme.
Aloitetaan vertauskuvasta, ja otetaan
tarkasteltavaksi eläinten käyttäytyminen. Isoja ihmisapinoita,
ennen kaikkea simpansseja pidetään älykkäinä. Ne käyttäytyvät
ihmismäisesti, ja niillä on isot aivot, joiden ajatellaan olevan
jonkinlainen merkki älykkyydestä. Apinat osaavat ratkaista
erilaisia pulmatehtäviä ja käyttää ja jopa valmistaa sitä
varten erilaisia apuvälineitä. On kuitenkin niin, että eräät
varislinnut ovat pulmatehtävien ratkaisijoina jopa apinoita
etevämpiä. Ja kuitenkin, niiden aivot mahtuisivat helposti
teelusikkaan.
Tehdään rohkea johtopäätös. Ihmisten (tai
apinoiden tai valaiden tai elefanttien) aivojen suuri koko ei sinänsä tee
omistajistaan älykkäitä. Nuo suuret aivot tuottavat enimmäkseen
jotain aivan muuta kuin niin sanottua älykkyyttä. Mutta mitä?
Aivotutkimus on vähitellen selvitellyt tätä
mysteeriä. Osoittautuu, että aivot ovat ennen kaikkea mallinnus- ja
ennustuskone. Ne tuottavat ympäristöämme ja sen tapahtumia kuvaavan ja ennustavan dynaamisen mallin, jonka rakennusaineina ovat aistihavainnot
ja muistissa oleva tieto. Se on välttämätöntä, jotta pysyisimme
toimimaan ja ylipäätään selviytymään maailmassa. Tämä on toki
yleinen piirre. Kaikkien eläinten hermostot toimivat vastaavalla
tavalla.
Isojen aivojemme erityismerkitys saa valaistusta
tästä havainnosta. Aivoihimme tallentuva muistiaines on tässä
hyvin tärkeää, kaikesta kokemastamme jää aivoihin muistijälkiä.
Olemme sosiaalisia ja pitkäikäisiä eläimiä, ja toimimme
mutkikkaalla tavalla mutkikkaassa ympäristössä. Aivoissamme täytyy
olla tilaa tallentaa ja hyödyntää tietoa koko pitkän elämämme
ajan. Siksi ne ovat niin suuret, erityisesti ihmisellä, joka on
suuriaivoisista eläimistä kyvykkäin. Ihmisen valtava tehokkuus,
kyky, kapasiteetti (ja tuhovoima) nojaa myös näppäriin käsiimme
ja erityiseen kielikykyymme.
Nyt voimme tehdä rinnastuksen uuden tekoälyn
toimintaperiaatteeseen. Ajattelumme, toimintamme ja reaktiomme ovat
eräänlaisia tilanteen mukaan tehtyjä vedoksia ja yhteenvetoja
muistissamme olevasta kokemusvarannosta. Karkeasti ajatellen aivojemme
valtava ja jatkuvasti karttuva muistivarasto vertautuu tekoälyn käytössä olevaan internetin
sisältöön.
Olen yllä esittänyt radikaalin oivalluksen, aika
kompaktisti, ikään kuin pikajuoksuna. En selitä tarkemmin, siihen
tarvittaisiin valtavasti tilaa, ei se tähän blogiin mahtuisi. Eikä
asia jankuttamalla parane. Radikaalin ajatuksen pitää antaa upota
ja vaikuttaa. Sitten siitä voi ottaa varovasti selvää. Vakuutan
kuitenkin, että edellä esitetty perustuu etevimpien aivotutkijoiden
vuosikymmenien aikana tuottamiin tuloksiin.
Pohjustan näitä ajatuksia tulevassa kirjassani
Robottipuisto. Esseitä ihmisen ja koneen älystä. Toivon, että
saan sen pian lukijoideni ulottuville.