keskiviikko 29. tammikuuta 2025

Tekoäly ja termodynamiikka

Nyt seuraa hieman vaikeaselkoinen kirjoitus. Ei voi mitään, jos tapaan hyvän idean, se pitää panna paperille, tavalla tai toisella. Ja nyt ei ole helposti saatavilla muuta sopivaa kanavaa kuin tämä blogi. En nimittäin halua kehitellä ideaa kokonaiseksi kirjaksi, ei sitä kukaan jaksaisi lukea. Ja tiukan tieteellisen standardin täyttävä artikkeli olisi turhan suuritöinen. Ehkä ”Tieteessä tapahtuu” lehti, joka kirjoittaa siitä mistä nimi kertoo mutta yleistajusesti, voisi aikanaan vastaanottaa aiheesta kirjoituksen.

Ja kerron tähän alkuun myös sen, etten unohda, että idea ei ole omani vaan biologin ja kirjailijan Tiina Raevaaran ja brittiläisen matemaatikon Dorje C. Brodyn. En kerro ideaa heti, vaan rakennan ensin aasinsillan. Siitä tulee valitettavasti varsin pitkä aasinsilta.

Asiaan! Aloitetaan siitä, mitä on termodynamiikka. Ei tarvitse googlata, se on fysikaalinen tiede, suomeksi se on nimeltään lämpöoppi. Ja nyt tulee ensimmäinen selityksen paikka, sillä tässä kohdassa pitää kysyä, ”mitä lämpö on”. Niin, luulemme sen toki tietävämme jo oman kokemusmaailman kautta. Aivan niin kuin uskomme tietävämme, ”mitä aika on”. Mutta ihan oikeasti: lämpö on kyllä jotain muuta kuin havaintopsykologiaa! Sitä mitenkään halventamatta.

Wikipedian hieman horjahteleva selitys kertoo että termodynamiikka käsittelee eri energimuotojen välisiä muutoksia. Suunnilleen sitä se varmaan on, mutta mitä sitten on energia? Sekään ei ole ollenkaan selvää, vaikka nykyään sanotaan, että se on kaiken perusta. Maailma kun koostuu modernin fysiikan mukaan aineesta ja energiasta, ja ne voivat muuttua toisikseen. Mutta on outoa, että pitkälle 1800-luvulle energia oli tuntematon asia, paremmin tunnettiin liikemäärä, jota soviteltiin fysiikan perussuureeksi. On ehkä jopa hassua, että energiaa ja siis myös termodynamiikkaa eivät keksineet teoreettiset fyysikot, matemaatikot tai filosofit vaan käytännön miehet: insinöörit ja fyysikot, jotka koettivat parantaa höyrykoneiden toimintaa.

Tässä tulee helppo muistisääntö, joka samalla valaisee energian olemusta. Se tulee kielten maailmasta. Se on yhdyssana en-ergia, missä kreikan ergeia tarkoittaa aktiivisuutta tai työtä (kuten sanassa ergonomia; ergo sattuu olemaan myös latinan apusana ”siis”). Energia on siis työn mahdollistaja, kyky tehdä työtä. Ja työ on tässä maailmassa hyvin yleinen ja tärkeä asia. Työ ei tarkoita pelkästään esineiden nostoa ja siirtämistä. Aineen muokkauksessa tarvitan työtä, samoin sitä kuluu nesteiden ja kaasujen pumppaamseen. Sähkö on energiaa, sillä voimme syöttää sitä sähkömoottoriin, joka alkaa tehdä työtä puolestamme. Valo on energiaa, sitä voidaan ottaa talteen aurinkopaneeleilla ja muuttaa sähköksi. Kemialliset prosessit voivat kuluttaa tai tuottaa energiaa. Poltamme puuta tuottaaksemme lämpöä, ja tankkaamme autoihin kemiallista energiaa vapauttavaa polttoainetta tai sähköä. Elintoimintamme perustuvat energian muutoksiin. Saamme kemiallisesti sitoutunutta energiaa ravinnosta, ja elimistömme alkaa tehdä energian munnoksia. Saamme kehomme lämpöä, ja käytämme sitä lihaksissamme – vaikka tekemällä työtä.

Kirjoitin edelle pitkän luettelon. Se havainnolistaa sitä, että jokseenkin kaikki, mitä maailmassamme tapahtuu, perustuu erilaisiin energian muunnoksiin. Ja termodynamiikka on tiede, joka tutkii ja mallittaa näitä energiatilojen muutoaksia ja niiden suuren mittakaavan seurauksia. Termodynamiikka on löytänyt yleisiä maailmaa koskevia säännönmukaisuuksia. Energiaprosessit ovat luonteeltaan energiatilojen muutoksia. Energia siirtyy niissä aina korkeasta kohti matalaa. Esimerkiksi höyrykoneen kattilassa poltetaan hiiltä, ja kattilaan kehttyy korkea energia eli lämpötila. Tuo energia siirtyy höyryn välityksellä viileään ulkoilmaan, ja ikäänkuin sivutuotteena höyrykone tekee mekaanista työtä.

Maailmassamme on siis suuri määrä erilaisia energiatiloja, ja nämä tilat tasoittuvat vähitellen erilaisissa energian muuttumisprosesseissa. Näiden tilojen yhteinen kokonaisenergian määrä ei muutu, se on eräs termodynamiikan laki. Sen sijaan tilojen väliset erot pyrkivät tasoittumaan, juuri se pitää maailmamme toimivana ja dynaamisena. Nuo energiatilat ovat järjestyneet korkeamman ja matalamman energian rakenteiksi. Vähitellen erot tasaantuvat, ja se tarkoittaa epäjärjestyksen lisääntymistä. Termistä epäjärjestystä sanotaan entropiaksi, ja eräs termodynamiikan laki sanookin, että entropia pyrkii lisääntymään.

Nyt filosofisesti ajatteleva lukija voisi kysyä, mitä tästä seuraa? Kun kaikki erot ovat lakanneet, energiaprosessit pysähtyvät, ja maailma kuolee, eli mitään liikettä ja muutosta ei enää tapahdu. Termodynamiikan lait koskevat kuitenkin vain eristettyjä eli suljettuja järjestelmiä. Tarkkaan ottaen linnunradan planeetat eivät ole termodynaamisesti suljettuja, sillä tähtien sisällä tapahtuvat ydinreaktiot tuottavat säteilyn kautta jatkuvaa energiavirtaa planeettojen pinnalle, ja se ylläpitää niiden dynamiikkaa, eli Maan tapauksessa se saa myös elämän jatkumaan. Tämä on tärkeä näkökohta, ja siihen palataan ehkä vielä aivan kirjoituksen lopussa.

Mutta nyt pitäisi jo päästä otsikon lupaamaan tekoälyyn. Tekoäly on jotain, mitä tietokoneet tekevät. Ja tietokoneet käsittelevät tietoa eli dataa. Tieto tallennetaan tietokoneiden muistilaitteen tallennusyksiköihin energiatiloina, ja näitä tiloja sanotaan biteiksi. Tallennusyksiköt voivat olla mikropiirien muistisoluja, tai magnetoituvan tai optisen materiaalin alueita. Kun tietoa tallennetaan, nuo bitit asetellaan tiettyyn järjestykseen. Näiden energiatilojen muutteluun eli tiedonkäsiyttelyyn tarvitaan siis aina energiaa. 

Tiedämme, että tietokoneiden energiatehokkuus on vuosikymmenien ajan parantunut, niin että nykyaikainen älypuhelin, joka on myös tietokone, on laskentanopedeltaan ja tiedonkäsittelyn energiatehokkuudeltaan valtavasti parempi kuin 1960-luvun tonnien painoiset tietokonejärkäleet. Tuo tehokkuus on saavutettu pienentämällä sitä energiamäärää, joka tarvitaan tietobitin tallentamiseen. Ja se on saavutettu tekemällä tietoa tallentavat muistisolut aina vain pienemmiksi. Nykyisin niiden koko alkaa lähestyä mikronin tuhannesosia. Pienentämisellä on kuitenkin rajansa, sillä molekyylien lämpövärähtely alkaa jo heilutella bittejä. Ilmiötä sanotaan termiseksi kohinaksi. Sitä voitaisiin pienentää jäähdyttämällä tietokoneet hyvin kylmiksi – mutta koska jäähdyttäminen on hankalaa ja kuluttaa paljon energiaa, menetelmää ei yleensä kannata käyttää.

Vähitellen alamme lähestyä tekoälyä. Nykyiset ja paljon keskustelua herättävät tekoälyjärjestelmät perustuvat hyvin surten tietomäärien käsittelyyn. Niin, oikeastaan vasta internetin sisältämät valtavat tietomassat ovat tehneet ne mahdollisiksi. Siksi tekoälyä tarjoavat serverit ovat valtavia energiasyöppöjä. Ja erityisen paljon dataa ja energiaa tarviaan niiden ohjelmoinnissa eli opetusvaiheessa.

On vielä eräs asia, joka tekoälystä puhuttaessa on syytä tuntea – vaikka asa onkin varsin syvällinen ja vaikea. Sen nimi kuulostaa todella vaikuttavalta: informaatioteoria. Matemaattisen informaatioteorian esitteli noin vuonna 1948 amerikkalainen matemaatikko Claude Shannon (1916– 2001). Tässä teoriassa informaation mitan perusyksikköä sanotaan bitiksi. Yksi bitti tarkoittaa valintaa kahden vaihtoehdon välillä. Monimutkaisemmat valinnat ovat mahdollisia käyttämällä enemmän bittejä. Biteistä rakentuu näin mutkikkaampaa tietoa, joka käytännössä voi olla kirjoitusta, puhetta, kuvia tai videoita. Informaatioateoriaa hyödynnetään signaalien koodauksessa. Tiedon siirrossa voi esiintyä häiriöitä, ja tiedon tallennuslaitteessa voi olla viallisia talennusyksiköitä. Koodaus tarkoittaa, että informaatioon eli bittien joukkoon lisätään ylimääräisiä bittejä, tämän bittien ylimäärän eli redundanssin avulla virheet voidaan joko korjata tai ainankin havaita. Jokaiseen käytännössä esiintyvään informaationa käsittelytapaan, siirtoon tai tallentamiseen, liittyy virheiden mahdollisuus, ja niille vodaan suunnitella parhaiten soveltuva koodaustapa.

Myönnän, että edellä annettu kuvaus informaation mittaamisesta ja koodaamisesta ei välttämättä aukea asiaa tuntemattoman silmille. Ehkä se antaa kuitenkin jonkinlaisen vihjeen, millaisesta ajattelutavasta on kysymys. Lisään vielä muutaman asian. Informaatioksi sanotaan sitä, että signaalin siirto- tai tallennusyksiköiden energiatilat on järjestelty tietyllä tavalla. Informaatio tarkoittaa siis järjestystä. Ja tässä on yhteys termodynamiikkaan: dynaamisessa maailmassamme energiatilat ovat järjestäytyneet tietyllä tavalla. Termodynaamisissa prosesseissa järjestys vähenee, tai pysyy enintään ennallaan. Lyhyt muistisääntö: järjestys = informaatio, epäjärjestys, kaaos=entropia.

Nyt pääsemme semanttiseen informaatioteoriaan: se käsittelle tiedon semantiikkaa eli tiedon merkitystä ihmiselle. Kaikki tieto ei ole yhtä kiinnostavaa. Usein käytetty esimerkki on kaksi uutista: ”koira puri miestä”, ja ”mies puri koiraa”. Edellinen ei ole kauhean kiinnostavaa, mutta jälkimmäinen on tosi silmiinpistävää. Jälkimmäinen tapaus sisältää kuulijan kannalta enemmän informaatiota. Se on myös epätodennäköinen. Saamme semanttiselle informaatiolle mitan: mitä epätodennäköisempi joku viesti on, sitä suurempi on sen informaatioarvo. (Totean vielä, että signaalin todennäköisyys on tärkeä käsite myös matemaattisessa informaatio- ja koodausteoriassa, mutta en selosta sitä enempää).

On selvää, että ihmiset tulkitsevat viestejä eri tavoin, informaation tulkinta on subjektiivista. Siksi semanttisessa informaatioteoriassa ei voida määritellä tarkkoja sääntöjä tai laskukaavoja informaation määrälle. Se on kuitenkin hyvin tärkeä ja suuntaa-antava ajattelutapa.

No niin, lopulta aasinsilta on valmis. Nyt voin kertoa sen tekoälyyn liittyvän ajatuksen, johon alussa viittasin. Nykyisin runsasta keskustelua herättävät tekoälyjärjestelmät perustuvat niin sanottuihin keinotekoisiin oppiviin hermoverkkoihin, tai oikeastaan sellaisia jäljitteleviin ohjelmiin. Kuulostaa oudolta ja jopa uhkaavalta, mutta asia on loppujen lopuksi yksinkertainen. Nuo ohjelmat laativat oikeastaan vain tilastollisia yhteenvetoja siitä materaalista, jolla ne on opetettu. Tekoälylle esitetään joku kysymys tai tehtävä, ja se tuottaa vastauksen, joka parhaiten sopii yhteen sen käyttämän aineiston kanssa. Asia on käytännössä mutkikkaampi, mutta lopputulos on sama: jollain kriteereillä tuotettu vedos opetusmateriaalista. 

On ilmeistä, että tekoälyllä tullaan jatkossa tuottamaan yhä suurempi osa sitä informaatiovirtaa, josta yhä enemmän ollaan riipuvia. On helppoa havaita, että tekoälystä on tullut termodynaaminen prosessi, ja se taas jatkuvasti kasvattaa entropiaa – eli pienentää informaatiosisältöä. Toinen havainto on, että sosiaalinen media näyttää toimivan samaan tapaan - eli sen sisältöä tuotetaan suuressa määrin siinä jo olevasta sisällöstä. Toisin sanoen, eri alustoilla liikkuva informaatio, joka on tärkeä osa ihmiskunnan kulttuurivarantoa, lisääntyy tulevaisuudessa määrällisesti, mutta sen semanttinen merkitys ja arvo kuihtuvat.

Erä mahdoillinen skenaario on, että tekoäly tuottaa näennäisen informaation vallankumouksen, joka pitkän päälle kuihduttaa merkityksensä ja jopa itsensä. Käytännössä siis kukaan ei enää ottaisi vakavasti tekoälyn tuottamaa aineistoa. Se saattasi olla jopa onnellinen vaihtoehto

Kolmas asia, joka ei ole ihan sama, on, että tekoälyt hyödyntävät myös henkilökohtaista tietoa, muun muassa kulutuskäyttäytymisestä ja tietosisältöjen kulutuksesta. Sosiaalisen median alustat keräävät tällaista tietoa käyttäjistään. Tietenkään eivät tekoälyt itse sitä tietoa tarvitse, vaan ne tahot, jotka haluavat manipuloida vaikkapa ihmisten ostokäyttäytymistä ja poliittista toimintaa. Tämähän on jo nähty, ja lisää on varmasti tulossa.

Ja vielä yksi ajatus, tällä kertaa omani – niin luulisin. Koska olen aikanaan opiskellut säätö- ja systeemiteoriaa, huomasin seuraavan huolen aiheen. Pian yhä suurempi määrä siitä materiaalista, jota infosfäärissä eli internetissä ja mediassa liikkuu, on itse asiassa jo kertaalleen tuotettu tekoälyllä. Säätötekniikassa tällainen ilmiö tunnetaan positiivisena takaisinkytkentänä. Se tarkoittaa käytännössä erilaisia tasapaino-ongelmia. Se voi tarkoittaa että osassa järjestelmää tapahtuu äkillisiä romahduksia, tai voi kehittyä kaoottisia informaation hyökyaaltoja, joiden sisältö ja vaikutus voivat olla arvaamattomia. Infosfääristämme saattaa siis tulla epästabiili.

Alussa pohdittiin, eikö entropian kasvu johda maailmamme termodynaamiseen kuolemaan ja kaiken pysähtymiseen? Näin ei käy, koska Aurinko tuottaa jatkuvasti uutta lämpöä.  Entä eikö vastaavasti informaatio tule kokemaan termodynaamista kuolemaa? Toistaiseksi ihmisten luova toiminta on lisännyt informaatiota kulttuuriimme. Miten käy jatkossa, kuka tietää.