Kategori: politisk alvor
Om kunst og kunstig intelligens.
11-07-2019
Her er adskillige links til engelske artikler, som skriver seriøst, kritisk og udførligt om kunstig intelligens.

Det er en grov første kladde uden fine formuleringer. Jeg skriver lige ud posen, fordi den er fyldt til randen. Om kunst og kunstig intelligens, AI, Artificial Intelligence.

Mange eksperter i kunstig intelligens forklarer, at disse digitale programmer ikke er intelligente, og at betegnelsen er en overdrivelse, som kun har det formål at promovere den nye teknologi. Ordet artificial kan have flere betydninger: skabt af mennesker, falsk og vildledende, unaturlig. Definitionen er fra en.wiktionary.org, som siger, at ordet er i slægt med 'artifice', der betyder en dygtig, men uærlig vildledning, et trik eller kneb klogt udført, en strategisk manøvre, som bruger alle midler til at undgå afsløring, et taktisk træk for opnå en fordel.

Kunstig intelligens er kort sagt menneskeskabt snyd, når det bruges på forhold, som angår mennesker, bl.a. kunst. I industrien og til tekniske formål kan AI være til stor hjælp. I det følgende vil jeg bruge andre betegnelser, ML (maskinlæring) eller komplekse digitale systemer.

Mit emne i en serie af indlæg er forholdet mellem kunst, litteratur, malerkunst, musik, film og komplekse digitale systemer. I dette indlæg om litteratur.

Der er ikke mange eksempler på tekster, som ML har skabt. Jeg undersøger derfor om ML kan forstå og oversætte tekster. Jeg slutter baglæns: hvis kunstige programmer kan forstå kernen i en tekst, kan de måske også skabe nye tekster.

Douglas Hofstadter undersøger Google Translate i sin artikel "The Shallowness of Google Translate". Han mener, at det er meget krævende at oversætte fra et sprog til et anden. Det kræver mange års livserfaring og en kreativ forestillingsevne. På den ene side mener han, at Google Translate er nyttig og brugbar i mange situationer, og at nogle sætninger og afsnit kan være oversat imponerende og forbavsende rigtigt og give en illusion af intelligens. På den anden side er der mange eksempler på, at Google Translate går glip af den den centrale pointe i teksten. Den forstår ikke hvad den 'læser'.

Douglas Hofstadter tester Googles oversættelse bl.a. på sætninger fra engelsk til fransk og fra kinesisk til engelsk. Han påviser, at Google kan tage helt fejl af pointen i original teksten. Han vælger et afsnit fra en kinesisk bog og lader Google oversætte det. Han påpeger flere besynderlige ord, som Google foreslår. Ét af de kinesiske ord kan han heller ikke selv oversætte og kun efter længere efterforskning finder han ud af den rigtige betydning af ordet.

Derefter foretager han selv en oversættelse af afsnittet, og det tager ham flere timer. Douglas Hofstadter er professionel oversætter, og han siger: oversættelse er en kunst, hvor ideerne i det ene sprog, original teksten, skal stå lige så klart i det andet sprog, og samtidig afspejle stilen, stemningen og finurlighederne i den originale tekst.

Jeg blev inspireret til selv at afprøve Google og tog først sætningen: en gammel stol kan være mere farlig at sætte sig på end en ny stol. Det gør Google fint, og det er uforståeligt og imponerende, at et computer program kan gøre det: An old chair can be more dangerous to sit on than a new chair. Jeg er dog i tvivl om 'at sætte sig på' er helt det samme som 'to sit on', der vel kun betyder 'at sidde på'. Googles system arbejder ved hjælp af statistik. Det komplekse digitale system hos Google er blev indlært med tusinder af tekster fra bøger og fra nettet på dansk og på engelsk. Systemet lærer, hvor et ord står i en sætning, og hvilke andre ord som kan stå i nærheden. Når der står 'en' må stol være 'chair'. Jeg prøvede en mere indviklet sætning end den første. ''Stol ikke på stole, som er gamle, da de kan gå i stykker. Nej, stol derimod på stole, som er nye. " Det bliver til det rene volapyk i anden sætning:" Do not rely on chairs that are old as they may break. No, on the other hand, chairs on new ones." Det viser klart, at Google Translate ikke læser og forstår en sætning, så ville den aldrig foreslå 'chairs on new ones'. Det giver ingen mening hverken på dansk eller på engelsk.

Fortalere for kunstig intelligens nævner ofte i deres artikler Google Translate som et eksempel på, hvor dygtige og kompente digitale systemer kan være. Jeg vil snarere sige, at det er et eksempel på, hvor dygtige digitale systemer er til at snyde, så vi i dette tilfælde tror de kan oversætte. Måske er Google Translate god til hverdags meddelelser. Jeg bruger nogle gange Google Translate til at oversætte et enkelt ord, men med mit kendskab til engelsk er jeg ikke altid tilfreds og bruger mere online engelske leksika så jeg kan se de forskellige betydninger, som et ord kan have. Efter sigende kan en ny app bruges, når man står over for en udlænding. Den oversætter straks og siger ordene i det fremmed sprog. Står jeg over for en kineser, oversætter appen straks fra dansk til kinesisk. Den turde jeg ikke bruge. Hvad kunne den ikke finde på at sige. Det kunne kun gå galt.

I artiklen "A reality check on AI’s grasp of human language" skriver Ben Dickson, at digitale programmer eller neurale net bruger en mekanisk og statistisk metode og oversætter ikke ords betydning. Derimod når mennesker oversætter fra et sprog til et andet, ser de på kulturen, som teksten er fra, og sammenhængen, som er i teksten, historien bag ord og ordspil. Mennesker forsker i baggrunden for emnet, før de tager en beslutning om hvilket ord, som er passende. Det er en meget kompliceret proccess, som involverer commonsense og abstrakt forståelse.

Et andet problem er, at et ML er indlært med fortidige data. I Googles tilfælde fortidige tekster. Forholdene i fortiden er forskellige fra forholdene nu om dage og forholdene, som vi gerne vil have dem i fremtiden. Aaron M. Bornstein udførte det eksperiment, at Google skulle oversætte to tyrkiske sætninger: “o bir doktor” og “o bir hemşire”, og der er det særlige ved tyrkisk at stedord ikke har køn, dvs ét ord 'o' står for både han og hun. Bornstein testede, hvordan Google Translate ville oversætte de to sætninger til engelsk. Resultater var "he is a doctor" og "she is a nurse". Jeg prøvede for nogle måneder siden, hvordan oversættelsen bliver til dansk, og det var "hun er doktor". Det samme i de andre nordiske sprog og tysk og fransk. Det var tilfældet for nogle måneder siden, da jeg foretog eksperimentet. Men nu er resultatet et andet. Nu siger Google Translate til dansk: "han er doktor". Og åbenbart har Google hørt om Bornstein, for oversættelsen til engelsk giver nu to forslag, et med hunkøn og et med hankøn, og det samme med hensyn til sygeplejerske.

Det må vise, at Google Translate ikke er ren ML, som kun arbejder på grundlag af data. Mennesker kan ikke sætte regler ind i et sådant system. Resultatet kan kun ændres, hvis systemet blev oplært med andre data. Google må have sat et filter efter, som tjekker på om det tyrkiske ord 'o' er i teksten, og retter oversættelsen derefter. Endnu et eksempel på at digitale programmer ikke fungerer uden menneskers hjælp.

Problemet med kunstig intelligens er, at det skal indlæres med data, mange tusinde data, og data vil i sagens natur altid være fortidige. Det medfører, at et ML kun kan afspejle fortiden og konservere status quo. Det er en af forskellene til ægte kunst, som kritisk belyser virkeligheden og foreslår nye måder at leve på, nye livsopfattelser.

Hvad er lettest at oversætte en roman eller at skabe en ny roman. Det første. Men hvis ML systemer ikke kan oversætte, hvordan kan de så skabe tekster, som er ægte kunst.

I de artikler jeg har læst er der eksempler på tekster, som er genereret af digitale programmer. I 2017 foretog Ross Goodwin et eksperiment, hvor han indlærte et ML med 3 grupper af litteratur, hver på 120 megabytes eller or 20 millioner ord, dels poesi, dels science fiction, dels trivial litteratur. Han udstyrede sin bil med sensorer, kamera, GPS og mikrofon, koblet til hans pc, og han tog på et roadtrip. Computeren med hans ML system bearbejdede de indtryk, som kom fra sensorerne, og computeren dannede tekster på den baggrund og det blev løbende skrevet ud. Da han startede bilen og kørte afsted på sin rejse, skrev computeren:" It was nine seventeen in the morning, and the house was heavy." ( klokken var 17 minutter over 9 og huset var tungt). På et andet tidspunkt skriver den:" A body of water came down from the side of the street. The painter laughed and then said, I like that and I don’t want to see it." (en krop af vand kom ned fra gadens side. Maleren lo og sagde så: det kan jeg lide og jeg vil ikke se det).

Goodwin var overvældet over ordene, som hans ML skabte, og fandt dem smukke. Men han konkluderede dog, at den maskin-generede rejsebog var et meget uperfekt dokument, et hurtig protyping projekt, og at bogen ikke var som en roman skrevet af et menneske, endda langt fra. Jeg må give ham ret. Til trods for hans ML's omfattende 'viden', 60 millioner ord, lyder det nærmest som om hans system satte helt tilfældige ord sammen.

I artiklen "AI hype. AI Can Write Novels and Screenplays Better than the Pros!" fortælles om det første AI-skrevne sci-fi filmscript: et ML blev indlært med mange filmscripter og genererede replikker derudfra. Et eksempel:" It may never be forgiven, but that is just too bad. I have to leave, but I’m not free of the world. ." (måske bliver det aldrig tilgivet, men det er bare en skam. Jeg bliver nødt til at tage afsted, men jeg er ikke fri for verden). Og dertil svarer 'den anden person':" Yes. Perhaps I should take it from here. I’m not going to do something." ( Ja, måske skulle jeg overtage. Jeg vil ikke gøre noget.) Den sidste sætning er iøvrigt mærkelig på engelsk. Det skulle have været 'anything' og ikke 'something'. Selvfølgelig vil AI disciple mene, at replikskiftet er dybt surrealistisk og meningsfuldt. Jeg mener, at ordene er det rene nonsens. Forfatteren af artiklen konkluderer da også: er filmscriptet overvældende. Ja, kun i dets idioti. Er det intenst? Nej, det er ikke engang interessant.

Journalisten Denyse O'Leary siger det rammende: bøger kan være så fyldte at klicheer, at det virker som om forfatteren har fået inspiration fra en cliche-generator. Det er umuligt ved hjælp af en cliche-generator at producere originale tanker.

Men digitale systemer er ikke kun blevet brugt til forsøgsvis at skabe filmscripts og romaner. AI disciple mener, at der er et stort kommercielt potentiale i at anvende disse systemer til at automatisere journalistik. Igen er formålet med at bruge teknologien at spare penge og at tjene penge. Journalister får høje lønninger og kunne de spares væk, ville det betyde meget for bundlinien. Desuden er der en stadig stigende strøm af nyheder, så det er svært at overskue for mennesker. Digitale maskiner kan på ingen tid tygge sig igennem enorme mængder data og skrive et sammendrag i en nyhedsartikel.

Kritikere mener, at maskiner ikke som mennesker kan forstå det væsentlige i en tekst, og formuleringer i maskin-genererede artikler er upræcise og usammenhængende. At sammenfatte det væsentlige i en tekst kræver ægte intelligens og commonsence og beherskelse af sproget. Digitale maskiner, som fungerer ved hjælp af statistik, mangler disse evner.

Aurora Yang skriver i artiklen "Algorithmic Journalism: Who decides what we should know?", at algoritmisk journalistik ikke er subjektiv og påvirket af manglende viden og fordomsfuld forståelse af en sag, som det kan være tilfældet med journalister af kød og blod. Men selv om algoritmer kan gennemlæse enorme mængder af data, garanterer det ikke pålidelig information. Aurora Yang giver et eksempel. Den 23. april 2013 blev et nyhedsmedies twitterkonto hacket og der blev sendt falske nyheder om en eksplosion i Det Hvide Hus. Det opfangede algoritmer på børsen og handlede aktier på den baggrund, og det resulterede i børsfald på 136 milliarder. Fejl i algoritmer kan også medføre, at nyheder ikke bliver objektive. Og der er for, at ægte journalistik ikke kun består i data og fakts, men at nyheder skal forstås og fortolkes, fordi de ofte er mere komplekse end første øjekast afslører. Aurora Yang slutter med at råde journalister til kritisk og objektivt at vurdere den digital teknologi. Det er andre toner end i begyndelsen af artiklen, hvor hun fremførte det synspunkt, at algoritmer er mere objektive end mennesker.

Min konklusion må være, at algoritmer bygger på statistik og matematik og aldrig kan skrive tekster som mennesker kan, og slet ikke med kreativitet.
se alle indlæg
cookies