AI: DeepMind sprænger alle rammer

DeepMind bag videnskabeligt gennembrud, der åbner for helt nye former for medicin.

DeepMind har gjort det igen: overrasket alt og alle med endnu en spektakulær anvendelse af kunstig intelligens.

Sejren over verdensmesteren i GO i 2016 er nok den bedst kendte af DeepMinds bedrifter, men den er langt fra enestående.
Deep Mind har blandt andet udviklet en kunstig intelligens, der kan diagnosticere scanninger af øjensygdomme med større nøjagtighed end de bedste øjenlæger.

I 2017 rettede DeepMind så blikket mod en af de helt store gåder inden for den biologiske forskning, nemlig foldning af proteiner.
Det er et problem, der har optaget nogle af verdens skarpeste hjerner gennem et halvt århundrede, og forskningen indenfor dette felt sker blandt andet inden for rammerne af store forskningscentre med dusinvis af forskere og med laboratorieudstyr til mange millioner dollars.

Proteiner omtales ofte som livets byggeklodser, og de dannes i naturen ved at forskellige aminosyrer danner lange kæder i vekslende kombinationer. Herefter sker der et mirakel, idet aminosyrerne folder sig sammen i et uhyre komplekst mønster.
På den måde dannes der et protein, der har en ganske bestemt egenskab, og som i kombination med andre proteiner, der har andre egenskaber, til sidst frembringer et øje der kan se, et øre der kan høre eller et hjerte der kan slå.

Mange sygdomme skyldes at nogle af disse proteiner bliver beskadiget, og meget medicin sigter grundlæggende mod at reparere på proteiner.

Samspillet mellem aminosyrer og proteiner sker på atomniveau, og kan derfor ikke iagttages. Proteinfoldning er teoretisk videnskab på højt niveau, og hidtil har det været en uløst gåde, hvordan bestemte rækker af aminosyrer folder sig sammen til at blive et bestemt protein med en ganske bestemt egenskab.

En løsning på dette problem ville gøre det muligt at forudse en bestemt foldning af et protein med en bestemt egenskab alene baseret på viden om de aminosyrer, der indgår i den kæde, der danner proteinet.
Med denne viden ville det blive muligt at udvikle langt mere præcis medicin, og det ville blive muligt at finde behandlinger til sygdomme, som man i dag ikke kan behandle.

Jagten på denne indsigt om foldning af proteiner har nu stået på i 50 år, og der er sket fremskridt. Men det er gået langsomt, og den kortlægning af foldningsprocesser for enkelte proteiner, der er blevet gennemført, har ofte taget ti år eller mere at gennemføre.

Tilbage i midten af 1990’erne blev der stiftet en slags global olympiade for forskningsteams, der arbejder med dette foldnings-problem.
Olympiaden kaldes “Critical Assessment of protein Structure Prediction” (CASP) og afholdes hvert andet år.
Her mødes verdens bedste forskningsteams for at sammenligne resultater og for at vinde berømmelse for deres respektive fremskridt.
I 2017 besluttede DeepMind, at etablere et lille internt team, der fik til opgave at deltage i CASP i 2018.

Da CASP 2018 blev afholdt i USA blæste DeepMinds team alle andre teams af banen og blev en suveræn vinder. Deres metode til at forudsige en bestemt foldning baseret på en bestemt sekvens af aminosyrer var 70-80 pct. akkurat, og dermed betydeligt bedre end konkurrenternes.
Det var et chok for hele det globale forskningsmiljø.
“Hvad var det lige der skete?”, skrev en af de deltagende forskere fra et amerikansk universitet på sin blog efter at han var kommet hjem fra CASP 2018.

DeepMinds team, der nu havde slået sit navn fast som AlphaFold, blev ikke liggende på lauerbærene.
En forudsigelse af foldningen med 70-80 pct. sikkerhed var fantastisk, men det store mål med CASP siden starten i 1990-erne har været at nå den hellige gral på lige over 90 pct. nøjagtighed. Med en så høj grad af præcision i en model ville foldningsproblemet kunne anses for at være “løst”.

Efter AlphaFolds spektakulære bedrift i 2018, blev der i det internationale forskningsmiljø spekuleret om, at en videreudvikling af AlphaFolds metode ville kunne føre til +90 pct. nøjagtighed allerede inden for 10-20 år.

Men ved CASP 2020, der netop har været afholdt i USA, stillede AlphaFold op med en løsning, der giver resultater på mellem 90 og 95 pct. nøjagtighed.
Hvor det med traditionelle metoder kunne tage ti år eller mere at finde løsningen på et enkelt protein kan AlphaFolds model løse opgaven på et par dage.

En uhyre vanskeligt problem, som toppen af poppen inden for den naturvidenskabelige forskning på globalt plan ikke havde kunnet knække gennem 50 års hårdt og uhyre kostbart forskningsarbejde, løste AlphaFold-teamet på under tre år.

Resultatet vil utvivlsomt give anledning til dyb selvransagelse i forskningsverdenen.
Det oplagte spørgsmål, der presser sig på, er, hvordan det kan gå til, at et lille team hos DeepMind kunne gennemføre noget så spektakulært lige for næsen af det samlede globale forskningsmiljø?

I visse grene af forskningsmiljøet peger man på, at AlphaFold har adgang til nærmest ubegrænsede midler, fordi de i sidste ende er ejet af Google, og at de desuden har adgang til al den computerkraft, som man kan drømme om.

Men disse indvendinger holder ikke.
AlphaFolds team på ca. 15 personer er muligvis bedre aflønnet end den typiske forsker ved et privat eller offentligt universitet, men det skal ses i forhold til, at det internationale forskningsmiljø inden for dette felt tæller flere hundrede topforskere, der har adgang til kostbare laboratoriefaciliteter.
AlphaFolds computerressourcer er oplyst til at være mellem 100 og 200 GPU’er, der ikke kan betegnes som ekstravagant inden for udvikling af kunstig intelligens på dette niveau.
Selve anvendelsen af kunstig intelligens er heller ikke speciel for AlphaFold. Alle de førende globale forskningsteams anvender kunstig intelligens i deres arbejde.

En af de anerkendte forskere inden for dette felt, Mohammed AlQuraishi, har peget på at AlphaFolds hemmelighed måske ligger i den måde, de arbejder på.

AlphaFold-teamet består af biologer, fysikere, softwareingeniører og computereksperter; de sidder side om side; de holder hyppige møder, hvor de deler viden og sætter fælles delmål; de bliver hele tiden opmuntret og holdt til ilden af ledelsen (der sidder lige ved siden af). Og så er de selvfølgelig både super dygtige og ambitiøse.

Dette står i nogen grad i kontrast til et akademisk miljø, der er præget af rivalisering og intern kamp om forskningsmidler; hvor man holder sine resultater tæt til kroppen indtil de er publiceret; hvor tværfagligt samarbejde sker for sjældent, og som, når det sker, er præget af hierarkier mellem de forskellige fag. Desuden betyder konkurrencen mellem de store globale teams, at man ikke udveksler resultater undervejs, men først ved offentliggørelse i videnskabelige tidsskrifter. Det medfører en langsom kadence for vidensdelingen.

Måske kan AlphaFolds gennembrud inden for proteinforskningen give anledning til en reel omstilling inden for den naturvidenskabelige forskningsverden. Hvis det ikke sker, vil proteinfoldning næppe blive det sidste markante nederlag for den traditionelle forskning.
Det taler til akademikernes fordel, at der i de seneste dage har været stående ovationer til AlphaFold fra hele den internationale elite inden for proteinforskningen – selvom AlphaFolds resultater utvivlsomt har været en bitter pille at sluge for mange.

Men hvor er de store globale farmaceutiske koncerner henne i hele dette billede?
Proteinfoldning må kunne anses for at være tæt på disse virksomheders kerneforretning.
Men i stedet for at investere har de store globale farmaceutiske koncerner generelt reduceret deres forskning i samme takt, som de har udvidet deres salgsstyrke.
De har med andre ord sovet i timen, og er blevet kørt bagud af dansen i forhold til et forskningsområde, der er fundamentalt for udviklingen af nye præparater og dermed for deres forretning – for ikke at tale om deres samfundsmæssige formål.

Situationen kan illustreres med et tænkt eksempel, hvor rollerne bliver vendt om.
Vi forestiller os her, at Microsoft, Google, IBM, Amazon og Facebook i årevis har skåret kraftigt ned på forskningen inden for forretningskritiske teknologier som billedgenkendelse og oversættelse. Pludselig offentliggør en af de farmaceutiske koncerner, at de har udviklet noget nær perfekt kunstig intelligens til billedgenkendelse og oversættelse.
Det er netop det, der nu er sket inden for forskningen i foldning af proteiner: Google-virksomheden DeepMind har udviklet en banebrydende teknologi, der er forretningskritisk i den farmaceutiske industri.

Mohammed AlQuraishi, der arbejder med proteinforskning på Columbia University i USA, bruger dette eksempel til at vise hvilken katastrofal situation, som de store globale farmaceutiske koncerner har fået bragt sig selv i på grund af hovedløse nedskæringer i deres forskningsafdelinger.

DeepMind har allerede indledt et samarbejde med flere mindre forskningsteams om udvikling af medicin baseret på den nye viden om proteinfoldning. I første omgang er der blevet sat fokus på sovesyge, malaria og andre udbredte tropesygdomme.


Se også videoen om arbejdet i AlphaFold hos Deep Mind

Henvisninger og baggrund: 03-12-2020

vzvzv