Den öppna databasen Protein Data Bank innehåller idag de tredimensionella strukturerna av omkring 180 000 proteiner som förekommer i olika organismer av alla slag, från människor och fruktflugor till svampar och bakterier.

Google-dotterbolaget Deepmind är på väg att utöka databasen med beräknade strukturer för ytterligare cirka 350 000 proteiner. Det handlar om strukturer som företagets maskininlärningsalgoritm Alphafold 2 har tagit fram.

Algoritmen har tränats på existerande proteiner och är en förbättrad version av Alphafold som släpptes 2018. Det som nu gör att biologer runt om i världen blir uppspelta är att den nya algoritmen är betydligt mer träffsäker, rapporterar The Verge. Enligt Deepminds forskares tester stämmer modellerna med verkligheten i nästan 90 procent av fallen. Den är dessutom 16 gånger snabbare.

Flera forskare The Verge har talat med säger att framstegen kommer ha stor inverkan på biologisk forskning framöver. Marcelo C. Sousa vid Coloradouniversitet säger till exempel att hans forskarlag hade haft ett protein i tio år utan att lyckas fastställa strukturen – för Alphafold tog det en kvart.

Proteinstrukturerna Alphafold 2 har tagit fram måste normalt bekräftas experimentellt för att kunna användas till exempel i framställning av nya läkemedel, men det är långt ifrån lika tidsödande och dyrt som att ta fram den från scratch.