Vědci po půlstoletí zkoumání zjistili, jak se formují proteiny. Očekává se revoluce v lékařství

Vizualizace skládání proteinu

Vizualizace skládání proteinu Zdroj: DeepMind

Marek Schwarzmann

Výzkumníci z britských laboratoří společnosti DeepMind jsou schopni přesně předvídat, jakým způsobem a do jakých trojrozměrných struktur se budou skládat proteiny – základní stavební kameny živých organismů. Za pomoci umělé inteligence tak našli odpověď na téměř pět dekád starou otázku. Výsledný tvar či „zamotání“ řetězců aminokyselin totiž určuje, jaké unikátní vlastnoti budou proteiny mít. Jde o potenciální průlom při hledání nových léčiv.

„Máme před sebou velký průlom,“ konstatoval Demis Hassabis, zakladatel a šéf DeepMind. Pod objevem, který má potenciál vnést revoluci nejen do standardního lékařského bádání, je vedle lékařů a inženýrů také podepsána umělá inteligence AlphaFold.

DeepMind se již dříve proslavil hlavně v herním světě, kdy jeho umělá inteligence na hlavu porážela lidské oponenty ve hrách jako Go, šachy či Starcraft II. Nyní mu připadne autorský zářez pod studií, která odpovídá na „chemickou záhadu století“. Nejsnáze ji popsal Christian Anfinsen v roce 1972 při přebírání Nobelovy ceny za chemii, když tehdy prohlásil, že „pořadí aminokyselin v proteinu plně určuje jeho výslednou strukturu“.

Tato hypotéza zažehla padesátiletý boj chemiků s tím, jak pochopit (a tedy určit) trojrozměrný tvar proteinu na základě sad jednorozměrných sekvencí aminokyselin. Už v roce 1969 přitom chemik Cyrus Levinthal odhadl, že u typického proteinu existuje 10^300 možných kombinací uspořádání aminokyselin a že jejich jednotlivý výčet by trval déle, než samotná existence vesmíru. Přesto, v rámci přírodního procesu jsou proteiny skládány v řádu milisekund – tomu se někdy říká Levinthalův paradox.

Předseda britské Královské společnosti Venki Ramakrishnan na sdělení DeepMind pro list The Guardian reagoval s tím, že k objevu došlo o dekády dříve, než by si řada lidí v oboru připustila. Vědci doposud identifikovali více než 200 milionů existujících proteinů, ale jejich přesné struktury jsou popsány jen u několika z nich. Umělá inteligence trénovala díky databázi 170 tisíc proteinových sekvencí a jejich známých tvarů. Učení běželo na výkonnostním ekvivalentu až dvou stovek standardních grafických karet a trvalo několik týdnů.

Schopnosti AlphaFold prověřila mimo jiné i soutěž zvaná Critical Assessment of Protein Structure Prediction (Casp) – neformálně uznaná „olympiáda ve skládání proteinů“, kde se mezinárodní týmy snaží soutěžit v přesnosti a rychlosti, s níž jejich programy dokážou skládat proteiny. Program v ní dosáhl v řadě experimentů mediánového skóre přesnosti přes 92 procent.