V červenci 2022 společnost DeepMind uvedla, že nejnovější verze jejích programů AlphaFold předpověděla struktury všech z 200 milionů vědecky známých bílkovin. Poznání je však jen poloviční cestou ke schopnosti takové bílkoviny vytvářet. Ani druhá fáze se však neobejde bez výpočetního výkonu a umělé inteligence.
V červnu jihokorejské regulační orgány povolily vůbec první lék, vakcínu proti covidu- 19, která byla vyrobena z nového proteinu navrženého člověkem. Vakcína je založena na kulovité bílkovinné „nanočástici“, kterou vědci pracně vytvořili pomocí metody pokus— omyl téměř před deseti lety. Pokrok v oblasti vývoje specializovaných „umělých inteligencí“ se však v posledních letech rozletěl neuvěřitelnou rychlostí. A tak v září tým vedený Davidem Bakerem, biochemikem z Washingtonské univerzity v Seattlu, v časopise Science předvedl, jak takové molekuly „na přání“ navrhnout během několika sekund namísto měsíců.
VĚDÁM ZAMĚŘENÝM NA ŽIVOT VLÁDNOU POČÍTAČE
Nový úspěch je součástí změny v biologických vědách v posledních několika málo letech, která umožňuje vědcům podstatně lépe pochopit, jak přesně fungují hlavní „dílky“, ze kterých se skládají naše těla: bílkoviny (či chcete-li proteiny).
Bílkoviny jsou složité molekuly tvořené tisíci až miliony atomů. Žijeme a fungujeme v podstatě výhradně díky nim. Živé organismy (i neživé viry) se skládají právě z bílkovin a využívají je ke všem činnostem.
K pochopení funkce bílkoviny a k identifikaci jejího možného užitku pro člověka potřebujeme znát její tvar. Ten určí, zda vás protilátka ochrání, či neochrání proti viru. Tvar jiné bílkoviny, kterou naše tělo vyrábí, třeba také rozhodne, zda nás postihne, či nepostihne Alzheimerova nemoc.
Bohužel, tvary bílkovin se špatně „měří“. Výrazně jednodušší je zjistit její chemické složení. Získat z něj představu tom, jak by molekula měla vypadat, je překvapivě složité. V předcházejících desetiletích bylo určení tvaru jediné bílkoviny v některých případech práce na celé roky (a někdy práce zcela marné). V posledních několika letech se tento problém podařilo výrazně zjednodušit, až by se chtělo říci „trivializovat“.
V roce 2020 společnost DeepMind (patří holdingu Alphabet, tedy do rodiny Google) představila nástroj AlphaFold. Software založený na principu hlubokého učení dokázal nejprve spolehlivě určovat podobu jednoduchých bílkovin a rychle se i výrazně zlepšoval. V červenci 2022 společnost DeepMind uvedla, že nejnovější verze programu AlphaFold předpověděla struktury všech vědecky známých bílkovin (je jich 200 milionů).
TAK TO CHCEME
Konkurence, na jejímž čele je právě Bakerova skupina, ovšem nespí. „Žijeme ve vzrušující době,“ řekla pro přední vědecký časopis Nature Noelia Ferruzová, bioložka z univerzity ve španělské Gironě.
Jednou ze vzrušujících možností blízké budoucnosti je právě možnost vytvářet bílkoviny „na přání“. Co by mohly dokázat?
Bakerova skupina prezentovala pár příkladů za všechny. Vytvořila například návrh enzymů katalyzujících konkrétní reakci, což by mohlo otevřít další možnosti v chemickém průmyslu. Nebo navrhla a vytvořila bílkovinu použitelnou ve vakcíně proti respiračnímu viru, který je hlavní příčinou hospitalizací kojenců.
Potenciál tu vidí i další. DeepMind v roce 2021 založila v Londýně spin-off společnost Isomorphic Labs, která hodlá nástroje umělé inteligence, jako je AlphaFold, použít při vytváření nových léčiv. Demis Hassabis, šéf společnosti DeepMind, při té příležitosti řekl, že navrhování bílkovin považuje za zřejmou a slibnou aplikaci pro technologii hlubokého učení a zejména pro AlphaFold. Dodal však, že „jsme teprve na začátku“.
Zajímavé věci nebývají úplně jednoduché, a v tomto případě to platí také. Problémy s návrhem nových bílkovin se daří odstraňovat postupně.
KDO JE NEJLEPŠÍ
Bakerova laboratoř strávila poslední tři desetiletí vytvářením nových proteinů. Software nazvaný Rosetta, který jeho laboratoř začala vyvíjet v 90. letech, rozděluje tento proces do několika kroků. Zpočátku vědci vymysleli tvar nového proteinu (často tak, že poskládali dohromady kousky jiných bílkovin) a software odvodil sekvenci aminokyselin, která tomuto tvaru odpovídala.
Tyto „prototypy“ se však při výrobě v laboratoři zřídkakdy skutečně složily do požadovaného tvaru a zaujímaly různé další, nečekané konfigurace. Vypočítat, do jaké podoby se bílkovina daného chemického složení složí, bylo nesmírně výpočetně náročné. „Doslova by na tom pracovaly desítky tisíc počítačů celé týdny,“ řekl pro Nature Sergej Ovčinnikov, evoluční biolog z Harvardovy univerzity v Cambridge ve státě Massachusetts, který dříve pracoval v Bakerově laboratoři.
Nastup softwaru založeného na principu strojového učení umožnil výpočet extrémně zrychlit — až na zmíněné sekundy. Rychlost ovšem není totéž co přesnost. Když Baker s kolegy vytvořili své první programy na vytvářené proteinů na přání, na obrazovce vše vycházelo skvěle, ovšem praktické výsledky byly žalostné. Z prvních 150 návrhů v praxi nefungoval ani jeden.
Autoři nicméně věděli, co by mohlo pomoci: více strojové učení. A vytvořili další specializovaný program (doslova expertní systém, jak se této třídě softwaru také říká). Jeho úkolem je jakási „kontrola pravopisu“ návrhu. Úspěšnost návrhů se tak zvýšila z 0 na cca 20 %. Což není dokonalé, ale pro praktický výzkum už je to použitelné.
Téměř určitě to také není konec vývoje. Protože jejich potenciál je tak ohromný, podobné systémy vytvářejí celé desítky týmů z různých částí světa. Zatím zjevně nepanuje shoda v tom, který přístup a který systém jsou nejlepší, ale to nám laikům může být v podstatě jedno. Důležité je, aby alespoň někdo v tomto klání zvítězil, a můžeme z toho těžit všichni.