Zjišťování rozdílů a změn
v genotypu, které spouští chorobu,
je pro Translational Genomics
Research Institute (TGen - Translační
genotypový výzkumný institut)
prioritou. Aby TGen podpořil
neziskový výzkumný institut
v jejich bádání, využívá technologii
SGI ke zrychlení analýzy molekulárního
profilování datových
souborů sloužících pro výzkum
léčby rakoviny.
Systém SGI® Altix® 4700, který
Institut koupil v dubnu 2007
prostřednictvím grantu Národního
zdravotního institutu (National
Institute of Health – NIH), bude
sloužit vědcům z TGen k pochopení
genotypových variací – tedy
procesu, který vyžaduje srovnávací
prohledávání enormních datových
souborů. Tyto soubory mohou být
okamžitě využity k diagnostice a
léčbě choroby způsobem ušitým na
míru jednotlivým pacientům.
TGen si vybral systém SGI Altix
4700 s více než polovinou terabytu
sdílené paměti, takže vědci z Institutu
ve Phoenixu v Arizoně mohou
vyhledávat napříč několika chromozomy,
jež jsou všechny uloženy přímo
v paměti, bez nutnosti rozložení
problému na menší části, což umožňuje
vědcům pozorovat celek místo
skládání několika částí.
Zatímco vlastní kód pro tato rozsáhlá
hledání bude teprve napsán,
TGen již oznámil, že benchmarky
běžely v Národním centru pro biotechnologickou
informaci (NCBI)
BLAST (Basic Local Alignment
Search Tool), algoritmus pro srovnání
primární biologické sekvenční
informace, ClustalW, program
pro obecné užití mnohonásobného
sekvenčního uspořádání pro DNA
nebo proteiny. Testování prokázalo
zlepšení výkonu až o 50 procent na
64bitovém systému SGI Altix ve
srovnání se stejnou 32bitovou systémovou
architekturou.
„Technologie, a mikrosoubory
především, umožnily, aby se bioinformatické
datové soubory staly
tak rozsáhlé, že je nyní nezbytné
využívat 64bitovou výpočetní infrastrukturu
s velkou pamětí, abychom
byli schopni manipulovat a analyzovat
tak datově náročné soubory jak
naši vědci vyžadují“, uvedl James
Lowey, ředitel pro vysoce výkonné
biovýpočty, Translačního genotypového
výzkumného institutu.
„Konvenční 32bitové výpočetní
architektury nemohou adresovat
paměť nad 4GB. Tento limit
představuje přibližně optimální
analytický přístup díky neúměrně
prodlouženým časům výpočetních
analýz potřebných pro optimální
matematické modely a výpočetní
algoritmy.“
Molekulární profily datových
souborů, které jsou analyzovány
v TGen pokrývají maligní myelom
(zhoubný nádor kostní dřeně),
rakovinu kůže, Alzheimrovu chorobu,
autismus a slinivku břišní,
prostatu, tračník a rakovinu prsu.
S použitím „microarrays“ nepřesáhne
jednotlivý soubor 150 MB.
Prohledat a srovnat genetické
vzory představuje pro vědce projít
stovky a stovky jednotlivých
souborů. Kód společnosti TGen
využije výpočetní síly globálně
sdílené paměti systému SGI Altix
pro běh „microarrays“, při hledání
variací tak detailních jako je
změna jednoho proteinu a bude se
snažit určit jaký efekt to má napříč
celým spektrem pozorování.