【編者按】英偉達(dá)TeslaGPU技術(shù)為基因研究和臨床醫(yī)療提供了解決方案敢智。
隨著測(cè)序技術(shù)和基因組學(xué)的發(fā)展杏县,基于基因測(cè)序的臨床診斷和個(gè)體化醫(yī)療等實(shí)際應(yīng)用離我們?cè)絹碓浇H欢砗牛蚪M數(shù)據(jù)呈現(xiàn)指數(shù)級(jí)增長(zhǎng)戳橱,相應(yīng)的數(shù)據(jù)處理與分析正面臨著大規(guī)模數(shù)據(jù)和密集計(jì)算所帶來的時(shí)間和成本上的巨大挑戰(zhàn),并影響著基因組學(xué)研究進(jìn)程殃忠。面對(duì)日益增長(zhǎng)的基因分析需求了奋,如何解決大數(shù)據(jù)存取能力以及計(jì)算能力不足等瓶頸問題,成為當(dāng)下基因組學(xué)研究和應(yīng)用面臨的一大難題趾始。
云計(jì)算被認(rèn)為是解決海量數(shù)據(jù)處理的最佳方案之一秉馏,然而通用的云計(jì)算平臺(tái)必須能夠支持各類軟件,只能選擇兼容性最好的x86硬件平臺(tái)脱羡,大規(guī)模的計(jì)算平臺(tái)其成本和能耗較高萝究。而基因組學(xué)分析涉及的計(jì)算類型較少,依靠NVIDIA(英偉達(dá))Tesla的全新硬件锉罐,可望用更少的硬件和成本達(dá)到同樣計(jì)算處理能力糊肤,實(shí)現(xiàn)綠色計(jì)算。目前氓鄙,我們?cè)贜VIDIA(英偉達(dá))Tesla平臺(tái)上,設(shè)計(jì)開發(fā)了針對(duì)基因信息數(shù)據(jù)的高效壓縮工具业舍,同時(shí)針對(duì)造成分析瓶頸的計(jì)算任務(wù)抖拦,如序列比對(duì)、變異檢測(cè)等基本工具舷暮,利用GPU技術(shù)進(jìn)行加速态罪,從而提高分析效率,并降低數(shù)據(jù)存儲(chǔ)和計(jì)算分析的成本下面。
基因組學(xué)數(shù)據(jù)的數(shù)據(jù)量需要在壓縮技術(shù)方面進(jìn)行更多的研究复颈。按照這類數(shù)據(jù)的特點(diǎn),采用以列為主的分塊壓縮方式董翻,我們針對(duì)TeslaGPU設(shè)計(jì)了一組壓縮算法圾董,在保證壓縮率的前提下極大地提升了壓縮速度。以常用的FASTQ和SAM格式為例桨挂,相比使用gzip或bzip2壓縮几谐,壓縮速度可達(dá)到10倍的性能提升恳瞄。高效的壓縮工具可以直接減少處理時(shí)間,間接提高數(shù)據(jù)傳輸效率坊欢,降低存儲(chǔ)成本漩践。
在基因研究和臨床醫(yī)療應(yīng)用中,序列比對(duì)和尋找基因變異是兩個(gè)重要分析步驟甥归。兩者也是主要的計(jì)算瓶頸肝唁,特別在臨床應(yīng)用上具有更高的時(shí)效性要求。為此卑保,我們借助NVIDIA(英偉達(dá))Tesla平臺(tái)处冰,開發(fā)了應(yīng)用于序列比對(duì)的SOAP3/SOAP3-DP,以及分別用于個(gè)體和群體基因變異分析的GSNP和GAMA琳柱。
SOAP3/SOAP3-DP設(shè)計(jì)了新的索引數(shù)據(jù)結(jié)構(gòu)耻陕,針對(duì)TeslaGPU架構(gòu)做了充分優(yōu)化,性能是其它主流軟件的數(shù)十倍刨沦,并且具有更高的準(zhǔn)確率和比對(duì)率诗宣。解決了基因研究中最基本的分析瓶頸,同時(shí)提高了后續(xù)基因變異分析的準(zhǔn)確度想诅。
GSNP與其前身相比召庞,采用稀疏表達(dá)格式優(yōu)化數(shù)據(jù)結(jié)構(gòu),同時(shí)運(yùn)用TeslaGPU實(shí)現(xiàn)高通量數(shù)據(jù)并行来破,原來處理一個(gè)人的數(shù)據(jù)需要三天以上的時(shí)間篮灼,GSNP僅需2小時(shí)左右,從而使得個(gè)體變異檢測(cè)初步達(dá)到快速臨床應(yīng)用的要求徘禁。
GAMA引入GPU的并行計(jì)算技術(shù)對(duì)多個(gè)位點(diǎn)進(jìn)行處理诅诱,加速計(jì)算過程。五百人規(guī)模計(jì)算分析送朱,用普通計(jì)算機(jī)需要超過4年時(shí)間才可能完成娘荡,如果將計(jì)算在多塊GPU上并行進(jìn)行,可以使計(jì)算時(shí)間縮短到數(shù)小時(shí)驶沼。這一效率的提升使得生物學(xué)家可以加快解析基因變異與疾病關(guān)系的步伐炮沐。
借助NVIDIA(英偉達(dá))Tesla平臺(tái),綜合利用以上技術(shù)和軟件佛缕,使我們當(dāng)前的數(shù)據(jù)分析效率得到極大提升碉伙,同時(shí),降低了計(jì)算和存儲(chǔ)成本陈汇,特別是臨床診斷治療的時(shí)間成本真译。在NVIDIATesla平臺(tái)支持下,我們正努力推動(dòng)基因組學(xué)研究實(shí)際應(yīng)用轉(zhuǎn)化,為大眾健康幸福保駕護(hù)航己倾。(
聲明:本網(wǎng)站所收集的部分公開資料來源于互聯(lián)網(wǎng)购哺,轉(zhuǎn)載的目的在于傳遞更多信息及用于網(wǎng)絡(luò)分享,并不代表本站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)蔫迅,也不構(gòu)成任何其他建議人狞。本站部分作品是由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳具藐,對(duì)此類作品本站僅提供交流平臺(tái)欢礼,不為其版權(quán)負(fù)責(zé)。如果您發(fā)現(xiàn)網(wǎng)站上所用視頻庞溜、圖片革半、文字如涉及作品版權(quán)問題,請(qǐng)第一時(shí)間告知流码,我們將根據(jù)您提供的證明材料確認(rèn)版權(quán)并按國(guó)家標(biāo)準(zhǔn)支付稿酬或立即刪除內(nèi)容又官,以保證您的權(quán)益!聯(lián)系電話:010-58612588 或 Email:editor@mmsonline.com.cn漫试。
- 暫無反饋
編輯推薦
- 2025新年特刊:打造新質(zhì)生產(chǎn)力,智啟未來新篇章
- 定義制造業(yè)未來的數(shù)控加工中心技術(shù)專題
- 航空航天及交通領(lǐng)域先進(jìn)制造技術(shù)應(yīng)用專題
- 解碼消費(fèi)電子產(chǎn)品生產(chǎn)的數(shù)字化之路技術(shù)專題
- 精密智能機(jī)床竿靠,助力制造升級(jí)技術(shù)專題
- 汽車輕量化驅(qū)動(dòng)下的零部件加工應(yīng)用專題
- 高性能銑刀實(shí)現(xiàn)高精加工生產(chǎn)技術(shù)專題
- 航空航天發(fā)動(dòng)機(jī)解決方案專題
- 高效齒輪加工生產(chǎn)技術(shù)方案專題
- 金屬加工液的性能不止?jié)櫥夹g(shù)應(yīng)用專題