英特爾深度神經(jīng)網(wǎng)絡(luò) 加速藥物研發(fā)新突破

2018-06-15 09:14 來源:美通社 作者:Janet

在近日舉行的英特爾人工智能開發(fā)者大會(huì)上,英特爾公司全球副總裁兼人工智能產(chǎn)品事業(yè)部總經(jīng)理Naveen Rao提到,英特爾正在與諾華合作,利用深度神經(jīng)網(wǎng)絡(luò)來加速高內(nèi)涵篩選 -- 這是早期藥品研發(fā)的關(guān)鍵因素。雙方的合作把訓(xùn)練圖片分析模型的時(shí)間從11個(gè)小時(shí)縮短到了31分鐘 -- 改善了20多倍1。

細(xì)胞表型的高內(nèi)涵篩選是支持早期藥品研發(fā)的關(guān)鍵工具,“高內(nèi)涵”一詞是指利用傳統(tǒng)圖像處理技術(shù)從圖像中提取的豐富數(shù)據(jù)集,這些數(shù)據(jù)集由數(shù)千個(gè)預(yù)定義特性(如大小、形狀、肌理等)構(gòu)成。通過高內(nèi)涵篩選可以分析顯微鏡圖像,進(jìn)而研究數(shù)千種基因或化學(xué)治療方法對(duì)不同細(xì)胞的培養(yǎng)效果。

深度學(xué)習(xí)有望做到的是從數(shù)據(jù)中“自動(dòng)”學(xué)習(xí)如何通過相關(guān)圖像特征將一種治療方法與另一種治療方法區(qū)分開。英特爾與諾華的生物學(xué)家和數(shù)據(jù)科學(xué)家希望通過利用深度神經(jīng)網(wǎng)絡(luò)加速技術(shù),提高高內(nèi)涵圖像篩選的速度。在雙方的合作中,團(tuán)隊(duì)并非通過獨(dú)立的步驟鑒別出圖像中的各個(gè)細(xì)胞,而是聚焦于完整的顯微鏡圖像,但完整的顯微鏡圖像遠(yuǎn)遠(yuǎn)大于深度學(xué)習(xí)數(shù)據(jù)集里的圖像,例如英特爾與諾華合作評(píng)估中使用的圖片就比典型的動(dòng)物、物體和場(chǎng)景數(shù)據(jù)集ImageNet*中的圖像大26倍以上。

深度卷積神經(jīng)網(wǎng)絡(luò)模型在分析顯微鏡圖像時(shí)可同時(shí)分析一張圖像中的幾百萬個(gè)像素或者一個(gè)模型中的幾百萬個(gè)參數(shù),甚至還能同時(shí)分析數(shù)千個(gè)訓(xùn)練圖像,這些構(gòu)成了很高的計(jì)算工作量,即使采用最先進(jìn)的計(jì)算性能也無法有足夠時(shí)間對(duì)DNN模型展開深入研究。為了解決這一挑戰(zhàn),英特爾聯(lián)手諾華利用深度神經(jīng)網(wǎng)絡(luò)加速技術(shù)處理多個(gè)圖像,大大縮減了時(shí)間并提高工作效率,同時(shí)讓模型從圖像特性中獲得更加豐富的洞察。具體講就是通過使用Broad Bioimage Benchmark Collection* 021 (BBBC-021) 數(shù)據(jù)集,英特爾與諾華合作團(tuán)隊(duì)將總處理時(shí)間縮短至31分鐘,準(zhǔn)確率超過99%;利用深度學(xué)習(xí)訓(xùn)練中的數(shù)據(jù)并行性原則,并充分依靠服務(wù)器平臺(tái)上的大存儲(chǔ)支持,通過了32個(gè)TensorFlow* workers,實(shí)現(xiàn)了每秒處理120個(gè)3.9兆像素圖像的成果。

與諾華的合作,是英特爾通過企業(yè)級(jí)的解決方案為人工智能的應(yīng)用與企業(yè)部署提供最廣泛的計(jì)算力合作案例之一。在未來,雖然監(jiān)督學(xué)習(xí)對(duì)于加快圖像分類、縮短獲得洞察的時(shí)間至關(guān)重要,但卻仍需要依賴大量專家標(biāo)記的數(shù)據(jù)集來訓(xùn)練模型,建立此類數(shù)據(jù)集所需的時(shí)間和工作量往往超出現(xiàn)實(shí)條件。無監(jiān)督學(xué)習(xí)或許可以應(yīng)用于無標(biāo)記的顯微鏡圖像,有望在細(xì)胞生物學(xué)領(lǐng)域發(fā)現(xiàn)新洞察,有助于人類藥物研發(fā)的進(jìn)一步發(fā)展。

1 20倍是通過從單節(jié)點(diǎn)系統(tǒng)擴(kuò)展到8插槽集群實(shí)現(xiàn)的21.7倍速度提升。

8插槽集群節(jié)點(diǎn)配置:CPU:英特爾?至強(qiáng)? 6148處理器(2.4GHz);核心數(shù):40;插槽數(shù):2;超線程:啟用;內(nèi)存/節(jié)點(diǎn):192GB,2666MHz;網(wǎng)卡:英特爾? Omni-Path Host Fabric Interface (英特爾? OP HFI);TensorFlow:v1.7.0;Horovod:0.12.1;OpenMPI:3.0.0;集群:ToR Switch:英特爾? Omni-Path Switch

單節(jié)點(diǎn)配置:CPU:英特爾?至強(qiáng)?融核處理器7290F;192GB DDR4 RAM;1x 1.6TB 英特爾? SSD DC S3610系列SC2BX016T4;1x 480GB 英特爾? SSD DC S3520系列SC2BB480G7;英特爾? MKL 2017/DAAL/Intel Caffe

英特爾 深度神經(jīng)網(wǎng)絡(luò) 藥物研發(fā)

相關(guān)閱讀

暫無數(shù)據(jù)

一周熱門