近日,IPF2021在蘇州隆重舉辦,會(huì)上浪潮存儲(chǔ)產(chǎn)品線總經(jīng)理李輝與華中科技大學(xué)武漢國家光電研究中心教授、博士生導(dǎo)師謝長生圍繞“從圖靈機(jī)視角看存儲(chǔ)產(chǎn)業(yè)發(fā)展”進(jìn)行了圓桌對話,對話由百易傳媒(DOIT)總編宋家雨主持。
“十四五”時(shí)期,數(shù)字經(jīng)濟(jì)推動(dòng)智算中心加速普及和升級,對計(jì)算、存儲(chǔ)能力的需求將出現(xiàn)巨大的飛躍。與中國數(shù)字經(jīng)濟(jì)遙相呼應(yīng),浪潮存儲(chǔ)業(yè)務(wù)正迎來爆發(fā)式增長,根據(jù)IDC最新報(bào)告,浪潮存儲(chǔ)2020年銷售額和銷量分別為26億元和2.4萬臺(tái),增速為70%和96%,浪潮存儲(chǔ)全年市場銷量躍居中國前二、增速第一。那么從理論和實(shí)踐兩個(gè)維度來看,圖靈理論對數(shù)據(jù)存儲(chǔ)產(chǎn)業(yè)發(fā)展有怎樣啟示,一路奔跑的存儲(chǔ)廠商如何在十四五期間再創(chuàng)新高?本次圓桌訪談,浪潮存儲(chǔ)聯(lián)袂學(xué)術(shù)大咖,就上述問題展開深入討論。
以下為學(xué)術(shù)專家與浪潮存儲(chǔ)嘉賓圓桌對話摘錄:
從圖靈理論 看存算協(xié)同
主持人:圖靈理論是1936年由數(shù)學(xué)家圖靈提出來的,我們今天整個(gè)存儲(chǔ)、計(jì)算的基礎(chǔ)仍然是圖靈機(jī)這樣一個(gè)模型,以計(jì)算作為處理的核心,以數(shù)據(jù)存儲(chǔ)作為存儲(chǔ)的核心,要求計(jì)算和存儲(chǔ)要協(xié)同發(fā)展。但是發(fā)展到今天,最新的技術(shù)進(jìn)展到什么地步了呢?
謝長生:現(xiàn)在商用的計(jì)算系統(tǒng)都在圖靈機(jī)的框架下,這是它的原理之根。從圖靈機(jī)模型可以直觀看出計(jì)算機(jī)實(shí)際就是計(jì)算、存儲(chǔ)、傳輸三個(gè)部分,存儲(chǔ)可以形象地認(rèn)為它就是那根無限長的帶子,其中隱含的信息就是存儲(chǔ)容量越大越好,數(shù)據(jù)存儲(chǔ)和傳輸速度要跟得上處理的速度。因此,圖靈從理論上告訴我們,存儲(chǔ)第一要大,第二要快。只要我們能夠有無限的算力、無限的數(shù)據(jù),我們就能計(jì)算整個(gè)世界。
計(jì)算跟存儲(chǔ)要協(xié)同發(fā)展,算力在一直前進(jìn),數(shù)據(jù)存儲(chǔ)也要在容量和性能上能夠跟計(jì)算匹配,并駕齊驅(qū)。特別是現(xiàn)在AI、云計(jì)算都要非常大的算力,應(yīng)用跑得快了以后我們存儲(chǔ)就得要跟上,過去存儲(chǔ)速度跟不上,所以我們采取了各種各樣的新技術(shù)、新器件、新結(jié)構(gòu),就是為了讓存儲(chǔ)跟得上應(yīng)用的數(shù)據(jù)處理速度。
主持人:計(jì)算和存儲(chǔ)的協(xié)同,目前是不是已經(jīng)達(dá)到一種比較令人滿意的狀態(tài)?
李輝:在當(dāng)前人工智能計(jì)算應(yīng)用下,我們的存儲(chǔ)是夠用的,但是隨著新的人工智能模型演進(jìn),硅級計(jì)算接近碳級計(jì)算、類腦接近人腦的話,無論是計(jì)算還是存儲(chǔ)都有很大的空間等著我們?nèi)ヌ剿骱吞嵘?。像在新型人工智能模?nbsp;GPT-3這里面,模型參數(shù)已經(jīng)達(dá)到100多個(gè)億,但我們要達(dá)到類腦計(jì)算的效果,模型參數(shù)要到幾百萬億,數(shù)據(jù)存儲(chǔ)的容量、性能還要有比較大的提高。
謝長生:應(yīng)用在推動(dòng)我們技術(shù)的發(fā)展。因?yàn)閼?yīng)用的要求是越來越高,剛把它滿足,又有新的挑戰(zhàn)出來了,所以技術(shù)的進(jìn)步總是有市場驅(qū)動(dòng)力在驅(qū)動(dòng)。
李輝:從存儲(chǔ)技術(shù)發(fā)展來看,過去存儲(chǔ)系統(tǒng)內(nèi)部的瓶頸在介質(zhì)上,現(xiàn)在介質(zhì)已經(jīng)把瓶頸突破了;目前的瓶頸是在傳輸和網(wǎng)絡(luò)上。無論是節(jié)點(diǎn)內(nèi)高速的處理,還是節(jié)點(diǎn)間海量的數(shù)據(jù)同步,我們都需要做更多的工作,像PCIe、100G以太網(wǎng)技術(shù)的進(jìn)步正在突破傳輸?shù)钠款i。
場景共同體 匯聚“產(chǎn)學(xué)研用”各方力量
主持人:本次IPF2021大會(huì)上,浪潮存儲(chǔ)提出了“場景共同體”的倡議。我們?nèi)绾卫斫膺@個(gè)概念呢?
謝長生:教科書里有一個(gè)思路,叫“加快經(jīng)常性事件”,經(jīng)常性的事件就是場景特定的、相關(guān)的。不同的場景,經(jīng)常發(fā)生的事情是不一樣的,把資源放到這個(gè)特定場景去優(yōu)化以后,加速效果是最好的。浪潮存儲(chǔ)提出來的以場景為特色的應(yīng)用,和我們教科書上的在哲學(xué)思想上是一樣的,就是加快經(jīng)常性事件。
計(jì)算機(jī)體系結(jié)構(gòu)領(lǐng)域獲得圖靈獎(jiǎng)的一位教授,帕特森,是RISC的發(fā)明人,又是磁盤陣列的發(fā)明人,他現(xiàn)在提出一個(gè)新的概念叫“域特定的架構(gòu)”,Domain-Specific Architecture,就是說用資源加強(qiáng)特定領(lǐng)域,就能得到最好的效果,這和場景化的哲學(xué)思想是一樣的,但浪潮提出來的場景化的概念,更加接近于老百姓的理解。
李輝:是的,場景共同體這個(gè)概念,我們主要是考慮海量非結(jié)構(gòu)化數(shù)據(jù)、超大規(guī)模應(yīng)用場景的新需求。過去我們接觸的非結(jié)構(gòu)化數(shù)據(jù)常見場景是高性能計(jì)算,現(xiàn)在演進(jìn)到智慧計(jì)算,智慧交通、醫(yī)學(xué)影像、金融大數(shù)據(jù)、互聯(lián)網(wǎng)短視頻等應(yīng)用場景里都有非常多的非結(jié)構(gòu)化數(shù)據(jù)。這些新應(yīng)用場景對數(shù)據(jù)的流動(dòng)、處理,有各自獨(dú)特的需求,所以我們提出了一個(gè)概念 -- 場景共同體,就是在通用產(chǎn)品上通過產(chǎn)品定制、技術(shù)創(chuàng)新,來更好的滿足新應(yīng)用場景對數(shù)據(jù)存儲(chǔ)的要求。
主持人:場景共同體的構(gòu)建,需要“產(chǎn)學(xué)研用”各方力量的匯聚,這種匯聚會(huì)產(chǎn)生什么價(jià)值呢?
謝長生:產(chǎn)學(xué)研結(jié)合實(shí)際上很早就在提,早期的產(chǎn)學(xué)研合作層次比較低,但是經(jīng)過二十年發(fā)展以后,我們的企業(yè)變強(qiáng)大了,學(xué)術(shù)界的研究水平也提高了,可以在國際前沿上做出我們自己創(chuàng)新的東西來,這樣產(chǎn)學(xué)研合作就能達(dá)到一個(gè)更高的水平。我們跟浪潮存儲(chǔ)幾年前還合作過一項(xiàng)經(jīng)費(fèi)達(dá)兩個(gè)億的重大專項(xiàng),就產(chǎn)生了自主創(chuàng)新的成果。
李輝:我們跟華中科技大學(xué)在2009年合作了一個(gè)課題,叫超大規(guī)模海量存儲(chǔ)。在課題當(dāng)中,我們在海量存儲(chǔ)體系結(jié)構(gòu)上有了一些突破,探索在分布式的體系結(jié)構(gòu)下我們怎么去解決容量、性能、可靠性的問題,這些成果為我們傳統(tǒng)集中式存儲(chǔ)和在新興分布式存儲(chǔ)的產(chǎn)品創(chuàng)新、產(chǎn)品工程化、市場化的商業(yè)運(yùn)作奠定了很好的技術(shù)基礎(chǔ)。
謝長生:現(xiàn)在我們的企業(yè)已經(jīng)在國際上有很強(qiáng)的競爭力了,有些領(lǐng)域已經(jīng)進(jìn)入無人區(qū),再往前怎么走,就要靠自己探路。這個(gè)時(shí)候企業(yè)和大學(xué)的結(jié)合是非常有好處的,因?yàn)閷W(xué)??赡芫褪遣粩嗳ヌ剿髑把?,看一些新方向,企業(yè)有大量的應(yīng)用需求,會(huì)提出很多真問題來。這樣我們結(jié)合,比過去是更高層次的合作,就可以產(chǎn)生一些新的,甚至可以超越國外的產(chǎn)品。我相信我們國家產(chǎn)學(xué)研結(jié)合可以走向一個(gè)更高的階段,而且可以做出一些世界領(lǐng)先的東西。
李輝:謝老師提的那些,我非常有感觸。我們現(xiàn)在國內(nèi)在學(xué)術(shù)界、高校、研究所有很多東西走在了前面,在基礎(chǔ)技術(shù)研究、新技術(shù)方向、算法、協(xié)議方面有很多突破,包括像謝老師在光存儲(chǔ)、在體系結(jié)構(gòu)上的突破。面對科研先行的探索,企業(yè)是來做接力棒的,我們要把科研領(lǐng)域的創(chuàng)新和突破拿到我們的產(chǎn)品上,在工程上去嘗試、應(yīng)用,把技術(shù)落地到產(chǎn)品上,最終能夠到達(dá)我們的用戶,到達(dá)產(chǎn)業(yè)界。
謝長生:形成一個(gè)產(chǎn)學(xué)研真正的循環(huán)。
主持人:據(jù)了解浪潮存儲(chǔ)和華中科技大學(xué)之間就異構(gòu)存儲(chǔ)方面目前正在合作,能不能給我們披露一些情況?
謝長生:現(xiàn)在新介質(zhì)越來越多,但沒有一種介質(zhì)它是又大又快又便宜的,有的是非??斓浅YF,有的是很便宜但又很慢。所以我們講異構(gòu)融合,那就是說存儲(chǔ)里要用不同的介質(zhì)來構(gòu)成一個(gè)系統(tǒng),總體呈現(xiàn)出來的是速度高、容量大、比較便宜的這樣一個(gè)虛擬的存儲(chǔ)系統(tǒng)。我們在這方面做了很多研究,我想浪潮存儲(chǔ)很多產(chǎn)品都是用的這種思想。
李輝:是,我們跟華中科技大學(xué)的合作成果在我們第二代全閃存儲(chǔ)上就開始了,我們第二代全閃存儲(chǔ)稱之為HF系列,我們?nèi)ツ臧l(fā)布,今年已經(jīng)量產(chǎn)。HF系列繼承了我們的合作成果,實(shí)現(xiàn)了3D XPoint跟3D TLC、MLC介質(zhì)的融合,為存儲(chǔ)系統(tǒng)帶來非常高的性能。
基于場景共同體 實(shí)現(xiàn)產(chǎn)品創(chuàng)新
主持人:全閃存、分布式存儲(chǔ),在場景共同體里會(huì)有哪些變化?
李輝:場景共同體我們也在一個(gè)探索過程當(dāng)中,場景共同體的產(chǎn)品定制會(huì)對產(chǎn)品帶來什么樣的變化,是革命性的、顛覆性的變化,還是說只是一些延續(xù)性的、局部的變化。從目前我們對場景的認(rèn)識(shí)來看,它應(yīng)該還是一個(gè)局部的,不是一個(gè)顛覆性的變化。比如車還是車,但是這個(gè)車根據(jù)應(yīng)用場景可以設(shè)計(jì)為公交車或是私家車,會(huì)有這樣的變化。
整體上來講我們認(rèn)為產(chǎn)品的架構(gòu)和基本技術(shù)、基本能力是不變的,只是針對場景去做優(yōu)化,就像遠(yuǎn)距離傳輸場景里的無損壓縮和傳輸?shù)男枨螅诟咝阅艿挠?jì)算碰到的快速拷貝需求等等,這些變化會(huì)對特定場景的用戶,帶來巨大的促進(jìn)。
我們預(yù)計(jì)近期不會(huì)有太多的變化,但我們不確定這個(gè)場景的延伸,至少我們目前看到兩個(gè)極端的延伸,一個(gè)極端的延伸是往邊緣和終端上走,所以在邊緣計(jì)算領(lǐng)域可能會(huì)出來一些架構(gòu)重構(gòu)、形態(tài)重構(gòu)的存儲(chǔ)。另外一個(gè)場景就是進(jìn)內(nèi)存計(jì)算,或者說這種高速的運(yùn)行計(jì)算往內(nèi)存存儲(chǔ)這個(gè)方向,可能會(huì)有一些架構(gòu)和形態(tài)的變化,可能會(huì)衍生出新的產(chǎn)品。
主持人:對于場景化的追求也是所有廠商都希望實(shí)現(xiàn)的這樣一個(gè)目標(biāo)。要實(shí)現(xiàn)這樣一個(gè)目標(biāo),它有沒有一些基本條件或門檻呢?
李輝:在場景共同體里面最基本的東西是搞清楚大家針對場景的認(rèn)識(shí)、判斷或者商業(yè)期望。
首先大家愿意在這個(gè)場景上去投入,我們要想把這個(gè)場景通過技術(shù)的手段更好的滿足,實(shí)際上是一定要有投入的。比如說像我們今天提到的智慧交管、醫(yī)療影像、金融的內(nèi)容管理,這實(shí)際上都是從用戶這一端來看業(yè)務(wù)發(fā)展過程當(dāng)中在未來一段時(shí)間面臨比較大的、迫切的需求。
同時(shí)在場景共同體里我們會(huì)有專業(yè)化的分工,比如我們是做產(chǎn)品的,謝老師是做技術(shù)的,我們還有做應(yīng)用的合作伙伴、做其他基礎(chǔ)設(shè)施產(chǎn)品的合作伙伴,比如做操作系統(tǒng)、數(shù)據(jù)庫、中間件、PaaS平臺(tái)的,甚至做服務(wù)器和網(wǎng)絡(luò)的一些合作伙伴。
場景共同體有一個(gè)簡單的想法,就是將專業(yè)化分工不同的伙伴聚在一起,類似圓桌或聯(lián)盟,大家不是點(diǎn)對點(diǎn),而是多點(diǎn)對多點(diǎn),通過多方交流合作方式大家共同去解決用戶碰到的問題。
主持人:場景共同體有點(diǎn)像從通用存儲(chǔ)往專用存儲(chǔ)去發(fā)展和變化,通用和專用之間需要有一個(gè)平衡,在技術(shù)上怎么樣支撐呢?
謝長生:通用性和專用性的問題還是看場景,看經(jīng)常性的事件是什么。現(xiàn)在很多場景上,像CPU就是通用性很強(qiáng)的產(chǎn)品,但要拿這個(gè)通用的產(chǎn)品去解決有特定的問題,它的效率就比專用產(chǎn)品差很多。
假如經(jīng)常性事件主要就是快速傅里葉變換,如果95%的時(shí)間都是要做這項(xiàng)應(yīng)用,我們用一個(gè)其他技術(shù)能比CPU快得多。又如像量子計(jì)算,針對某一個(gè)場景能夠比現(xiàn)在IT方案快幾萬倍,那就是特定。所以就是這個(gè)道理,選擇通用產(chǎn)品還是專用產(chǎn)品,取決于業(yè)務(wù)場景。
李輝:場景之間來看需求的時(shí)候一定是個(gè)性化的,但是這個(gè)場景里面一定是包含著巨大的群體,包含著很多用戶,在場景內(nèi)部又是共性的,所以這就是場景間是個(gè)性、場景內(nèi)是共性,這就是所謂個(gè)性化的批量生產(chǎn),這就是工業(yè)革命4.0的核心思想。比如一個(gè)領(lǐng)帶單品能賣100萬件,如果考慮我們周邊人的話不會(huì)想到它會(huì)賣出100萬件。但是你把它放到網(wǎng)上的幾億消費(fèi)者當(dāng)中,你就會(huì)找出100萬個(gè)直接用戶來。所以場景覆蓋的群體越大、找到的共性越大,實(shí)際上效率就越高。
主持人:感謝兩位,相信未來數(shù)據(jù)存儲(chǔ)的場景針對性會(huì)越來越強(qiáng),就像本次圓桌對話的主題“新存志遠(yuǎn)數(shù)聚向新”,我們也期待著場景共同體能夠給整個(gè)存儲(chǔ)產(chǎn)業(yè)帶來一些新的變化,能夠?yàn)閿?shù)據(jù)存儲(chǔ)、為整個(gè)行業(yè)用戶提供全新的支撐,釋放數(shù)據(jù)價(jià)值加速企業(yè)數(shù)字化轉(zhuǎn)型。