128核聽起來很多,其實(shí)也就那么回事兒。
不過是11個(gè)全志a31soc的核心數(shù)罷了,人家畢竟是傳說中的“四核八顯12核心”!
說起來,gpu因?yàn)橐诒M可能短時(shí)間內(nèi)完成大量圖像渲染任務(wù),更加重視并行計(jì)算能力,向來有配備大量并發(fā)管線的傳統(tǒng)。像是a31的八顯,說的就是其內(nèi)部有兩顆sgx544gpu模塊,各有4個(gè)被稱為通用可拓展著色引擎us色2的渲染單元,結(jié)果本來只是雙gpu的芯片就被奸商吹成了八顯一開始還有些遮掩,只說是“八顯”不說“八核顯卡”,后來就徹底放開了。
而作為移動soc里面顯示性能最強(qiáng)的女idia,他們家最新的平板soc產(chǎn)品tegrak1,更是因此而變成了逆天的192核顯卡,似乎眼看著就要吊打桌面顯卡了。
實(shí)際情況卻不是這樣,整個(gè)k1的熱設(shè)計(jì)功耗只有5瓦,和桌面顯卡暫時(shí)還沒有比較的可能,至少只有96個(gè)cuda核心的雙敏大狂牛gt440-4gb就能將其輕松秒殺。
狂牛系列顯卡向來以看起來嚇人的超大顯存和不夠給力的中低端gpu而著稱于世,大顯存成了奸商欺騙消費(fèi)者的利器,弱核心廉價(jià)低速dd顯存又成了硬件老鳥嘲笑廠家和小白用戶的武器。然而,只有笑而不語的打金工作室老板才知道“好馬配好鞍,打金用狂牛”,這卡其實(shí)還是很牛的。
對于普通人來說,以gf108gpu的速度,正常情況下根本用不完4gb顯存。但是對于網(wǎng)游工作室來說,這種低價(jià)大顯存顯卡簡直是為其量身定制的,他們并不在意畫質(zhì)什么的,反正為了流暢多開都是最低畫質(zhì)的,這種時(shí)候這種用內(nèi)存顆粒充當(dāng)?shù)退亠@存的顯卡就顯得非常實(shí)用了,hold住十幾個(gè)甚至幾十個(gè)網(wǎng)游客戶端毫無問題。
只可惜,現(xiàn)在畢竟是免費(fèi)網(wǎng)游的天下,這些游戲普遍有著經(jīng)濟(jì)系統(tǒng)不健康道具貶值特別快的通病,以至于很多工作室選擇了轉(zhuǎn)行,改去玩計(jì)算力挖礦了。比起還需要安排小弟照看一二的網(wǎng)游多開打金業(yè)務(wù),時(shí)下流行的計(jì)算力挖礦就更加簡單了,只要網(wǎng)絡(luò)和電力保持通暢,電腦開機(jī)就能給老板賺錢。
在國內(nèi)最出名的兩大計(jì)算力挖礦品牌,一個(gè)是國外最流行的逼tcoin比特幣,另一個(gè)則是蜜蜂p幣,或者說蜜蜂糧票。和價(jià)格隨行就市的比特幣不同,蜜蜂p幣的價(jià)格一直保持穩(wěn)中有降的趨勢,雖然賺不了大錢但也不會像比特幣那樣因?yàn)閮r(jià)格大起大落而倒霉賠錢,淪為炒家收割的對象。
不過無論是挖比特幣掙美元,還是跟著蜜蜂混賺點(diǎn)電費(fèi)錢,都對計(jì)算機(jī),尤其是gpu的計(jì)算能力有比較高的要求,尤其是比特幣挖礦,一開始都是各種中高端顯卡在挖,用到快廢就折價(jià)賣二手,很是坑了一批貪便宜半價(jià)買高端顯卡的玩家。以狂牛一般偏弱的gpu,自然是沒有當(dāng)“礦卡”的命。于是,以賣牛為生的雙敏,卒。
不管是a記的sp流處理器,還是n記的cuda通用并行計(jì)算單元,亦或是intel家xeonphi的x86核心,都不是單獨(dú)的“核”。論起結(jié)構(gòu)的復(fù)雜度,完全不能和馬競的ipu相比較。畢竟前面三者都要考慮量產(chǎn)成本的問題,太過復(fù)雜的電路設(shè)計(jì)會導(dǎo)致生產(chǎn)工序的冗長和低容錯(cuò)率,自然是智者不為的。
實(shí)際上,馬競的ipu更像是威力加強(qiáng)版本的intel至強(qiáng)處理器。
intel下半年發(fā)布的,目前地球上最強(qiáng)大的量產(chǎn)cpu至強(qiáng)e5-2699v3擁有18個(gè)物理核心,每顆核心獨(dú)享32+32kb高速l1緩存和256kb的l2緩存,再集體共享“高達(dá)”45的l3緩存。
芯片設(shè)計(jì)師們當(dāng)然知道馮諾依曼瓶頸,于是很早就開始給cpu配置了cache高速緩存,且一般使用sra態(tài)隨機(jī)存儲器,相比于內(nèi)存條常用的dra態(tài)存儲器,前者的優(yōu)點(diǎn)是不需要設(shè)置刷新電路,讀寫速度快,缺點(diǎn)則是電路集成度低、成本高。
無論是高成本,還是低集成度,對于cpu來說都是要命的,因此也就不難解釋為什么時(shí)至今日,cpu的l1/l2一二級緩存的容量依舊以kb為單位了,倒是使用dral3緩存,倒是可以做得大一點(diǎn)也不能太大,畢竟芯片面積上每一毫米都是珍貴的。
當(dāng)代u皇2699全部三-級緩存加起來也只有50的容量,對于應(yīng)用程序來說自然是不夠用的,當(dāng)沒有在緩存中找到數(shù)據(jù),系統(tǒng)還是得去內(nèi)存甚至更慢的硬盤當(dāng)中去搜尋,自然進(jìn)一步拖慢了速度。
而這些問題對于馬競來說,基本上都不是問題了。第一代ipu芯片的具體型號是128-16/16,指的自然是128顆運(yùn)算核心,每顆都被分配了16一級緩存,然后再集體共享2gb三-級緩存,即核均16。
之所以能夠做到這一點(diǎn),一來是某人掌握黑科技,可以熟練地制造碳基芯片,唯一的問題就是“人工生產(chǎn)”導(dǎo)致產(chǎn)量太低,二來也是因?yàn)閕pu的設(shè)計(jì)思路是全新的,不論是cpu還是gpu,以及動物神經(jīng)系統(tǒng),都是其參考借鑒的對象。比如顯卡領(lǐng)域目前研發(fā)熱點(diǎn)的hb帶寬顯存技術(shù)就被馬競借鑒了去。
既然基于內(nèi)存都3d堆棧了,處理器部分更加不能繼續(xù)平面化。實(shí)際上馬競在3d晶體管方面比intel和三星還要激進(jìn),畢竟人家要考慮工藝實(shí)現(xiàn)問題,而馬競卻可以隨便開腦洞,失敗也不過是浪費(fèi)幾天時(shí)間罷了。
和動物們的神經(jīng)系統(tǒng)相比,ipu128個(gè)自帶“記憶”能力的計(jì)算核心并不算多,但是也基本夠用了。馬競之前有測試過不同數(shù)量的方案,總得來說核心越少、“內(nèi)存”越少效果越差,反之則約好。不過隨著核心數(shù)的堆砌,以及“內(nèi)存”的擴(kuò)容,晶體管數(shù)目迅速增加,相應(yīng)的芯片的厚度、面積和發(fā)熱量也要增加,最終只能折衷選擇了128-16/16這個(gè)方案。
人類大腦皮層平均厚度不到3毫米,但布滿褶皺溝回,全部展開后總面積高達(dá)2200平方厘米,其中據(jù)估計(jì)含有約140億個(gè)神經(jīng)細(xì)胞。并且人的腦細(xì)胞數(shù)量每天還在減少,同樣據(jù)估計(jì)每天有10萬腦細(xì)胞陣亡,并且不會得到補(bǔ)充。好在“生物腦計(jì)算機(jī)”的自我糾錯(cuò)能力可比電子計(jì)算機(jī)強(qiáng)多了,死亡的腦細(xì)胞會被其他細(xì)胞迅速代替,通常不會動不動給你一個(gè)藍(lán)屏死機(jī)。
顯然,神經(jīng)元之間的復(fù)數(shù)連接起到了非常強(qiáng)大的冗余備份能力,而且大腦作為一個(gè)活系統(tǒng),雖然神經(jīng)元很難增生,但卻可以建立新的突觸連接,以自動適應(yīng)各種不同情況,通常說的腦子越用越靈便是這種情況,患者腦部的自發(fā)變化同樣也算。當(dāng)然要是過度用腦,或者病情發(fā)展太快太嚴(yán)重,超過了大腦的自主調(diào)節(jié)范圍,還是會出現(xiàn)各種問題的。
馬競在設(shè)計(jì)ipu的立體晶體管構(gòu)架時(shí),就有在刻意模仿動物神經(jīng)網(wǎng)絡(luò),一來借助立體架構(gòu)增加晶體管密度,二來也有構(gòu)建芯片內(nèi)“神經(jīng)網(wǎng)絡(luò)”的意思。
這個(gè)網(wǎng)絡(luò)還非常簡單粗糙,根本不能和各大巨頭們研究人工智能時(shí)搭建的計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)相比擬,不過馬競卻非常看好它的發(fā)展,畢竟芯片內(nèi)通訊的速度和能耗都要優(yōu)于計(jì)算機(jī)間通過網(wǎng)線進(jìn)行通訊。
尤其是用于一些“簡單”場合時(shí),效果比大型系統(tǒng)還要好。現(xiàn)在蜂園里面亂跑的動物們,已經(jīng)可以做到“雙兔傍地走,安能辨我是假真”的地步,蜜蜂客服中心人工客服崗位也不增反減。至于其他的人工智能應(yīng)用同樣有上佳表現(xiàn),無論是語音識別合成、語義識別、機(jī)器翻譯,還是圖像識別合成、模糊計(jì)算、ai模擬等等方面都有hold得住。
不過產(chǎn)量和能耗都很讓馬競蛋疼,一方面產(chǎn)量太低只能自用,另一方面因?yàn)榫w管數(shù)量太多,整體的能耗也有些大,暫時(shí)還不能放到移動設(shè)備里面去。馬競倒不是急著把ipu塞進(jìn)人造動物體內(nèi),跑去進(jìn)而寵物搶市場,他真正在意的是把ipu用在下一代pt2以及小馬電動車、飛馬飛行器上面去。
游戲機(jī)當(dāng)然是需要大量人工智能以及人機(jī)交互技術(shù)的,作為智能交通設(shè)備的后兩者同樣也需要更加機(jī)靈的腦子。不過可惜,現(xiàn)在的鋰離子電池容量不夠給力,把功耗超過100瓦的ipu裝進(jìn)去以后續(xù)航會變得很坑爹。
前面提到的地上最強(qiáng)cpu,至強(qiáng)e5-2699v3集成了約57億晶體管,核心面積662毫米,熱設(shè)計(jì)功耗(tdp)為145瓦。
tdp是一個(gè)安全值,芯片廠家用此表示自家芯片最大發(fā)熱程度,從而給其他關(guān)聯(lián)廠商進(jìn)行參考,避免散熱器不給力系統(tǒng)過熱乃至融化變形等意外的發(fā)生。所以tdp通常比芯片本身的最大功耗還要大一些,而如今主流芯片大多搭載有降頻節(jié)能技術(shù),實(shí)際運(yùn)行功耗可能只有tdp的三分之一甚至更低。
因?yàn)樘脊艹叽缰挥胁坏?納米左右的緣故,馬競在ipu里面足足塞了大約200億個(gè)晶體管,不過即便如此每個(gè)核心單元平均的晶體管數(shù)目也才只有一億六千萬,別說和intelx86cpu相比,就算是和ar動處理器相比,也都是處在比較低的水平。比如最新的蘋果芯a8作為雙核cpu加四核gpu的組合,卻擁有20億晶體管數(shù)量,平均每個(gè)核心擁有超過3億晶體管。
當(dāng)然這種比較實(shí)在過于粗略,現(xiàn)實(shí)中的手機(jī)處理器因?yàn)槭莝oc的關(guān)系,不但要集成cpu、gpu以及很占地方的sra存,還要騰出很大面積給諸如dsp、isp之類的專業(yè)處理器,用在cpugpu上的面積其實(shí)頗為有限,整體來說核均晶體管數(shù)量自然不能像桌面cpu一樣堆得那么猛。
而且晶體管越多,必然的發(fā)熱也會越多。即便已經(jīng)用上了電阻更小的碳晶體管,但先進(jìn)材料帶來的功耗優(yōu)勢還是被超大的晶體管數(shù)量給拉平了,這也是為什么只做到128核的一個(gè)原因。
繞是如此,當(dāng)魏偉終于見到了期待已久的ipu,還是忍不住驚訝地反復(fù)問了句有沒有拿錯(cuò)?
因?yàn)轳R競拿給他的ipu,并不是他之前想象的一塊芯片,而是一塊帶有pci-e金手指的拓展卡簡單來說,就是一塊長得非常非常像高端顯卡的這么一塊板磚。
占據(jù)ai卡絕大部分厚度的其實(shí)是鋁鎂合金制作的水冷散熱系統(tǒng),不但內(nèi)里芯片被蓋住看不見,就連板載內(nèi)存/閃存也看不見盡管已經(jīng)有了總計(jì)高達(dá)4gb的芯片內(nèi)內(nèi)存,但是唯恐不夠用的馬競還是在板子上面堆了8gb的dd內(nèi)存和128gb的閃存芯片。
雖然全金屬外殼顯得頗有科技感和未來感,但是架不住顯卡廠商早這么干了,這塊ai卡的外觀又過分像顯卡,以至于魏偉拿在手里看了幾下也索然無味將其棄之一旁了。
主要還是之前期待值刷得太高了,見到平平無奇的實(shí)物,自然難免有些失望。
當(dāng)然,這也跟他不是卡巴基佬有關(guān)系,不然的話這會肯定會拉著跑分、拆機(jī)、拍照,然后拿去發(fā)帖爆料了。
是以,放下ai卡以后,他立即轉(zhuǎn)移了興趣,問起了另外一個(gè)話題:“這次總算要三馬齊聚了吧?”
“應(yīng)該吧,”馬競無所謂地說道:“這有什么好期待的,作為資深三季王我們就是去打醬油的。”
【精彩東方文學(xué) www.nuodawy.com】 提供武動乾坤等作品手打文字版最新章節(jié)首發(fā),txt電子書格式免費(fèi)下載歡迎注冊收藏。