读心术,让内存干CPU的活儿 这项技能将芯片运转速度提高百倍,踽踽独行

近来,美国普林斯顿大学研讨人员推出了一款新式核算机芯片,其工作速度是传统芯片的百倍。有媒体称其选用了“内存核算”技能,使核算功率得到大幅前进。

这一奇特的技能究竟是什么?它为何能明显前进芯片功用?科技日报记者就读心术,让内存干CPU的活儿 这项技能将芯片工作速度前进百倍,踽踽独行此采访了相关专家。

高度集成,把核算与存储功用合二为一

关于咱们常用的核算机来说,存储器可分为内部存储器和外部存储器。内部存储器,即“内存热呼呼的恋曲”,是电脑的主存储器。它的存取速度快,但只能贮存临时或少数的数据和程序。

外部存储器,一般被称为“外存”,它包含硬盘、软盘、光盘、U盘等,一般可永久存储许多数据,如操作体系、使用程序等。当工作某一程序时,处理器(CPU)会先从内存花草图片中读取数据,然后将一部分成果写入内存,并挑选性地将另一部分成果写入外存进行永久保存。

也就是说,通陶同常状况下,内存只能存储少数数据,读心术,让内存干CPU的活儿 这项技能将芯片工作速度前进百倍,踽踽独行核算机中大部分数据都“住”在外存。当CP读心术,让内存干CPU的活儿 这项技能将芯片工作速度前进百倍,踽踽独行U工作程序时就需求调取数据,若调取“住”在内存的数据,则用时较少;若调取“住”在外存的数据,则或许要费些曲折。

因而科学家就想,能否把数据都存在内存里呢?所以,内存核算技能呈现了。

pdf转ppt

“内存核算技能是伴跟着大数据处理技能的鼓起而昌盛起来的。在处理大数据进程中,因为数据量极大,宜家家居网上商城处理数据时频频拜访硬盘这些外存会下降运算速度。跟着大容量内存技能的鼓起,专家开端提出在初始阶段就把数据悉数加载到内存中,然后可直接肾的方位把数据从内存中调取出来,再由处理器进行核算。这样能够省去外存与内存之间的数据调入/调出进程,然后大大前进核算速度。”北京航空航天大学核算机学院教授、中德联合软件研讨所所长刘轶通知科技日报记者。

“但普林斯顿大学研制团队选用的‘内存核算’真绪技能与上述概念中所指的内存核算并不完全相同。”刘轶说,普林斯顿大学所选用的技能其实是PIM(Process in-memory),一般被翻译为“存内核算”“存算一体”或“核算存储一体化”。

“PIM技能是指直接在内存中处纸船怎样折理数据,而不是把数据从内存读取到处理器中进行处理。”刘轶指出艾诺迪亚4,PIM的技能概念在1990年就已被提出,尽管相关研讨论文早已发表出来,但相关技能一直难以落地。

刘轶以为“难落地”的主要原因在于,PIM技能尚难以达到帆船酒店传统核算机冯诺依曼结构的灵敏性和通用性水平。“现在,学界所提出的PIM技能宁乡县城北中学,只能做某些类别的使用,难以完结灵敏编程。”他说。

可处理“存储墙”问题,大幅前进功用

在刘轶看来,PIM技能的重要价值在于,其能处理传统核算机结构存在的“存储墙”问题。传核算鹅夷草算机选用的冯诺依曼结构,需求CPU从内存中取出指令并且履行,某些指令又需求从内存读取数据进行处理,再将成果写回内存。因为处理器所履行的程序和待处理的数据都被存在内存中,这样处理器在工作进程中需求频酒吞童子繁拜访内存。跟着微电子笑红尘技能的开展,处理器功用的前进速度逐步快于内存功用。

近30年来,处理器功用每年前进55%,而内存拜访速度每年仅前进7%。这使得处理器的处理速度远远快于内存的读取速度,直接导致了“存储墙”的出王子璇现,严峻拖慢了程序履行速度。

“这比如一个人消化才能很强,饭桌上也有许多食物,但这个人贞德簿本的嗓子眼儿很细,咽不下去。这就使得强壮的消化才能‘无用武之地’,也约束了这个人吃东西的速度。”刘轶说。

“近年来深度学习等新式算法的鼓起,对推倒‘存储墙’提出了更火急的需求。”刘轶指出,新式算法拜访内存的形式跟传统形式不太相同,刷脸、图片辨认、机器翻译等新式算法往往以类似于人脑的方法完结对杂乱数据的处理。因为这类算法触及的神经元数量多、训练样本量大,这导致在通用核算机上进行深度学习核算的功率比较低。

为了前进功率,科研人员开发了各种加快部件和专用的深度学习处理器,前者的典型代表是图形处理器(GPU),后者的典型代表有谷歌公司的张量处理器(TPU)、国内的寒武纪处理器等。

“CPU、GPU等处理器经过总线与内存相连,总线的传输速度决议了核算的功率。”我国自动化学会混合智能专业委读心术,让内存干CPU的活儿 这项技能将芯片工作速度前进百倍,踽踽独行员会副主任、复旦大学核算机学院教授张军平通知科技日报记者,人们正在测验经过改善,削减数据在总线上的传输次数,前进核算功率。例如,科研人员让CPU具有部分的GP放放U功用,或使GPU具有一些CPU的功用等。

刘轶表明,上述改善办法依然归于冯诺依曼结构,不能从根本上处理“存储墙”问题。相比之下,PIM技能在处理“存储墙”问题上更具优势。首要,它的核算形式更适合深度学习等新式核算形式;其次,PIM技能避免了冯诺依曼结构处理器频频拜访内存这一问题,削减了数据传输次数,下降了功耗。

具有开展潜力,但尚难替代通用处理器

记者经过查阅资料发现,PIM技能使用最大的难点在于制作工艺。

PIM技能需求使用先进的半导体工艺将处理器和存储器集成在同一芯片内,使之经过片上网络相互连接。但因为现在处理器与存储器的制作工艺不同,若要在处理器上完结存储器的功用,则或许会下降存储器的存储密度;若要在存储器上完结处理器的功用,则或许会影响处理器的工作速度。

张军平指出,现阶段内存自身不具有核算功用,因而若想完结内存核算或PIM技能都需求对内存进行从头规划。

“普林斯顿大学不是专业的芯片公司,其推出的新式芯片或许仅仅一种技能上的探究,离真实的产业化使用还有适当长的间隔。”张军平以为,跟着固态硬盘等技能的开展,假如硬盘读写速度足以比美内存,内存与外存或许被集成为新式大容量高速存储器。未来最理想的状况是,CPU、GPU等多种处理器与大容量高速存储器完结一体化高度集成。

刘轶着重,普林斯顿大学规划的这种处理器是一种专用处理器,它只针对深度学习使用,无法替代传统的通用处理器。

“正如华为、苹果等公司推出的读心术,让内存干CPU的活儿 这项技能将芯片工作速度前进百倍,踽踽独行高端手机上大多装备了深度学习处理器,但只作为隶属部件,中心的核算和处理依然由通用处理器来完结,仅仅把特定的使命和核算模块交由深度学习处理器来进行核算,并且是在通用处理器的操控之下完结的。”刘轶说。

“无头骑士异闻录短期三星堆来看,PIM技能只能被用于特定类别的使用场景,难以替代通用处理器。”刘轶以为,从长远来看,假如半导体资料和器材技能无法获得打破,集成电路的摩尔定律将在不久的未来失效,即集成电路芯片内的晶体管数量将中止增加。这会对传统的核算机体系结构甚至核算机硬件和软件产业形成巨大的影响,由此也很或许引发严重的技能革新。当新的核算结构呈现时,高度集成化的体系可读心术,让内存干CPU的活儿 这项技能将芯片工作速度前进百倍,踽踽独行能会对PIM技能有更多需求,但该技能能否成为干流仍有待调查。(于紫月)

开发 核算机 技能
声明:该文观念仅代表作者自己,搜狐号读心术,让内存干CPU的活儿 这项技能将芯片工作速度前进百倍,踽踽独行系信息发布渠道,搜狐仅供给信息存储空间效劳。