第22章算力汇率
林远将所有问题归纳为两点:计算、采集。
对于计算问题,林远一直很想知道这算力系统的实际性能。这系统的1p算力到底约等于现实世界的多少算力。
以前他没有专业算力设备来测试,但现在因为测试任务,好团的算力设备不就是现成的嘛。
好团的紫金分部这边有一个h100和a100gpu混搭的测试用算力平台,林远成功申请到了一块a100的使用权。虽然a100比h100差了不少,但这毕竟是正儿八经的算力卡,妥妥能秒杀市面上的各种rtx和hd等电脑用显卡。
林远先跑了次针对tf32数据的通用测试,a100对tf32的计算性能基本稳定在35t/s以上。自己的算力系统要到达同级别表现只需要将近10t/s的算力功率。
林远据此总算标定了算力系统当前的算力性能:大约比现实世界的算力优秀三倍。也就是说,同样是1t单位的算力,算力系统的相当于现实世界的3t。
也就是说:系统和现实世界的算力汇率是1比3。
林远顿时有了种“老子是发达国家,整个现实世界都是第三世界”的感觉,因为老子的算力值钱啊。
可即便如此,林远也对用算力系统去跑算法优化也没什么信心。因为算力系统的算力汇率也就才是3倍,自己这1000p累积算力根本就不够看的。
但是,哪怕是出于好奇心,试还是要试一下的。
林远随即就准备给算力系统载入一份采集好的数据。这份数据是一段时间内一大群骑手的真实配送数据。
林远很快就遇到问题:特么的他要怎么录入数据。这份数据太大了,足足有10个g,光靠自己眼睛录入要到猴年马月啊。
【系统,我都跟你说了,给我脑子里弄个wifi,以后你就能和电子设备通信了。】
但是,系统并没有搭理他。
直到林远打算放弃的时候,系统这才主动弹了个提示。
【数据已载入完毕,是否开始训练?】
‘什么时候载入完毕的?’
林远惊奇地在系统面板上看到了眼前服务器上一模一样的数据,这10多个g的数据就那么几下功夫就被系统读取了,整个过程林远都没有察觉到。
【原来你特么不光是只能靠眼睛录入数据。】
林远忽然意识到:难道系统本身就和现实世界有联系?
来不及多想,林远带着这份好奇心开始了系统的ai模型训练。
他将算力功率设定在了50t/s,这是一个很安全不会导致他头晕的功率值。
出乎林远意料,系统仅仅用时一分钟就完成了一次数据训练。50t/s*60s=3000t,也就是才3p的算力消耗。
而林远清楚知道,a100满负荷跑同样的一次数据训练却需要十分钟。
已知,a100的满负荷算力为:35t/s,则a100满负荷运行十分钟产生的算力是:35t/s*600=21000t=21p。
也就是说,完成同样的工作量。算力系统只用了3p算力,而a100则用了21p。由于a100的算力值是现实世界的算力值,因此哪怕是用h100算力卡,其工作效率虽然会提升,但是消耗的总算力不会改变。
进而得出:训练这份10g数据集,算力系统1p的算力相当于现实世界的7p。那算力汇率就变成1比7了。
这不就和之前的1比3对不上了嘛。
这系统虽然神奇,但目前为止林远并没有发现这系统有突破自然法则的迹象。
ai的模型训练其实就是数据计算,既然是数据计算,那就不存在那会儿算的慢这会儿算的快的情况,因为林远用的数据类型没变,都是tf32。