特斯拉发布D1 Dojo芯片 可提供22.6 TFLOPS单精度浮点运算性能

时间: 2021-08-24 16:09:48 来源:中关村在线
  芯研所消息,特斯拉在AI DAY上发布了D1芯片和Dojo超级计算机,并表示 D1 Dojo 芯片具有 GPU 级别的计算能力、CPU 级别的灵活性,以及网络交换机 IO。

  

具备显卡算力?特斯拉发布D1 Dojo芯片

 

  特斯拉介绍,D1芯片可以提供22.6 TFLOPS的单精度浮点运算性能,BF16/CFP8的峰值算力达到了362 TFLOPS,热设计功耗(TDP)不超过400W。对AI训练来说,可扩展性非常重要,因此通过带宽为10 TB/s的“延迟交换结构”在各个方向进行互连。

  

具备显卡算力?特斯拉发布D1 Dojo芯片

 

  为了支撑AI训练的扩展性,它的互连带宽非常惊人,最高可达10TB/s,由多达576个通道组成,每个通道的带宽都有112Gbps。而实现这一切,热设计功耗仅为400W。

  

具备显卡算力?特斯拉发布D1 Dojo芯片

 

  据悉,将包含3000个D1芯片的120个训练模块可以组成ExaPOD,能够提供超过100万个训练节点,BF16/CFP8的峰值算力达到1.1 ExaFLOPS。

 
热门推荐
推荐图文
热点推荐
点击排行
网站首页  |  滨海新区  |  高新区  |  新区巡礼  |  科技前沿  |  高新时评  |  公告  |  今日关注  |  财经  |  体育  |  国内  |  国际  |  教育  |  天津  |  投资  |  高层对话  |  史海探秘  |  手机  |  电脑  |  数码  |  汽车  |  IT业界  |  企业  |  品牌  |  科技  |