亚马逊推出基于 Habana AI 加速器芯片驱动的DL1实例
发布时间:2021-11-10 09:27:59 所属栏目:系统 来源:互联网
导读:近日,亚马逊云服务部门亚马逊网络服务 (AWS) 宣布 Elastic Compute Cloud (EC2) DL1 实例全面上市。 亚马逊表示,虽然新的实例类型通常不是特别新颖,但 DL1(特别是 DL1.24xlarge)是 AWS 中第一种专为训练机器学习模型而设计的类型,由英特尔旗下 Habana
|
近日,亚马逊云服务部门亚马逊网络服务 (AWS) 宣布 Elastic Compute Cloud (EC2) DL1 实例全面上市。 亚马逊表示,虽然新的实例类型通常不是特别新颖,但 DL1(特别是 DL1.24xlarge)是 AWS 中第一种专为训练机器学习模型而设计的类型,由英特尔旗下 Habana 实验室的 Gaudi 加速器提供支持。 在此发布之前,包括 Seagate、Fractal、Indel、Riskfuel 和 Leidos 在内的开发人员已抢先体验了在 AWS 上运行的 Gaudi。 英特尔Habana 实验室表示,“这是 AWS 第一个不基于 GPU 的 AI 训练实例,创建这个新训练实例类的主要动机是 Andy Jassy 在 2020 年 re:Invent 中提出的:'为我们的最终客户提供比当前一代基于 GPU 的实例高 40% 的性价比。” 借助 DL1,AWS给出了针对谷歌张量处理单元 (TPU) 的第一个答案:一套运行在谷歌云平台上的定制加速器芯片。亚马逊和 Habana 声称,AWS 客户现在可以更快地训练模型,性价比提高高达 40%与最新的 GPU 驱动的 EC2 实例相比。 DL1 实例利用多达 8 个专为加速训练而构建的 Gaudi 加速器,搭配 256GB 高带宽内存、768GB 系统内存、第二代亚马逊自定义英特尔至强可扩展 (Cascade Lake) 处理器、400 Gbps 网络吞吐量、以及高达 4TB 的本地 NVMe 存储。 随着企业意识到在其组织中部署 AI 模型的业务影响,机器学习正成为主流。使用机器学习通常首先通过从数据集中学习来训练模型来识别模式,然后将模型应用于新数据以进行预测。保持模型的预测准确性需要频繁地重新训练模型,这会占用大量资源,从而导致费用增加。加速器芯片被寄予重望。 (编辑:老榕树站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |


