|
8 ~4 k* |# c0 j& i 原标题:正式支持 JIT LTO,英伟达发布 CUDA 12.0 开发工具集更新IT之家 12 月 10 日消息,英伟达(NVIDIA)公司于近日发布了 CUDA 12.0 开发工具更新本次更新带来了非常多的改变,包括支持最新的 Hopper 和 Ada Lovelace GPU 架构、升级 C++ 方言(Dialects)、正式支持 JIT LTO、改善和引入新的 API 等等。 2 z) s+ Y i. D5 S& ]& t1 C4 D1 Y9 B
IT之家了解到,CUDA 12.0 主要功能介绍如下CUDA 12.0 为 NVIDIA 的 Hopper 和 Ada Lovelace 架构提供可编程功能CUDA 12 为 Hopper 和 Ada 架构提供了很多张量操作(tensor operation)选项,这些选项很多都支持公共 PTX 中间表示法。
3 i8 ]* y& X* n2 m+ P& }7 r3 c) S 合作网格阵列(CGA)支持 C 内置函数,用于 SM 多投的编程式二级缓存,基因组学 / DPX 指令,以及其它新增功能支持对标记为 CUDA_VISIBLE_DEVICES 的 GPU 使用虚拟内存管理 API。
, o k* `+ H* ] V0 }$ ~8 y) j 应用程序和库开发人员可以以编程方式更新 CUDA 流的优先级改良后的 CUDA 动态平行化 API,与之前的 API 相比,性能有了 "实质性" 的提高现在通过 nvJitLink 库正式支持即时链接优化(JIT LTO)。
% [5 C/ d5 g5 f2 b- b% V, V, ` 支持 GCC 12.1 主机编译器NVCC 和 NVRTC 对 C++20 方言的支持NVRTC 将其默认的 C++ 方言从 C++14 更新为 C++17更多关于 CUDA 12.0 变化的细节请参见发布说明。 9 U. n: V. @( D- V }& \
用户和开发者可以从 developer.nvidia.com 下载适用于所有主要平台的 CUDA 12.0返回搜狐,查看更多责任编辑:
. l( u: B1 W5 n5 U, a4 z
! h# Z) N4 }/ l6 V) Y7 v
) W7 m- q# A; R
2 U8 \) b$ k* n7 D. z# |1 m2 _* s' o5 S$ T) Y. v1 C* g2 b5 G
|