找回密码
 加入怎通
查看: 181|回复: 0

正式支持 JIT LTO,英伟达发布 CUDA 12.0 开发工具集更新(正式支持和非正式支持网络区别)

[复制链接]
我来看看 发表于 2023-03-09 19:55:41 | 显示全部楼层 |阅读模式
8 ~4 k* |# c0 j& i

原标题:正式支持 JIT LTO,英伟达发布 CUDA 12.0 开发工具集更新IT之家 12 月 10 日消息,英伟达(NVIDIA)公司于近日发布了 CUDA 12.0 开发工具更新本次更新带来了非常多的改变,包括支持最新的 Hopper 和 Ada Lovelace GPU 架构、升级 C++ 方言(Dialects)、正式支持 JIT LTO、改善和引入新的 API 等等。

2 z) s+ Y i. D5 S& ]& t1 C4 D1 Y9 B

IT之家了解到,CUDA 12.0 主要功能介绍如下CUDA 12.0 为 NVIDIA 的 Hopper 和 Ada Lovelace 架构提供可编程功能CUDA 12 为 Hopper 和 Ada 架构提供了很多张量操作(tensor operation)选项,这些选项很多都支持公共 PTX 中间表示法。

3 i8 ]* y& X* n2 m+ P& }7 r3 c) S

合作网格阵列(CGA)支持 C 内置函数,用于 SM 多投的编程式二级缓存,基因组学 / DPX 指令,以及其它新增功能支持对标记为 CUDA_VISIBLE_DEVICES 的 GPU 使用虚拟内存管理 API。

, o k* `+ H* ] V0 }$ ~8 y) j

应用程序和库开发人员可以以编程方式更新 CUDA 流的优先级改良后的 CUDA 动态平行化 API,与之前的 API 相比,性能有了 "实质性" 的提高现在通过 nvJitLink 库正式支持即时链接优化(JIT LTO)。

% [5 C/ d5 g5 f2 b- b% V, V, `

支持 GCC 12.1 主机编译器NVCC 和 NVRTC 对 C++20 方言的支持NVRTC 将其默认的 C++ 方言从 C++14 更新为 C++17更多关于 CUDA 12.0 变化的细节请参见发布说明。

9 U. n: V. @( D- V }& \

用户和开发者可以从 developer.nvidia.com 下载适用于所有主要平台的 CUDA 12.0返回搜狐,查看更多责任编辑:

. l( u: B1 W5 n5 U, a4 z ! h# Z) N4 }/ l6 V) Y7 v ) W7 m- q# A; R 2 U8 \) b$ k* n7 D. z# |1 m2 _* s' o5 S$ T) Y. v1 C* g2 b5 G
回复

使用道具 举报

    您需要登录后才可以回帖 登录 | 加入怎通

    本版积分规则

    QQ|手机版|小黑屋|网站地图|真牛社区 ( 苏ICP备2023040716号-2 )

    GMT+8, 2026-4-4 15:04 , Processed in 0.044199 second(s), 23 queries , Gzip On.

    免责声明:本站信息来自互联网,本站不对其内容真实性负责,如有侵权等情况请联系420897364#qq.com(把#换成@)删除。

    Powered by Discuz! X3.5

    快速回复 返回顶部 返回列表