写CUDA到底难在哪?

2025-06-21 02:45:15

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?
广告位810*200
相关阅读
Rust的设计缺陷是什么?

Rust的设计缺陷是什么?

刚看上一个大佬回答的评论区,我认为其实Rust最核心的设计缺...

2025-06-19
2025年是否会爆发第三次世界大战?

2025年是否会爆发第三次世界大战?

感觉2025还不够成熟,能猫还不太想打(准备还不够充分),鹰...

2025-06-19
2025 年 6 月,Rust 在 GUI 方面有何大的进展? 你最看好哪个框架?

2025 年 6 月,Rust 在 GUI 方面有何大的进展? 你最看好哪个框架?

整天一堆nc粉在推tauri就知道没救了。 rust作为追求...

2025-06-19
刘强东称「跨境电商的模式长期来看不可持续」,有依据吗?京东不走跨境电商模式,对其国际市场布局有何影响?

刘强东称「跨境电商的模式长期来看不可持续」,有依据吗?京东不走跨境电商模式,对其国际市场布局有何影响?

问大家一个问题: 你愿意等七天外贸小包裹?还是隔壁挂着“山姆...

2025-06-19
陌生人晕倒了,帮他拨打120后,病人不支付120出车费,这个费用谁来承担?

陌生人晕倒了,帮他拨打120后,病人不支付120出车费,这个费用谁来承担?

如果病人不出,那就是谁打的120谁出。 比出钱更郁闷的,是你...

2025-06-19