Oculus为Quest推出两款全新GPU性能开发工具
来源:映维网 作者 黄颜
Oculus和高通在过去一年中一直在努力构建一个名为Performance Interface Library(PIL)的底层设备端库,从而提供以前只能通过Snapdragon Profiler获得的GPU信息。这个库现在已经嵌入到Quest操作系统中,并提供了两种主要的信息:渲染阶段度量和实时度量。你可以通过GPU Systrace和ovrgpuprofiler这两个新工具进行访问,以最少的GPU开销来探其所为。
1. GPU Systrace
对于大多数现有的GPU工具,一个核心问题是它们将时间测量作为绘制调用序列,而移动GPU将一个接一个地渲染曲面图元。你无法查询图片时间和信息,因为图元是在图形API之下抽象出来。然而,PIL为我们提供了一种查询所有相关数据的方法,能够有效地告诉我们“GPU渲染了一个1216×1344的曲面,其中96个图元的大小都是192×168,耗时5.2ms。”
GPU Systrace将渲染阶段信息集成到Systrace中,从而提供了更佳的可视化体验,并允许你在同一视图中查看GPU负载和CPU负载。通过这样的方式,你就可以探知应用程序的CPU负载和GPU负载是如何协同工作。

VrCubeworld 示例规矩输出(须用Chrome浏览器)
在上面的屏幕截图中,你可以在顶行看到GPU渲染曲面的进程,而CPU进程则在底行呈现。在GPU完成渲染曲面后不久,CPU等待操作(FenceChecker::wait)就会释放。另外,GPU曲面渲染过程会划分为一系列的渲染阶段。Binning是指计算所有绘制调用的三角形顶点位置并将其分配给对应于绘制曲面分区的bin。Render表示一个bin的所有顶点和片段操作的总成本。Preempt是合成器,一个操作系统级的服务,它定期执行并将应用程序提交的图像显示在屏幕。有关工具提供的GPU信息的完整列表,请参阅这个GPU Systrace文档。
2. Ovrgpuprofiler Tool
Ovrgpuprofiler是Oculus Quest的一个底层CLI工具,主要用于提供对详细GPU信息的访问。它构建成一个超轻量级的CLI客户端,并有效地充当PIL-Qualcomm库之上的wrapper。它允许你检索两种类型的信息,渲染阶段度量(类似GPU systrace,但只是文本形式)和实时度量。它的主要目标是成为一个易于使用的低摩擦工具,因为它可以直接通过adb shell提供。
在adb shell提示符中,ovrgpuprofiler-m将显示工具支持的所有实时指数列表,前几个结果是:
monterey:/ # ovrgpuprofiler -m
47 metrics supported:
1 Clocks / Second
2 GPU % Bus Busy
3 % Vertex Fetch Stall
4 % Texture Fetch Stall
5 L1 Texture Cache Miss Per Pixel
例如,如果用户希望要检索度量值3和5,用户需要调用ovrgpuprofiler–realtime=“3,5”,它将每秒返回采样的度量值:
monterey:/ # ovrgpuprofiler –realtime=”3,5”
% Vertex Fetch Stall : 1.057
L1 Texture Cache Miss Per Pixel : 0.166
% Vertex Fetch Stall : 1.082
L1 Texture Cache Miss Per Pixel : 0.166
要查询renderstage数据,在调用ovrgpuprofiler-e并重启应用(这是将应用的GPU情景置于分析模式所必需的动作,与GPU Systrace完全相同)之后,对ovrgpuprofiler-t的调用将返回如下信息:
Surface 1 | 1216×1344 | color 32bit, depth 24bit, stencil 0 bit, MSAA 4 | 60 128×224 bins | 5.12 ms | 123 stages : Binning : 0.643ms Render : 2.17ms StoreColor : 0.474ms Blit : 0.002ms Preempt : 1.411ms
渲染阶段数据允许我们回答这样的问题:“我的应用实际需要多长时间完成计算,其中有多少是时间扭曲?”
我们从数据中可以看到,它需要5.12毫秒来执行,其中1.411毫秒是时间扭曲。现在,你已经拥有了为应用做出明智选择所需的一切信息。
3. 总结
有关PIL、ovrgpuprofiler和GPU Systrace的更多信息,请查看GPU Systrace文档 和ovrgpuprofiler文档 。
需要注意的是,这个库和附带工具正在开发之中,而Oculus计划在不久的将来添加更多的信息和功能,如绘制调用度量和其他渲染阶段。Oculus同时注意到Vulkan的一个问题:在使用渲染阶段跟踪时会造成不必要的CPU等待。
相关文章
-
黄仁勋:英伟达豪赌GPU终获回报,但我更看好高性能计算
-
东宝生物:公司的供应商主要包括骨料及相应的辅料
-
Facebook正在构建自主操作系统,减少对安卓系统依赖
-
PC话你知|首个虚拟大学生入学清华/神舟十二号载人飞船出征
-
Gartner报告:阿里云容器产品布局全球第一
-
家具家电租赁平台“轻松住”完成240万美元Pre-A轮融资
-
【虎嗅早报】马云今日“退休”;苹果称员工加班是自愿
-
花钱心底有数!支付宝Apple专区App Store账单上线了
-
谁杀死了ofo?马化腾说的那个病根,未必正确
-
贝索斯与妻子达成离婚协议:保留亚马逊75%股份
-
宇联表Union|与你有关
-
误入歧途的罗永浩,骑虎难下的锤子手机
-
iPhone14Pro机型将配备新的A16Pro处理器
-
蓝牙耳机打不开是为什么
-
华为手机关不了机怎么办
-
泄露公司源代码致超百万损失,大疆前员工被罚20万并获刑
-
剧本杀测评《神启》硬核进阶(部分复盘)
-
本性难移!“安卓之父”东山再起,又遭离职风波
-
【PW早报】苹果承认iPhone在中国卖得不好,大幅下调营收预期,盘后大跌8%
-
不仅仅是情怀,好的像素游戏就是艺术本身
-
Facebook在深圳设立体验中心,让中国广告商了解平台上的广告运作
-
一场游戏平台商与游戏大厂的战争
-
开学季换新机热潮来袭:荣耀V20、小米9和联想Z5ProGT,咋选?
-
中国移动公布智能家庭网关中标候选人 16亿元最高报价是哪家?
-
6000万美元接盘人人网 隐身独角兽多牛传媒浮出水面
-
2018年与2019年中国互联网企业百强榜对比分析
-
开放不是口号,而是生存能力
-
8点1氪|传阿里将于11月赴港上市;抖音回应“李小璐PGone视频”泄露质疑;苹果Q4营收640亿美元
-
地下综合管廊可视化智慧管理系统精细业务管理