Oculus为Quest推出两款全新GPU性能开发工具
来源:映维网 作者 黄颜
Oculus和高通在过去一年中一直在努力构建一个名为Performance Interface Library(PIL)的底层设备端库,从而提供以前只能通过Snapdragon Profiler获得的GPU信息。这个库现在已经嵌入到Quest操作系统中,并提供了两种主要的信息:渲染阶段度量和实时度量。你可以通过GPU Systrace和ovrgpuprofiler这两个新工具进行访问,以最少的GPU开销来探其所为。
1. GPU Systrace
对于大多数现有的GPU工具,一个核心问题是它们将时间测量作为绘制调用序列,而移动GPU将一个接一个地渲染曲面图元。你无法查询图片时间和信息,因为图元是在图形API之下抽象出来。然而,PIL为我们提供了一种查询所有相关数据的方法,能够有效地告诉我们“GPU渲染了一个1216×1344的曲面,其中96个图元的大小都是192×168,耗时5.2ms。”
GPU Systrace将渲染阶段信息集成到Systrace中,从而提供了更佳的可视化体验,并允许你在同一视图中查看GPU负载和CPU负载。通过这样的方式,你就可以探知应用程序的CPU负载和GPU负载是如何协同工作。
VrCubeworld 示例规矩输出(须用Chrome浏览器)
在上面的屏幕截图中,你可以在顶行看到GPU渲染曲面的进程,而CPU进程则在底行呈现。在GPU完成渲染曲面后不久,CPU等待操作(FenceChecker::wait)就会释放。另外,GPU曲面渲染过程会划分为一系列的渲染阶段。Binning是指计算所有绘制调用的三角形顶点位置并将其分配给对应于绘制曲面分区的bin。Render表示一个bin的所有顶点和片段操作的总成本。Preempt是合成器,一个操作系统级的服务,它定期执行并将应用程序提交的图像显示在屏幕。有关工具提供的GPU信息的完整列表,请参阅这个GPU Systrace文档。
2. Ovrgpuprofiler Tool
Ovrgpuprofiler是Oculus Quest的一个底层CLI工具,主要用于提供对详细GPU信息的访问。它构建成一个超轻量级的CLI客户端,并有效地充当PIL-Qualcomm库之上的wrapper。它允许你检索两种类型的信息,渲染阶段度量(类似GPU systrace,但只是文本形式)和实时度量。它的主要目标是成为一个易于使用的低摩擦工具,因为它可以直接通过adb shell提供。
在adb shell提示符中,ovrgpuprofiler-m将显示工具支持的所有实时指数列表,前几个结果是:
monterey:/ # ovrgpuprofiler -m
47 metrics supported:
1 Clocks / Second
2 GPU % Bus Busy
3 % Vertex Fetch Stall
4 % Texture Fetch Stall
5 L1 Texture Cache Miss Per Pixel
例如,如果用户希望要检索度量值3和5,用户需要调用ovrgpuprofiler–realtime=“3,5”,它将每秒返回采样的度量值:
monterey:/ # ovrgpuprofiler –realtime=”3,5”
% Vertex Fetch Stall : 1.057
L1 Texture Cache Miss Per Pixel : 0.166
% Vertex Fetch Stall : 1.082
L1 Texture Cache Miss Per Pixel : 0.166
要查询renderstage数据,在调用ovrgpuprofiler-e并重启应用(这是将应用的GPU情景置于分析模式所必需的动作,与GPU Systrace完全相同)之后,对ovrgpuprofiler-t的调用将返回如下信息:
Surface 1 | 1216×1344 | color 32bit, depth 24bit, stencil 0 bit, MSAA 4 | 60 128×224 bins | 5.12 ms | 123 stages : Binning : 0.643ms Render : 2.17ms StoreColor : 0.474ms Blit : 0.002ms Preempt : 1.411ms
渲染阶段数据允许我们回答这样的问题:“我的应用实际需要多长时间完成计算,其中有多少是时间扭曲?”
我们从数据中可以看到,它需要5.12毫秒来执行,其中1.411毫秒是时间扭曲。现在,你已经拥有了为应用做出明智选择所需的一切信息。
3. 总结
有关PIL、ovrgpuprofiler和GPU Systrace的更多信息,请查看GPU Systrace文档 和ovrgpuprofiler文档 。
需要注意的是,这个库和附带工具正在开发之中,而Oculus计划在不久的将来添加更多的信息和功能,如绘制调用度量和其他渲染阶段。Oculus同时注意到Vulkan的一个问题:在使用渲染阶段跟踪时会造成不必要的CPU等待。
相关文章
-
世界银行点赞阿里巴巴:淘宝成中国农村扶贫新路径
-
智东西晚报:亚洲消费电子展宣布永久停办微软分拆小冰业务并独立发展
-
周鸿祎:我们要放弃幻想,从没什么系统能固若金汤
-
Facebook在深圳设立体验中心,让中国广告商了解平台上的广告运作
-
网易云音乐与腾讯音乐娱乐,正在成为两个物种
-
竞逐万亿级互联网医疗市场,阿里、平安、众安如何共搅一池春水?
-
怎样下载国内外专利?
-
41亿元接盘宝沃,神州优车布局全产业链
-
随着社交电商的崛起,唯品会已去日无多
-
《指环王》是孤独的
-
带你一起喜刷刷!
-
微软因Win10强制自动更新被判赔数千欧
-
浩瀚星空,隐藏了太多的神奇!
-
中国引入高端职业,跟“佩奇”有关,国外同行时薪2000美元!
-
秘籍来了!优化师职业的华丽转身
-
传骁龙898多方面提升,马斯克减持特斯拉股票,富士康对明年持谨慎态度,《地平线5》用户创微软纪录,这就是今天的其他大新闻!
-
IG 夺冠,是给中国电竞一次最大的正名
-
微软Edge浏览器衰落之谜:“自杀”还是“他杀”
-
2020年智慧医院HIC百强排行榜:广州市妇女儿童医疗中心蝉联榜首(附TOP100)
-
开屏广告太烦人?用这个只有2M的App,助你自动跳过5秒等待
-
uBarforMac(Win式任务栏工具)
-
未来全球嵌入式主板市场将如何发展?
-
快手vs抖音:500万的“小官司”与直播电商的大方向
-
国内和境外游戏版号申报正式重启;特斯拉缩减董事会成员;每日优鲜App炒作996遭差评轰炸
-
阿里云盘实施VIP制:10项功能受到限制,初心未变!
-
支付宝为什么要学百度智能小程序“一次开发多平台可运行”?
-
回顾FBEC2018大会 | VR/AR行业新思考
-
微信显示“正在输入”,其实不是在回你消息,背后原因挺“伤人”
-
【PW早报】微信停止服务印度用户