POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
12
返回列表 发新帖
楼主: kyrome
打印 上一主题 下一主题

推荐一款移动GPU性能测试软件,Electopia

[复制链接]
21#
 楼主| 发表于 2011-6-20 23:13 | 只看该作者
eoc 发表于 2011-6-19 23:23
自测结果:
i9100 (mali 400mp4): 36.47fps WVGA
p990 (geforce ulp): 16.81fps WVGA

sensation (adreno 220)是QHD,如果WVGA应该也有30fps以上.
回复 支持 反对

使用道具 举报

22#
发表于 2011-6-20 23:23 | 只看该作者
本帖最后由 defia 于 2011-6-20 23:25 编辑

18.12 nexus s又跑了一次18.41了
回复 支持 反对

使用道具 举报

23#
发表于 2011-6-20 23:25 | 只看该作者
66666 发表于 2011-6-20 23:12
回复 cloudol 的帖子

A4G自带图库本身有bug,换用第三方图库缩放滑动非常流畅。这在机锋上面早就有证实,还 ...

Android自带的图库是垃圾,测试过连清晰度都大打折扣。

另外不知道视频里的Galaxy 10.1是什么系统。如果是3.0的话横着用会比竖着用界面流畅1倍,这是3.0的性能bug。如果是3.1则横竖流畅性无差别。

回复 支持 反对

使用道具 举报

24#
发表于 2011-6-20 23:28 | 只看该作者
本帖最后由 66666 于 2011-6-20 23:38 编辑
开普勒 发表于 2011-6-20 23:25
Android自带的图库是垃圾,测试过连清晰度都大打折扣。

另外不知道视频里的Galaxy 10.1是什么系统。如 ...

3.1,横竖流畅度没什么区别

另外带宽并不是tegra系ulp geforce最大的软肋,甚至浮点计算也不是

ulp geforce最大弱点是ROPs性能非常非常差,1200M/S的填充率绝大部分时间都是胡扯的,再增加带宽对GPU性能提升也是微乎其微。
回复 支持 反对

使用道具 举报

25#
发表于 2011-6-21 00:37 | 只看该作者
66666 发表于 2011-6-20 23:28
3.1,横竖流畅度没什么区别

另外带宽并不是tegra系ulp geforce最大的软肋,甚至浮点计算也不是

这就是带宽低的反映。

Tegra 2宣称的1200MPixels/s的ROP性能,其实能达到,但仅限于Z-cull时。如果完全不遮挡的话,受限于内存带宽,在采用LPDDR2 600时实测值只有不到300MPixels/s(打开双线性过滤),如果是大纹理还要再略低一些。Alpha Blending时更惨,还不到200。

所以,Tegra 2的游戏开发者最简单有效的优化办法就是,尽量从近到远渲染,增加Z-cull比例,减少内存访问。

回复 支持 反对

使用道具 举报

26#
发表于 2011-6-21 02:56 | 只看该作者
zixel 不能算是 pixel,只是 z-op/s。
回复 支持 反对

使用道具 举报

27#
发表于 2011-6-21 08:17 | 只看该作者
本帖最后由 asdfjkl 于 2011-6-21 08:20 编辑
66666 发表于 2011-6-20 23:12
回复 cloudol 的帖子

A4G自带图库本身有bug,换用第三方图库缩放滑动非常流畅。这在机锋上面早就有证实,还 ...


某云老是被你这么强有力的打脸,心情郁闷呀~~~

我想把他这种口中刚一黑,就被打脸的语句收集收集;当笑话集看!
回复 支持 反对

使用道具 举报

28#
发表于 2011-6-21 10:13 | 只看该作者
开普勒 发表于 2011-6-21 00:37
这就是带宽低的反映。

Tegra 2宣称的1200MPixels/s的ROP性能,其实能达到,但仅限于Z-cull时。如果完全 ...

这是anandtech对ulp geforce的分析:

The ROPs are integrated into the pixel shader, making what NVIDIA calls a programmable blend unit. GeForce ULV uses the same ALUs for ROPs as it does for pixel shaders. This hardware reuse saves die size although it adds control complexity to the design. The hardware can perform one texture fetch and one ROP operation per clock.


如果是带宽瓶颈,实际填充率不应该跟理论数据差这么多,LP DDR2 600也有2.4G/s,大多数时候tegra2的实际填充率还不如8年前的GF4 MX。


结合anandtech的说法,我猜测tegra2的ROPs很有可能是pixel shader+专用Z cull单元,这也就能解释为什么NV在tegra3上还是使用32bit的原因,GPU实际填充率低下根本用不到高带宽
回复 支持 反对

使用道具 举报

29#
发表于 2011-6-21 14:17 | 只看该作者
Edison 发表于 2011-6-21 02:56
zixel 不能算是 pixel,只是 z-op/s。

我也觉得是这样,因为无任何实际的读写framebuffer。但的确只有在这种情况下才能达到1200MP/s
回复 支持 反对

使用道具 举报

30#
发表于 2011-6-21 14:19 | 只看该作者
66666 发表于 2011-6-21 10:13
这是anandtech对ulp geforce的分析:

The ROPs are integrated into the pixel shader, making what N ...

2.4GB/s很高吗?
执行一次纹理采样,放到帧缓存,需要多少字节?

回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-2-8 04:09

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表