POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
楼主: 什么?
打印 上一主题 下一主题

Rv870原本是一个核心面积和G200b一样大的大家伙,结果被砍了

[复制链接]
101#
发表于 2010-2-17 20:43 | 只看该作者
非商业化的东西,没有动力进行更高效率的编程
slr 发表于 2010-2-17 20:20

不好说,但也能说明问题……

况且FAH目前面对着AMD、NV和CPU三种平台……

对了,STU目前主要通过调整PPD来安抚人心……
回复 支持 反对

使用道具 举报

102#
发表于 2010-2-17 22:10 | 只看该作者

没让NV吃一惊!
回复 支持 反对

使用道具 举报

103#
发表于 2010-2-17 22:30 | 只看该作者
回复 108# 奶牛老仙


    这个应该不现实  换了一个世代  也就1920  太少了吧 起码要飚到2400  三核啊  嘿嘿
回复 支持 反对

使用道具 举报

104#
发表于 2010-2-18 00:28 | 只看该作者
特斯拉阵列效率低的原因估计在软件上。并联的节点越多,软件的投入成正比的提高。总投入高了写出来的东西更能发挥硬件。天河一号之前我没听说过4870X2可以用来跑linpack,出来后却证明不仅能跑,而且效率可以让人接受。所以说,天国对这方面的投入绝对不会低的
回复 支持 反对

使用道具 举报

105#
发表于 2010-2-18 00:50 | 只看该作者
东京工业大学的特斯拉已经经过优化,最初加了170台Tesla S1070,运算能力只达到77.48TF,77.48 - 67.7= 9 ...
左脚选手 发表于 2010-2-18 00:46

这搞搞效率高一倍。。。说明上面的软件太不成熟
回复 支持 反对

使用道具 举报

106#
发表于 2010-2-18 01:04 | 只看该作者
不可这样饭N
什么? 发表于 2010-2-15 20:33


不可这样饭A
回复 支持 反对

使用道具 举报

107#
发表于 2010-2-18 01:09 | 只看该作者
2008年11月的top500是77.48TF,2009年6月就是87.01TF,2009年11月还是87.01TF,可见优化差不多到头了,Te ...
左脚选手 发表于 2010-2-18 00:58

也可能是投资停掉了没人更新了。。。
回复 支持 反对

使用道具 举报

108#
发表于 2010-2-18 01:09 | 只看该作者
桌面应用没看出什么需要“如此强大”的GPU来帮忙运算。要我说,先把CUDA编码做好,不支持2-pass的编码方式 ...
slr 发表于 2010-2-15 20:44


这个说得就比较客观了 ,不像LZ那样逢N必踩逢A必挺的恶心+虚伪AFAN,我严重怀疑LZ没用过N卡!
回复 支持 反对

使用道具 举报

109#
发表于 2010-2-18 01:13 | 只看该作者
这个说得就比较客观了 ,不像LZ那样逢N必踩逢A必挺的恶心+虚伪AFAN,我严重怀疑LZ没用过N卡!
bennylim 发表于 2010-2-18 01:09

两家卡都在用啊。最近倒出了个新的用途,96GT在MADVR软解时性能不足,换上260+一切OK
回复 支持 反对

使用道具 举报

110#
发表于 2010-2-18 01:32 | 只看该作者
两家卡都在用啊。最近倒出了个新的用途,96GT在MADVR软解时性能不足,换上260+一切OK
slr 发表于 2010-2-18 01:13


我也是A卡N卡都用 ,现在用着260+ ,不过手上还收着块公版4850不舍得卖
回复 支持 反对

使用道具 举报

111#
发表于 2010-2-18 01:42 | 只看该作者
软解+MADVR,不知道是96GT的512显存爆了还是性能不足?总之部分1080P不流畅
回复 支持 反对

使用道具 举报

112#
发表于 2010-2-18 01:59 | 只看该作者
每台Tesla S1070有4个GPU,170套就是680个GPU运算核心,而天河一号有2560块4870X2,总计5120个GPU运算核心 ...
左脚选手 发表于 2010-2-18 01:30
各种看不懂
System Name           TSUBAME Grid Cluster with CompView TSUBASA
Site         GSIC Center, Tokyo Institute of Technology
System Family         Sun Fire - Cluster
System Model         Fire x4600 Cluster
Computer         Sun Fire x4600/x6250, Opteron 2.4/2.6 GHz, Xeon E5440 2.833 GHz, ClearSpeed CSX600, nVidia GT200; Voltaire Infiniband
Vendor         NEC/Sun
URL         http://www.gsic.titech.ac.jp/
Application area         Research
Main Memory         21600 GB
Installation Year         2009

Operating System         SuSE Linux Enterprise Server 9
Memory         21600 GB
Interconnect         Infiniband
Processor         AMD x86_64 Opteron Dual Core 2400 MHz (4.8 GFlops)

CPU各多少不知道,加速阵列不仅有GT200,还有ClearSpeed CSX600,需要详细资料
回复 支持 反对

使用道具 举报

113#
发表于 2010-2-18 02:03 | 只看该作者
这样的讨论氛围还是不错的嘛~比喷来喷去强多了~

又看了遍回帖,发现linpack确实不适合异构系统……可什么适合并且能通吃呢?迷茫……
回复 支持 反对

使用道具 举报

头像被屏蔽
114#
发表于 2010-2-18 03:22 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

115#
发表于 2010-2-18 09:26 | 只看该作者
clearspeed csx600  协处理器
deadmeat 发表于 2010-2-18 03:22

clearspeed csx600的资料好找,问题是用了多少块?要估算性能时候总得把它算上去吧
回复 支持 反对

使用道具 举报

116#
发表于 2010-2-18 10:48 | 只看该作者
刚翻了一下TOP10的资料,发现天河一号的Rpeak/Rmax是最大的……小白我不明白什么意思
yamhill 发表于 2010-2-17 14:07



这除了说明GPGPU是废材,Larrabee才是王道,对于AN之间不能说明什么
回复 支持 反对

使用道具 举报

117#
发表于 2010-2-18 10:53 | 只看该作者
这除了说明GPGPU是废材,Larrabee才是王道,对于AN之间不能说明什么
itany 发表于 2010-2-18 10:48

等拉拉比出来了再说……

而且我不会相信业界会去发展一个废柴……
回复 支持 反对

使用道具 举报

118#
发表于 2010-2-18 10:53 | 只看该作者
回复 107# slr
41%已经是GPGPU 惊人的高效率了,GPU 的峰值是按照MA 算的,通常很难拼一个MA 一起做,还要考虑程序控制,数据同步,数据传送时间,GPGPU 的理论极限应该在45%以下,能做到峰值的41%,属于调优非常好的效果。
GPGPU 有意义的计算,效率是20%以上。
回复 支持 反对

使用道具 举报

119#
发表于 2010-2-18 10:54 | 只看该作者
回复 125# slr
因为GPU 系统,移植的代价,编程环境的变化,目前都只能研究看看,很难投入商业开发。
回复 支持 反对

使用道具 举报

120#
发表于 2010-2-18 11:03 | 只看该作者
回复  slr
41%已经是GPGPU 惊人的高效率了,GPU 的峰值是按照MA 算的,通常很难拼一个MA 一起做,还要考 ...
tomsmith123 发表于 2010-2-18 10:53


连硬件存储一致性都没有,能做到40%已经是“天价”了……
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-1-30 16:42

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表