GPU 有20%的效率就很高了。
GPU 做Linpack,东京的Tesla 170 个S1070 才做到20T,而理论性能是680T,折合效率是1/39 不到3%。
tomsmith123 发表于 2009-10-31 12:59
19# yamhill 能说一下是Intel 哪位说Linpack 不适合HPC吗?
目前衡量HPC 的只有Linpack,Linpack 不适合服务器性能或者工作站性能倒是真的。
tomsmith123 发表于 2009-10-31 13:06
17# yamhill
Linpack 是非传输瓶颈的应用,X86 集群在百万亿次的数量级上,效率是70%,而即使按照最宽的标准,CUDA 做Linpack 效率也不会超过20%。
tomsmith123 发表于 2009-10-31 13:08
22# yamhill
你要学会阅读文章,用Linpack 选HPC 不合适,是何博士推销调优工具的广告语。
Intel 目前在国内展开了一个大规模并行的研发中心,可以帮助客户优化其大规模并行代码,对于这样的用户,应用本身是更 ...
tomsmith123 发表于 2009-10-31 13:12
26# yamhill
S1070 单精度峰值是4T,双精度性能是0.5T,计算效率用双精度性能,标称理论性能用单精度性能,这就是最宽的标准。
tomsmith123 发表于 2009-10-31 13:13






我的软件到现在还不支持多核心。。。吐血中但我们这次把Gpu的效率提高到了70%,连生产Gpu的国外厂家都很受鼓舞,要求与我们联合开展研究。

一定要核心支持ECC才能实现高可靠性的大型计算吗?从系统的角度看,不是的。
芯片级没有支持ECC,没有支持容错,但是合理的设计系统的架构,达到系统级的容错,一样可以在某些元件失效的时候整个系统却依然是可靠 ...
gzpony 发表于 2009-11-1 14:31

不支持ecc,运算结果算两编,不是什么高深难题,nv自揭家底时候说过。
raid的冗余是为了防止某块硬盘故障,不是数据纠错。
我想所有硬盘都是ecc纠错算法,不然这世界还不乱套?有数据纠错是硬盘能用的前提 ...
飞鸟真 发表于 2009-11-1 14:44
我是举例说不可靠的器件得到可靠的结果的例子。
算两遍是用简单的语言告诉普通人。实际上不会这么简单。 算两遍,两次不一样的话,哪次是对的?能不能用更好的系统结构,让这两次或者更多的计算在同一时间就算 ...
gzpony 发表于 2009-11-1 14:53
LS就一空想家,你没看说的是系统设计,RAID5的系统设计难道不是某块或者几块硬盘出错了,不影响整个RAID5系统的数据安全?别老往自己那方面想,仔细读读别人的意见。
ff0759 发表于 2009-11-1 14:55
还记得intel的p4吗?扣肉没出时,枪手们给吹出市场。扣肉一出来,立刻被抛弃成为垃圾的待名字。
其实nv也是,有了费米底气就足了,敢自揭老底了。没有ecc高性能计算就是玩闹,你们见过不ecc的大型机吗?
nv的通用计算以前的确是小玩闹,就像游戏公司,开始做h游戏起家,等实力雄厚就开始做正经游戏了。
抛开ati nv之争,你们真相信国内这几个大学?
飞鸟真 发表于 2009-10-31 23:54
我的表达有问题。。。我是说我在用的软件。。。。我不会写程序地。。。。。。。87# 飞鸟真 硬盘是CRC 错,不是ECC。
ECC 是所有纠错中,时间成本最低,空间成本最高的办法,对于高速数据吞吐,有比较特殊的意义。
针对不同的故障模型,ECC 不一定是最好的,某些时候,在不支持ECC 的系统,不 ...
tomsmith123 发表于 2009-11-1 17:25
不支持ecc,运算结果算两编,不是什么高深难题,nv自揭家底时候说过。
raid的冗余是为了防止某块硬盘故障,不是数据纠错。
我想所有硬盘都是ecc纠错算法,不然这世界还不乱套?有数据纠错是硬盘能用的前提 ...
飞鸟真 发表于 2009-11-1 14:44
| 欢迎光临 POPPUR爱换 (https://we.poppur.com/) | Powered by Discuz! X3.4 |