POPPUR爱换

标题: Tesla C2070 2010 Q3 Available [打印本页]

作者: tomsmith123    时间: 2010-4-24 16:34
标题: Tesla C2070 2010 Q3 Available
进一步联系nVidia 得到的消息,短期内,C2070 在零售市场不会出现。
作者: tomsmith123    时间: 2010-4-24 16:39
448SP According to the Whitebook
作者: kaven    时间: 2010-4-24 16:44
科研机构现在都在等这个东西,双精度浮点数的诱惑不是一般的大,早就给包园了。
作者: tomsmith123    时间: 2010-4-24 16:48
回复 4# kaven
理论上,科研机构除了少数外,都需要从零售市场购买。
作者: kaven    时间: 2010-4-24 16:50
回复 5# tomsmith123


    人家不是买一块,是买一堆,然后组群集,买一块的才去零售市场
作者: tomsmith123    时间: 2010-4-24 16:53
回复 6# kaven
零售市场面向1000块以下的,正常情况下,我是直接从nVidia 采购,由nVidia 安排代理公司参加招标的。
作者: kaven    时间: 2010-4-24 16:56
回复 7# tomsmith123


    按照目前产能,100块就得按照原来的1000块对待
作者: tomsmith123    时间: 2010-4-24 16:59
回复 8# kaven
nVidia 非零售市场,是nVidia 参与的大型计算项目,这里面涉及一个报价的区别对待问题。
作者: tomsmith123    时间: 2010-4-24 19:17
回复 10# Heidfeld
Features

GPUs powered by the Fermi-generation of the CUDA architecture Delivers cluster performance at 1/10th the cost and 1/20th the power of CPU-only systems based on the latest quad core CPUs.
448 CUDA Cores Delivers up to 515 Gigaflops of double-precision peak performance in each GPU, enabling a single workstation to deliver a Teraflop or more of performance. Single precision peak performance is over a Teraflop per GPU.
ECC Memory Meets a critical requirement for computing accuracy and reliability for workstations. Offers protection of data in memory to enhance data integrity and reliability for applications. Register files, L1/L2 caches, shared memory, and DRAM all are ECC protected.
Desktop Cluster Performance Solves large-scale problems faster than a small server cluster on a single workstation with multiple GPUs.
Up to 6GB of GDDR5 memory per GPU Maximizes performance and reduces data transfers by keeping larger data sets in local memory that is attached directly to the GPU.
NVIDIA Parallel DataCache™ Accelerates algorithms such as physics solvers, ray-tracing, and sparse matrix multiplication where data addresses are not known beforehand. This includes a configurable L1 cache per Streaming Multiprocessor block and a unified L2 cache for all of the processor cores.
NVIDIA GigaThread™ Engine Maximizes the throughput by faster context switching that is 10X faster than previous architecture, concurrent kernel execution, and improved thread block scheduling.
Asynchronous Transfer Turbocharges system performance by transferring data over the PCIe bus while the computing cores are crunching other data. Even applications with heavy data-transfer requirements, such as seismic processing, can maximize the computing efficiency by transferring data to local memory before it is needed.
CUDPro-Agramming environment with broad support of programming languages and APIs Choose C, C++, OpenCL, DirectCompute, or Fortran to express application parallelism and take advantage of the “Fermi” GPU’s innovative architecture. NVIDIA Parallel Nsight™ tool is available for Microsoft Visual Studio developers.
High Speed , PCIe Gen 2.0 Data Transfer Maximizes bandwidth between the host system and the TeslPro-Acessors. Enables Tesla systems to work with virtually any PCIe-compliant host system with an open PCIe x16 slot.
作者: luckissy    时间: 2010-4-24 19:24
米物
作者: sleepyboy    时间: 2010-4-24 19:27
Q3,这个时间不知道具体是哪个月啊?
作者: Asuka    时间: 2010-4-24 19:30
这玩意到Q3就真的可以out了

注意AMD和Intel的CPU roadmap
作者: tomsmith123    时间: 2010-4-24 19:31
回复 14# sleepyboy
7月起,就是2010 Q3了。
作者: 380    时间: 2010-4-24 20:11
提示: 作者被禁止或删除 内容自动屏蔽
作者: westlee    时间: 2010-4-24 20:24
提示: 作者被禁止或删除 内容自动屏蔽
作者: los_parrot    时间: 2010-4-24 22:11
512sp版本的tesla什么时候能上市?
我是来围观的 发表于 2010-4-24 20:31


醒醒吧
作者: Edison    时间: 2010-4-24 22:14
M1060 的换代产品是  512 CUDA Core。
作者: 380    时间: 2010-4-25 14:28
提示: 作者被禁止或删除 内容自动屏蔽
作者: bessel    时间: 2010-4-25 15:50
等这个不如现在就去买amd的8核心6128.
4颗可以凑出256G双精度,价格也差不多.

科研机构现在都在等这个东西,双精度浮点数的诱惑不是一般的大,早就给包园了。
kaven 发表于 2010-4-24 16:44

作者: xreal    时间: 2010-4-25 16:28

amd 12核好像还不如intel 8核
作者: cool_exorcist    时间: 2010-4-25 16:47

amd 12核好像还不如intel 8核
xreal 发表于 2010-4-25 16:28

不要小看amd,人家的12核大多数情况下还是干赢了开超线程的intel 6核的。
作者: 52pk    时间: 2010-4-25 17:53
不要小看amd,人家的12核大多数情况下还是干赢了开超线程的intel 6核的。
cool_exorcist 发表于 2010-4-25 16:47



    从原先的3>2升级到2>1,呵呵。
作者: skywalker_hao    时间: 2010-4-25 18:16
本帖最后由 skywalker_hao 于 2010-4-25 18:17 编辑

tesla理论性能比不过power7
实际跑起来,在i/a的8核,12核面前也没什么优势
一般来说,没有3、5倍的提升,别指望别人为你换软件
作者: los_parrot    时间: 2010-4-25 19:58
如果amd/intel的下代cpu明年1季度上市的话,q3差不多会向合作伙伴提供样品测试了.
作者: los_parrot    时间: 2010-4-25 20:06
tesla理论性能比不过power7
实际跑起来,在i/a的8核,12核面前也没什么优势
一般来说,没有3、5倍的提升, ...
skywalker_hao 发表于 2010-4-25 18:16


买这些东西的机构,一般自己开发应用.

gpu的优势就是便宜.power7死贵死贵的,intel的8核也贵.

amd是唯一可以提供在价格上有竞争力的对应产品的供应商,但是gpu在某些特定的运算速度上远远高于cpu.而且gpgpu是用来做加速的,hpc再怎么配还是要用到cpu的.用gpgpu产品,就可以少用cpu.而gpgpu比cpu便宜.

但是fermi耗电太恐怖,使用成本不低,不知道nV有没有相应的解决方案.
作者: los_parrot    时间: 2010-4-25 20:22
本帖最后由 los_parrot 于 2010-4-25 20:25 编辑
所谓的GPGPU市场NV就没啥对手,说的再美好但是没有工具没有应用就等于零,这方面AMD没有解决方案
Heidfeld 发表于 2010-4-25 20:15


我说的是amd的12核cpu,如果你没注意到,magny-cours的价格非常有竞争力.
作者: lvbinbin    时间: 2010-10-19 13:16
本帖最后由 lvbinbin 于 2010-10-19 13:20 编辑

Tesla C2050 / C2070 GPU计算处理器
NVIDIA(英伟达)Tesla C2050/2070计算处理器以二十分之一的功耗和十分之一的成本即可实现超级计算能力,为台式机带来了小型集群般的性能。

C2070国内于9月底正式发行,与C2070相比,每颗GPU最多配备6GB GDDR5存储器,更大的数据集能够保存在直接附属于GPU的本地存储器上,从而实现了性能的最大化并减少了数据传输的情况。

美国超微10月20日即将发行 采用NVIDIA  TESLA  C2070 / M2070最新GPU 平台 (1U 和 4U塔式机型) 初定型号:
1026GT-TF-FM207                   6016GT-TF-FM207       1U双GPU平台
1026GT-TF-FM107                   6016GT-TF-FM107       1U单GPU平台
7046GT-TRF-FC407                 4U塔式  四GPU平台           



详细资料请咨询 http://www.supermicro.com
本产品支持订购:http://superserver.taobao.com
订购热线 :吕彬彬  021-60526615




欢迎光临 POPPUR爱换 (https://we.poppur.com/) Powered by Discuz! X3.4