POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 3570|回复: 28
打印 上一主题 下一主题

AMD Cayman GPU 媒体吹风会幻灯片全展示,来自波兰网站

[复制链接]
跳转到指定楼层
1#
发表于 2010-11-22 17:38 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
Do godziny 6 rano 22 listopada naszego czasu obowiązywało embargo na informacje dotyczące Radeonów HD 6970 i HD 6950, które firma AMD zaprezentowała przy okazji opisywanej już na FrazPC konferencji Believe Your Eyes. Wywiązując się ze złożonej w tamtym artykule obietnicy, możemy już po zakończeniu wspomnianego embarga zaprezentować dane na temat architektury, możliwości i funkcjonalności najszybszych kart z nowej rodziny AMD Radeon HD 6000.
Karty graficzne z układami Radeon HD 6970 i 6950 w odróżnieniu od opisywanych już przez nas akceleratorów AMD Radeon HD 6870 i 6850 (patrz: http://www.frazpc.pl/recenzje-2/595111,AMD-Radeon-HD-6870-i-HD-6850.html) bazują nie na kości o kodowej nazwie Barts, ale nieco różniącej się od niej chipie o kodowej nazwie Cayman. Początkowo nowe akceleratory miały mieć swoją premierę pod koniec listopada, ale AMD nieco ja przesunęła i wszystko na to wskazuje, że pojawią się one w sklepach 13 grudnia – choć data ta nie jest jeszcze oficjalnie potwierdzona.
Co więcej, pojawiły się też nieoficjalne informacje, że premiera najsilniejszego Radeona z nowej rodziny HD 6000, a więc Radeona HD 6990, bazującego na kości o kodowej nazwie Antilles będzie także opóźniona w stosunku do pierwotnych planów firmy AMD. Akceleratory 3D z tym układem będziemy mogli kupić dopiero w pierwszym kwartale 2011 roku. Istotne jest to, że Antilles to tak naprawdę akcelerator składający się z dwóch GPU Cayman. Według ostatnich informacji w tym samym czasie pojawią się również w sklepach karty graficzne z serii HD 6000 dla niższych segmentów rynku. Nowe akceleratory bazować będą na 40-nanometrowych GPU o kodowych nazwach Turks oraz Caicos.
Wróćmy jednak do kości Cayman. Jak można się domyślić, nowe układy graficzne Cayman mają być znacznie szybsze niż Barts i budowane na ich bazie należące do średniej klasy akceleratorów Radeony HD 6870 i 6850. Nie tak dawno Eliane Liao z firmy Power Color stwierdził, że karty z kośćmi Cayman osiągają wydajność od 30 do 50% wyższą niż akceleratory 3D bazujące na układach Barts. Oczywiście należy pamiętać, że często że częstotliwości GPU oraz taktowanie pamięci RAM ustala się dopiero tuż przed premierą i producent do ostatniej chwili jej nie podaje. Czasami również doprecyzowuje się wówczas liczbę procesorów strumieniowych, która może się różnić od tej wcześniej deklarowanej. No dobrze, ale dość już spekulacji i przejdźmy do informacji, które na konferencji w Los Angeles przekazała firma AMD.
Czas na Radeony HD 6900
Informacje o nowej rodzinie kart HD 6900 nie były specjalnie podczas konferencji wydzielone. Dane na temat najsilniejszej rodziny kart pojawiały się przy okazji slajdów prezentujących architekturę kart z serii 6800. Z reguły miały one zademonstrować główne różnice miedzy układami Cayman i Barts. W obu wypadkach nowe GPU produkowane są w 40-nanometrowym procesie technologicznym. Różnice sprowadzają się do niektórych elementów architektury, liczby procesorów strumieniowych i jednostek teksturujących, liczby teselarorów czy jednostek rasteryzujących, a także częstotliwości i wydajności taktowania pamięci. Znacznie wyższe niż w wypadku układów Barts jest też zużycie energii. Pojawiły się też nowe funkcjonalności niedostępne dla układów z serii HD 6800.

Fot_001 – Podczas konferencji „Believe Your Eyes” zorganizowanej przez firmę AMD informacje o nowych kartach z rodziny Radeon HD 6900 przedstawił David Cummings, szef działu zarządzaniPro-Aduktem w GPU Division.


Układy Cayman występować będą w dwóch wersjach Cayman XT oraz Cayman Pro odpowiednio montowane będą w kartach HD 6970 oraz HD 6950.
Nowa rodzina Radeonów HD 6900, to podobnie jak w wypadku kości Barts, również należy do drugiej już generacji układów graficznych firmy AMD zgodnych z DirectX 11. W obu wypadkach Radeon HD 6970 i 6950 współpracować będą z pamięcią graficzna GDDR5 o pojemności 2 GB i szyną pamięci o szerokości 256-bitów. W sprzedaży mogą się też znaleźć wersje HD 6950 z pamięcią 1 GB/256-bit. W wypadku pierwszej karty przepustowość magistrali pamięci szacowana jest na 6 Gbit/s, a słabszej na 5 Gbit/s. Mocniejszy Radeon HD 6970 maksymalnie ma zużywać do 300 W mocy i ze względu na to do jego zasilania potrzebne będą dwa dodatkowe wejścia na wtyczki 6- i 8-pinowe. AMD Radeon HD 6950 powinien zadowolić się 225 W pobieranej energii, a na karcie graficznej znajdą się również dwa dodatkowe „power connectory”, z tym ze oba maja być 6-pinowe.
Z istotnych danych wspomnieć należy o 32 jednostkach rasteryzujących ROP (Raster OPeration unit) – podobnie jak w układach Barts, oraz o 128 modułach (również podobnie jak w układach Barts) odpowiedzialnych w operacjach postprocesingu za obsługę bufora Z i bufora szablonów (Z/Stencil ROP). Jak wynika z powyższej ilustracji, nowe Radeony oferują standardowo obsługę wielomonitorową zgodną z ulepszoną z technologią Eyefinity, która zadebiutowała wraz z kartami z serii Radeon HD 6800. Na kartach AMD Radeon HD 6970 i 6950 znajdą się dwa wyjścia miniDP 1.2, dwa złącza DVI oraz jedno HDMI 1.4a. Oczywiście również i wypadku nowych Radeonów z serii HD 6900 złącza miniDP 1.2, wraz z dodatkowymi kablami-adapterami, pozwalają łącznie obsłużyć maksymalnie do sześciu wyświetlaczy.
2#
 楼主| 发表于 2010-11-22 17:38 | 只看该作者
Architektura GPU Cayman
Kolejne informacje dotyczące układów Cayman oraz bazujących na nich Radeonów HD 6970 i HD 6950 pojawiły się w prezentacji o architekturze układów HD 6800, którą poprowadził Eric Demers, CTO z GPU Division.
Fot_007 – Podczas prezentacji o architekturze Radeonów HD 6870 i HD 6850, poprowadzonej przez Erica Demersa pojawiły się istotne informacje o Radeonach HD 6900.

Fot_008 – Kilka słów o znaczeniu teselacji. Teselacja adaptacyjna pozwala na osiągnięcie kompromisu między jakością obrazu, a wydajnością generowania sceny 3D. Wysoki współczynnik podziału trójkątów sceny 3D powinien być wykorzystywany jedynie dla znajdujących się blisko obserwatora obiektów, dla dalszych podział ten powinien być mniejszy.

Fot_009 – AMD Radeon HD 6970.

Fot_010 – Architektura Radeonów z serii HD 6900.

Fot_011 – Schemat blokowy układu Cayman…

Fot_012 – … oraz dla porównania schemat blokowy układu Barts.

Najważniejsza różnica między architekturą, którą można od razu zauważyć porównując schemat blokowy dla układów Cayman i Barts jest istnienie podwójnego silnika graficznego (Graphics Engine) w tym pierwszym. Dzięki temu podwojona została nie tylko liczba teselatorów, rasteryzatorów, modułów odpowiedzialnych za hierarchiczną eliminację niewidocznych dla obserwatora na scenie 3D obiektów (Hierarchical Z-buffer) czy modułów Geometry Assembler i Vertex Assembler, ale przede wszystkim znacznie zwiększono wydajność układu podczas wykonywania operacji verteksowych.
Fot_013 – Technologia Dual Graphics Engines zastosowana w układach Cayman.

回复 支持 反对

使用道具 举报

3#
 楼主| 发表于 2010-11-22 17:38 | 只看该作者
Przede wszystkim dlatego, że w układach Cayman zastosowano dwa moduły Geometry Assembler i Vertex Assembler oraz podwójny teselator, kości z serii Radeon HD 6900 znacznie lepiej radzą sobie z operacjami geometrycznymi. Przede wszystkim są w stanie przetworzyć dwa trójkąty w jednym takcie zegarowym oraz znacznie lepiej radzi sobie z teselacją – w stosunku do Radeona HD 5870 Cayman jest aż trzy razy szybszy. Udało się też zwiększyć szybkość rasteryzacji sceny 3D z 16 do 32 pikseli przetwarzanych w jednym takcie zegarowym.
Fot_014 – Poprawa wydajności teselatora w architekturze Cayman.

Poprawa wydajności teselcji jest widoczna praktycznie niezależnie od liczby podziału wyjściowego trójkąta. Maksimum szybkości osiągnięto dla wartości dziewięć, a przy większych liczbach podziału wydajność ta zaczyna spadać. Niemniej dzięki temu, że mamy tutaj do czynienia z dwoma teselatorami  nawet przy dużych podziałach rzędu 32 wielokąty mamy zawsze dwa razy większa szybkość teselacji niż dla  kart poprzedniej generacji, w której był dostępny, podobnie jak w kościach Barts, tylko jeden teselator.

Fot_015, 016 – Nowy projekt procesorów strumieniowych SIMD w Radeonach z serii HD 6900.

W układach Cayman na nowo zaprojektowane zostały również procesory strumieniowe. Skonstruowane zostały one tak, aby zapewnić znacznie lepszy stopień ich wykorzystania, tak aby maksymalnie wyeliminować puste przebiegi obliczeniowe. Przede wszystkim wszystkie procesory strumieniowe maja teraz dokładnie te same możliwości oraz funkcjonalność związana z możliwością zajmowania trzech spośród czterech dostępnych slotów czasowych związanych z wykonywaniem obliczeń (chodzi tutaj rozdział czasu procesorów w pojedynczym Stream Processing Units – patrz Fot-016), a powiązanych z dostępem do ograniczonych zasobów globalnych (w tym rejestrów), o które jednostki strumieniowe muszą ze sobą konkurować. Jak podkreślają przedstawiciele AMD, dzięki zastosowanym zabiegom udało się zachować tą samą wydajność przy ok. 10% redukcji liczby tranzystorów oraz znacznie uprościć kolejkowanie (usprawniono algorytmy szeregowania) i zarządzanie zawartością rejestrów.
Przeprojektowano też jednostki strumieniowe (Stream Processing Unit). Dwa moduły zmiennoprzecinkowe mogą teraz razem wykonać cztery 32-bitowe operacje MAD lub dwie 64-bitowe MUL lub ADD bądź jedną 64-bitowa operację MAD bądź FMA. Z kolei dwie jednostki stałoprzecinkowe wchodzące w skład jednego procesora strumieniowego są w stanie wykonać cztery 24-bitowe operacje MAD, MUL lub ADD bądź dwie 32-bitowe ADD, lub jedna 32-bitową MUL.
回复 支持 反对

使用道具 举报

4#
 楼主| 发表于 2010-11-22 17:39 | 只看该作者
Ulepszenia
Inżynierowie projektujący Cayman’a nie zapomnieli o usprawnieniu obliczeń wykonywanych przez układy graficzne. Ma to na celu usprawnienie obliczeń numerycznych realizowanych za posrednictwem takich bibliotek jak DirectCompute oraz OpenCL.

Fot_017, 018 – GPU Compute Enhancements.

Najważniejsze obliczeniowe zmiany dotyczą asynchronicznego przesyłania danych, a w nim zmian dotyczących symultanicznego wykonywania wielu wątków obliczeń oraz tego, że każdy główny wątek obliczeniowy ma do dyspozycji własną kolejkę rozkazów oraz chroniona domenę wirtualnych adresów. Istotnymi zmianami są również wprowadzenie dwukierunkowego mechanizmu dostępu do pamięci typu DMA (Direct Memory Access) pozwalającego na szybsze prowadzenie operacji zapisu i odczytu danych, wspólnie wykonywanych przez shadery operacji odczytu (instrukcje dotyczące odczytu danych realizowane przez różne shadery są grupowane i wspólnie realizowane jako „jedna paczka”), pobranie kodu rozkazu z pamięci do rejestru, ulepszenia kontroli przepływu operacji i danych oraz przyspieszenia operacji podwójnej precyzji.

Fot_019 – Specyfikacja Radeona HD 6970. Jak widać, wielu parametrów, w tym liczby procesorów strumieniowych, jeszcze ostatecznie nie ustalono.

Antyaliasing i zasilanie
W nowych Radeonach HD z serii 6900 wprowadzono również nowe algorytmy związane z wygładzaniem krawędzi oraz zmodyfikowano mechanizmy związane z zarządzaniem zasilaniem.

Fot_020 – Enhanced Quality Anti-Aliasing (EQAA).

Przede wszystkim zmieniono sposób wyboru maski do próbkowania punktów używanych do wygładzania krawędzi. Co ważne, liczba kolorów oraz same punkty mogą być w niezależny sposób kontrolowane, tak jak wymyśli sobie to programista. Nowy algorytm Enhanced Quality Anti-Aliasingu (EQAA) jest kompatybilny z antyaliasingiem adaptacyjnym, morfologicznym oraz antyaliasingu wykorzystującego metodę supersamplingu.

Fot_021 – Tryby próbkowania w antyaliasingu EQAA.


Fot_022 – Usprawnienia wprowadzone w układach Cayman dotyczące końcowych operacji realizowanych w potoku graficznym.

W układach Cayman przeprojektowany też został moduł zasilania. Najważniejsze zmiany dotyczą kontroli zasilania w każdym cyklu zegarowym, a co za tym idzie dostosowania szybkości zegara dla posczególnych bloków wykonawczych w zależności od ich aktualnego obciążenia i parametru TDP.

Fot_023, 024 – Usprawnienia wprowadzone w module zasilania w układzie AMD Cayman.

I to wszystkie informacje dotyczące najmocniejszych układów z rodziny Radeon HD 6000, które zaprezentowane zostały na konferencji Believe Your Eyes zorganizowanej przez firmę AMD.
Autor: Marcin Bieńkowski
Uaktualnienie: Według ostatnich niepotwierdzonych oficjalnie informacji opublikowanych na slajdzie zamieszczonym na forum serwisu Guru3D.com Radeon HD 6990 wyposażony będzie w 3840 procesorów strumieniowych i 4 GB pamięci GDDR5. Przepustowość pamięci wynosić ma 307,2 GB/s. Zużycie energii ma byc na poziomie 300 W, a w trybie idle 30 W. Moc obliczeniowa karty ma wynosić 6 TFLOPs (1,5 TFLOPs-a dla obliczeń w podwójnej precyzji). Wydajność rasteryzacji to zaś 64 piksele na takt zegarowy, a wydajność geometryczna wynosić ma, jak zamieszczono na wspomnianym slajdzie, 3100 megatrójkatów na sekundę. Zmieniono też liczbę złączy wideo. Karta ma teraz mieć 2 złącza DVI i 3 miniDP. oznacza to możliwość obsługi 9 monitorów.
Z kolei wg serwisu **illa Cayman XT (Radeon HD 6970) ma mieć 1920 procesorów strumieniowych i taktowany będzie 900-megahercowym zegarem. Pamięć to 2 GB GDDR5 taktowanych efektywnie zegarem 6 GHz. Moc obliczeniowa to 3,5 TFLOPs. Cayman Pro (Radeon HD 6950) ma dysponować 1536 procesorami strumieniowymi. GPU taktowany będzie 800-megahercowym zegarem. Tutaj pamięć to również 2 GB GDDR5 , ale taktowanych efektywnie zegarem 5 GHz. Moc obliczeniowa wynosić ma 2,5 TFLOPs-a.
回复 支持 反对

使用道具 举报

5#
发表于 2010-11-22 17:39 | 只看该作者
我擦,这个鸟文彻底不懂
回复 支持 反对

使用道具 举报

6#
发表于 2010-11-22 17:40 | 只看该作者
看到很多SP和TMU的 PS图啊  笑而不语~~
回复 支持 反对

使用道具 举报

7#
发表于 2010-11-22 17:41 | 只看该作者
DX11性能大约是6870两倍???
回复 支持 反对

使用道具 举报

8#
 楼主| 发表于 2010-11-22 17:42 | 只看该作者
回复 支持 反对

使用道具 举报

9#
发表于 2010-11-22 17:44 | 只看该作者
波兰文?英文都看不懂,这个更是
回复 支持 反对

使用道具 举报

10#
 楼主| 发表于 2010-11-22 17:49 | 只看该作者
Cayman 支持 NVIDIA 的 CSAA,不过改名为 EQAA:P
回复 支持 反对

使用道具 举报

westlee 该用户已被删除
11#
发表于 2010-11-22 17:49 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

头像被屏蔽
12#
发表于 2010-11-22 17:51 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

westlee 该用户已被删除
13#
发表于 2010-11-22 17:53 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

14#
 楼主| 发表于 2010-11-22 18:05 | 只看该作者
westlee 发表于 2010-11-22 17:53
没感觉出来csaa有啥优点啊,用的最多的还是Msaa。

我这里如果用 32x CSAA 还是能看出和 8QCSAA不同的地方。
回复 支持 反对

使用道具 举报

15#
 楼主| 发表于 2010-11-22 18:13 | 只看该作者
大图:


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

16#
发表于 2010-11-22 18:15 | 只看该作者
偶等明年的28nm   功耗再次下降  嘿嘿
回复 支持 反对

使用道具 举报

westlee 该用户已被删除
17#
发表于 2010-11-22 18:15 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

18#
 楼主| 发表于 2010-11-22 18:23 | 只看该作者
和 Fermi 相比,Cayman 主要欠缺的是 cache。
回复 支持 反对

使用道具 举报

头像被屏蔽
19#
发表于 2010-11-22 18:52 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

20#
发表于 2010-11-22 19:15 | 只看该作者
sp还是TBD……
至于 clamp power comsumption to pre-determined level...."
前一
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-6-3 14:21

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表