我們測試了 GK104:GeForce GTX 680 和高端槍
是時候了! 我們等了很長時間,從很多地方聽到了很多關於它的消息,但最終NVIDIA的架構稱為Kepler,可以認為是Fermi的繼任者。 或不? 在我們的文章中,我們不僅在技術方面進行了修復,當然我們還描述了代號為GK104的GeForce GTX 680卡的精神世界描述的所有功能,除了消耗和升溫之外,我們還進行了性能多方面測試。 讓我們切入其中!
技術
到目前為止,人們的共識是,從長遠來看,GPU 的整體計算能力比三維遊戲中表現出的速度具有更高的價值。 這一趨勢對 NVIDIA Fermi 顯卡產生了重大影響,然而,第一款 Kepler 芯片打破了這一原則。 是否值得採取這一步將在幾頁中清楚地顯示出來。
認識 GK104 GPU
GeForce GTX 680 顯卡基於前面提到的 GK104 圖形處理器。 該芯片採用台積電 28nm 製造技術製造,尺寸為 294 平方毫米,由 3,54 億個晶體管組成。 與AMD代號為Tahiti的解決方案相比,這是一個相當不錯的價值——主要體現在生產成本上。 GPU最引人注目的參數是1536 CUDA核心,是GeForce GTX 580的三倍。 芯片本身有 4 個 GPC(圖形處理集群),其中裝有兩個 SMX(著色器多處理器)。 SMX 包括一個 PolyMorph 2.0 引擎、一個指令緩存、192 個 CUDA 內核、16 個紋理器,當然還有一級緩存。 在這裡我們要注意,到目前為止使用的Shader時鐘已經成為過去,所以現在芯片的所有組件都遵循相同的頻率,這在調度方面實際上是一件好事。
[]
以 NVIDIA 模式保存
根據以往的經驗,我們可以看到,構成新加農炮基礎的芯片現在具有令人驚訝的有利物理參數。 與 GeForce GTX 280、480 和 580 卡相比,新手在完全不同的類別中移動。 我們現在將簡要介紹工程師控制晶體管數量和芯片尺寸的發展和創新。
[]
每個著色器多處理器都擁有一個曲面細分器單元,這意味著總共有 8 個處理器。 如果單看數字,我們可能會認為在這一點上與上一代相比有所退步,但由於鑲嵌器的性能翻了一番,總體而言,肯定是有進步的。 最大的變化是在後端。 GK104 GPU 通過 256 位內存總線訪問 2GB 的 GDDR5 板載內存,內存芯片的有效頻率為 6,0 GHz。 這在實踐中意味著什麼? 與GeForce GTX 580相比,內存總線的寬度減半,但這已經被令人毛骨悚然的內存時鐘完全抵消了。 這也是一個巨大的輕彈,因為 AMD 過去在這一點上總是處於不同的維度,但現在 Radeon HD 7970 也被超過了半 GHz。 優化 ROP 單元的數量也不是顯著的節省。 到目前為止,作業是五星,但現在是黑湯。
儘管 GeForce GTX 680 具有極其廣泛的 API 支持(CUDA C、CUDA C++、CUDA Fortran、OpenCL、DirectCompute 和 Microsoft C ++ AMP),這些確實是通用可編程性的關鍵,但有些事情仍然非常少了很多。 雙精度計算能力是 GPGPU 市場的一個重要因素,適用於富含性能密集型浮點計算的任務,但一般來說也是如此。 在這一點上,新的開普勒瓷磚可以受到非常嚴重的攻擊。 該芯片理論上具有四分之二的雙精度單精度計算能力,這立即在SiSoftware Sandra 2012測量程序中發揮作用。 GeForce GTX 680 甚至無法擊敗其前身,而 AMD Radeon HD 7900 系列則屬於完全不同的類別。 為了進一步優化,工程師沒有實現 ECC 和虛擬內存支持,並且各種緩存的大小被限制在仍然可以接受的範圍內,因此 GeForce GTX 580 的二級存儲是新人的一倍半。 主要是因為缺少硬件虛擬紋理,我們的心很痛,因為這樣做會給圖形處理器處理大量紋理帶來嚴重的頭痛。 我們很想知道在《毀滅戰士 4》期間是否還會有另一個禁食。 GPGPU 性能將在下一頁討論。 前言是香檳值得放回冰箱。
不乏創新(即便如此)
當然,GeForce GTX 680 符合 PCI Express 3.0 標準,還支持 DirectX 11.1 和 NVIDIA GPU Boost 技術。 GPU Boost 程序允許自動設置核心時鐘。 為確保性能始終處於理想水平,Kepler 芯片還考慮了圖形處理器負載、功耗和當前溫度,並相應提高了速度。 根據官方文檔,時鐘增加發生在 100 毫秒內,因此用戶不會注意到任何事情。 實際上,這意味著 GK104 以 1006 MHz(核心基礎)的基本速度運行,但在評估前幾個因素後,該芯片可以將其提升至 1110 MHz(核心提升)。 英偉達計算,GPU Boost 的平均成績是 1056 MHz,但在有利的速度下,確實可以捕捉到 1,10 GHz。 開賽當天,我們在國外電腦網站上看到了這樣的例子。 速度非常棒,所以難怪我們已經設法接近之前的雙頭加農炮 GeForce GTX 590。 可以設置 MSI Afterburner 和 EVGA Precision X 調整實用程序以獲得最大性能和時鐘偏移。
該公司希望為粉絲提供額外的獨家功能,如幀率目標、自適應垂直同步和 NVENC。 第一個實際上只不過是可修改的 FPS 限制。 如果我們最喜歡的遊戲以不必要的高速旋轉,這可能是幸運的。 如果您想減少噪音排放和消耗,您可能需要考慮使用幀速率目標。
自適應垂直同步,或動態啟用垂直同步,旨在保持穩定的速度。 當特定應用程序的速度低於顯示器的刷新率時,您可能需要關閉同步以獲得更好的性能。 該過程基本上完成了這一點——當然,無需用戶干預。
NVENC 是一個固定功能單元,旨在加速 H.264 視頻的編碼。 在這裡,應該預期的主要不是性能的顯著提高,而是工作流程將以比以前少得多的能耗進行。 CyberLink MediaEspresso 已經準備好利用 NVENC。 與上一代相比,發展相當驚人。 根據德國 ComputerBase 的測量,GeForce GTX 680 的性能比其前身更快,功耗降低了 100 多瓦。
對於那些甚至沒有足夠的人,請查看 FXAA 平滑程序。 該算法基於 GK104 的高著色器性能。 FXAA 可實現與 4 倍 MSAA(多樣本抗鋸齒)類似的圖像質量,但比率要高 60%。 不幸的是,AMD ZeroCore 降耗程序並沒有以任何形式被納入,但總的來說我們沒有任何抱怨的理由。
[]
GeForce GTX 680 支持 NVIDIA 3D Vision Surround 技術。 幸運的擁有者最多可以使用四台顯示器以獲得更好的視覺體驗。
簡單回顧一下,我們可以說NVIDIA GeForce GTX 680並不是市面上最強大的單顯卡,但2GB的顯存在極高分辨率下可能會變得稀缺。 有傳言說,Greens 甚至可能會在以後推出配備 4GB 板載內存的型號,但畢竟沒有出現這種情況也沒有問題。 合作夥伴已經完成了許多渦輪增壓變體。
所用圖塊的編號證實了 GK104 代表了遊戲玩家線,GF104 和 GF114 已經很好地接觸了這一點。 因此,第一款基於開普勒的芯片在GPGPU應用下並不出色,但在遊戲中卻是無敵的,芯片尺寸和功耗一直很吸引人。 同時,這也反映出,AMD憑藉GCN芯片,非常有針對性地針對專業需求,GPU的更廣泛應用。 因此,基於 Tahiti 的顯卡在大多數遊戲中的性能低於使用 GK104 的 GeForce GTX 680。