Vulkan API로 가속시 Radeon, GeForce 성능 변화, DX12에서 CPU 스케일링 > 컴퓨터포럼

본문 바로가기
사이트 내 전체검색


회원로그인

네이버 아이디로 로그인 Sign in with googleSign in with kakao
자동로그인

Vulkan API로 가속시 Radeon, GeForce 성능 변화, DX12에서 CPU 스케일링
일반 |
워아이니
쪽지보내기 자기소개 아이디로 검색

작성일: 2016-07-14 00:42:25 조회: 3,873  /  추천: 3  /  반대: 0  /  댓글: 4 ]

본문

최근에 고전 원작의 리부트 작품인 2016년작 둠의 업데이트가 있었습니다.

 

vulkan API 지원 업데이트입니다. 

 

computerbase 에서 벌컨 API 사용시 OGL에 비해 성능 변화가 어떤지 벤치마크를 했습니다.

 

참고로 vulkan 은 크로노스 그룹(khronos)에서 창안한,  산업 표준을 위한 범용 API 입니다.

 

DirectX 와 같이 특정 기업에 기술 종속적이지 않고 (DX는 ms사가 모든 권리를 가지고 있고

 

윈도우 외에 여타의 OS에서는 사용이 전혀 불가능합니다....) 업계 표준을 위해 여러 업체가

 

협력해서 고안해낸 범용적인 소프트웨어 기술입니다.

 

현재, 구글/애플/인텔/삼성/소니/AMD/nvidia/퀄컴/이미지네이션/ARM/Epic games 등의

 

여러 기업이 크로노스 그룹의 멤버로 참여해 있고,  이제까지 업계 표준으로 폭넓게사용된

 

OpenGL 역시 이 크로노스 그룹에서 고안해내고 기술 관리하는 범용 API 입니다.

 

vulkan 은 이 크로노스 그룹에서 OpenGL의 뒤를 이어서 내놓은 API로 특정 OS 종속적이지

 

않고 플랫폼을 가리지 않는 범용적인 API 입니다.

 

 

vulkan의 중요한 특징 중에 하나는 DX12와 같이 Asynchronous Compute 를 지원하는

 

low-level API 라는 점입니다. 

 

사설이 길었는데 과연 벌컨으로 둠을 가동시에 어떤 변화가 있는지 벤치마크로 확인해 보겠습니다.

 

모든 그래프의 출처는 computerbase.de 입니다.

 

https://www.computerbase.de/2016-07/doom-vulkan-benchmarks-amd-nvidia/#diagramm-doom-mit-vulkan-3840-2160 

 

 


 

벤치마크 시스템 구성은 위 표대로 입니다.

 

그래픽 드라이버는 벌컨 API를 지원하는 양 사의 최신 버젼 드라이버입니다.

 

AMD Crimson 16.7.2 and the GeForce 368.69 

 

입니다.  오래된 드라이버에서는 vulkan 가속이 제대로 이루어지지 않는다는 점을 주의해야 합니다.

 

둠의 세팅은 Maximum Detail 입니다.

 

먼저 FHD 해상도에서의 결과입니다.

 


 

눈을 의심하게 만들 만큼 놀라운 그래프가 그려졌습니다.

 

벌컨으로 가속하자 하와이 코어의 R9 390은 무려 48%

 

폴라리스 10 기반의 RX 480은 무려 46%

 

Fiji 코어의 Fury X 는 무려 66%라는 비약적인 성능 향상이 확인되었습니다.

 

맥스웰 기반 GTX 980 Ti 에서 고작 8%의 성능 향상에 비하면 놀라운 결과입니다.

 

지포스에서 성능 향상이 크지 않은 이유는 아직 Asynchronous Compute 에 대한

 

지원이 제대로 되지 않기 때문입니다.

 

파스칼 코어에서는 이에 대한 개선이 이루어 졌는데 실제 측정에서는 아직 반영이

 

안되었습니다. 이는 시스템에 따라 결과가 상이한데 아래에서 다시 확인 하겠습니다.

 

 

평균적으로, GTX 1070에 비해 20% 성능이 낮은 Fury X 가 벌컨으로 가속하자 1070

 

마저 제쳐버렸습니다.  이제 해상도를 더 높여서 연산 부하를 더 가해보겠습니다.

 


 

QHD에서는 상승 비율이 조금 줄어들었습니다.

 

각각 48, 46, 66%에서 38, 40, 52%로 줄어들었습니다.

 

그러나... AMD GPU에서는 DX11이나 OpenGL 보다는 벌컨이 여전히 월등합니다.

 

 


 

연산 부하가 극에 달하는 UHD 해상도에서는 하와이 코어 R9 390과 RX 480로는 감당이 안됩니다.

 

Fury X....  11%의 성능이 향상되었습니다.

 

왜이렇게 UHD해상도에서는 성능 상승 폭이 미미한 것일까....?

 

이는 API의 문제로 인한 bottleneck(병목)이 아닙니다...

 

GPU의 성능이 이 해상도에서 연산 부하를 감당해 내지 못하기 때문입니다.

 

근소한 차이지만 그래도 여전히 vulkan 으로 가속한 Fury X 가 1위 자리를 지켰습니다.

 

 


 

 

벌컨으로 가속시 각 해상도별 성능 향상 폭입니다.

 

비약적인 radeon 의 성능 상승, 초라할 정도로 미미한 geforce 의 상승 폭이 극과 극의 대비를 보입니다.

 

 

시스템이 바뀌면 결과가 달라집니다.

 

또다른 벤치마크 자료가 있습니다. computerbase 내부 측정이 아닌 외부 사이트 입니다.

 

http://www.golem.de/news/doom-vulkan-macht-die-hoelle-schneller-1607-122052.html 

 

Core i7-6700K and 16GB, 윈도우 10 환경이고

 

둠의 설정은,  Ultra / Nightmare 에 TSSAA 8TX 입니다.

 

GTX 1080 은 벌컨으로 가속시에

 

FHD 해상도에서 27% (129fps -> 164)

 

QHD 해상도에서 9% (103 -> 112)

 

UHD 해상도에서 0.xxx?? (59 -> 61)

 

 

RX 480 은 벌컨 가속시에

 

FHD 해상도에서 22% (94fps -> 115)

 

QHD 해상도에서 26% (62 -> 78)

 

UHD 해상도에서 25% (32 -> 40)

 

였습니다.

 

 

또 다른 자료도 살펴보겠습니다.

 

http://www.forum-3dcenter.org/vbulletin/showpost.php?p=11098171&postcount=1084 

 

맥스웰 기반 지포스 GTX 970 을 사용했고 CPU가 4.2GHz 로 오버클럭된 AMD FX-8320e 입니다.

 

720 HD 해상도에서 둠의 설정은 Ultra....

 

OpenGL로 가속시에 83fps 였는데 벌컨으로 가속하자 123fps로 약 50% 가 상승했습니다.

 

의아한 결과가 아닐 수 없습니다.

 

 

둠은 id 소프트웨어 사의 id-tech 6 엔진을 사용합니다. 이 엔진에 벌컨 API 기술을 도입하기

 

위해서 여러 업체가 협력 중입니다.  Bethesda Softworks 사는 둠에 벌컨 API 도입을 위해

 

크로노스 그룹의 멤버인 amd, nvidia 사와 긴밀하게 협업 하고 있습니다.

 

벌컨 API를 위해서는 Asynchronous compute 가 반드시 필요합니다.

 

현재, Asynchronous compute는 AMD GPU 에서만 제대로 지원되고 있습니다.

 

nvidia에서는 이 문제를 인지하고 있으며,  Bethesda​ 는 nvidia와 함께 지포스 GPU에서 벌컨

 

API 가속을 위해 협력하고 있습니다.   빠른 시일 내에 업데이트가 이루어 지기를 Bethesda

 

에서도 기대합니다.

 

 

한편, 또 다른 흥미로운 자료가 있습니다.

 

vulkan 이 아닌 또다른 API....

 

Asynchronous compute 를 활용하는 또 다른 low-level API...  바로 DirectX 12 입니다.

 

DX 12에서 Rise of Tomb Raider 로 Fury X 와 GTX 980 Ti 를 DX11과 DX12 각각의 API로

 

벤치마크를 했습니다. CPU 스케일링 자료를 보았는데 굉장히 흥미로운 결과가 발견되었습니다.

 


 

 

Fury X 에서,   DX11 에서는 우리가 이제까지 알고 있던 성능 순서대로 CPU가 정렬됩니다.

 

근데... DX12로 바뀌면 양상이 전혀 달라집니다... FX-6300이 i7-6700k 과 성능이 같습니다.

 

i3-4330 마저 같은 것으로 보아 멀티코어를 제대로 활용하는게 아닌...  병목이나 아니면

 

Fury X의 DX12 드라이버 문제, 혹은 멀티코어를 제대로 활용 못하고 일부만 사용하는게

 

아닌가 추정됩니다.

 

 

980-Ti 에서는 의외의 양상이 펼쳐집니다.

 

DX11 에서는 Fury-X 와 마찬가지로 우리가 이제까지 알고 있던 성능 순서대로 CPU들이 정렬됩니다.

 

근데 DX12 로 바뀌자 놀라운 일이 펼쳐집니다.

 

저 밑에 있던 FX-8370 이 바로 i7-6700k 의 턱밑까지 쫓아 올라옵니다.

 

 

Asynchronous compute 는 CPU 의 멀티 코어를 십분 활용합니다.

 

이제까지 잉여자원으로 남겨졌던 CPU의 다중 코어를 다 끌어다 쓰게 됩니다.

 

논리적인 Thread 증가 (인텔의 하이퍼 쓰레딩같은) 기술은 크게 도움이 안됩니다.

 

물리 코어가 중요하게 작용합니다.

 

AMD FX-8320e CPU에서 OpenGL 가속시에 둠에서 GTX 970 이 83fps 이었습니다.

 

근데 vulkan 으로 가속하자 123fps로 무려 50%가 상승했습니다.

 

제대로 활용하지 못했던 여분의 코어까지 다 사용해서 이루어낸 향상으로 보입니다.

 

근데 의아한건 GTX 970은 Asynchronous compute 를 제대로 지원하지 못한다는 겁니다.

 

그렇다면... Asynchronous compute​ 를 제대로 지원하는 Fury X 에서는 DX11에서 DX12로

 

변경 시에 둠에서 지포스가 그러했듯이 AMD FX 코어 환경에서 성능이 대폭 상승해야 하는데

 

그렇지 못했습니다.... (뭐야 이건 도대체 ㅠ_ㅠ)

 

뭔가 뒤죽박죽이 되어 버린 느낌입니다.

 

low-level API 인 DX12와 vulkan... 둘 다 초기 단계, 걸음마를 시작하는 단계입니다.

 

Asynchronous compute 지원에 있어서도 nvidia는 물론이고 amd도 문제가 있는게

 

아닌가...  라는 생각이 드는데,  뭐든 신기술이 도입되는 격변기에는 이렇습니다.

 

크로노스 그룹과 마이크로 소프트사,  그리고 각 게임 개발 업체들과

 

GPU 제조사인 nvidia, AMD 까지...

 

업계 전반에 걸쳐 문제 해결을 위한 긴밀한 협력이 필요해 보입니다.

 


추천 3 반대 0

댓글목록

잘보고갑니다. 작성중인 글이지만요 ㅋ

    0 0

잘보고 갑니다

    0 0

그래픽카드 대전과 더불어 소프트웨어 쪽도 뭔가 큰변화가 이루어질꺼 같네요...
좋은글 잘읽었습니다.

    0 0

다 이해는 못했지만..ㅜ.ㅜ 상세한 설명 감사드립니다.

    0 0



리모컨

맨위로
 댓 글 
 목 록 
회사소개 개인정보처리방침 서비스이용약관 메일문의 Copyright © 딜바다닷컴 All rights reserved.
상단으로
모바일 버전으로 보기