• 169701.pdf

     (출처: iitp.kr)
  • 주요 내용 요약
    • intel과 nVidia 기술을 소개. nVidia 기술쪽만 요약해 본다.
    • nVidia에서는 병렬 컴퓨팅 아키텍처로 Tesla, Quadro, GeForce GPU로 처음 출시
    • 이후 Tesla와 Quadro를 통합하여 Maximus 기술로 2011년 공개 (CUDA는 테슬라에서 돌고, OpenGL은 Quadro에서 동작하는 형태)
    • Tesla는 Fermi -> Kepler -> Maxwell로 발전하였음
    • Tesla는 CUDA 코어를 192개씩 묶어 하나의 클러스터로 구성하였지만 코어의 작업 효율이 떨어지는 문제가 발생
      • 이는 6개의 CUDA 코어 당 한 개의 load/store 유닛과 한 개의 special function 유닛으로 구성되어 있는데, 4개의 CUDA 코어가 최적이라는 여러 결과가 나옴.
      • 따라서 Fermi에서는 4개의 CUDA 코어 당한 개의 load/store 유닛과 special function 유닛으로 구성함과 동시에 CUDA 코어 성능을 35% 개서
      • 대신 클러스터 당 CUDA 코어 갯수를 192개에서 128개로 줄이고, 128개의 CUDA 코어도 32개씩 관리하는 구조로 변경
    • Maxswell은 L1 캐시에 텍스처 캐시 기능을 통합하고 64KB의 캐시 공간을 모든 블록이 공유할 수 있는 구조로 개선
      • nVidia GPU 프로세서 코어단위인 SM(Streaming Multiprocessor) 구조를 SMM(Streaming mutiprocessor Maxswell)으로 변경
      • 맥스웰의 SMM 구성은 쿼드코어처럼 각각의 모듈이 처리한 명령어를 공유하는 형태인 반면, 케플러는 모든 코어에 입력된 데이터를 할당하는 대규모 싱글코어 형태
저작자 표시
신고
Posted by getcome
TAG ,

티스토리 툴바