CUDA 2

GPU 작동원리

작업 순서작업 분할 및 할당데이터 로드 및 준비병렬 연산 수행캐시 시스템 활용특화 유닛 활용결과 통합 및 출력상호작용과 피드백 루프각 작업 설명1. 작업 분할 및 할당명령 디코딩:CPU는 복잡한 고수준 명령어를 해석하고, 이를 GPU가 처리할 수 있는 작은 작업 단위로 분할하는 과정을 수행합니다. 이 과정은 CPU가 전체 작업을 여러 개의 간단한 연산으로 나누어, 병렬 처리가 가능한 형태로 만드는 것입니다. 이렇게 분할된 작업 단위는 GPU의 대규모 병렬 처리 능력을 최대한 활용할 수 있도록 설계됩니다.커널 런칭:분할된 작은 작업 단위들은 "커널(Kernel)"이라고 불립니다. 커널은 GPU에서 실행될 수 있는 프로그램의 가장 작은 단위로, 특정 연산을 수행하도록 설계됩니다. CPU는 이러한 커널들을 G..

poetry 환경에서 GPU(CUDA) 사용 가능하게 하기

배경conda로 cuda를 설치하는건 많았는데, poetry 환경에 CUDA를 설치하기가 생각보다 어려웠다.실습환경파워쉘의 프로젝트 가상환경 활성화(poetry shell) 이후 입력창과정poetry add가 먹히지 않기 때문에, 소스로부터 cuda를 추가해야한다.본인 컴퓨터에 맞는 cuda 버전 확인 (아래 링크 참조)티스토리CUDA 현재 날짜 기준 최신 12.5이지만, 동작하지 않았다. 11.8 추천11.8 버전에 맞는 모듈들 설치poetry 가상환경 활성화CUDA 11.8에 맞는 모듈 모음 링크를 소스로 등록위에 등록한 소스로부터 torch, torchvision, torchaudio 이 세 패키지를 가져와 설치PS C:\Users\project> poetry shell(.venv) PS C:\Us..