전체 PDF 자료!
1. 문제의 발단
2. 사용된 하드웨어 스펙
3. 문제해결을 위한 고민
- Windows OS에서도 동작 가능하도록 경로를 모두 수정하는 방법
- Linux OS의 가상머신(Virtual Machine)을 구축하는 방법
- WSL을 활용하여 Windows에서 Linux환경을 구축하는 방법
4. 문제해결 방법 선택
1. Windows OS에서도 동작 가능하도록 경로를 모두 수정하는 방법
=> 하드코딩 되어있는 부분이 많아 경로를 수정하는데 시간이 많이 소요
2. Linux OS의 가상머신(Virtual Machine)을 구축하는 방법
=> 가상머신 프로그램에서 Computing Cost가 과다하게 발생할 것으로 예상
3. WSL을 활용하여 Windows에서 Linux환경을 구축하는 방법
=> CUDA를 잘 설치할 수 있을까? 의문이 들었지만, 시도해보기로 결정!
5. WSL 설치 에러
wsl 0x80370102 설치 에러 해결 방법
WSL2 Error: 0x80370102 설치 에러 WSL은 윈도우즈 환경에서 리눅스를 구동시켜주는 하위 시스템(Sub System)이다. WSL2로 업데이트 되면서 Hyper-V 가상화 기술이 적용되어 리눅스 커널을 탑재하게 된다. 덕
everyhark.tistory.com
[WSL] Error: 0x80370102 해결
WSL2 를 설치하는 도중 아래와 같은 에러가 발생했다.Error: 0x80370102열심히 구글링을 거친 결과 Microsoft 공식 페이지에서 아래 내용을 발견했다.해당 페이지에서 제안하고 있는 항목을 하나씩 확인
velog.io
- Windows 기능 켜기/끄기 -> Linux용 Windows 하위 시스템, Hyper-V
![](https://blog.kakaocdn.net/dn/cTq9va/btrMkuuoLJK/BopG9n7BP6s0ODhXlmpOz0/img.png)
![](https://blog.kakaocdn.net/dn/dDw6JS/btrMqrXdfTy/PhbpgwjshwsBTJJSR8XkI1/img.png)
6. WSL 전용 그래픽 드라이버 설치
Download the latest official NVIDIA drivers
Download the latest official NVIDIA drivers
www.nvidia.com
![](https://blog.kakaocdn.net/dn/4vXXy/btrMoybgAo0/ZPkUdckM8lzVgkE6EafEK0/img.png)
7. WSL 전용 CUDA 설치
WSL2(Windows Subsystem for Linux 2)을 이용한 Deep Learning 개발 환경 구축(2)
WSL2(Windows Subsystem for Linux 2)을 이용한 Deep Learning 개발 환경 구축(1) 본 게시글에서는 위 게시글에서 설정한 WSL2 환경에 Deep Learning을 위한 CUDA 설치 및 개발 환경 구축에 대한 내용을 다루고 있..
0verc10ck.tistory.com
![](https://blog.kakaocdn.net/dn/B1D5N/btrMlVEOswE/a8Zke103zooXKnW7KoGbx0/img.png)
8. GPU 인식 실패
![](https://blog.kakaocdn.net/dn/PNXC0/btrMjCGEkle/SIoO8lJwCt2ACKVwsoOzJK/img.png)
![](https://blog.kakaocdn.net/dn/bk2YOi/btrMmgB77Ge/zubJOt4CzKK9eE6eoxUKGK/img.png)
![](https://blog.kakaocdn.net/dn/oUbQB/btrMkuHTCbr/6D0TcqXiuZ00Q9mc3bPKw1/img.png)
![](https://blog.kakaocdn.net/dn/cigXKA/btrMjXX6uAE/ODK2LnuBZpzF52Ti5sCuLK/img.png)
9. torch.cuda.fail, nvidia-smi 명령어 안됨 현상
![](https://blog.kakaocdn.net/dn/2OLJm/btrMkdzE5Ve/tcLx1V3KtNVxg2qIyNELsK/img.png)
[WSL] Cuda WSL 환경에서 실행하기-3 : WSL에서 Cuda 사용
1. Nvidia Container Toolkit 설치 우분투에서 아래명령어 차래대로 실행 distribution=$(. /etc/os-release;echo $ID$VERSION_ID) curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo apt-key add..
pbsquid.tistory.com
Windows 10 다운로드
Windows 10용 ISO 파일을 다운로드한 경우, 해당 파일은 선택한 위치에 로컬로 저장됩니다.컴퓨터에 타사 DVD 굽기 프로그램이 설치되어 있으며 해당 프로그램을 사용하여 설치 DVD를 만들려는 경우,
www.microsoft.com
![](https://blog.kakaocdn.net/dn/b2Yd3P/btrMkhIPFGV/R5UUKI2TuxvlPvClUO4Lnk/img.png)
10. torch.cuda.is_available() == True
이렇게 다양한 에러를 경험했지만 끝까지 포기하지 않고 목표를 달성했습니다.
디버깅 과정을 상세히 기록하여 다음에도 활용할 수 있도록 했으며,
해당 문서가 다른 개발자 분들에게 도움이 되길 바랍니다.
부록. CUDA Out of Memory 개선
https://discuss.pytorch.org/t/when-to-set-pin-memory-to-true/19723
When to set pin_memory to true?
From the imagenet example: train_loader = torch.utils.data.DataLoader( train_dataset, batch_size=args.batch_size, shuffle=(train_sampler is None), num_workers=args.workers, pin_memory=True, sampler=train_sampler) val_loader = torch.utils.data.DataLoader( d
discuss.pytorch.org
https://discuss.pytorch.org/t/using-pined-memory-causes-out-of-memory-error-even-though-batch-size-is-set-to-low-values/30602
Using pined memory causes out-of-memory error even though batch size is set to low values
I am fine-tuning on a custom dataset using ResNet. I have met with this strange issue. When I try to train the model, I see the following error message: THCudaCheck FAIL file=/opt/conda/conda-bld/pytorch_1535491974311/work/aten/src/THC/THCCachingHostAlloca
discuss.pytorch.org
https://cvml.tistory.com/24
num_workers & pin_memory in DataLoader
pytorch를 이용해 딥러닝 모델을 학습시킬 때 custom dataset을 이용할 경우 torch.utils.data.Dataset으로 데이터셋을 정의하고(input data type, augmentation 등) torch.utils.data.DataLoader로 어떻게 데이터..
cvml.tistory.com
연산을 빠르게 해주고, 미리 올려놓고 하는 방법으로 알고 있다.