tensorflow

[tensorflow] multi gpu 사용하기

2022.01.13

multi gpu 사용하기 모델링 할 때 gpu를 사용하면 속도가 몇만배이상 빨라진다. 그러나 모델이 복잡해지면 복잡해질수록 single gpu가 아닌 multi gpu를 사용하게 되는데 이 때는 약간의 코드만 추가해주면 된다. 예시 코드 * tensorflow 기준 import tensorflow as tf tf.compat.v1.disable_eager_execution() mirrored_strategy = tf.distribute.MirroredStrategy(devices=["/gpu:0", "/gpu:1"]) gpu 0번과 1번을 사용하겠다는 예시이다. 나는 실행시킬 때, $ CUDA_DEVICE_ORDER=PCI_BUS_ID CUDA_VISIBLE_DEVICES=1,2 python3 mode..

AI/MachineLearning

GD vs SGD(Stochastic Gradient Descent)

2021.07.19

GD(Gradient Descent)**는 시작 지점에서 기울기의 반대 방향으로 하강하면서 **손실 함수(loss function)를 최소화하는 지점을 찾기 위한 가장 직관적인 방법입니다. 이처럼 전체 데이터 셋을 가지고 학습하게 되면 안정적이긴 하지만, 계산량과 학습 비용이 많아지게 됩니다. 이때 전체 데이터 셋이 아닌, 무작위로 뽑은 데이터들에 대한 Gradient Descent를 진행하고, 이를 반복하며 정확도를 찾아 나가는 것을 SGD(Stochastic Gradient Descent)라고 합니다. 이번 실습에서는 동일한 모델 생성 및 학습을 통하여 두 최적화 기법을 비교해보도록 하겠습니다. 데이터셋은 IMDB 영화 리뷰 데이터 셋을 사용합니다. 해당 데이터셋은 훈련용 데이터 25,000개와 테스..

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

tensorflow

[tensorflow] multi gpu 사용하기

GD vs SGD(Stochastic Gradient Descent)

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역