์ด ํ์ด์ง์์๋ ํ์ต ์์ ์ ์๋ช ์ฃผ๊ธฐ๋ฅผ ํตํ ํ์ต ํด๋ฌ์คํฐ์ ์ํ ๋ฐ Vertex AI๊ฐ ํ์ต ์ค๋ฅ๋ฅผ ์ฒ๋ฆฌํ๋ ๋ฐฉ๋ฒ์ ์ค๋ช ํฉ๋๋ค. ์ด ์ ๋ณด๋ฅผ ์ฌ์ฉํ์ฌ ํ์ต ์ฝ๋๋ฅผ ์ ์ ํ ์กฐ์ ํ ์ ์์ต๋๋ค.
ํ์ต ์์ ์ ์๋ช ์ฃผ๊ธฐ
์ด ์น์ ์์๋ Vertex AI๊ฐ ํ์ต ์์ ์ ์๋ช ์ฃผ๊ธฐ๋ฅผ ํตํด ์์ ์ VM์ ์ฒ๋ฆฌํ๋ ๋ฐฉ๋ฒ์ ์ค๋ช ํฉ๋๋ค.
์ ์์ ํ์ ์ถ๊ฐ
CustomJob
๋๋ HyperparameterTuningJob
์ ๋ง๋ค๋ฉด ์์
์ด Vertex AI์์ ์คํ๋๊ธฐ ์ ์ ์ผ์ ์๊ฐ ๋์ JOB_STATE_QUEUED
์ํ๋ก ์ ์ง๋ ์ ์์ต๋๋ค. ์ผ๋ฐ์ ์ผ๋ก ์ด ์๊ฐ์ ๊ธธ์ง ์์ง๋งGoogle Cloud ํ๋ก์ ํธ์ ์์
์ ๋ํ ์ปค์คํ
ํ์ต ํ ๋น๋์ด ๋ถ์กฑํ ๊ฒฝ์ฐ Vertex AI๋ ํ ๋น๋์ด ์ถฉ๋ถํ ํ๋ณด๋ ๋๊น์ง ์์
์ ํ์ ์ ์งํฉ๋๋ค.
๋์์ ์์ ์ ์์
ํ์ต ์์
์ด ์์๋๋ฉด Vertex AI๋ ์งง์ ์๊ฐ ๋ด์ ์ต๋ํ ๋ง์ ์์
์๋ฅผ ์์ฝํฉ๋๋ค. ๋ฐ๋ผ์ ์์
์๊ฐ ์์ฐจ์ ์ผ๋ก ์์๋๋ ๋์ ๋ณ๋ ฌ๋ก ์์๋ ์ ์์ต๋๋ค. ์์ ์ง์ฐ ์๊ฐ์ ์ค์ด๊ธฐ ์ํด Vertex AI๋ ๊ฐ ์์
์๊ฐ ์ฌ์ฉ ๊ฐ๋ฅํด์ง๋ ์ฆ์ ๊ฐ ์์
์์ ์ฝ๋๋ฅผ ์คํํฉ๋๋ค. ๋ชจ๋ ์์
์๋ฅผ ์ฌ์ฉํ ์ ์๋ ๊ฒฝ์ฐ Vertex AI๋ ์์
์ํ๋ฅผ JOB_STATE_RUNNING
์ผ๋ก ์ค์ ํฉ๋๋ค.
๋๋ถ๋ถ์ ๊ฒฝ์ฐ ๋จธ์ ๋ฌ๋ ํ๋ ์์ํฌ๋ ๋ณ๋ ฌ๋ก ์์๋๋ ์์ ์๋ฅผ ์๋์ผ๋ก ์ฒ๋ฆฌํฉ๋๋ค. ํ์ต ์ฝ๋์์ ๋ฐฐํฌ ์ ๋ต์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ ๋ณ๋ ฌ๋ก ์์๋๋ ์์ ์๋ฅผ ์ฒ๋ฆฌํ๋๋ก ์๋์ผ๋ก ์กฐ์ ํด์ผ ํ ์ ์์ต๋๋ค. TensorFlow ๋ฐ PyTorch์ ๋ฐฐํฌ ์ ๋ต์ ๋ํด ์์ธํ ์์๋ณด์ธ์.
ํ์ต ์์ ์ค์ ์์ ์ ๋ค์ ์์
ํ์ต ์์ ์ค์ Vertex AI๋ ํธ์คํธ ์ด๋ฆ์ด ๋์ผํ ์์ ์ ํ์์ ์์ ์๋ฅผ ๋ค์ ์์ํ ์ ์์ต๋๋ค. ์ด๋ ๋ค์๊ณผ ๊ฐ์ ๊ฒฝ์ฐ์ ๋ฐ์ํ ์ ์์ต๋๋ค.
- VM ์ ์ง๋ณด์: ์์ ์๋ฅผ ์คํํ๋ VM์ VM ์ ์ง๋ณด์๊ฐ ์ ์ฉ๋๋ ๊ฒฝ์ฐ Vertex AI๋ ๋ค๋ฅธ VM์์ ์์ ์๋ฅผ ๋ค์ ์์ํฉ๋๋ค. VM ์ ์ง๋ณด์๋ฅผ ์ํ ๋ผ์ด๋ธ ๋ง์ด๊ทธ๋ ์ด์ ์ ์์ธํ ์์๋ณด์ธ์.
0์ด ์๋ ์ข ๋ฃ: 0์ด ์๋ ์ข ๋ฃ ์ฝ๋๋ก ์์ ์๊ฐ ์ข ๋ฃ๋๋ฉด Vertex AI๊ฐ ํด๋น ์์ ์๋ฅผ ๋์ผํ VM์์ ์ฆ์ ๋ค์ ์์ํฉ๋๋ค.
- ์์ ์๊ฐ ์ผ๋ฐ์ ์ธ ์ค๋ฅ๋ก ์ธํด ์คํจํ๋ฉด ์๊ตฌ ์ค๋ฅ๋ก ์ทจ๊ธ๋๊ณ Vertex AI๋ ์ ์ฒด ์์ ์ ์ข ๋ฃํฉ๋๋ค. Vertex AI๊ฐ ์ ์ฒด ์์ ์ ์ข ๋ฃํ๊ธฐ ์ ์ ์ปจํ ์ด๋๊ฐ ๋ค์ ์์๋๋ฉด ์ด๋ฌํ ์ปจํ ์ด๋๊ฐ Cloud Logging์ ๋ก๊ทธ๋ฅผ ์์ฑํ ์ ์์ต๋๋ค.
- ๋น์๊ตฌ์ ์ค๋ฅ(์ผ๋ฐ์ ์ธ ์ค๋ฅ์ ๋์ด๋์ง ์์ ์ค๋ฅ)๋ก ์ธํด ์์ ์๊ฐ ์คํจํ๋ฉด Vertex AI์์ ๋ค์ ์์๋ ์์ ์๊ฐ ์์ ์๋น ์ต๋ 5๋ฒ๊น์ง ๊ณ์ ์คํ๋ฉ๋๋ค. 5๋ฒ์ ๋ค์ ์์ํ ํ ์์ ์๊ฐ ๋ค์ ์คํจํ๋ฉด Vertex AI์์ ์ ์ฒด ์์ ์ด ์คํจํ๊ธฐ ์ ์ ์ ์ฒด ์์ ์ 3ํ๊น์ง ๋ค์ ์๋ํฉ๋๋ค.
ํ์ต ์ฝ๋์์ ์์ ์ ์ฌ์์์ ์ฒ๋ฆฌํ๋ ค๋ฉด ์์ ์๊ฐ ๋ค์ ์์๋ ๋ ์ฒดํฌํฌ์ธํธ๋ก๋ถํฐ ๋ณต์ํ ์ ์๋๋ก ํ์ต ์ค์ ์ ๊ธฐ์ ์ผ๋ก ์ฒดํฌํฌ์ธํธ๋ฅผ ์ ์ฅํฉ๋๋ค. ํ์ต์ด 4์๊ฐ ๋๊ฒ ๊ฑธ๋ฆด ๊ฒ์ผ๋ก ์์๋๋ฉด ์ต์ 4์๊ฐ๋ง๋ค ํ ๋ฒ์ฉ ์ฒดํฌํฌ์ธํธ๋ฅผ ์ ์ฅํ๋ ๊ฒ์ด ์ข์ต๋๋ค. TensorFlow ๋ฐ PyTorch์์ ํ์ต ์ฒดํฌํฌ์ธํธ ์ฌ์ฉ ๋ฐฉ๋ฒ์ ๋ํด ์์๋ณด์ธ์.
์ฑ๊ณต์ ์ผ๋ก ์์ ์๋ฃ
๊ธฐ๋ณธ ๋ณต์ ๋ณธ์ด ์ข ๋ฃ ์ฝ๋ 0์ผ๋ก ์ข ๋ฃ๋๋ฉด ํ์ต ์์ ์ด ์ฑ๊ณต์ ์ผ๋ก ์๋ฃ๋ฉ๋๋ค. ์ด ์์ ์ Vertex AI๋ ๋ค๋ฅธ ๋ชจ๋ ์คํ ์์ ์๋ฅผ ์ข ๋ฃํฉ๋๋ค.
Vertex AI๊ฐ ํ์ต ์์ ์ค๋ฅ๋ฅผ ์ฒ๋ฆฌํ๋ ๋ฐฉ๋ฒ
์ด ์น์ ์์๋ Vertex AI๊ฐ ์ผ๋ฐ์ ์ธ ํ์ต ์์ ์ค๋ฅ ๋ฐ ๋ด๋ถ ์ค๋ฅ๋ฅผ ์ฒ๋ฆฌํ๋ ๋ฐฉ๋ฒ์ ์ค๋ช ํฉ๋๋ค.
์์ ์ด ์ข ๋ฃ๋๊ณ ์ฝ 1๋ถ ํ Vertex AI๋ ์ข ๋ฃ ์ฝ๋๋ฅผ ๊ธฐ์ค์ผ๋ก ํ์ต ์์ ๊ฐ์ฒด์ ์ค๋ฅ ์ฝ๋๋ฅผ ์ค์ ํฉ๋๋ค.
์ผ๋ฐ์ ์ธ ์ค๋ฅ ์ฒ๋ฆฌ
๋ค์๊ณผ ๊ฐ์ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋ฉด Vertex AI๊ฐ ๋ชจ๋ ์์ ์๋ฅผ ์ข ๋ฃํฉ๋๋ค.
์ค๋ฅ ์ ํ | ์ค๋ฅ ๋ฉ์์ง/๋ก๊ทธ | ์ฐธ๊ณ |
์ฌ์ฉ์ ์ฝ๋ ์์ธ | ๋ณต์ ๋ณธ REPLICA_NAME์ด 0์ด ์๋ EXIT_CODE ์ํ๋ก ์ข ๋ฃ๋์์ต๋๋ค. ์ข ๋ฃ ์์ธ์ REASON์ ๋๋ค. | ์์
์ด ์ผ์์ ์ผ ์ ์๋ ์ข
๋ฃ ์ฝ๋๊ฐ ๋ฐ์ํ๋ฉด Vertex AI๋ ์ต๋ 3ํ๊น์ง ์์
์ ๋ค์ ์์ํ๋ ค๊ณ ์๋ํฉ๋๋ค.
Vertex AI์์ ์์
์ ๋ค์ ์๋ํ๋ผ๊ณ ์๋ฆฌ๋ ์ผ์์ ์ธ ์ค๋ฅ ์ฝ๋์๋ ๋ค์์ด ํฌํจ๋ฉ๋๋ค.
|
๋ฉ๋ชจ๋ฆฌ ๋ถ์กฑ | ๋ณต์ ๋ณธ REPLICA_NAME์ ๋ฉ๋ชจ๋ฆฌ๊ฐ ๋ถ์กฑํ์ฌ 0์ด ์๋ EXIT_CODE ์ํ๋ก ์ข ๋ฃ๋์์ต๋๋ค. |
GKE๋ Vertex AI ๋
ธ๋์ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์์ฝํฉ๋๋ค. ์ต์ ๋จธ์ ์ ํ(์: n1-standard-4 )์์ Vertex AI ์์คํ
์์ด์ ํธ๋ ์ด ๋ฉ๋ชจ๋ฆฌ์ ์ต๋ 40%๋ฅผ ์ฌ์ฉํ ์ ์์ต๋๋ค.
๋ ํฐ VM์ ๊ฒฝ์ฐ ์ค๋ฒํค๋๊ฐ ๋น๊ต์ ์์ต๋๋ค. n1-standard ๋จธ์ ์ ํ์ ํ ๋น ๊ฐ๋ฅํ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ๋น๊ตํฉ๋๋ค.
|
๋ฆฌ์ ์ ์ฉ๋ ๋ถ์กฑ(Compute Engine ์ฌ๊ณ ๋ถ์กฑ) | REGION_NAME ๋ฆฌ์ ์ ๋ฆฌ์์ค๊ฐ ๋ถ์กฑํฉ๋๋ค. ๋ค๋ฅธ ๋ฆฌ์ ์ ์ฌ์ฉํ๊ฑฐ๋ ๋ค๋ฅธ ๊ฐ์๊ธฐ๋ฅผ ์ฌ์ฉํด ๋ณด์ธ์. | ์ฌ๊ณ ๋ถ์กฑ์ ๋ฆฌ์ ์ ์ ํํ CPU ๋๋ GPU์ ๋ํด Compute Engine ์ฉ๋์ด ๋ถ์กฑํ ๊ฒฝ์ฐ ๋ฐ์ํฉ๋๋ค. ํ๋ก์ ํธ ํ ๋น๋๊ณผ๋ ๊ด๋ จ์ด ์์ต๋๋ค.
์ด ๊ฒฝ์ฐ Vertex AI๊ฐ ์์
์ ์ต๋ 3ํ๊น์ง ๋ค์ ์์ํ๋ ค๊ณ ์๋ํฉ๋๋ค.
A2 ๋ฐ A3 VM์์ ์คํ๋๋ ์์ ์ ๊ฒฝ์ฐ ๋์ ์ํฌ๋ก๋ ์ค์ผ์ค๋ฌ๋ฅผ ์ฌ์ฉํ๋ฉด ์ฌ๊ณ ๋ถ์กฑ ์ค๋ฅ๋ก ์คํจํ๋ ๋์ ์์ฒญ๋ GPU ๋ฆฌ์์ค๊ฐ ์ ๊ณต๋ ๋ ์คํ๋๋ ์์ ์ ์์ฝํ ์ ์์ต๋๋ค. ์์ธํ ๋ด์ฉ์ ๋ฆฌ์์ค ๊ฐ์ฉ์ฑ ๊ธฐ๋ฐ์ ํ์ต ์์ ์์ฝ์ ์ฐธ์กฐํ์ธ์. |
๋ด๋ถ ์ค๋ฅ ์ฒ๋ฆฌ
Vertex AI์ ๋ด๋ถ ์ค๋ฅ๊ฐ ์์ผ๋ฉด Vertex AI๋ ์์
์ 2ํ ๋ค์ ์์ํ๋ ค๊ณ ์๋ํฉ๋๋ค(์ด 3ํ). ์ฌ์์๋ ์คํจํ๋ฉด Vertex AI๋ Internal error occurred for the current attempt
๋ฉ์์ง์ ํจ๊ป ๋ด๋ถ ์ค๋ฅ๋ฅผ ๋ฐํํฉ๋๋ค.