- ๋น ๋ฅด๊ฒ ๋ก๋๋๊ณ GPU ์ง์ ๊ตฌ์กฐ๋ก ์ต์ํ์ ๋ณํ์ด ํ์ํ ๋ชจ๋ธ์ ์ฌ์ฉํ๊ณ ๋ก๋ ๋ฐฉ๋ฒ์ ์ต์ ํํฉ๋๋ค.
- ์ต๋์ ํจ์จ์ ์ธ ๋์ ์คํ์ ํ์ฉํ๋ ๊ตฌ์ฑ์ ์ฌ์ฉํ๋ฉด ๋น์ฉ์ ๋ฎ์ถ๋ฉด์ ์ด๋น ๋ชฉํ ์์ฒญ์ ์ฒ๋ฆฌํ๋ ๋ฐ ํ์ํ GPU ์๋ฅผ ์ค์ผ ์ ์์ต๋๋ค.
Cloud Run์์ ๋๊ท๋ชจ ML ๋ชจ๋ธ์ ๋ก๋ํ๋ ๋ฐ ๊ถ์ฅ๋๋ ๋ฐฉ๋ฒ
Google์ ML ๋ชจ๋ธ์ ์ปจํ ์ด๋ ์ด๋ฏธ์ง ๋ด์ ์ ์ฅํ๊ฑฐ๋ Cloud Storage์์ ๋ก๋๋ฅผ ์ต์ ํํ๋ ๊ฒ์ด ์ข์ต๋๋ค.
ML ๋ชจ๋ธ ์ ์ฅ๊ณผ ๋ก๋์ ์ฅ๋จ์
๋ค์์ ์ต์ ์ ๋น๊ตํ ๋ด์ฉ์ ๋๋ค.
๋ชจ๋ธ ์์น | ๋ฐฐํฌ ์๊ฐ | ๊ฐ๋ฐ ํ๊ฒฝ | ์ปจํ ์ด๋ ์์ ์๊ฐ | ์ ์ฅ์ ๋น์ฉ |
์ปจํ ์ด๋ ์ด๋ฏธ์ง | ๋๋ฆฝ๋๋ค. ๋ํ ๋ชจ๋ธ์ด ํฌํจ๋ ์ด๋ฏธ์ง๋ฅผ Cloud Run์ผ๋ก ๊ฐ์ ธ์ค๋ ๋ฐ ์๊ฐ์ด ๋ ์ค๋ ๊ฑธ๋ฆฝ๋๋ค. | ์ปจํ ์ด๋ ์ด๋ฏธ์ง๋ฅผ ๋ณ๊ฒฝํ๋ ค๋ฉด ์ฌ๋ฐฐํฌ๊ฐ ํ์ํ๋ฉฐ, ๋ํ ์ด๋ฏธ์ง์ ๊ฒฝ์ฐ ๋๋ ค์ง ์ ์์ต๋๋ค. | ๋ชจ๋ธ์ ํฌ๊ธฐ์ ๋ฐ๋ผ ๋ค๋ฆ ๋๋ค. ์ด๋ํ ๋ชจ๋ธ์ ๊ฒฝ์ฐ ์์ธก ๊ฐ๋ฅ์ฑ์ ๋์ง๋ง ์ฑ๋ฅ์ ์ ํ๋๋ Cloud Storage๋ฅผ ์ฌ์ฉํฉ๋๋ค. | Artifact Registry์ ์ฌ๋ฌ ๊ฐ์ ์ฌ๋ณธ์ด ์์ ์ ์์ต๋๋ค. |
Cloud Storage FUSE ๋ณผ๋ฅจ ๋ง์ดํธ๋ฅผ ์ฌ์ฉํ์ฌ ๋ก๋๋ Cloud Storage | ๋น ๋ฆ ๋๋ค. ๋ชจ๋ธ์ด ์ปจํ ์ด๋ ์์ ์ค์ ๋ค์ด๋ก๋๋ฉ๋๋ค. | ์ค์ ์ด ์ด๋ ต์ง ์์ผ๋ฉฐ Docker ์ด๋ฏธ์ง๋ฅผ ๋ณ๊ฒฝํ ํ์๊ฐ ์์ต๋๋ค. | ๋คํธ์ํฌ ์ต์ ํ๋ฅผ ์ฌ์ฉํ๋ฉด ์๋๊ฐ ๋น ๋ฆ ๋๋ค. ๋ค์ด๋ก๋๋ฅผ ๋ณ๋ ฌํํ์ง ์์ต๋๋ค. | ์ฌ๋ณธ 1๊ฐ๊ฐ Cloud Storage์ ์์ต๋๋ค. |
Transfer Manager ๋์ ๋ค์ด๋ก๋ ์ฝ๋ ์ํ์ ํ์๋ ๋๋ก Google Cloud CLI ๋ช
๋ น์ด gcloud storage cp ๋๋ Cloud Storage API๋ฅผ ์ฌ์ฉํ์ฌ ๋์์ ๋ค์ด๋ก๋๋ Cloud Storage. |
๋น ๋ฆ ๋๋ค. ๋ชจ๋ธ์ด ์ปจํ ์ด๋ ์์ ์ค์ ๋ค์ด๋ก๋๋ฉ๋๋ค. | Cloud Storage API๋ฅผ ์ฌ์ฉํ๋ ค๋ฉด ์ด๋ฏธ์ง์ Google Cloud CLI๋ฅผ ์ค์นํ๊ฑฐ๋ ์ฝ๋๋ฅผ ์ ๋ฐ์ดํธํด์ผ ํ๋ฏ๋ก ์ค์ ์ด ์ฝ๊ฐ ๋ ์ด๋ ต์ต๋๋ค. | ๋คํธ์ํฌ ์ต์ ํ๋ฅผ ์ฌ์ฉํ๋ฉด ์๋๊ฐ ๋น ๋ฆ ๋๋ค. Google Cloud CLI๋ ๋ชจ๋ธ ํ์ผ์ ๋์์ ๋ค์ด๋ก๋ํ๋ฏ๋ก FUSE ๋ง์ดํธ๋ณด๋ค ๋น ๋ฆ ๋๋ค. | ์ฌ๋ณธ 1๊ฐ๊ฐ Cloud Storage์ ์์ต๋๋ค. |
์ธํฐ๋ท | ๋น ๋ฆ ๋๋ค. ๋ชจ๋ธ์ด ์ปจํ ์ด๋ ์์ ์ค์ ๋ค์ด๋ก๋๋ฉ๋๋ค. | ์ผ๋ฐ์ ์ผ๋ก ๋ ๊ฐ๋จํฉ๋๋ค(๋ง์ ํ๋ ์์ํฌ๊ฐ ์ค์ ์ ์ฅ์์์ ๋ชจ๋ธ์ ๋ค์ด๋ก๋ํฉ๋๋ค). | ์ผ๋ฐ์ ์ผ๋ก ํ์ง์ด ๋ฎ๊ณ ์์ธกํ ์ ์์ต๋๋ค.
|
๋ชจ๋ธ ํธ์คํ ์ ๊ณต์ ์ฒด์ ๋ฐ๋ผ ๋ค๋ฆ ๋๋ค. |
์ปจํ ์ด๋ ์ด๋ฏธ์ง์ ๋ชจ๋ธ ์ ์ฅ
Cloud Run์ ๋ฐฐํฌ๋ ์ปจํ ์ด๋ ์ด๋ฏธ์ง์ ML ๋ชจ๋ธ์ ์ ์ฅํ๋ฉด ์ถ๊ฐ ๋คํธ์ํฌ ์ต์ ํ ์์ด ํ์ผ ๋ก๋ ์๊ฐ์ ๊ทน๋ํํ๋ Cloud Run์ ๊ธฐ๋ณธ ์ ๊ณต ์ปจํ ์ด๋ ์ด๋ฏธ์ง ์คํธ๋ฆฌ๋ฐ ์ต์ ํ์ ์ด์ ์ ๋๋ฆด ์ ์์ต๋๋ค.
ML ๋ชจ๋ธ์ด ํฌํจ๋ ์ปจํ ์ด๋๋ฅผ ๋น๋ํ๋ ๋ฐ ์๊ฐ์ด ๋ค์ ๊ฑธ๋ฆด ์ ์์ต๋๋ค. Cloud Build๋ฅผ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ ๋ ํฐ ๋จธ์ ์ ์ฌ์ฉํ์ฌ ๋ ๋น ๋ฅด๊ฒ ๋น๋ํ๋๋ก Cloud Build๋ฅผ ๊ตฌ์ฑํ ์ ์์ต๋๋ค. ์ด๋ ๊ฒ ํ๋ ค๋ฉด ๋ค์ ๋จ๊ณ์ ๋น๋ ๊ตฌ์ฑ ํ์ผ์ ์ฌ์ฉํ์ฌ ์ด๋ฏธ์ง๋ฅผ ๋น๋ํฉ๋๋ค.
steps: - name: 'gcr.io/cloud-builders/docker' args: ['build', '-t', 'IMAGE', '.'] - name: 'gcr.io/cloud-builders/docker' args: ['push', 'IMAGE'] images: - IMAGE options: machineType: 'E2_HIGHCPU_32' diskSizeGb: '500'
๋ชจ๋ธ์ ํฌํจํ๋ ๋ ์ด์ด๊ฐ ์ด๋ฏธ์ง ๊ฐ์ ๊ณ ์ ํ ๊ฒฝ์ฐ(๋ค๋ฅธ ํด์) ์ด๋ฏธ์ง๋น ํ๋์ ๋ชจ๋ธ ๋ณต์ฌ๋ณธ์ ๋ง๋ค ์ ์์ต๋๋ค. ๋ชจ๋ธ ๋ ์ด์ด๊ฐ ๊ฐ ์ด๋ฏธ์ง๋ง๋ค ๊ณ ์ ํ ๊ฒฝ์ฐ ์ด๋ฏธ์ง๋น ๋ชจ๋ธ ์ฌ๋ณธ์ด ํ๋์ฉ ์์ ์ ์์ผ๋ฏ๋ก Artifact Registry ๋น์ฉ์ด ์ถ๊ฐ๋ก ๋ฐ์ํ ์ ์์ต๋๋ค.
Cloud Storage์ ๋ชจ๋ธ ์ ์ฅ
Cloud Storage ๋ณผ๋ฅจ ๋ง์ดํธ๋ฅผ ์ฌ์ฉํ๊ฑฐ๋ Cloud Storage API ๋๋ ๋ช
๋ น์ค์ ์ง์ ์ฌ์ฉํ์ฌ Cloud Storage์์ ML ๋ชจ๋ธ์ ๋ก๋ํ ๋ ML ๋ชจ๋ธ ๋ก๋๋ฅผ ์ต์ ํํ๋ ค๋ฉด ๋น๊ณต๊ฐ Google ์ก์ธ์ค์ ํจ๊ป ์ด๊ทธ๋ ์ค ์ค์ ๊ฐ์ all-traffic
์ผ๋ก ์ค์ ํ ์ง์ VPC๋ฅผ ์ฌ์ฉํด์ผ ํฉ๋๋ค.
์ธํฐ๋ท์์ ๋ชจ๋ธ ๋ก๋
์ธํฐ๋ท์์ ML ๋ชจ๋ธ ๋ก๋๋ฅผ ์ต์ ํํ๋ ค๋ฉด ์ด๊ทธ๋ ์ค ์ค์ ๊ฐ์ all-traffic
์ผ๋ก ์ค์ ํ์ฌ ๋ชจ๋ ํธ๋ํฝ์ VPC ๋คํธ์ํฌ๋ฅผ ํตํด ๋ผ์ฐํ
ํ๊ณ Cloud NAT๋ฅผ ์ค์ ํ์ฌ ๋์ ๋์ญํญ์ผ๋ก ๊ณต๊ฐ ์ธํฐ๋ท์ ์ฐ๊ฒฐํฉ๋๋ค.
๋น๋, ๋ฐฐํฌ, ๋ฐํ์, ์์คํ ๋์์ธ ๊ณ ๋ ค์ฌํญ
๋ค์ ์น์ ์์๋ ๋น๋, ๋ฐฐํฌ, ๋ฐํ์, ์์คํ ์ค๊ณ์ ๋ํ ๊ณ ๋ ค์ฌํญ์ ์ค๋ช ํฉ๋๋ค.
๋น๋ ์๊ฐ
๋ค์ ๋ชฉ๋ก์ ๋น๋๋ฅผ ๊ณํํ ๋ ๊ณ ๋ คํด์ผ ํ ์ฌํญ์ ๋ณด์ฌ์ค๋๋ค.
- ์ ์ ํ ๊ธฐ๋ณธ ์ด๋ฏธ์ง๋ฅผ ์ ํํฉ๋๋ค. ์ฌ์ฉ ์ค์ธ ML ํ๋ ์์ํฌ์ ๋ํด Deep Learning Containers ๋๋ NVIDIA Container Registry์ ์ด๋ฏธ์ง๋ก ์์ํด์ผ ํฉ๋๋ค. ์ด๋ฌํ ์ด๋ฏธ์ง์๋ ์ต์ ์ฑ๋ฅ ๊ด๋ จ ํจํค์ง๊ฐ ์ค์น๋์ด ์์ต๋๋ค. ์ปค์คํ ์ด๋ฏธ์ง ๋ง๋ค๊ธฐ๋ ๊ถ์ฅํ์ง ์์ต๋๋ค.
- ๊ฒฐ๊ณผ ํ์ง์ ์ํฅ์ ๋ฏธ์น๋ค๊ณ ์ ์ฆํ ์ ์๋ ํ ๋์ ์คํ์ ์ต๋ํํ๊ธฐ ์ํด 4๋นํธ ์์ํ ๋ชจ๋ธ์ ์ ํํฉ๋๋ค. ์์ํ๋ ๋ ์๊ณ ๋น ๋ฅธ ๋ชจ๋ธ์ ์์ฑํฉ๋๋ค. ๋ฐ๋ผ์ ๋ชจ๋ธ์ ์ ๊ณตํ๋ ๋ฐ ํ์ํ GPU ๋ฉ๋ชจ๋ฆฌ์ ์์ ์ค์ด๊ณ ๋ฐํ์์ ๋ณ๋ ฌ์ฑ์ ๋์ผ ์ ์์ต๋๋ค. ๋ชจ๋ธ์ ํ๊ฒ ๋นํธ ์ฌ๋๋ก ์์ํํ๋ ๊ฒ๋ณด๋ค๋ ํ๊ฒ ๋นํธ ์ฌ๋๋ก ํ์ตํ๋ ๊ฒ์ด ์ด์์ ์ ๋๋ค.
- GGUF์ ๊ฐ์ด ๋ก๋ ์๊ฐ์ด ์งง์ ์ปจํ ์ด๋ ์์ ์๊ฐ์ ์ต์ํํ๋ ๋ชจ๋ธ ํ์์ ์ ํํฉ๋๋ค. ์ด๋ฌํ ํ์์ ํ๊ฒ ์์ํ ์ ํ์ ๋ ์ ํํ๊ฒ ๋ฐ์ํ๋ฉฐ GPU์ ๋ก๋ํ ๋ ๋ณํ์ด ์ ๊ฒ ํ์ํฉ๋๋ค. ๋ณด์์ ๊ฐํํ๋ ค๋ฉด ํผํด ํ์ ์ฒดํฌํฌ์ธํธ๋ฅผ ์ฌ์ฉํ์ง ๋ง์ธ์.
- ๋น๋ ์ LLM ์บ์๋ฅผ ๋ง๋ค๊ณ ์ํฉ๋๋ค. Docker ์ด๋ฏธ์ง๋ฅผ ๋น๋ํ๋ ๋์ ๋น๋ ๋จธ์ ์์ LLM์ ์์ํฉ๋๋ค. ํ๋กฌํํธ ์บ์ฑ์ ์ฌ์ฉ ์ค์ ํ๊ณ ์ผ๋ฐ ๋๋ ์์ ํ๋กฌํํธ๋ฅผ ํผ๋ํ์ฌ ์ค์ ์ฌ์ฉ์ ์ํด ์บ์๋ฅผ ์ํฉ๋๋ค. ์์ฑ๋ ์ถ๋ ฅ์ ์ ์ฅํ์ฌ ๋ฐํ์์ ๋ก๋ํฉ๋๋ค.
- ๋น๋ ์๊ฐ ์ค ์์ฑํ๋ ์์ฒด ์ถ๋ก ๋ชจ๋ธ์ ์ ์ฅํฉ๋๋ค. ์ด๋ ๊ฒ ํ๋ฉด ์ ์ฅ๋ ๋ชจ๋ธ์ ํจ์จ์ฑ์ด ๋ฎ์ ๋ชจ๋ธ์ ๋ก๋ํ๊ณ ์ปจํ ์ด๋ ์์ ์ ์์ํ์ ๊ฐ์ ๋ณํ์ ์ ์ฉํ๋ ๊ฒ๋ณด๋ค ํจ์ฌ ์๊ฐ์ ์ ์ฝํ ์ ์์ต๋๋ค.
๋ฐฐํฌ ์
๋ค์ ๋ชฉ๋ก์ ๋ฐฐํฌ๋ฅผ ๊ณํํ ๋ ๊ณ ๋ คํด์ผ ํ ์ฌํญ์ ๋ณด์ฌ์ค๋๋ค.
- Cloud Run์์ ์๋น์ค ๋์ ์คํ์ ์ ํํ๊ฒ ์ค์ ํด์ผ ํฉ๋๋ค.
- ๊ตฌ์ฑ์ ๋ฐ๋ผ ์์ ํ๋ก๋ธ๋ฅผ ์กฐ์ ํฉ๋๋ค.
์์ ํ๋ก๋ธ๋ ์ปจํ ์ด๋๊ฐ ์์๋์๊ณ ํธ๋ํฝ์ ์๋ฝํ ์ค๋น๊ฐ ๋์๋์ง ํ์ธํฉ๋๋ค. ์์ ํ๋ก๋ธ๋ฅผ ๊ตฌ์ฑํ ๋๋ ๋ค์ ์ฃผ์ ์ฌํญ์ ๊ณ ๋ คํ์ธ์.
- ์ ์ ํ ์์ ์๊ฐ: ๋ชจ๋ธ์ ํฌํจํ ์ปจํ ์ด๋๊ฐ ์์ ํ ์ด๊ธฐํ๋๊ณ ๋ก๋๋๋ ๋ฐ ์ถฉ๋ถํ ์๊ฐ์ ํ์ฉํฉ๋๋ค.
- ๋ชจ๋ธ ์ค๋น ํ์ธ: ์ ํ๋ฆฌ์ผ์ด์ ์ด ์์ฒญ์ ์ฒ๋ฆฌํ ์ค๋น๊ฐ ๋์์ ๋๋ง ํต๊ณผํ๋๋ก ํ๋ก๋ธ๋ฅผ ๊ตฌ์ฑํฉ๋๋ค. ๋๋ถ๋ถ์ ์๋น ์์ง์ ๋ชจ๋ธ์ด GPU ๋ฉ๋ชจ๋ฆฌ์ ๋ก๋๋ ๋ ์ด๋ฅผ ์๋์ผ๋ก ์คํํ์ฌ ์กฐ๊ธฐ ์์ฒญ์ ๋ฐฉ์งํฉ๋๋ค.
Ollama๋ ๋ชจ๋ธ์ด ๋ก๋๋๊ธฐ ์ ์ TCP ํฌํธ๋ฅผ ์ด ์ ์๋ค๋ ์ ์ ์ ์ํ์ธ์. ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ค๋ฉด ๋ค์ ์๋ด๋ฅผ ๋ฐ๋ฅด์ธ์.
- ๋ชจ๋ธ ๋ฏธ๋ฆฌ ๋ก๋: ์์ ์ค์ ๋ชจ๋ธ์ ๋ฏธ๋ฆฌ ๋ก๋ํ๋ ๋ฐฉ๋ฒ์ ๊ดํ ์๋ด๋ Ollama ๋ฌธ์๋ฅผ ์ฐธ๊ณ ํ์ธ์.
๋ฐํ์
- ์ง์๋๋ ์ปจํ ์คํธ ๊ธธ์ด๋ฅผ ์ ๊ทน์ ์ผ๋ก ๊ด๋ฆฌํฉ๋๋ค. ์ง์ํ๋ ์ปจํ ์คํธ ์ฐฝ์ด ์์์๋ก ๋ ๋ง์ ์ฟผ๋ฆฌ๋ฅผ ๋์์ ์คํํ ์ ์์ต๋๋ค. ์์ธํ ๋ฐฉ๋ฒ์ ํ๋ ์์ํฌ์ ๋ฐ๋ผ ๋ค๋ฆ ๋๋ค.
- ๋น๋ ์๊ฐ์ ์์ฑํ LLM ์บ์๋ฅผ ์ฌ์ฉํฉ๋๋ค. ํ๋กฌํํธ ๋ฐ ํ๋ฆฌํฝ์ค ์บ์๋ฅผ ์์ฑํ ๋ ๋น๋ ์๊ฐ ์ค์ ์ฌ์ฉํ ๊ฒ๊ณผ ๋์ผํ ํ๋๊ทธ๋ฅผ ์ ๊ณตํฉ๋๋ค.
- ๋ฐฉ๊ธ ์์ฑํ ์ ์ฅ๋ ๋ชจ๋ธ์์ ๋ก๋ํฉ๋๋ค. ๋ชจ๋ธ ๋ก๋ ๋ฐฉ๋ฒ์ ๋ํ ๋น๊ต๋ ๋ชจ๋ธ ์ ์ฅ๊ณผ ๋ชจ๋ธ ๋ก๋์ ์ฅ๋จ์ ์ ์ฐธ์กฐํ์ธ์.
- ํ๋ ์์ํฌ์์ ์ง์ํ๋ ๊ฒฝ์ฐ ์์ํ๋ ํค-๊ฐ ์บ์๋ฅผ ์ฌ์ฉํ๋ ๊ฒ์ด ์ข์ต๋๋ค. ์ด๋ ๊ฒ ํ๋ฉด ์ฟผ๋ฆฌ๋น ๋ฉ๋ชจ๋ฆฌ ์๊ตฌ์ฌํญ์ด ์ค์ด๋ค๊ณ ๋์ ๋ก๋๋ฅผ ๋ ๋ง์ด ๊ตฌ์ฑํ ์ ์์ต๋๋ค. ํ์ง๋ง ํ์ง์ ์ํฅ์ ๋ฏธ์น ์๋ ์์ต๋๋ค.
- ๋ชจ๋ธ ๊ฐ์ค์น, ํ์ฑํ, ํค-๊ฐ ์บ์๋ฅผ ์ํด ์์ฝํ GPU ๋ฉ๋ชจ๋ฆฌ ์์ ์กฐ์ ํฉ๋๋ค. ๋ฉ๋ชจ๋ฆฌ ๋ถ์กฑ ์ค๋ฅ๊ฐ ๋ฐ์ํ์ง ์๋๋ก ์ต๋ํ ๋๊ฒ ์ค์ ํฉ๋๋ค.
- ํ๋ ์์ํฌ์ ์ปจํ ์ด๋ ์์ ์ฑ๋ฅ์ ๊ฐ์ ํ ์ ์๋ ์ต์ ์ด ์๋์ง ํ์ธํฉ๋๋ค(์: ๋ชจ๋ธ ๋ก๋ ๋์ ๋ก๋ ์ฌ์ฉ).
- ์๋น์ค ์ฝ๋ ๋ด์์ ๋์ ์คํ์ ์ฌ๋ฐ๋ฅด๊ฒ ๊ตฌ์ฑํฉ๋๋ค. ์๋น์ค ์ฝ๋๊ฐ Cloud Run ์๋น์ค ๋์ ์คํ ์ค์ ๊ณผ ํธํ๋๋๋ก ๊ตฌ์ฑ๋์ด ์๋์ง ํ์ธํฉ๋๋ค.
์์คํ ๋์์ธ ์์ค
- ์ ์ ํ ์์น์ ์๋งจํฑ ์บ์๋ฅผ ์ถ๊ฐํฉ๋๋ค. ๊ฒฝ์ฐ์ ๋ฐ๋ผ์๋ ์ ์ฒด ์ฟผ๋ฆฌ์ ์๋ต์ ์บ์ฑํ์ฌ ์ผ๋ฐ์ ์ธ ์ฟผ๋ฆฌ์ ๋น์ฉ์ ํจ๊ณผ์ ์ผ๋ก ์ ํํ ์ ์์ต๋๋ค.
- ํ๋ฆฌ์ฐ๋ธ์ ๋ถ์ฐ์ ์ ์ดํฉ๋๋ค. ํ๋กฌํํธ ์บ์๋ ํ๋กฌํํธ๊ฐ ์์ฐจ์ ์ผ๋ก ํฌํจ๋ ๊ฒฝ์ฐ์๋ง ์ ์ฉํฉ๋๋ค. ์บ์๋ ์ฌ์ค์ ํ๋ฆฌํฝ์ค ์บ์๋ก ์ฒ๋ฆฌ๋ฉ๋๋ค. ์ํ์ค์ ์ฝ์ ๋๋ ์์ ์ด ์์ผ๋ฉด ์บ์๋์ง ์์๊ฑฐ๋ ์ผ๋ถ๋ง ํ์๋๋ค๋ ์๋ฏธ์ ๋๋ค.
์๋ ํ์ฅ ๋ฐ GPU
๊ธฐ๋ณธ Cloud Run ์๋ ํ์ฅ์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ Cloud Run์ CPU ์ฌ์ฉ๋ฅ ๋ฐ ์์ฒญ ๋์ ์คํ๊ณผ ๊ฐ์ ์์๋ฅผ ๊ธฐ์ค์ผ๋ก ๊ฐ ๋ฒ์ ์ ์ธ์คํด์ค ์๋ฅผ ์๋์ผ๋ก ํ์ฅํฉ๋๋ค. ํ์ง๋ง Cloud Run์ GPU ์ฌ์ฉ๋ฅ ์ ๊ธฐ์ค์ผ๋ก ์ธ์คํด์ค ์๋ฅผ ์๋์ผ๋ก ํ์ฅํ์ง ์์ต๋๋ค.
GPU๊ฐ ํฌํจ๋ ๋ฒ์ ์ ๊ฒฝ์ฐ ๋ฒ์ ์ ์๋นํ CPU ์ฌ์ฉ๋์ด ์์ผ๋ฉด ์์ฒญ ๋์ ์คํ์ ์ํด Cloud Run์ด ์ํ ํ์ฅ๋ฉ๋๋ค. ์์ฒญ ๋์ ์คํ์ ์ต์ ํํ๋ ค๋ฉด ๋ค์ ์น์ ์ ์ค๋ช ๋ ๋๋ก ์ต์ ์ ์ธ์คํด์ค๋น ์ต๋ ๋์ ์์ฒญ ์๋ฅผ ์ค์ ํด์ผ ํฉ๋๋ค.
์ธ์คํด์ค๋น ์ต๋ ๋์ ์์ฒญ ์
์ธ์คํด์ค๋น ์ต๋ ๋์ ์์ฒญ ์ ์ค์ ์ Cloud Run์ด ๋จ์ผ ์ธ์คํด์ค์ ํ ๋ฒ์ ์ ์กํ๋ ์ต๋ ์์ฒญ ์๋ฅผ ์ ์ดํฉ๋๋ค. ๊ฐ ์ธ์คํด์ค ๋ด๋ถ์ ์ฝ๋๊ฐ ์ฐ์ํ ์ฑ๋ฅ์ผ๋ก ์ฒ๋ฆฌํ ์ ์๋ ์ต๋ ๋์ ์คํ๊ณผ ์ผ์นํ๋๋ก ๋์ ์คํ์ ์กฐ์ ํด์ผ ํฉ๋๋ค.
์ต๋ ๋์ ์คํ ๋ฐ AI ์ํฌ๋ก๋
๊ฐ ์ธ์คํด์ค์ GPU์์ AI ์ถ๋ก ์ํฌ๋ก๋๋ฅผ ์คํํ ๋ ์ฝ๋๊ฐ ์ฐ์ํ ์ฑ๋ฅ์ผ๋ก ์ฒ๋ฆฌํ ์ ์๋ ์ต๋ ๋์ ์คํ์ ํน์ ํ๋ ์์ํฌ ๋ฐ ๊ตฌํ ์ธ๋ถ์ ๋ณด์ ๋ฐ๋ผ ๋ค๋ฆ ๋๋ค. ๋ค์์ ์ต์ ์ ์ต๋ ๋์ ์์ฒญ ์ค์ ์ ์ค์ ํ๋ ๋ฐฉ๋ฒ์ ์ํฅ์ ๋ฏธ์นฉ๋๋ค.
- GPU์ ๋ก๋๋ ๋ชจ๋ธ ์ธ์คํด์ค ์
- ๋ชจ๋ธ๋น ๋ณ๋ ฌ ์ฟผ๋ฆฌ ์
- ์ผ๊ด ์ฒ๋ฆฌ ์ฌ์ฉ
- ํน์ ๋ฐฐ์น ๊ตฌ์ฑ ๋งค๊ฐ๋ณ์
- ๋น GPU ์์ ์ ์
์ต๋ ๋์ ์์ฒญ ์๊ฐ ๋๋ฌด ๋๊ฒ ์ค์ ๋๋ฉด ์์ฒญ์ด GPU์ ์ก์ธ์คํ๊ธฐ ์ํด ์ธ์คํด์ค ๋ด์์ ๋๊ธฐํ๊ฒ ๋์ด ์ง์ฐ ์๊ฐ์ด ๋์ด๋ ์ ์์ต๋๋ค. ์ต๋ ๋์ ์์ฒญ ์๊ฐ ๋๋ฌด ๋ฎ๊ฒ ์ค์ ๋๋ฉด GPU๊ฐ ์ฌ์ฉ๋์ง ์์ Cloud Run์์ ํ์ ์ด์์ผ๋ก ์ธ์คํด์ค๋ฅผ ์ํ ํ์ฅํ ์ ์์ต๋๋ค.
AI ์ํฌ๋ก๋์ ์ต๋ ๋์ ์์ฒญ์ ๊ตฌ์ฑํ๊ธฐ ์ํ ๋๋ต์ ์ธ ๊ท์น์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
(Number of model instances * parallel queries per model) + (number of model instances * ideal batch size)
์๋ฅผ ๋ค์ด ์ธ์คํด์ค๊ฐ GPU์ 3
๋ชจ๋ธ ์ธ์คํด์ค๋ฅผ ๋ก๋ํ๊ณ ๊ฐ ๋ชจ๋ธ ์ธ์คํด์ค๊ฐ 4
๋ณ๋ ฌ ์ฟผ๋ฆฌ๋ฅผ ์ฒ๋ฆฌํ ์ ์๋ค๊ณ ๊ฐ์ ํด ๋ณด๊ฒ ์ต๋๋ค. ๋ํ ์ด์์ ์ธ ๋ฐฐ์น ํฌ๊ธฐ๋ ๊ฐ ๋ชจ๋ธ ์ธ์คํด์ค๊ฐ ์ฒ๋ฆฌํ ์ ์๋ ๋ณ๋ ฌ ์ฟผ๋ฆฌ ์์ธ 4
์
๋๋ค. ๋๋ต์ ์ธ ๊ฐ์ด๋๋ผ์ธ์ ๋ฐ๋ผ ์ต๋ ๋์ ์์ฒญ 24
: (3
* 4
) + (3
* 4
)๋ฅผ ์ค์ ํฉ๋๋ค.
์ด ์์์ ๊ฒฝํ์ ๊ธฐ๋ฐํ ๊ท์น์ผ ๋ฟ์ด๋ผ๋ ์ ์ ์ ์ํ์ญ์์ค. ์ด์์ ์ธ ์ต๋ ๋์ ์์ฒญ ์ค์ ์ ๊ตฌํ์ ์ธ๋ถ์ฌํญ์ ๋ฐ๋ผ ๋ค๋ฆ ๋๋ค. ์ค์ ์ต์ ์ ์ฑ๋ฅ์ ์ป์ผ๋ ค๋ฉด ๋ค์ํ ์ต๋ ๋์ ์์ฒญ ์ค์ ์ผ๋ก ์๋น์ค๋ฅผ ๋ถํ ํ ์คํธํ์ฌ ๊ฐ์ฅ ์ค์ ์ด ์ข์ ์ต์ ์ ํ๊ฐํ๋ ๊ฒ์ด ์ข์ต๋๋ค.
์ฒ๋ฆฌ๋, ์ง์ฐ ์๊ฐ, ๋น์ฉ ์ ์ถฉ
์ต๋ ๋์ ์์ฒญ์ด ์ฒ๋ฆฌ๋, ์ง์ฐ ์๊ฐ, ๋น์ฉ์ ๋ฏธ์น๋ ์ํฅ์ ์ฒ๋ฆฌ๋, ์ง์ฐ ์๊ฐ, ๋น์ฉ ์ ์ถฉ์ ์ฐธ๊ณ ํ์ธ์. GPU๋ฅผ ์ฌ์ฉํ๋ ๋ชจ๋ Cloud Run ์๋น์ค์๋ ์ธ์คํด์ค ๊ธฐ๋ฐ ๊ฒฐ์ ๊ฐ ๊ตฌ์ฑ๋์ด ์์ด์ผ ํฉ๋๋ค.