Google Cloud์์ ๊ฐ๋ฐฉํ ๊ด๋ฆฌํ ์ธํ ๋ฆฌ์ ํธ ๋ฐ์ดํฐ ๋ ์ดํฌํ์ฐ์ค ๋น๋
Google์ ์ ๊ณ ์ต๊ณ ์ AI์ ํตํฉ๋ ๊ณ ์ฑ๋ฅ ๋ฐ์ดํฐ ๋ ์ดํฌํ์ฐ์ค๋ก ๋ฉํฐ๋ชจ๋ฌ ๋ฐ์ดํฐ๋ฅผ ํตํฉํ๊ณ ์ ์ดํ์ธ์. Apache Iceberg์ ์ ๊ณ ์ต์ด์ ์๋ ํ์ฅ ์๋ฒ๋ฆฌ์ค Spark๋ฅผ ์ต๋ํ ํ์ฉํ์ฌ ๋ฐ์ดํฐ ์ฒ๋ฆฌ, ๋ถ์, AI ์ด๋์ ํฐ๋ธ๋ฅผ ๊ฐ์ํํ์ธ์.
๊ฐ๋ฐฉํ ๋ฐ์ดํฐ ํ์์ ์๋ก์ด ํ์ , ์ง๋ฅํ ๋ฐ์ดํฐ-AI ๊ฑฐ๋ฒ๋์ค, ๊ฐ์ํ๋ ๋ฐ์ดํฐ ์ฒ๋ฆฌ, ๊ณ ๊ธ AI ์ง์ ๊ฐ๋ฐ ๋๊ตฌ๊ฐ ๋ชจ๋ ๊ฒฐํฉ๋์ด ๋ฐ์ดํฐ ๊ด๋ฆฌ๋ฅผ ๊ฐ์ํํ๊ณ ํ์ ์ ๊ฐ์ํํฉ๋๋ค.
BigLake
์ํฐํ๋ผ์ด์ฆ๊ธ ์คํ ๋ฆฌ์ง ๊ด๋ฆฌ๋ก Apache Iceberg์ ๊ฐ๋ฐฉ์ฑ์ ํ์ฉํ์ธ์
BigLake๋ Cloud Storage ์ํธ ์ด์ฉ์ฑ์ ์ํ ๊ธฐ๋ณธ Iceberg ์คํ ๋ฆฌ์ง ์์ง์ ์ ๊ณตํ๊ณ , ํตํฉ๋ ๋ฐํ์ ๋ฉํ๋ฐ์ดํฐ ๊ด๋ฆฌ๋ฅผ ์ ๊ณตํ๋ฉฐ, ๊ณ ๊ธ ๋ถ์ ๋ฐ ๋ฐ์ดํฐ ๊ณผํ์ ์ง์ํ๊ณ , ๊ธฐ๋ณธ ์ ๊ณต๋๋ ๊ฑฐ๋ฒ๋์ค๋ฅผ ํตํด ์๋ํ๋ ๋ฐ์ดํฐ ๊ด๋ฆฌ๋ฅผ ์ ๊ณตํฉ๋๋ค. Iceberg ํธํ ์์ง์ด๋ผ๋ฉด BigLake์ ์๋ ํ ์ด๋ธ ๊ด๋ฆฌ๋ฅผ ์ฌ์ฉํ์ฌ ์ฟผ๋ฆฌ ์ฑ๋ฅ์ ๊ฐ์ ํ๊ณ ๋น์ฉ์ ์ ๊ฐํ ์ ์์ต๋๋ค.
โGoogle Cloud์์ ํํธ๋์ญ์ Snap์ ์ฐจ์ธ๋ ๊ฐ๋ฐฉํ ๋ ์ดํฌํ์ฐ์ค๋ฅผ ๊ตฌ์ถํ๊ณ ๊ฐ๋ฐ์ ์ปค๋ฎค๋ํฐ์์ Spark์ Iceberg๋ฅผ ๋ฒ์ฉํํ๋ ์ฌ์ ์์ ์ค์ํ ์ญํ ์ ํ์ต๋๋ค.โ
์ ฑ์ด ๋ฆฌ์ฐ, Snap ์ ์ ๊ด๋ฆฌ์ ๊ฒธ ์ํํธ์จ์ด ์์ง๋์ด
Apache Spark์ฉ Google Cloud ์๋ฒ๋ฆฌ์ค
์๋ฒ๋ฆฌ์ค Spark๋ ํด๋ฌ์คํฐ ๊ด๋ฆฌ๊ฐ ํ์ํ์ง ์์ ๊ณ ์ฑ๋ฅ ๋ฐ ์ด๊ณ ์ ์ฒ๋ฆฌ๋ฅผ ์ ๊ณตํฉ๋๋ค
Apache Spark์ฉ Google Cloud ์๋ฒ๋ฆฌ์ค๋ก ๋ ์ดํฌํ์ฐ์ค๋ฅผ ํ์ ํ์ธ์. ์๋ก์ด Lightning Engine์ ์ฌ์ฉํ๋ฉด ์ด์ ์ค๋ฒํค๋ ์์ด ๋น ๋ฅธ ์์์ ๊ฒฝํํ ์ ์์ผ๋ฉฐ Spark ์ํฌ๋ก๋์ ์ฑ๋ฅ๋ ๊ฐ์ ๋ฉ๋๋ค. Gemini์์ ๊ฐ๋ ฅํ ์กฐํฉ์ ์์ฐ์ฑ์ ๋์ด๊ณ TCO๋ฅผ ์ต๋ 60% ์ ๊ฐํฉ๋๋ค.
โSQL๊ณผ Spark๋ ๋ฐ์ดํฐ์ ์ก์ธ์คํ๊ณ ๋ณํํ๋ ๋ ๊ฐ์ง ์ํธ ๋ณด์์ ์ธ ๋ฐฉ๋ฒ์ ๋๋ค. Spark๋ ํ์ ์์ฅ์ด์ง๋ง ๋น์ฆ๋์ค์ ๋งค์ฐ ์ค์ํ ๋ณต์กํ ๋น์ฆ๋์ค ๋ก์ง์ด ํ์ํ ์ฌ์ฉ ์ฌ๋ก์ ํนํ ์ ์ฉํฉ๋๋ค. ๋ ธํธ๋ถ์์ ๊ฐ๋ฐ ํ๊ฒฝ์ ์ ๊ณตํ๋ SQL, Spark, AI๋ฅผ ์ํ ํตํฉ ํ๋ซํผ์ ์ฌ์ฉํ๋ฉด ์ด๋ฌํ ์ค์ํ ์ฌ์ฉ ์ฌ๋ก๋ฅผ ๋ํญ ๊ฐ์ํํ ์ ์์ต๋๋ค.โ
์๋๋ ์ค ์ํ๋ ํ๋ ์ค, Trivago ์ฝํ ์ธ ์์ง๋์ด๋ง ๋ถ๋ฌธ ์ฑ ์์
Dataplex ๋ฒ์ฉ ์นดํ๋ก๊ทธ
๋ฐ์ดํฐ ๋ ์ดํฌํ์ฐ์ค์ ๋ฐ์ดํฐ ํ์, ์ดํด, ์ ๋ขฐ ๊ฐ์ํ
Dataplex ๋ฒ์ฉ ์นดํ๋ก๊ทธ๋ Google Cloud์ ํตํฉ ๋ฐ์ดํฐ-AI ๊ฑฐ๋ฒ๋์ค ์๋ฃจ์ ์ ๋๋ค. AI ๊ธฐ๋ฐ ์นดํ๋ก๊ทธ๋ Google Cloud ์ ๋ฐ์ ๋น์ฆ๋์ค, ๊ธฐ์ , ์ด์ ๋ฉํ๋ฐ์ดํฐ๋ฅผ ์ค์ ์ง์คํํ๊ณ AI ๊ธฐ๋ฐ ํต๊ณ๋ฅผ ์ ๊ณตํฉ๋๋ค. Apache Iceberg์ ๊ฐ์ ๊ฐ๋ฐฉํ ํ์์ ์ง์ํ์ฌ ์ ์ฒด ๋ ์ดํฌํ์ฐ์ค์ ๋ํ ํตํฉ ๊ฑฐ๋ฒ๋์ค๋ฅผ ์คํํฉ๋๋ค.
โDataplex๋ ๋ฐ์ดํฐ ํ๋ซํผ์ ์์ ํ๊ณ ํจ์จ์ ์ด๋ฉฐ ํ์ฅ ๊ฐ๋ฅํ ๋ฐ์ดํฐ ์ํ๊ณ๋ก ํ์ ํ๋ ๋ฐ ์ค์ํ ์ญํ ์ ํ์ต๋๋ค. ๋ฐ์ดํฐ ๊ฑฐ๋ฒ๋์ค, ํ์, ๋ชจ๋ํฐ๋ง ๊ฐ๋ฅ์ฑ, ๋ณด์ ๊ท์ ์ค์์ ์ค์ ์ ๋๊ณ ๋์งํธ ์๋์ ๋ฐ์ดํฐ ๊ด๋ฆฌ ๊ณผ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ ์ญ๋์ ๊ฐ์ถ๊ณ ์์ต๋๋ค. Dataplex๋ ํ์ด ๋ฐ์ดํฐ์ ์ ์ฌ๋ ฅ์ ์ต๋ํ ํ์ฉํ๊ณ Box.Inc์ ์ง์์ ์ธ ์ฑ์ฅ๊ณผ ํ์ ์ ์ฃผ๋ํ ์ ์๋๋ก ์ง์ํฉ๋๋ค.โ
์์ค๋ฏธํ ์ฟจ์นด๋ฅด๋, Box.Inc ์ ์ ์ ํ ๊ด๋ฆฌ์
BigQuery Studio ๋ฐ IDE ํ์ฅ ํ๋ก๊ทธ๋จ
๊ฐ๋ฐ ๋ฐ ์ด์์ ๊ฐ์ํํ์ฌ ๋ ์ดํฌํ์ฐ์ค ์ํคํ ์ฒ ๋ด ๊ณ ๊ธ ๋ฐ์ดํฐ ๊ณผํ ๋ฐ AI/ML ์ํฌ๋ก๋๋ฅผ ์ํ Apache Spark ๊ฐํ
Dataproc์ GPU ๋๋ผ์ด๋ฒ์ ์ผ๋ฐ์ ์ธ ML ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ ML ๋ฐํ์์ ์๋ก์ด ํ์ ์ผ๋ก ๋ ์ดํฌํ์ฐ์ค์์ AI/ML์ ์ํ Spark๋ฅผ ๋ฐ์ ์ํต๋๋ค. BigQuery Studio์ Colab Enterprise ๋ ธํธ๋ถ๊ณผ ์๋ ํํฐ IDE๋ Vertex AI์ ํตํฉ๋ MLOps ๋ฐ ๊ฐ์ํ๋ ํ๋ก๋์ ํ์ดํ๋ผ์ธ์ ์ ๊ณตํ์ฌ ๋ฐ์ดํฐ ๊ณผํ์ ๊ฐ์ํํฉ๋๋ค.
โShopify๋ ๋ฐ์ดํฐ ๊ณผํ ๋ฐ ์์ง๋์ด๋ง ํธ๋ ๋์ ๋ค์ณ์ง์ง ์๊ธฐ ์ํด ๋ค๋ฐฉ๋ฉด์ ๊ธฐ์ ์ ๋ณด์ ํ ํ์ ๊ตฌ์ฑํ๋ ๋ฐ ํฌ์ํ์ต๋๋ค. BigQuery Studio๋ฅผ ์ด๊ธฐ ํ ์คํธํ ๋ ๊ฐ์ํ๋ ํ๊ฒฝ์์ ๋ค์ํ ์ฌ์ฉ์๋ฅผ ์ํ ๋ค์ฑ๋ก์ด ๋๊ตฌ๋ฅผ ์ฐ๊ฒฐํ๋ Google์ ๊ธฐ๋ฅ์ด ๋ง์กฑ์ค๋ฌ์ ์ต๋๋ค. BigQuery์ ๊ธฐ๋ํ๋ ํ์ฅ์ฑ์ ์ ํดํ๋ ์ผ ์์ด ํ ์ ๋ฐ์์ ์ฅ์ ์์๋ฅผ ์ค์ผ ์ ์๋ ๊ธฐํ๊ฐ ๋ ๊ฒ์ ๋๋ค.โ
์ญ ๋ก๋ฒ์ธ , Shopify ๋ฐ์ดํฐ ์์ง๋์ด๋ง ๊ด๋ฆฌ์
BigLake
์ํฐํ๋ผ์ด์ฆ๊ธ ์คํ ๋ฆฌ์ง ๊ด๋ฆฌ๋ก Apache Iceberg์ ๊ฐ๋ฐฉ์ฑ์ ํ์ฉํ์ธ์
BigLake๋ Cloud Storage ์ํธ ์ด์ฉ์ฑ์ ์ํ ๊ธฐ๋ณธ Iceberg ์คํ ๋ฆฌ์ง ์์ง์ ์ ๊ณตํ๊ณ , ํตํฉ๋ ๋ฐํ์ ๋ฉํ๋ฐ์ดํฐ ๊ด๋ฆฌ๋ฅผ ์ ๊ณตํ๋ฉฐ, ๊ณ ๊ธ ๋ถ์ ๋ฐ ๋ฐ์ดํฐ ๊ณผํ์ ์ง์ํ๊ณ , ๊ธฐ๋ณธ ์ ๊ณต๋๋ ๊ฑฐ๋ฒ๋์ค๋ฅผ ํตํด ์๋ํ๋ ๋ฐ์ดํฐ ๊ด๋ฆฌ๋ฅผ ์ ๊ณตํฉ๋๋ค. Iceberg ํธํ ์์ง์ด๋ผ๋ฉด BigLake์ ์๋ ํ ์ด๋ธ ๊ด๋ฆฌ๋ฅผ ์ฌ์ฉํ์ฌ ์ฟผ๋ฆฌ ์ฑ๋ฅ์ ๊ฐ์ ํ๊ณ ๋น์ฉ์ ์ ๊ฐํ ์ ์์ต๋๋ค.
โGoogle Cloud์์ ํํธ๋์ญ์ Snap์ ์ฐจ์ธ๋ ๊ฐ๋ฐฉํ ๋ ์ดํฌํ์ฐ์ค๋ฅผ ๊ตฌ์ถํ๊ณ ๊ฐ๋ฐ์ ์ปค๋ฎค๋ํฐ์์ Spark์ Iceberg๋ฅผ ๋ฒ์ฉํํ๋ ์ฌ์ ์์ ์ค์ํ ์ญํ ์ ํ์ต๋๋ค.โ
์ ฑ์ด ๋ฆฌ์ฐ, Snap ์ ์ ๊ด๋ฆฌ์ ๊ฒธ ์ํํธ์จ์ด ์์ง๋์ด
Apache Spark์ฉ Google Cloud ์๋ฒ๋ฆฌ์ค
์๋ฒ๋ฆฌ์ค Spark๋ ํด๋ฌ์คํฐ ๊ด๋ฆฌ๊ฐ ํ์ํ์ง ์์ ๊ณ ์ฑ๋ฅ ๋ฐ ์ด๊ณ ์ ์ฒ๋ฆฌ๋ฅผ ์ ๊ณตํฉ๋๋ค
Apache Spark์ฉ Google Cloud ์๋ฒ๋ฆฌ์ค๋ก ๋ ์ดํฌํ์ฐ์ค๋ฅผ ํ์ ํ์ธ์. ์๋ก์ด Lightning Engine์ ์ฌ์ฉํ๋ฉด ์ด์ ์ค๋ฒํค๋ ์์ด ๋น ๋ฅธ ์์์ ๊ฒฝํํ ์ ์์ผ๋ฉฐ Spark ์ํฌ๋ก๋์ ์ฑ๋ฅ๋ ๊ฐ์ ๋ฉ๋๋ค. Gemini์์ ๊ฐ๋ ฅํ ์กฐํฉ์ ์์ฐ์ฑ์ ๋์ด๊ณ TCO๋ฅผ ์ต๋ 60% ์ ๊ฐํฉ๋๋ค.
โSQL๊ณผ Spark๋ ๋ฐ์ดํฐ์ ์ก์ธ์คํ๊ณ ๋ณํํ๋ ๋ ๊ฐ์ง ์ํธ ๋ณด์์ ์ธ ๋ฐฉ๋ฒ์ ๋๋ค. Spark๋ ํ์ ์์ฅ์ด์ง๋ง ๋น์ฆ๋์ค์ ๋งค์ฐ ์ค์ํ ๋ณต์กํ ๋น์ฆ๋์ค ๋ก์ง์ด ํ์ํ ์ฌ์ฉ ์ฌ๋ก์ ํนํ ์ ์ฉํฉ๋๋ค. ๋ ธํธ๋ถ์์ ๊ฐ๋ฐ ํ๊ฒฝ์ ์ ๊ณตํ๋ SQL, Spark, AI๋ฅผ ์ํ ํตํฉ ํ๋ซํผ์ ์ฌ์ฉํ๋ฉด ์ด๋ฌํ ์ค์ํ ์ฌ์ฉ ์ฌ๋ก๋ฅผ ๋ํญ ๊ฐ์ํํ ์ ์์ต๋๋ค.โ
์๋๋ ์ค ์ํ๋ ํ๋ ์ค, Trivago ์ฝํ ์ธ ์์ง๋์ด๋ง ๋ถ๋ฌธ ์ฑ ์์
Dataplex ๋ฒ์ฉ ์นดํ๋ก๊ทธ
๋ฐ์ดํฐ ๋ ์ดํฌํ์ฐ์ค์ ๋ฐ์ดํฐ ํ์, ์ดํด, ์ ๋ขฐ ๊ฐ์ํ
Dataplex ๋ฒ์ฉ ์นดํ๋ก๊ทธ๋ Google Cloud์ ํตํฉ ๋ฐ์ดํฐ-AI ๊ฑฐ๋ฒ๋์ค ์๋ฃจ์ ์ ๋๋ค. AI ๊ธฐ๋ฐ ์นดํ๋ก๊ทธ๋ Google Cloud ์ ๋ฐ์ ๋น์ฆ๋์ค, ๊ธฐ์ , ์ด์ ๋ฉํ๋ฐ์ดํฐ๋ฅผ ์ค์ ์ง์คํํ๊ณ AI ๊ธฐ๋ฐ ํต๊ณ๋ฅผ ์ ๊ณตํฉ๋๋ค. Apache Iceberg์ ๊ฐ์ ๊ฐ๋ฐฉํ ํ์์ ์ง์ํ์ฌ ์ ์ฒด ๋ ์ดํฌํ์ฐ์ค์ ๋ํ ํตํฉ ๊ฑฐ๋ฒ๋์ค๋ฅผ ์คํํฉ๋๋ค.
โDataplex๋ ๋ฐ์ดํฐ ํ๋ซํผ์ ์์ ํ๊ณ ํจ์จ์ ์ด๋ฉฐ ํ์ฅ ๊ฐ๋ฅํ ๋ฐ์ดํฐ ์ํ๊ณ๋ก ํ์ ํ๋ ๋ฐ ์ค์ํ ์ญํ ์ ํ์ต๋๋ค. ๋ฐ์ดํฐ ๊ฑฐ๋ฒ๋์ค, ํ์, ๋ชจ๋ํฐ๋ง ๊ฐ๋ฅ์ฑ, ๋ณด์ ๊ท์ ์ค์์ ์ค์ ์ ๋๊ณ ๋์งํธ ์๋์ ๋ฐ์ดํฐ ๊ด๋ฆฌ ๊ณผ์ ๋ฅผ ํด๊ฒฐํ ์ ์๋ ์ญ๋์ ๊ฐ์ถ๊ณ ์์ต๋๋ค. Dataplex๋ ํ์ด ๋ฐ์ดํฐ์ ์ ์ฌ๋ ฅ์ ์ต๋ํ ํ์ฉํ๊ณ Box.Inc์ ์ง์์ ์ธ ์ฑ์ฅ๊ณผ ํ์ ์ ์ฃผ๋ํ ์ ์๋๋ก ์ง์ํฉ๋๋ค.โ
์์ค๋ฏธํ ์ฟจ์นด๋ฅด๋, Box.Inc ์ ์ ์ ํ ๊ด๋ฆฌ์
BigQuery Studio ๋ฐ IDE ํ์ฅ ํ๋ก๊ทธ๋จ
๊ฐ๋ฐ ๋ฐ ์ด์์ ๊ฐ์ํํ์ฌ ๋ ์ดํฌํ์ฐ์ค ์ํคํ ์ฒ ๋ด ๊ณ ๊ธ ๋ฐ์ดํฐ ๊ณผํ ๋ฐ AI/ML ์ํฌ๋ก๋๋ฅผ ์ํ Apache Spark ๊ฐํ
Dataproc์ GPU ๋๋ผ์ด๋ฒ์ ์ผ๋ฐ์ ์ธ ML ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํ ML ๋ฐํ์์ ์๋ก์ด ํ์ ์ผ๋ก ๋ ์ดํฌํ์ฐ์ค์์ AI/ML์ ์ํ Spark๋ฅผ ๋ฐ์ ์ํต๋๋ค. BigQuery Studio์ Colab Enterprise ๋ ธํธ๋ถ๊ณผ ์๋ ํํฐ IDE๋ Vertex AI์ ํตํฉ๋ MLOps ๋ฐ ๊ฐ์ํ๋ ํ๋ก๋์ ํ์ดํ๋ผ์ธ์ ์ ๊ณตํ์ฌ ๋ฐ์ดํฐ ๊ณผํ์ ๊ฐ์ํํฉ๋๋ค.
โShopify๋ ๋ฐ์ดํฐ ๊ณผํ ๋ฐ ์์ง๋์ด๋ง ํธ๋ ๋์ ๋ค์ณ์ง์ง ์๊ธฐ ์ํด ๋ค๋ฐฉ๋ฉด์ ๊ธฐ์ ์ ๋ณด์ ํ ํ์ ๊ตฌ์ฑํ๋ ๋ฐ ํฌ์ํ์ต๋๋ค. BigQuery Studio๋ฅผ ์ด๊ธฐ ํ ์คํธํ ๋ ๊ฐ์ํ๋ ํ๊ฒฝ์์ ๋ค์ํ ์ฌ์ฉ์๋ฅผ ์ํ ๋ค์ฑ๋ก์ด ๋๊ตฌ๋ฅผ ์ฐ๊ฒฐํ๋ Google์ ๊ธฐ๋ฅ์ด ๋ง์กฑ์ค๋ฌ์ ์ต๋๋ค. BigQuery์ ๊ธฐ๋ํ๋ ํ์ฅ์ฑ์ ์ ํดํ๋ ์ผ ์์ด ํ ์ ๋ฐ์์ ์ฅ์ ์์๋ฅผ ์ค์ผ ์ ์๋ ๊ธฐํ๊ฐ ๋ ๊ฒ์ ๋๋ค.โ
์ญ ๋ก๋ฒ์ธ , Shopify ๋ฐ์ดํฐ ์์ง๋์ด๋ง ๊ด๋ฆฌ์
์ ๋ฌธ ๊ธธ์ด: 10๋ถ
์ ๋ฌธ ๊ธธ์ด: 10๋ถ
์ ๋ฌธ ๊ธธ์ด: 10๋ถ
์ ๋ฌธ ๊ธธ์ด: 15๋ถ
10๋ถ
์ ๋ฌธ ๊ธธ์ด: 15๋ถ