๊ด๊ณํ ๋ฐ์ดํฐ๋ฒ ์ด์ค์์ BigQuery๋ก ์ง์ ์ํํ๊ฒ ๋ณต์ ํ์ฌ ์ด์ ๋ฐ์ดํฐ์ ๋ํ ์ ์ฉํ ์ ๋ณด๋ฅผ ๊ฑฐ์ ์ค์๊ฐ์ผ๋ก ์ป์ ์ ์์ต๋๋ค.
BigQuery์์ ๊ฑฐ์ ์ค์๊ฐ์ผ๋ก ํต๊ณ๋ฅผ ์ป์ ์ ์๋ ์ง์ฐ ์๊ฐ์ด ์งง์ ๋ณต์
MySQL, PostgreSQL, AlloyDB, SQL Server, Oracle ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ์คํธ๋ฆฌ๋ฐ ๋ฐ์ดํฐ์ ์ก์ธ์ค
๋ฆฌ์์ค๋ฅผ ํ๋ก๋น์ ๋ ๋๋ ๊ด๋ฆฌํ ํ์ ์์ด ์๋์ผ๋ก ํ์ฅ๋๋ ์๋ฒ๋ฆฌ์ค ํ๋ซํผ
๊ธฐ๋ณธ ์ ๊ณต๋๋ ๋ณด์ ์ฐ๊ฒฐ๋ก ELT(์ถ์ถ, ๋ก๋, ๋ณํ) ํ์ดํ๋ผ์ธ์ ์์ฝ๊ฒ ์ค์
์์ฒ ๋ช ์ ๊ณ ๊ฐ์ด ์ด์ ๋ฐ์ดํฐ๋ฅผ BigQuery์ ๋ณต์ ํ๋ ๋ฐ ์ฌ์ฉ
์ด์
์งง์ ์ง์ฐ ์๊ฐ์ผ๋ก ์์ค ์ฑ๋ฅ์ ์ํฅ์ ๋ฏธ์น์ง ์์ผ๋ฉด์ MySQL, PostgreSQL, AlloyDB, SQL Server, Oracle ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๋ฐ์ดํฐ๋ฅผ ์ํํ๊ฒ BigQuery์ ์ง์ ๋ณต์ ํ์ธ์.
๊ด๋ฆฌํ ์ธํ๋ผ ์์ด ์๋์ผ๋ก ํ์ฅ๋๋ ์๋ฒ๋ฆฌ์ค ์ ๊ทผ ๋ฐฉ์์ผ๋ก ์ด์ ์ค๋ฒํค๋๋ฅผ ์ ๊ฑฐํฉ๋๋ค.
๊ฐ์ํ๋ ์ค์ ํ๊ฒฝ์ ํตํด ๋จ ๋ช ๋จ๊ณ๋ง์ผ๋ก ์ด์ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ๋ฐ์ดํฐ๋ฅผ BigQuery๋ก ๋ณต์ ํ ์ ์์ต๋๋ค.
์ฃผ์ ํน์ง
Datastream์ BigQuery์ ๋ณ๊ฒฝ ๋ฐ์ดํฐ ์บก์ฒ(CDC) ๊ธฐ๋ฅ ๋ฐ Storage Write API๋ฅผ ์ฌ์ฉํ์ฌ ์์ค ์์คํ ์์ ์ง์ ๊ฑฐ์ ์ค์๊ฐ์ผ๋ก ์ ๋ฐ์ดํธ๋ฅผ ํจ์จ์ ์ผ๋ก ๋ณต์ ํฉ๋๋ค. ๋ณต์กํ ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ, ์์ฒด ๊ด๋ฆฌํ ์คํ ์ด์ง ํ ์ด๋ธ, ๊น๋ค๋ก์ด ๋ณํฉ ๋ก์ง, ์๋ ๋ฐ์ดํฐ ์ ํ ๋ณํ์ ๊ท์คํ ๋ฆฌ์์ค๋ฅผ ๋ญ๋นํ๋ ๋ณต์ ์๋ฃจ์ ์ด ๋ ์ด์ ํ์ํ์ง ์์ต๋๋ค.
Datastream์ ์ฌ์ฉํ๋ฉด ๋ช ๋จ๊ณ๋ง์ผ๋ก BigQuery๋ก ๋ฐ์ดํฐ ๋ณต์ ๋ฅผ ์์ํ ์ ์์ต๋๋ค. BigQuery์์ ์์ค ๋ฐ์ดํฐ๋ฒ ์ด์ค, ์ฐ๊ฒฐ ์ ํ, ๋์์ ๊ตฌ์ฑํ๊ธฐ๋ง ํ๋ฉด ๋ชจ๋ ์ค๋น๊ฐ ์๋ฃ๋ฉ๋๋ค. BigQuery์ฉ Datastream์ ์ด์ ๋ฐ์ดํฐ๋ฅผ ๋ฐฑํํ๊ณ ์๋ก์ด ๋ณ๊ฒฝ์ฌํญ์ด ๋ฐ์ํ ๋๋ง๋ค ๊ณ์ ๋ณต์ ํฉ๋๋ค.
Datastream์ MySQL, PostgreSQL, AlloyDB, SQL Server, Oracle ๋ฐ์ดํฐ๋ฒ ์ด์ค์์ ๋ชจ๋ ๋ณ๊ฒฝ์ฌํญ(์ฝ์ , ์ ๋ฐ์ดํธ, ์ญ์ )์ ์ฝ๊ณ ์ง์ฐ ์๊ฐ์ ์ต์ํํ๋ฉด์ BigQuery๋ก ์ ์กํฉ๋๋ค. ์์ค ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ Cloud SQL ๋๋ Oracle์ฉ ๋ฒ ์ด๋ฉํ ์๋ฃจ์ ๊ณผ ๊ฐ์ Google Cloud ์๋น์ค, ์จํ๋ ๋ฏธ์ค ๋๋ ํด๋ผ์ฐ๋์ ๋ค๋ฅธ ๋ชจ๋ ์์น์์ ํธ์คํ ํ ์ ์์ต๋๋ค. BigQuery์ฉ์ผ๋ก ํน๋ณํ ๋น๋๋ ์์ด์ ํธ ์๋ Google ๊ธฐ๋ฐ ์๋น์ค๋ก ๋ชจ๋ ์ด๋ฒคํธ๋ฅผ ์์ ์ ์ผ๋ก ์คํธ๋ฆฌ๋ฐํฉ๋๋ค.
์์ค ์คํค๋ง๊ฐ ๋ณ๊ฒฝ๋๋ฉด Datastream์ด ์คํค๋ง ๋๋ฆฌํํธ๋ฅผ ์ํํ๊ฒ ์ฒ๋ฆฌํ๊ณ ์์ค์ ์ถ๊ฐ๋ ์ ์ด๊ณผ ํ ์ด๋ธ์ BigQuery์ ์๋์ผ๋ก ๋ณต์ ํฉ๋๋ค.
Datastream์ ์ ์ก ์ค ๋ฐ์ดํฐ๋ฅผ ๋ณดํธํ๊ธฐ ์ํด ์ฌ๋ฌ ๊ฐ์ง ์์ ํ ๋น๊ณต๊ฐ ์ฐ๊ฒฐ ๋ฐฉ์์ ์ง์ํฉ๋๋ค. ๋ํ ๋ฐ์ดํฐ๊ฐ ์ ์ฅ ์ํ์์ ์ํธํ๋ฉ๋๋ค.
๊ณ ๊ฐ
Datastream์ ํตํด ๋จ์ผ ๋๊ตฌ๋ก ์ด์ ๋ฐ์ดํฐ๋ฅผ BigQuery์ ๊ฑฐ์ ์ค์๊ฐ์ผ๋ก ์ํํ๊ฒ ๋ณต์ ํ ์ ์์ต๋๋ค. Datastream์ ์ฌ์ฉํ๋ฉด ์ด์ ๋ฐ์ดํฐ์ ๋ํ ์ ์ฉํ ์ ๋ณด๋ฅผ ํจ์ฌ ๋ ๋น ๋ฅด๊ฒ ์ป๊ณ ๋ณด๋ค ์์ ์ ์ธ ๋ฐ์ดํฐ ์ ํ์ ์ ๊ณตํ๋ฉฐ ๋น์ฆ๋์ค ์๊ตฌ์ฌํญ์ ๋ณด๋ค ์ ํด๊ฒฐํ ์ ์์ต๋๋ค.
๋ฅด๋ค ๋ธ๊ฐ๋, Falabella ๋ฐ์ดํฐ ์๋ฃจ์ ์ฑ ์์
์ฌ์ฉ ์ฌ๋ก
Datastream์ ์์ค ๋ฐ์ดํฐ๋ฒ ์ด์ค์์ ๋ณ๊ฒฝ ์ด๋ฒคํธ(์ฝ์ , ์ ๋ฐ์ดํธ, ์ญ์ )๋ฅผ ์ฝ๊ณ ๊ฑฐ์ ์ค์๊ฐ์ผ๋ก BigQuery ํ ์ด๋ธ์ ์๋๋ค. ๋ฐ๋ผ์ ์๋งค ๊ตฌ๋งค์ ๊ฐ์ ํธ๋์ญ์ ๋ฐ์ดํฐ๋ก ๊ธฐ์กด BigQuery ๋ฐ์ดํฐ ์จ์ดํ์ฐ์ค ๋ฐ ML ๋ชจ๋ธ์ ๋ณด๊ฐํ์ฌ ๋ฐ์ดํฐ๋ฅผ ๋ณด๋ค ์ ์ฒด์ ์ธ ์๋ ํฌ ์๋ ๊ด์ ์์ ๊ตฌ์ถํ ์ ์์ต๋๋ค. Datastream์ ์ด์ ๋ฐ์ดํฐ๋ฅผ ๋ฐฑํํ๊ณ ์๋ก์ด ๋ณ๊ฒฝ์ฌํญ์ด ๋ฐ์ํ ๋๋ง๋ค ๊ณ์ ๋ณต์ ํ๋ฉฐ ์คํค๋ง ๋ณ๊ฒฝ์ฌํญ์ ์ํํ๊ฒ ์ฒ๋ฆฌํฉ๋๋ค.
์ฃผ์ ์ด์
์ด์ ๋ฐ์ดํฐ๋ฅผ BigQuery๋ก ๋ณต์ ํ๋ ๊ฐ์ฅ ์ฌ์ด ์ต์
์๋์ผ๋ก ํ์ฅ ๋ฐ ์ถ์๋๋ ์๋ฒ๋ฆฌ์ค ์ํคํ ์ฒ
๋ณต์ ํ์ดํ๋ผ์ธ์ ์๋ ํฌ ์๋ ๊ฐ์์ฑ ๋ฐ ๋ชจ๋ํฐ๋ง์ ์ํ ๋จ์ผ ์ธํฐํ์ด์ค
์ ์ฐ์ฑ์ด ํฅ์๋ ๋ง์ถค์ค์ ๊ฐ๋ฅํ ์๋ฃจ์
Google์์ ์ง์ํ๋ ๋ค์ํ ๋์์ ์ฌ์ ๋น๋๋ ํ ํ๋ฆฟ
๋ฐ์ดํฐ ํ์ง ๋ฐ ๋ฐ์ดํฐ ๋ง์คํน๊ณผ ๊ฐ์ ์ถ๊ฐ ๊ธฐ๋ฅ ํตํฉ
ETL ๊ฐ๋ฐ์ ๋ฐ ๋ฐ์ดํฐ ๋ถ์๊ฐ๋ฅผ ์ํ ๊ฐ๋จํ ์ธํฐํ์ด์ค
๋ณต์ ์ ์ ์ฌ์ ๋ฌธ์ ๋ฐ ๊ฒฉ์ฐจ๋ฅผ ์ฌ์ ์ ํ์
๋ณต์ ์ฑ๋ฅ์ ๋ํ ์ค์๊ฐ์ ๊ฐ๊น์ด ํต๊ณ
์ฃผ์ ์ด์
์ด์ ๋ฐ์ดํฐ๋ฅผ BigQuery๋ก ๋ณต์ ํ๋ ๊ฐ์ฅ ์ฌ์ด ์ต์
์๋์ผ๋ก ํ์ฅ ๋ฐ ์ถ์๋๋ ์๋ฒ๋ฆฌ์ค ์ํคํ ์ฒ
๋ณต์ ํ์ดํ๋ผ์ธ์ ์๋ ํฌ ์๋ ๊ฐ์์ฑ ๋ฐ ๋ชจ๋ํฐ๋ง์ ์ํ ๋จ์ผ ์ธํฐํ์ด์ค
์ฃผ์ ์ด์
์ ์ฐ์ฑ์ด ํฅ์๋ ๋ง์ถค์ค์ ๊ฐ๋ฅํ ์๋ฃจ์
Google์์ ์ง์ํ๋ ๋ค์ํ ๋์์ ์ฌ์ ๋น๋๋ ํ ํ๋ฆฟ
๋ฐ์ดํฐ ํ์ง ๋ฐ ๋ฐ์ดํฐ ๋ง์คํน๊ณผ ๊ฐ์ ์ถ๊ฐ ๊ธฐ๋ฅ ํตํฉ
์ฃผ์ ์ด์
ETL ๊ฐ๋ฐ์ ๋ฐ ๋ฐ์ดํฐ ๋ถ์๊ฐ๋ฅผ ์ํ ๊ฐ๋จํ ์ธํฐํ์ด์ค
๋ณต์ ์ ์ ์ฌ์ ๋ฌธ์ ๋ฐ ๊ฒฉ์ฐจ๋ฅผ ์ฌ์ ์ ํ์
๋ณต์ ์ฑ๋ฅ์ ๋ํ ์ค์๊ฐ์ ๊ฐ๊น์ด ํต๊ณ
๊ฐ๊ฒฉ ์ฑ ์
Datastream ๊ฐ๊ฒฉ์ ์ค์ ์ฒ๋ฆฌ๋ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ์ค์ผ๋ก ํฉ๋๋ค. ๋ณผ๋ฅจ ๊ธฐ๋ฐ ๋ฑ๊ธ๋ณ ๊ฐ๊ฒฉ ์ฑ ์ ์ ์ฌ์ฉํ ์ ์์ด ๋๊ท๋ชจ ๋ฐ์ดํฐ๋ฅผ ์ด์ ํ๋ ๊ฒฝ์ฐ์ ๋ ๊ฒฝ์ ์ ์ ๋๋ค. ๊ฐ๊ฒฉ ์ฑ ์ ์ ๊ดํ ์ถ๊ฐ ์ธ๋ถ์ ๋ณด๋ Datastream ๊ฐ๊ฒฉ ์ฑ ์ ํ์ด์ง์์ ํ์ธํ ์ ์์ต๋๋ค.
BigQuery, Cloud Storage, Dataflow์ ๊ฐ์ ์ถ๊ฐ ๋ฆฌ์์ค์ ์๊ธ์ ํด๋น ์๋น์ค์ ๊ฐ๊ฒฉ ์ฑ ์ ์ ๋ฐ๋ผ ์ฒญ๊ตฌ๋ฉ๋๋ค.
$300์ ๋ฌด๋ฃ ํฌ๋ ๋ง๊ณผ 20์ฌ ๊ฐ์ ํญ์ ๋ฌด๋ฃ ์ ํ์ผ๋ก Google Cloud์์ ๋น๋ํ์ธ์.