BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ์ฌ์ฉํ ๋ถ์
์ด ๋ฌธ์์์๋ ๋ฐ์ดํฐ ๋ถ์์ ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ์ ์ค๋ช ํฉ๋๋ค. Dataplex๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฉํ๋ฐ์ดํฐ๋ฅผ ๊ด๋ฆฌํ ์๋ ์์ต๋๋ค.
BigQuery์ Gemini ๊ธฐ๋ฅ์ธ BigQuery Studio ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ์ฌ์ฉํ๋ฉด ์์ฐ์ด ํ๋กฌํํธ์ ๋ถ์ ์ํฌํ๋ก์ฉ ๊ทธ๋ํฝ ์ธํฐํ์ด์ค๋ฅผ ํตํด ๋ฐ์ดํฐ๋ฅผ ์ฐพ๊ณ , ๋ณํํ๊ณ , ์ฟผ๋ฆฌํ๊ณ , ์๊ฐํํ ์ ์์ต๋๋ค.
๋ถ์ ์ํฌํ๋ก์ ๊ฒฝ์ฐ BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ ์ํฌํ๋ก์ ๊ทธ๋ํฝ ๋ทฐ๋ฅผ ์ ๊ณตํ๋ ๋ฐฉํฅ์ฑ ๋น์ํ ๊ทธ๋ํ(DAG)๋ฅผ ์ฌ์ฉํฉ๋๋ค. BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค์์๋ ์ฟผ๋ฆฌ ๊ฒฐ๊ณผ๋ฅผ ๋ฐ๋ณตํ๊ณ ํ ๊ณณ์์ ์ฌ๋ฌ ๋ฌธ์ ๋ธ๋์น๋ก ์์ ํ ์ ์์ต๋๋ค.
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ ๋ถ์ ์์ ์ ๊ฐ์ํํ๊ณ ๋ฐ์ดํฐ ๋ถ์๊ฐ, ๋ฐ์ดํฐ ์์ง๋์ด ๋ฑ์ ๋ฐ์ดํฐ ์ ๋ฌธ๊ฐ๊ฐ ๋ฐ์ดํฐ์์ ์ ์ฉํ ์ ๋ณด๋ก ์ด๋ํ๋ ์ฌ์ ์ ์ง์ํ๋๋ก ์ค๊ณ๋์์ต๋๋ค. ํน์ ๋๊ตฌ์ ๋ํ ๊ธฐ์ ์ ์ง์์ด ์์ด๋ ๋๋ฉฐ SQL ์ฝ๊ธฐ ๋ฐ ์ฐ๊ธฐ์ ๋ํ ๊ธฐ๋ณธ์ ์ธ ์ง์๋ง ์์ผ๋ฉด ๋ฉ๋๋ค. BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ Dataplex ๋ฉํ๋ฐ์ดํฐ์ ํจ๊ป ์๋ํ์ฌ ์์ฐ์ด๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ ์ ํ ํ ์ด๋ธ์ ์๋ณํฉ๋๋ค.
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ ๋น์ฆ๋์ค ์ฌ์ฉ์๊ฐ ์ง์ ์ฌ์ฉํ๋ ์ฉ๋๊ฐ ์๋๋๋ค.
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ BigQuery์ Gemini๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์ฐพ๊ณ , SQL์ ๋ง๋ค๊ณ , ์ฐจํธ๋ฅผ ์์ฑํ๊ณ , ๋ฐ์ดํฐ ์์ฝ์ ๋ง๋ญ๋๋ค.
Google Cloud ์ฉ Gemini์์ ์ฌ์ฉ์์ ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํ๋ ๋ฐฉ๋ฒ๊ณผ ์์ ์ ์์๋ณด์ธ์.
๊ธฐ๋ฅ
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ์ฌ์ฉํ๋ฉด ๋ค์ ์์ ์ ํ ์ ์์ต๋๋ค.
Dataplex ๋ฉํ๋ฐ์ดํฐ์ ํจ๊ป ์์ฐ์ด ์ฟผ๋ฆฌ ๋๋ ํค์๋ ๊ฒ์ ๊ตฌ๋ฌธ์ ์ฌ์ฉํ์ฌ ํ ์ด๋ธ, ๋ทฐ ๋๋ ๊ตฌ์ฒดํ๋ ๋ทฐ์ ๊ฐ์ ์ ์ ์ ์ฐพ์ต๋๋ค.
๋ค์๊ณผ ๊ฐ์ ๊ธฐ๋ณธ SQL ์ฟผ๋ฆฌ์ ์์ฐ์ด๋ฅผ ์ฌ์ฉํฉ๋๋ค.
FROM
์ , ์ํ ํจ์, ๋ฐฐ์ด, ๊ตฌ์กฐ์ฒด๊ฐ ํฌํจ๋ ์ฟผ๋ฆฌ- ๋ ํ
์ด๋ธ์
JOIN
์์
๋ค์ ๊ทธ๋ํฝ ์ ํ์ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์๊ฐํํฉ๋๋ค.
- ๋ง๋ ์ฐจํธ
- ํํธ๋งต
- ์ ๊ทธ๋ํ
- ์ํ ์ฐจํธ
- ๋ถ์ฐํ ์ฐจํธ
์ํ๋ ๋ด์ฉ์ ์์ฐ์ด๋ก ์ค๋ช ํ์ฌ ์ปค์คํ ์๊ฐํ๋ฅผ ๋ง๋ญ๋๋ค.
๋ฐ์ดํฐ ํต๊ณ ์๋ํ
์ ํ์ฌํญ
๋ค์๊ณผ ๊ฐ์ ๊ฒฝ์ฐ์๋ ์์ฐ์ด ๋ช ๋ น์ด ์ ๋๋ก ์๋ํ์ง ์์ ์ ์์ต๋๋ค.
- BigQuery ML
- Apache Spark
- ๊ฐ์ฒด ํ ์ด๋ธ
- BigLake
- ์กฐํ์
INFORMATION_SCHEMA
ํ - JSON
- ์ค์ฒฉ๋๊ณ ๋ฐ๋ณต๋๋ ํ๋
- ๋ณต์กํ ํจ์ ๋ฐ ๋ฐ์ดํฐ ์ ํ(์:
DATETIME
๋ฐTIMEZONE
)
๋ฐ์ดํฐ ์๊ฐํ๋ Geomap ์ฐจํธ์์ ์๋ํ์ง ์์ต๋๋ค.
ํ๋กฌํํธ ๊ถ์ฅ์ฌํญ
์ ์ ํ ํ๋กฌํํธ ๊ธฐ๋ฒ์ ์ฌ์ฉํ๋ฉด ๋ณต์กํ SQL ์ฟผ๋ฆฌ๋ฅผ ์์ฑํ ์ ์์ต๋๋ค. ๋ค์ ์ ์์ BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค์์ ์์ฐ์ด ํ๋กฌํํธ๋ฅผ ๋ฏธ์ธ ์กฐ์ ํ์ฌ ์ฟผ๋ฆฌ์ ์ ํ์ฑ์ ๋์ด๋ ๋ฐ ๋์์ด ๋ฉ๋๋ค.
๋ช ํํ๊ฒ ์์ฑํฉ๋๋ค. ์์ฒญ์ ๋ช ํํ๊ฒ ์์ ํ๊ณ ๋ชจํธํ๊ฒ ํํํ์ง ๋ง์ธ์.
์ง์ ์ ์ผ๋ก ์ง๋ฌธํ์ธ์. ๊ฐ์ฅ ์ ํํ ๋ต๋ณ์ ์ป์ผ๋ ค๋ฉด ํ ๋ฒ์ ํ๋์ ์ง๋ฌธ์ ํ๊ณ ํ๋กฌํํธ๋ ๊ฐ๊ฒฐํ๊ฒ ์ ์งํ์ธ์. ํ์ํ ๊ฒฝ์ฐ BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค์์ ํ๋กฌํํธ๋ฅผ ์ฌ๋ฌ ๋ ธ๋๋ก ๊ตฌ๋ถํฉ๋๋ค.
์ค์ ์ ์ผ๋ก ๋ช ํํ ์ง์นจ์ ์ฃผ์ธ์. ํ๋กฌํํธ์์ ์ฃผ์ ์ฉ์ด๋ฅผ ๊ฐ์กฐํฉ๋๋ค.
์์ ์์๋ฅผ ์ง์ ํฉ๋๋ค. ๋ช ํํ๊ณ ์ฒด๊ณ์ ์ธ ๋ฐฉ์์ผ๋ก ์ง์นจ์ ์ ๊ณตํฉ๋๋ค. ์์ ์ ์ง์ค์ ์ผ๋ก ์ํํ ์ ์๋ ์์ ๋จ๊ณ๋ก ๋๋๋๋ค.
์์ ํ๊ณ ๋ฐ๋ณตํ์ธ์. ๋ค์ํ ๋ฌธ๊ตฌ์ ์ ๊ทผ ๋ฐฉ์์ ์๋ํ์ฌ ๊ฐ์ฅ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ์ป๋ ๋ฐฉ๋ฒ์ ์์๋ณด์ธ์.
์์ธํ ๋ด์ฉ์ BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค ํ๋กฌํํธ ๊ถ์ฅ์ฌํญ์ ์ฐธ์กฐํ์ธ์.
์์ํ๊ธฐ ์ ์
- BigQuery์ Gemini๊ฐ Google Cloud ํ๋ก์ ํธ์ ์ฌ์ฉ ์ค์ ๋์ด ์๋์ง ํ์ธํฉ๋๋ค. ์ผ๋ฐ์ ์ผ๋ก ๊ด๋ฆฌ์๊ฐ ์ด ๋จ๊ณ๋ฅผ ์คํํฉ๋๋ค.
- BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ์ฌ์ฉํ๊ธฐ ์ํ ํ์ํ Identity and Access Management(IAM) ๊ถํ์ด ์๋์ง ํ์ธํฉ๋๋ค.
- Dataplex์์ ๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฉํ๋ฐ์ดํฐ๋ฅผ ๊ด๋ฆฌํ๋ ค๋ฉด Google Cloud ํ๋ก์ ํธ์์ Dataplex API๊ฐ ์ฌ์ฉ ์ค์ ๋์ด ์๋์ง ํ์ธํฉ๋๋ค.
ํ์ํ ์ญํ
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ์ฌ์ฉํ๋ ๋ฐ ํ์ํ ๊ถํ์ ์ป์ผ๋ ค๋ฉด ๊ด๋ฆฌ์์๊ฒ ํ๋ก์ ํธ์ ๋ํ ๋ค์ IAM ์ญํ ์ ๋ถ์ฌํด ๋ฌ๋ผ๊ณ ์์ฒญํ์ธ์.
-
BigQuery Studio ์ฌ์ฉ์(
roles/bigquery.studioUser
) -
Google Cloud๋ฅผ ์ํ Gemini ์ฌ์ฉ์(
roles/cloudaicompanion.user
)
์ญํ ๋ถ์ฌ์ ๋ํ ์์ธํ ๋ด์ฉ์ ํ๋ก์ ํธ, ํด๋, ์กฐ์ง์ ๋ํ ์ก์ธ์ค ๊ด๋ฆฌ๋ฅผ ์ฐธ์กฐํ์ธ์.
์ปค์คํ ์ญํ ์ด๋ ๋ค๋ฅธ ์ฌ์ ์ ์๋ ์ญํ ์ ํตํด ํ์ํ ๊ถํ์ ์ป์ ์๋ ์์ต๋๋ค.
BigQuery์์ IAM ์ญํ ๋ฐ ๊ถํ์ ๋ํ ์์ธํ ๋ด์ฉ์ IAM ์๊ฐ๋ฅผ ์ฐธ์กฐํ์ธ์.
Dataplex์์ ๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฉํ๋ฐ์ดํฐ๋ฅผ ๊ด๋ฆฌํ๋ ค๋ฉด ํ์ํ Dataplex ์ญํ ๊ณผ dataform.repository.get
๊ถํ์ด ์๋์ง ํ์ธํฉ๋๋ค.
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค ์ฌ์ฉ
Google Cloud ์ฝ์, ์ฟผ๋ฆฌ ๋๋ ํ ์ด๋ธ์์ BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ์ฌ์ฉํ ์ ์์ต๋๋ค.
BigQuery ํ์ด์ง๋ก ์ด๋ํฉ๋๋ค.
์ฟผ๋ฆฌ ํธ์ง๊ธฐ์์
SQL ์ฟผ๋ฆฌ ์์ ์๋ ์๋ก ๋ง๋ค๊ธฐ๋ฅผ ํด๋ฆญํ ๋ค์ ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ํด๋ฆญํฉ๋๋ค.์์ฐ์ด ํ๋กฌํํธ ํ๋์ ์์ฐ์ด ํ๋กฌํํธ๋ฅผ ์ ๋ ฅํฉ๋๋ค.
์๋ฅผ ๋ค์ด
Find me tables related to trees
๋ฅผ ์ ๋ ฅํ๋ฉด BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋bigquery-public-data.usfs_fia.plot_tree
๋๋bigquery-public-data.new_york_trees.tree_species
์ ๊ฐ์ ๊ณต๊ฐ ๋ฐ์ดํฐ ์ธํธ๋ฅผ ํฌํจํ์ฌ ๊ฐ๋ฅํ ํ ์ด๋ธ ๋ชฉ๋ก์ ๋ฐํํฉ๋๋ค.ํ ์ด๋ธ์ ์ ํํ์ธ์.
์ ํํ ํ ์ด๋ธ์ ํ ์ด๋ธ ๋ ธ๋๊ฐ BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์ถ๊ฐ๋ฉ๋๋ค. ์คํค๋ง ์ ๋ณด๋ฅผ ๋ณด๊ฑฐ๋ ํ ์ด๋ธ ์ธ๋ถ์ ๋ณด๋ฅผ ๋ณด๊ฑฐ๋ ๋ฐ์ดํฐ๋ฅผ ๋ฏธ๋ฆฌ ๋ณด๋ ค๋ฉด ํ ์ด๋ธ ๋ ธ๋์์ ๋ค์ํ ํญ์ ์ ํํ์ธ์.
์์ ์ํฌํ๋ก ์ฌ์ฉํด ๋ณด๊ธฐ
์ด ์น์ ์์๋ ๋ถ์ ์ํฌํ๋ก์์ BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ์ฌ์ฉํ๋ ๋ค์ํ ๋ฐฉ๋ฒ์ ๋ณด์ฌ์ค๋๋ค.
์ํฌํ๋ก ์์: ๋ฐ์ดํฐ ์ฐพ๊ธฐ, ์ฟผ๋ฆฌ, ์๊ฐํ
์ด ์์์์๋ BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์์ฐ์ด ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์ฐพ๊ณ , ์ฟผ๋ฆฌ๋ฅผ ์์ฑํ๊ณ , ์ฟผ๋ฆฌ๋ฅผ ์์ ํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ ์ฐจํธ๋ฅผ ๋ง๋ญ๋๋ค.
ํ๋กฌํํธ 1: ๋ฐ์ดํฐ ์ฐพ๊ธฐ
Google Cloud ์ฝ์์์ BigQuery ํ์ด์ง๋ก ์ด๋ํฉ๋๋ค.
์ฟผ๋ฆฌ ํธ์ง๊ธฐ์์
SQL ์ฟผ๋ฆฌ ์์ ์๋ ์๋ก ๋ง๋ค๊ธฐ๋ฅผ ํด๋ฆญํ ๋ค์ ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ํด๋ฆญํฉ๋๋ค.์์ฐ์ด ํ๋กฌํํธ ํ๋์ ๋ค์ ์์ฐ์ด ํ๋กฌํํธ๋ฅผ ์ ๋ ฅํฉ๋๋ค.
Chicago taxi trips
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ Dataplex ๋ฉํ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๊ฐ๋ฅํ ํ ์ด๋ธ ๋ชฉ๋ก์ ์์ฑํฉ๋๋ค. ์ฌ๋ฌ ํ ์ด๋ธ์ ์ ํํ ์ ์์ต๋๋ค.
bigquery-public-data.chicago_taxi_trips.taxi_trips
ํ ์ด๋ธ์ ์ ํํ ๋ค์ ์บ๋ฒ์ค์ ์ถ๊ฐ๋ฅผ ํด๋ฆญํฉ๋๋ค.taxi_trips
์ ํ ์ด๋ธ ๋ ธ๋๊ฐ BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์ถ๊ฐ๋ฉ๋๋ค. ์คํค๋ง ์ ๋ณด๋ฅผ ๋ณด๊ฑฐ๋ ํ ์ด๋ธ ์ธ๋ถ์ ๋ณด๋ฅผ ๋ณด๊ฑฐ๋ ๋ฐ์ดํฐ๋ฅผ ๋ฏธ๋ฆฌ ๋ณด๋ ค๋ฉด ํ ์ด๋ธ ๋ ธ๋์์ ๋ค์ํ ํญ์ ์ ํํ์ธ์.
ํ๋กฌํํธ 2: ์ ํํ ํ ์ด๋ธ์์ SQL ์ฟผ๋ฆฌ ์์ฑ
bigquery-public-data.chicago_taxi_trips.taxi_trips
ํ
์ด๋ธ์ SQL ์ฟผ๋ฆฌ๋ฅผ ์์ฑํ๋ ค๋ฉด ๋ค์์ ์ํํฉ๋๋ค.
๋ฐ์ดํฐ ์บ๋ฒ์ค์์ ์ฟผ๋ฆฌ๋ฅผ ํด๋ฆญํฉ๋๋ค.
์์ฐ์ด ํ๋กฌํํธ ํ๋์ ๋ค์์ ์ ๋ ฅํฉ๋๋ค.
Get me the 100 longest trips
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ ๋ค์๊ณผ ์ ์ฌํ SQL ์ฟผ๋ฆฌ๋ฅผ ์์ฑํฉ๋๋ค.
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `bigquery-public-data.chicago_taxi_trips.taxi_trips` ORDER BY trip_miles DESC LIMIT 100;
ํ๋กฌํํธ 3: ์ฟผ๋ฆฌ ์์
์์ฑํ ์ฟผ๋ฆฌ๋ฅผ ์์ ํ๋ ค๋ฉด ์ฟผ๋ฆฌ๋ฅผ ์๋์ผ๋ก ์์ ํ๊ฑฐ๋ ์์ฐ์ด ํ๋กฌํํธ๋ฅผ ๋ณ๊ฒฝํ๊ณ ์ฟผ๋ฆฌ๋ฅผ ๋ค์ ์์ฑํ๋ฉด ๋ฉ๋๋ค. ์ด ์์์์๋ ์์ฐ์ด ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํ์ฌ ๊ณ ๊ฐ์ด ํ๊ธ์ผ๋ก ๊ฒฐ์ ํ ์ด๋๋ง ์ ํํ๋๋ก ์ฟผ๋ฆฌ๋ฅผ ์์ ํฉ๋๋ค.
์์ฐ์ด ํ๋กฌํํธ ํ๋์ ๋ค์์ ์ ๋ ฅํฉ๋๋ค.
Get me the 100 longest trips where the payment type is cash
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ ๋ค์๊ณผ ์ ์ฌํ SQL ์ฟผ๋ฆฌ๋ฅผ ์์ฑํฉ๋๋ค.
SELECT taxi_id, trip_start_timestamp, trip_end_timestamp, trip_miles FROM `PROJECT_ID.chicago_taxi_trips_123123.taxi_trips` WHERE payment_type = 'Cash' ORDER BY trip_miles DESC LIMIT 100;
์ ์์์์
PROJECT_ID
๋ Google Cloud ํ๋ก์ ํธ์ ID์ ๋๋ค.์ฟผ๋ฆฌ ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ ค๋ฉด ์คํ์ ํด๋ฆญํฉ๋๋ค.
์ฐจํธ ๋ง๋ค๊ธฐ
- ๋ฐ์ดํฐ ์บ๋ฒ์ค์์ ์๊ฐํ๋ฅผ ํด๋ฆญํฉ๋๋ค.
๋ง๋ ๊ทธ๋ํ ๋ง๋ค๊ธฐ๋ฅผ ํด๋ฆญํฉ๋๋ค.
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ ์ด๋ ID๋ณ๋ก ๊ฐ์ฅ ๋ง์ ์ด๋ ๊ฑฐ๋ฆฌ๋ฅผ ๋ณด์ฌ์ฃผ๋ ๋ง๋ ๊ทธ๋ํ๋ฅผ ๋ง๋ญ๋๋ค. BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ ์ฐจํธ๋ฅผ ์ ๊ณตํ๋ ๊ฒ ์ธ์๋ ์๊ฐํ๋ฅผ ๋ท๋ฐ์นจํ๋ ๋ฐ์ดํฐ์ ์ผ๋ถ ์ฃผ์ ์ธ๋ถ์ ๋ณด๋ฅผ ์์ฝํฉ๋๋ค.
์ ํ์ฌํญ: ๋ค์ ์ค ํ๋ ์ด์์ ์ํํฉ๋๋ค.
- ์ฐจํธ๋ฅผ ์์ ํ๋ ค๋ฉด ์์ ์ ํด๋ฆญํ ๋ค์ ์๊ฐํ ์์ ์ฐฝ์์ ์ฐจํธ๋ฅผ ์์ ํฉ๋๋ค.
- ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ๊ณต์ ํ๋ ค๋ฉด ๊ณต์ ๋ฅผ ํด๋ฆญํ ๋ค์ ๋งํฌ ๊ณต์ ๋ฅผ ํด๋ฆญํ์ฌ BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค ๋งํฌ๋ฅผ ๋ณต์ฌํฉ๋๋ค.
- ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ์ ๋ฆฌํ๋ ค๋ฉด ์์ ๋๋ณด๊ธฐ๋ฅผ ์ ํํ ๋ค์ ์บ๋ฒ์ค ์ง์ฐ๊ธฐ๋ฅผ ์ ํํฉ๋๋ค. ์ด ๋จ๊ณ๋ฅผ ์๋ฃํ๋ฉด ๋น ์บ๋ฒ์ค๊ฐ ํ์๋ฉ๋๋ค.
์ํฌํ๋ก ์์: ํ ์ด๋ธ ์กฐ์ธ
์ด ์์์์๋ BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์์ฐ์ด ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์ฐพ๊ณ ํ ์ด๋ธ์ ์กฐ์ธํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ ์ฟผ๋ฆฌ๋ฅผ ๋ ธํธ๋ถ์ผ๋ก ๋ด๋ณด๋ ๋๋ค.
ํ๋กฌํํธ 1: ๋ฐ์ดํฐ ์ฐพ๊ธฐ
์์ฐ์ด ํ๋กฌํํธ ํ๋์ ๋ค์ ํ๋กฌํํธ๋ฅผ ์ ๋ ฅํฉ๋๋ค.
Information about trees
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค์๋ ๋๋ฌด์ ๊ดํ ์ ๋ณด๊ฐ ํฌํจ๋ ์ฌ๋ฌ ํ ์ด๋ธ์ด ํ์๋ฉ๋๋ค.
์ด ์์์์๋
bigquery-public-data.new_york_trees.tree_census_1995
ํ ์ด๋ธ์ ์ ํํ ๋ค์ ์บ๋ฒ์ค์ ์ถ๊ฐ๋ฅผ ํด๋ฆญํฉ๋๋ค.ํ ์ด๋ธ์ด ์บ๋ฒ์ค์ ํ์๋ฉ๋๋ค.
ํ๋กฌํํธ 2: ์ฃผ์์ ๋ฐ๋ผ ํ ์ด๋ธ ์กฐ์ธ
๋ฐ์ดํฐ ์บ๋ฒ์ค์์ ์กฐ์ธ์ ํด๋ฆญํฉ๋๋ค.
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค์์ ์กฐ์ธํ ํ ์ด๋ธ์ ์ถ์ฒํฉ๋๋ค.
์ ์์ฐ์ด ํ๋กฌํํธ ํ๋๋ฅผ ์ด๋ ค๋ฉด ํ ์ด๋ธ ๊ฒ์์ ํด๋ฆญํฉ๋๋ค.
์์ฐ์ด ํ๋กฌํํธ ํ๋์ ๋ค์ ํ๋กฌํํธ๋ฅผ ์ ๋ ฅํฉ๋๋ค.
Information about trees
bigquery-public-data.new_york_trees.tree_census_2005
ํ ์ด๋ธ์ ์ ํํ ๋ค์ ์บ๋ฒ์ค์ ์ถ๊ฐ๋ฅผ ํด๋ฆญํฉ๋๋ค.ํ ์ด๋ธ์ด ์บ๋ฒ์ค์ ํ์๋ฉ๋๋ค.
๋ฐ์ดํฐ ์บ๋ฒ์ค์์ ์กฐ์ธ์ ํด๋ฆญํฉ๋๋ค.
์ด ์บ๋ฒ์ค ์น์ ์์ ํ ์ด๋ธ ์ ์ฒดํฌ๋ฐ์ค๋ฅผ ์ ํํ ๋ค์ ํ์ธ์ ํด๋ฆญํฉ๋๋ค.
์์ฐ์ด ํ๋กฌํํธ ํ๋์ ๋ค์ ํ๋กฌํํธ๋ฅผ ์ ๋ ฅํฉ๋๋ค.
Join on address
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ ์ฃผ์๋ฅผ ๊ธฐ์ค์ผ๋ก ๋ ํ ์ด๋ธ์ ์กฐ์ธํ๋ SQL ์ฟผ๋ฆฌ๋ฅผ ์ ์ํฉ๋๋ค.
SELECT * FROM `bigquery-public-data.new_york_trees.tree_census_2015` AS t2015 JOIN `bigquery-public-data.new_york_trees.tree_census_1995` AS t1995 ON t2015.address = t1995.address;
์ฟผ๋ฆฌ๋ฅผ ์คํํ๊ณ ๊ฒฐ๊ณผ๋ฅผ ๋ณด๋ ค๋ฉด ์คํ์ ํด๋ฆญํฉ๋๋ค.
์ฟผ๋ฆฌ๋ฅผ ๋ ธํธ๋ถ์ผ๋ก ๋ด๋ณด๋ด๊ธฐ
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ์ฌ์ฉํ๋ฉด ์ฟผ๋ฆฌ๋ฅผ ๋ ธํธ๋ถ์ผ๋ก ๋ด๋ณด๋ผ ์ ์์ต๋๋ค.
- ๋ฐ์ดํฐ ์บ๋ฒ์ค์์ ๋ ธํธ๋ถ์ผ๋ก ๋ด๋ณด๋ด๊ธฐ๋ฅผ ํด๋ฆญํฉ๋๋ค.
- ๋ ธํธ๋ถ ์ ์ฅ ์ฐฝ์์ ๋ ธํธ๋ถ์ ์ด๋ฆ๊ณผ ์ ์ฅํ ๋ฆฌ์ ์ ์ ๋ ฅํฉ๋๋ค.
- ์ ์ฅ์ ํด๋ฆญํฉ๋๋ค. ๋ ธํธ๋ถ์ด ์์ฑ๋ฉ๋๋ค.
- ์ ํ์ฌํญ: ๋ง๋ ๋ ธํธ๋ถ์ ๋ณด๋ ค๋ฉด ์ด๊ธฐ๋ฅผ ํด๋ฆญํฉ๋๋ค.
์ํฌํ๋ก ์์: ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํ์ฌ ์ฐจํธ ์์
์ด ์์์์๋ BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์์ฐ์ด ํ๋กฌํํธ๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ์ฐพ๊ณ , ์ฟผ๋ฆฌํ๊ณ , ํํฐ๋งํ ๋ค์ ์๊ฐํ ์ธ๋ถ์ ๋ณด๋ฅผ ์์ ํฉ๋๋ค.
ํ๋กฌํํธ 1: ๋ฐ์ดํฐ ์ฐพ๊ธฐ
๋ฏธ๊ตญ ์ด๋ฆ์ ๊ดํ ๋ฐ์ดํฐ๋ฅผ ์ฐพ์ผ๋ ค๋ฉด ๋ค์ ํ๋กฌํํธ๋ฅผ ์ ๋ ฅํฉ๋๋ค.
Find data about USA names
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค์์ ํ ์ด๋ธ ๋ชฉ๋ก์ด ์์ฑ๋ฉ๋๋ค.
์ด ์์์์๋
bigquery-public-data.usa_names.usa_1910_current
ํ ์ด๋ธ์ ์ ํํ ๋ค์ ์บ๋ฒ์ค์ ์ถ๊ฐ๋ฅผ ํด๋ฆญํฉ๋๋ค.
ํ๋กฌํํธ 2: ๋ฐ์ดํฐ ์ฟผ๋ฆฌ
๋ฐ์ดํฐ๋ฅผ ์ฟผ๋ฆฌํ๋ ค๋ฉด ๋ฐ์ดํฐ ์บ๋ฒ์ค์์ ์ฟผ๋ฆฌ๋ฅผ ํด๋ฆญํ๊ณ ๋ค์ ํ๋กฌํํธ๋ฅผ ์ ๋ ฅํฉ๋๋ค.
Summarize this data
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ ๋ค์๊ณผ ์ ์ฌํ ์ฟผ๋ฆฌ๋ฅผ ์์ฑํฉ๋๋ค.
SELECT state, gender, year, name, number FROM `bigquery-public-data.usa_names.usa_1910_current`
์คํ์ ํด๋ฆญํฉ๋๋ค. ์ฟผ๋ฆฌ ๊ฒฐ๊ณผ๊ฐ ํ์๋ฉ๋๋ค.
ํ๋กฌํํธ 3: ๋ฐ์ดํฐ ํํฐ๋ง
- ๋ฐ์ดํฐ ์บ๋ฒ์ค์์ ๊ฒฐ๊ณผ ์ฟผ๋ฆฌ๋ฅผ ํด๋ฆญํฉ๋๋ค.
๋ฐ์ดํฐ๋ฅผ ํํฐ๋งํ๋ ค๋ฉด SQL ํ๋กฌํํธ ํ๋์ ๋ค์ ํ๋กฌํํธ๋ฅผ ์ ๋ ฅํฉ๋๋ค.
Get me the top 10 most popular names in 1980
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ ๋ค์๊ณผ ์ ์ฌํ ์ฟผ๋ฆฌ๋ฅผ ์์ฑํฉ๋๋ค.
SELECT name, SUM(number) AS total_count FROM `bigquery-public-data`.usa_names.usa_1910_current WHERE year = 1980 GROUP BY name ORDER BY total_count DESC LIMIT 10;
์ฟผ๋ฆฌ๋ฅผ ์คํํ๋ฉด 1980๋ ์ ํ์ด๋ ์์ด์ ๊ฐ์ฅ ํํ ์ด๋ฆ 10๊ฐ๊ฐ ํฌํจ๋ ํ ์ด๋ธ์ด ํ์๋ฉ๋๋ค.
์ฐจํธ ๋ง๋ค๊ธฐ ๋ฐ ์์
๋ฐ์ดํฐ ์บ๋ฒ์ค์์ ์๊ฐํ๋ฅผ ํด๋ฆญํฉ๋๋ค.
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค์์๋ ๋ง๋ ๊ทธ๋ํ, ์ํ ์ฐจํธ, ์ ๊ทธ๋ํ, ์ปค์คํ ์๊ฐํ ๋ฑ ์ฌ๋ฌ ์๊ฐํ ์ต์ ์ ์ ์ํฉ๋๋ค.
์ด ์์์์๋ ๋ง๋ ๊ทธ๋ํ ๋ง๋ค๊ธฐ๋ฅผ ํด๋ฆญํฉ๋๋ค.
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ ๋ค์๊ณผ ์ ์ฌํ ๋ง๋ ๊ทธ๋ํ๋ฅผ ๋ง๋ญ๋๋ค.
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ ์ฐจํธ๋ฅผ ์ ๊ณตํ๋ ๊ฒ ์ธ์๋ ์๊ฐํ๋ฅผ ๋ท๋ฐ์นจํ๋ ๋ฐ์ดํฐ์ ์ผ๋ถ ์ฃผ์ ์ธ๋ถ์ ๋ณด๋ฅผ ์์ฝํฉ๋๋ค. ์๊ฐํ ์ธ๋ถ์ ๋ณด๋ฅผ ํด๋ฆญํ๊ณ ์ธก๋ฉด ํจ๋์์ ์ฐจํธ๋ฅผ ์์ ํ์ฌ ์ฐจํธ๋ฅผ ์์ ํ ์ ์์ต๋๋ค.
ํ๋กฌํํธ 4: ์๊ฐํ ์ธ๋ถ์ ๋ณด ์์
์๊ฐํ ํ๋กฌํํธ ํ๋์ ๋ค์์ ์ ๋ ฅํฉ๋๋ค.
Create a bar chart sorted high to low, with a gradient
BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ ๋ค์๊ณผ ์ ์ฌํ ๋ง๋ ๊ทธ๋ํ๋ฅผ ๋ง๋ญ๋๋ค.
์ ํ์ฌํญ: ์ถ๊ฐ๋ก ๋ณ๊ฒฝํ๋ ค๋ฉด ์์ ์ ํด๋ฆญํฉ๋๋ค.
์๊ฐํ ์์ ์ฐฝ์ด ํ์๋ฉ๋๋ค. ์ฐจํธ ์ ๋ชฉ, x์ถ ์ด๋ฆ, y์ถ ์ด๋ฆ๊ณผ ๊ฐ์ ์ธ๋ถ์ ๋ณด๋ฅผ ์์ ํ ์ ์์ต๋๋ค. ๋ํ JSON ํธ์ง๊ธฐ ํญ์ ํด๋ฆญํ๋ฉด JSON ๊ฐ์ ๊ธฐ๋ฐ์ผ๋ก ์ฐจํธ๋ฅผ ์ง์ ์์ ํ ์ ์์ต๋๋ค.
๋ชจ๋ ๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ณด๊ธฐ
ํ๋ก์ ํธ์ ๋ชจ๋ ๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ชฉ๋ก์ ๋ณด๋ ค๋ฉด ๋ค์ ๋จ๊ณ๋ฅผ ๋ฐ๋ฅด์ธ์.
Google Cloud ์ฝ์์์ BigQuery ํ์ด์ง๋ก ์ด๋ํฉ๋๋ค.
ํ์๊ธฐ ์ฐฝ์์ ๋ฐ์ดํฐ ์บ๋ฒ์ค ์์ ์๋
์์ ๋ณด๊ธฐ๋ฅผ ํด๋ฆญํ ํ ๋ค์ ์ค ํ๋๋ฅผ ์ํํฉ๋๋ค.
- ํ์ฌ ํญ์์ ๋ชฉ๋ก์ ์ด๋ ค๋ฉด ๋ชจ๋ ํ์๋ฅผ ํด๋ฆญํฉ๋๋ค.
- ๋ชฉ๋ก์ ์ ํญ์์ ์ด๋ ค๋ฉด ๋ชจ๋ ํ์ > ์ ํญ์ ํด๋ฆญํฉ๋๋ค.
- ๋ถํ ํญ์์ ๋ชฉ๋ก์ ์ด๋ ค๋ฉด ๋ชจ๋ ํ์ > ๋ถํ ํญ์ ํด๋ฆญํฉ๋๋ค.
๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฉํ๋ฐ์ดํฐ ๋ณด๊ธฐ
๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฉํ๋ฐ์ดํฐ๋ฅผ ๋ณด๋ ค๋ฉด ๋ค์ ๋จ๊ณ๋ฅผ ๋ฐ๋ฅด์ธ์.
Google Cloud ์ฝ์์์ BigQuery ํ์ด์ง๋ก ์ด๋ํฉ๋๋ค.
ํ์๊ธฐ ์ฐฝ์์ ํ๋ก์ ํธ์ ๋ฐ์ดํฐ ์บ๋ฒ์ค ํด๋๋ฅผ ํผ์น๊ณ ํ์ํ ๊ฒฝ์ฐ ๊ณต์ ๋ฐ์ดํฐ ์บ๋ฒ์ค ํด๋๋ฅผ ํผ์นฉ๋๋ค. ๋ฉํ๋ฐ์ดํฐ๋ฅผ ๋ณด๋ ค๋ ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์ด๋ฆ์ ํด๋ฆญํฉ๋๋ค.
์์ฝ ์ฐฝ์์ ์ฌ์ฉ๋๋ ๋ฆฌ์ ๋ฐ ๋ง์ง๋ง์ผ๋ก ์์ ๋ ๋ ์ง ๋ฑ ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ๋ํ ์ ๋ณด๋ฅผ ํ์ธํฉ๋๋ค.
๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฒ์ ์ง์
๋ฐ์ดํฐ ์บ๋ฒ์ค์ ๋ฒ์ ์ ๋ณด๊ณ , ๋น๊ตํ๊ณ , ๋ณต์ํ ์ ์์ต๋๋ค.
๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฒ์ ๋ณด๊ธฐ ๋ฐ ๋น๊ต
๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์ฌ๋ฌ ๋ฒ์ ์ ๋ณด๊ณ ํ์ฌ ๋ฒ์ ๊ณผ ๋น๊ตํ๋ ค๋ฉด ๋ค์ ๋จ๊ณ๋ฅผ ๋ฐ๋ฅด์ธ์.
Google Cloud ์ฝ์์์ BigQuery ํ์ด์ง๋ก ์ด๋ํฉ๋๋ค.
ํ์๊ธฐ ์ฐฝ์์ ํ๋ก์ ํธ์ ๋ฐ์ดํฐ ์บ๋ฒ์ค ํด๋๋ฅผ ํผ์น๊ณ ํ์ํ ๊ฒฝ์ฐ ๊ณต์ ๋ฐ์ดํฐ ์บ๋ฒ์ค ํด๋๋ฅผ ํผ์นฉ๋๋ค. ํ๋์ ๋ณด๋ ค๋ ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์ด๋ฆ์ ํด๋ฆญํฉ๋๋ค.
ํ๋ ํญ์ ํด๋ฆญํ์ฌ ๋ ์ง ๊ธฐ์ค ๋ด๋ฆผ์ฐจ์์ผ๋ก ์ ๋ ฌ๋ ๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฒ์ ๋ชฉ๋ก์ ํ์ธํฉ๋๋ค.
๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฒ์ ์์ ์๋
์์ ๋ณด๊ธฐ๋ฅผ ํด๋ฆญํ ๋ค์ ๋น๊ต๋ฅผ ํด๋ฆญํฉ๋๋ค. ์ ํํ ๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฒ์ ์ ํ์ฌ ๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฒ์ ๊ณผ ๋น๊ตํ๋ ๋น๊ต ์ฐฝ์ด ์ด๋ฆฝ๋๋ค.(์ ํ์ฌํญ): ๋ณ๋์ ์ฐฝ ๋์ ๋ฒ์ ์ ์ธ๋ผ์ธ ๋น๊ตํ๋ ค๋ฉด ๋น๊ต๋ฅผ ํด๋ฆญํ ๋ค์ ์ธ๋ผ์ธ์ ํด๋ฆญํฉ๋๋ค.
๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฒ์ ๋ณต์
๋ค์ ์ต์ ์ค ํ๋๋ฅผ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฒ์ ์ ๋ณต์ํฉ๋๋ค. ๋น๊ต ์ฐฝ์์ ๋ณต์ํ๋ฉด ๋ณต์ ์ฌ๋ถ๋ฅผ ์ ํํ๊ธฐ ์ ์ ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์ด์ ๋ฒ์ ์ ํ์ฌ ๋ฒ์ ๊ณผ ๋น๊ตํ ์ ์์ต๋๋ค.
ํ๋ ์ฐฝ
- ํ์๊ธฐ ์ฐฝ์์ ํ๋ก์ ํธ์ ๋ฐ์ดํฐ ์บ๋ฒ์ค ํด๋๋ฅผ ํผ์น๊ณ ํ์ํ ๊ฒฝ์ฐ ๊ณต์ ๋ฐ์ดํฐ ์บ๋ฒ์ค ํด๋๋ฅผ ํผ์นฉ๋๋ค. ์ด์ ๋ฒ์ ์ ๋ณต์ํ ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์ด๋ฆ์ ํด๋ฆญํฉ๋๋ค.
- ํ๋ ์ฐฝ์ ์ ํํฉ๋๋ค.
- ๋ณต์ํ ๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฒ์ ์์ ์๋ ์์ ๋ณด๊ธฐ๋ฅผ ํด๋ฆญํ ํ ๋ณต์์ ํด๋ฆญํฉ๋๋ค.
- ํ์ธ์ ํด๋ฆญํ์ฌ ์์ ์ ํ์ธํฉ๋๋ค.
๋น๊ต ์ฐฝ
- ํ์๊ธฐ ์ฐฝ์์ ํ๋ก์ ํธ์ ๋ฐ์ดํฐ ์บ๋ฒ์ค ํด๋๋ฅผ ํผ์น๊ณ ํ์ํ ๊ฒฝ์ฐ ๊ณต์ ๋ฐ์ดํฐ ์บ๋ฒ์ค ํด๋๋ฅผ ํผ์นฉ๋๋ค. ์ด์ ๋ฒ์ ์ ๋ณต์ํ ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์ด๋ฆ์ ํด๋ฆญํฉ๋๋ค.
- ํ๋ ์ฐฝ์ ์ ํํฉ๋๋ค.
- ๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฒ์ ์์ ์๋ ์์ ๋ณด๊ธฐ๋ฅผ ํด๋ฆญํ ๋ค์ ๋น๊ต๋ฅผ ํด๋ฆญํฉ๋๋ค. ์ ํํ ๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฒ์ ์ ๊ฐ์ฅ ์ต๊ทผ ๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฒ์ ๊ณผ ๋น๊ตํ๋ ๋น๊ต ์ฐฝ์ด ์ด๋ฆฝ๋๋ค.
- ๋น๊ตํ ํ ์ด์ ๋ฐ์ดํฐ ์บ๋ฒ์ค ๋ฒ์ ์ ๋ณต์ํ๋ ค๋ฉด ๋ณต์์ ํด๋ฆญํฉ๋๋ค.
- ํ์ธ์ ํด๋ฆญํ์ฌ ์์ ์ ํ์ธํฉ๋๋ค.
Dataplex์์ ๋ฉํ๋ฐ์ดํฐ ๊ด๋ฆฌ
Dataplex๋ฅผ ์ฌ์ฉํ๋ฉด ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ๋ฉํ๋ฐ์ดํฐ๋ฅผ ๋ณด๊ณ ๊ด๋ฆฌํ ์ ์์ต๋๋ค. ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ ์ถ๊ฐ ๊ตฌ์ฑ ์์ด ๊ธฐ๋ณธ์ ์ผ๋ก Dataplex์์ ์ฌ์ฉํ ์ ์์ต๋๋ค.
Dataplex๋ฅผ ์ฌ์ฉํ์ฌ ๋ชจ๋ BigQuery ์์น์์ ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ๊ด๋ฆฌํ ์ ์์ต๋๋ค. Dataplex์์ ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ๊ด๋ฆฌํ๋ ๊ฒฝ์ฐ Dataplex ํ ๋น๋ ๋ฐ ํ๋์ Dataplex ๊ฐ๊ฒฉ ์ฑ ์ ์ด ์ ์ฉ๋ฉ๋๋ค.
Dataplex๋ ๋ฐ์ดํฐ ์บ๋ฒ์ค์์ ๋ค์ ๋ฉํ๋ฐ์ดํฐ๋ฅผ ์๋์ผ๋ก ๊ฒ์ํฉ๋๋ค.
- ๋ฐ์ดํฐ ์ ์ ์ด๋ฆ
- ๋ฐ์ดํฐ ์ ์ ์์ ํญ๋ชฉ
- ๋ฐ์ดํฐ ์ ์ ์์น
- ๋ฐ์ดํฐ ์ ์ ์ ํ
- ํด๋น Google Cloud ํ๋ก์ ํธ
Dataplex๋ ๋ฐ์ดํฐ ์บ๋ฒ์ค๋ฅผ ๋ค์ ํญ๋ชฉ ๊ฐ์ ์ฌ์ฉํด ํญ๋ชฉ์ผ๋ก ๋ก๊น ํฉ๋๋ค.
- ์์คํ ํญ๋ชฉ ๊ทธ๋ฃน
- ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์์คํ
ํญ๋ชฉ ๊ทธ๋ฃน์
@dataform
์ ๋๋ค. Dataplex์์ ๋ฐ์ดํฐ ์บ๋ฒ์ค ํญ๋ชฉ์ ์ธ๋ถ์ ๋ณด๋ฅผ ๋ณด๋ ค๋ฉดdataform
์์คํ ํญ๋ชฉ ๊ทธ๋ฃน์ ํ์ธํด์ผ ํฉ๋๋ค. ํญ๋ชฉ ๊ทธ๋ฃน์ ๋ชจ๋ ํญ๋ชฉ ๋ชฉ๋ก์ ๋ณด๋ ๋ฐฉ๋ฒ์ ๊ดํ ์๋ด๋ Dataplex ๋ฌธ์์ ํญ๋ชฉ ๊ทธ๋ฃน ์ธ๋ถ์ ๋ณด ๋ณด๊ธฐ๋ฅผ ์ฐธ์กฐํ์ธ์. - ์์คํ ํญ๋ชฉ ์ ํ
- ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์์คํ
ํญ๋ชฉ ์ ํ์
dataform-code-asset
์ ๋๋ค. ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์ธ๋ถ์ ๋ณด๋ฅผ ๋ณด๋ ค๋ฉดdataform-code-asset
์์คํ ํญ๋ชฉ ์ ํ์ ํ์ธํ๊ณ , ๊ด์ ๊ธฐ๋ฐ ํํฐ๋ก ๊ฒฐ๊ณผ๋ฅผ ํํฐ๋งํ๊ณ ,dataform-code-asset
๊ด์ ๋ด์type
ํ๋๋ฅผDATA_CANVAS
๋ก ์ค์ ํด์ผ ํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ ์ ํํ ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ํญ๋ชฉ์ ์ ํํฉ๋๋ค. ์ ํํ ํญ๋ชฉ ์ ํ์ ์ธ๋ถ์ ๋ณด๋ฅผ ๋ณด๋ ๋ฐฉ๋ฒ์ ๊ดํ ์๋ด๋ Dataplex ๋ฌธ์์ ํญ๋ชฉ ์ ํ์ ์ธ๋ถ์ ๋ณด ๋ณด๊ธฐ๋ฅผ ์ฐธ์กฐํ์ธ์. ์ ํํ ํญ๋ชฉ์ ์ธ๋ถ์ ๋ณด๋ฅผ ๋ณด๋ ๋ฐฉ๋ฒ์ ๊ดํ ์๋ด๋ Dataplex ๋ฌธ์์ ํญ๋ชฉ ์ธ๋ถ์ ๋ณด ๋ณด๊ธฐ๋ฅผ ์ฐธ์กฐํ์ธ์. - ์์คํ ๊ด์ ์ ํ
- ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์์คํ
๊ด์ ์ ํ์
dataform-code-asset
์ ๋๋ค. ๊ด์ ์ผ๋ก ๋ฐ์ดํฐ ์บ๋ฒ์ค ํญ๋ชฉ์ ์ฃผ์์ ์ถ๊ฐํ์ฌ Dataplex์ ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์ถ๊ฐ ์ปจํ ์คํธ๋ฅผ ์ ๊ณตํ๋ ค๋ฉดdataform-code-asset
๊ด์ ์ ํ์ ํ์ธํ๊ณ ๊ด์ ๊ธฐ๋ฐ ํํฐ๋ก ๊ฒฐ๊ณผ๋ฅผ ํํฐ๋งํ ๋ค์dataform-code-asset
๊ด์ ๋ด์type
ํ๋๋ฅผDATA_CANVAS
๋ก ์ค์ ํฉ๋๋ค. ๊ด์ ์ผ๋ก ํญ๋ชฉ์ ์ฃผ์์ ์ถ๊ฐํ๋ ๋ฐฉ๋ฒ์ ๊ดํ ์๋ด๋ Dataplex ๋ฌธ์์ ๊ด์ ๊ด๋ฆฌ ๋ฐ ๋ฉํ๋ฐ์ดํฐ ๋ณด๊ฐ์ ์ฐธ์กฐํ์ธ์. - ์ ํ
- ๋ฐ์ดํฐ ์บ๋ฒ์ค์ ์ ํ์
DATA_CANVAS
์ ๋๋ค. ์ด ์ ํ์ ์ฌ์ฉํ๋ฉด ๊ด์ ๊ธฐ๋ฐ ํํฐ์์aspect:dataplex-types.global.dataform-code-asset.type=DATA_CANVAS
์ฟผ๋ฆฌ๋ฅผ ์ฌ์ฉํ์ฌdataform-code-asset
์์คํ ํญ๋ชฉ ์ ํ ๋ฐdataform-code-asset
๊ด์ ์ ํ์ ๋ฐ์ดํฐ ์บ ๋ฒ์ค๋ฅผ ํํฐ๋งํ ์ ์์ต๋๋ค.
Dataplex์์ ์ ์ ์ ๊ฒ์ํ๋ ๋ฐฉ๋ฒ์ ๊ดํ ์๋ด๋ Dataplex ๋ฌธ์์ Dataplex์์ ๋ฐ์ดํฐ ์ ์ ๊ฒ์์ ์ฐธ์กฐํ์ธ์.
๊ฐ๊ฒฉ ์ฑ ์
์ด ๊ธฐ๋ฅ์ ๊ฐ๊ฒฉ ์ฑ ์ ์ ๊ดํ ์์ธํ ๋ด์ฉ์ BigQuery์ Gemini ๊ฐ๊ฒฉ ์ฑ ์ ๊ฐ์๋ฅผ ์ฐธ๊ณ ํ์ธ์.
ํ ๋น๋ ๋ฐ ํ๋
์ด ๊ธฐ๋ฅ์ ํ ๋น๋ ๋ฐ ํ๋์ ๋ํ ์์ธํ ๋ด์ฉ์ BigQuery์ Gemini ํ ๋น๋์ ์ฐธ์กฐํ์ธ์.
์๊ฒฌ ๋ณด๋ด๊ธฐ
Google์ ์๊ฒฌ์ ์ ์ถํ์ฌ BigQuery ๋ฐ์ดํฐ ์บ๋ฒ์ค ์ ์์ ๊ฐ์ ํ ์ ์์ต๋๋ค. ์๊ฒฌ์ ์ ๊ณตํ๋ ค๋ฉด ๋ค์ ๋จ๊ณ๋ฅผ ๋ฐ๋ฅด์ธ์.
Google Cloud ์ฝ์ ํด๋ฐ์์ ์๊ฒฌ ์ ์ถ์ ํด๋ฆญํฉ๋๋ค.
์ ํ์ฌํญ: DAG JSON ์ ๋ณด๋ฅผ ๋ณต์ฌํ์ฌ ์๊ฒฌ์ ์ถ๊ฐ ์ปจํ ์คํธ๋ฅผ ์ ๊ณตํ๋ ค๋ฉด
๋ณต์ฌ๋ฅผ ํด๋ฆญํฉ๋๋ค.์์์ ์์ฑํ๊ณ ์๊ฒฌ์ ์ ๊ณตํ๋ ค๋ฉด ์์์ ํด๋ฆญํฉ๋๋ค.
๋ฐ์ดํฐ ๊ณต์ ์ค์ ์ ์ ์ฒด ํ๋ก์ ํธ์ ์ ์ฉ๋๋ฉฐ serviceusage.services.enable
๋ฐ serviceusage.services.list
IAM ๊ถํ์ด ์๋ ํ๋ก์ ํธ ๊ด๋ฆฌ์๋ง ์ด ์ค์ ์ ์ค์ ํ ์ ์์ต๋๋ค. ์ ๋ขฐํ ์ ์๋ ํ
์คํฐ ํ๋ก๊ทธ๋จ์์ ๋ฐ์ดํฐ ์ฌ์ฉ์ ๋ํ ์์ธํ ๋ด์ฉ์ Google Cloud ์ ๋ขฐํ ์ ์๋ ํ
์คํฐ ํ๋ก๊ทธ๋จ์ Gemini๋ฅผ ์ฐธ์กฐํ์ธ์.
์ด ๊ธฐ๋ฅ์ ๋ํ ์ง์ ์ ์ธ ์๊ฒฌ์ ์ ๊ณตํ๋ ค๋ฉด datacanvas-feedback@google.com์ผ๋ก ๋ฌธ์ํ์ธ์.
๋ค์ ๋จ๊ณ
Gemini ์ง์์ผ๋ก ์ฟผ๋ฆฌ๋ฅผ ์์ฑํ๋ ๋ฐฉ๋ฒ์ ์์๋ณด์ธ์.
๋ ธํธ๋ถ์ ๋ง๋๋ ๋ฐฉ๋ฒ ์์๋ณด๊ธฐ