Prophet์ ๋ฉํ๋ฅผ ํตํด ์ ์ง๋๋ ์์ธก ๋ชจ๋ธ์ ๋๋ค. ์๊ณ ๋ฆฌ์ฆ ์ธ๋ถ์ ๋ณด๋ Prophet ์๋ฃ, ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๋ํ ์์ธํ ๋ด์ฉ์ ํด๋น ๋ฌธ์๋ฅผ ์ฐธ์กฐํ์ธ์.
BigQuery ML ARIMA_PLUS์ ๋ง์ฐฌ๊ฐ์ง๋ก Prophet์ ๊ฐ ์๊ณ์ด์ ํธ๋ ๋, ๊ณ์ , ๊ณตํด์ผ๋ก ๋ถํ ํ๊ณ ์ด๋ฌํ ๋ชจ๋ธ์ ์ถ๋ก ์ง๊ณ๋ฅผ ์ฌ์ฉํ์ฌ ์์ธก์ ์์ฑํ๋ ค๊ณ ์๋ํฉ๋๋ค. ํ์ง๋ง ์ค์ํ ์ฐจ์ด์ ์ BQML ARIMA+๋ ARIMA๋ฅผ ์ฌ์ฉํ์ฌ ํธ๋ ๋ ๊ตฌ์ฑ์์๋ฅผ ๋ชจ๋ธ๋งํ๋ ๋ฐ๋ฉด Prophet์ ๊ฐ๋ณ ๋ก์ง์คํฑ ๋๋ ์ ํ ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ๊ณก์ ์ ๋ง์ถ๋ ค ์๋ํ๋ค๋ ๊ฒ์ ๋๋ค.
Google Cloud ๋ Prophet ๋ชจ๋ธ์ ํ์ตํ๊ธฐ ์ํ ํ์ดํ๋ผ์ธ๊ณผ Prophet ๋ชจ๋ธ์์ ์ผ๊ด ์ถ๋ก ์ ์ํํ๊ธฐ ์ํ ํ์ดํ๋ผ์ธ์ ์ ๊ณตํฉ๋๋ค. ๋ ํ์ดํ๋ผ์ธ ๋ชจ๋ Google Cloud ํ์ดํ๋ผ์ธ ๊ตฌ์ฑ์์(GCPC)์ Vertex AI Pipelines์ ์ธ์คํด์ค์ ๋๋ค.
Prophet์ Vertex AI์ ํตํฉํ๋ฉด ๋ค์์ ์ํํ ์ ์์ต๋๋ค.
- Vertex AI ๋ฐ์ดํฐ ๋ถํ ๋ฐ ์๋์ ์ ๋ต์ ์ฌ์ฉํฉ๋๋ค.
- Cloud Storage์ ์ ์ฅ๋ BigQuery ํ ์ด๋ธ์ด๋ CSV์์ ๋ฐ์ดํฐ๋ฅผ ์ฝ์ต๋๋ค. Vertex AI๋ ๊ฐ ํ์ ํ์์ด Vertex AI ์์ธก๊ณผ ๋์ผํ ํ์์ ๊ฐ์ง ๊ฒ์ผ๋ก ์์ํฉ๋๋ค.
Prophet์ ๋ค๋ณ๋ ๋ชจ๋ธ์ด์ง๋ง Vertex AI๋ ์ผ๋ณ๋ ๋ฒ์ ๋ง ์ง์ํฉ๋๋ค.
์ด ์ํฌํ๋ก์ ์ฌ์ฉ๋๋ ์๋น์ค ๊ณ์ ์ ๋ํ ์์ธํ ๋ด์ฉ์ ํ ์ด๋ธ ํ์ ์ํฌํ๋ก์ ์๋น์ค ๊ณ์ ์ ์ฐธ์กฐํ์ธ์.
์ํฌํ๋ก API
์ด ์ํฌํ๋ก์์๋ ๋ค์ API๋ฅผ ์ฌ์ฉํฉ๋๋ค.
- Vertex AI
- Dataflow
- BigQuery
- Cloud Storage
Prophet์ผ๋ก ๋ชจ๋ธ ํ์ต
Prophet์ ๋จ์ผ ์๊ณ์ด์ ์ํด ์ค๊ณ๋์์ต๋๋ค. Vertex AI๋ ์๊ณ์ด ID๋ก ๋ฐ์ดํฐ๋ฅผ ์ง๊ณํ๊ณ ๊ฐ ์๊ณ์ด์ ๋ํด Prophet ๋ชจ๋ธ์ ํ์ตํฉ๋๋ค. ๋ชจ๋ธ ํ์ต ํ์ดํ๋ผ์ธ์ ๊ทธ๋ฆฌ๋ ๊ฒ์ ๋ฐ Prophet์ ๊ธฐ๋ณธ ์ ๊ณต๋๋ ๋ฐฑํ ์คํธ ๋ ผ๋ฆฌ๋ฅผ ์ฌ์ฉํ์ฌ ํ์ดํผํ๋ผ๋ฏธํฐ ์กฐ์ ์ ์ํํฉ๋๋ค.
์ฌ๋ฌ ์๊ณ์ด์ ์ง์ํ๊ธฐ ์ํด ํ์ดํ๋ผ์ธ์ Vertex AI ์ปค์คํ ํ์ต ์์ ๋ฐ Dataflow๋ฅผ ์ฌ์ฉํ์ฌ ์ฌ๋ฌ Prophet ๋ชจ๋ธ์ ๋ณ๋ ฌ๋ก ํ์ตํฉ๋๋ค. ์ ๋ฐ์ ์ผ๋ก ํ์ต๋๋ ๋ชจ๋ธ ์๋ ์๊ณ์ด ์์ ํ์ดํผํ๋ผ๋ฏธํฐ ์กฐ์ ์๋ ํ์์ ๊ณฑ์ ๋๋ค.
๋ค์ ์ํ ์ฝ๋์์๋ Prophet ๋ชจ๋ธ ํ์ต ํ์ดํ๋ผ์ธ์ ์คํํ๋ ๋ฐฉ๋ฒ์ ๋ณด์ฌ์ค๋๋ค.
job = aiplatform.PipelineJob(
...
template_path=train_job_spec_path,
parameter_values=train_parameter_values,
...
)
job.run(service_account=SERVICE_ACCOUNT)
job.run()
์ ์ ํ์ service_account
ํ๋ผ๋ฏธํฐ๋ฅผ ์ฌ์ฉํ๋ฉด Vertex AI Pipelines ์๋น์ค ๊ณ์ ์ ์ํ๋ ๊ณ์ ์ผ๋ก ์ค์ ํ ์ ์์ต๋๋ค.
ํ์ดํ๋ผ์ธ๊ณผ ํ๋ผ๋ฏธํฐ ๊ฐ์ ๋ค์ ํจ์๋ก ์ ์๋ฉ๋๋ค.
(
train_job_spec_path,
train_parameter_values,
) = utils.get_prophet_train_pipeline_and_parameters(
...
)
๋ค์์ get_prophet_train_pipeline_and_parameters
ํ๋ผ๋ฏธํฐ์ ํ์ ์งํฉ์
๋๋ค.
ํ๋ผ๋ฏธํฐ ์ด๋ฆ | ์ ํ | ์ ์ |
---|---|---|
project |
๋ฌธ์์ด | ํ๋ก์ ํธ ID |
location |
๋ฌธ์์ด | ๋ฆฌ์ . |
root_dir |
๋ฌธ์์ด | ์ถ๋ ฅ์ ์ ์ฅํ Cloud Storage ์์น์ ๋๋ค. |
target_column |
๋ฌธ์์ด | ์ด ๋ชจ๋ธ์์ ์์ธกํ ์ด(๊ฐ)์ ๋๋ค. |
time_column |
๋ฌธ์์ด | ์๊ฐ ์ด. ์๊ฐ ์ด์ ์ง์ ํด์ผ ํ๋ฉฐ ์ด ์ด์ ๋ชจ๋ ํ์ ๊ฐ์ด ์์ด์ผ ํฉ๋๋ค. ์๊ฐ ์ด์ ์ง์ ๋ ๊ด์ฐฐ์ด ์ํ๋ ์๊ฐ์ ๋ํ๋ ๋๋ค. |
time_series_identifier_column |
๋ฌธ์์ด | ์๊ณ์ด ์๋ณ์ ์ด์ ๋๋ค. ์๊ณ์ด ์๋ณ์ ์ด์ ์ง์ ํด์ผ ํ๋ฉฐ ์ด ์ด์๋ ๋ชจ๋ ํ์ ๊ฐ์ด ์์ด์ผ ํฉ๋๋ค. ์์ธก ํ์ต ๋ฐ์ดํฐ์๋ ์ผ๋ฐ์ ์ผ๋ก ์ฌ๋ฌ ์๊ณ์ด์ด ํฌํจ๋๋ฉฐ, ์๋ณ์๋ ํ์ต ๋ฐ์ดํฐ์์ ์ง์ ๋ ๊ด์ฐฐ์ด ์ํ ์๊ณ์ด์ Vertex AI์ ์๋ ค์ค๋๋ค. ํน์ ์๊ณ์ด์ ๋ชจ๋ ํ์ ์๊ณ์ด ์๋ณ์ ์ด์ ๊ฐ์ด ๋์ผํฉ๋๋ค. ์ผ๋ฐ์ ์ธ ์๊ณ์ด ์๋ณ์๋ ์ ํ ID, ๋งค์ฅ ID ๋๋ ๋ฆฌ์ ์ผ ์ ์์ต๋๋ค. ์๊ณ์ด ์๋ณ์ ์ด์ ์๋ ๋ชจ๋ ํ์ ๋์ผํ ๊ฐ์ ์ฌ์ฉํด์ ๋จ์ผ ์๊ณ์ด๋ก ์์ธก ๋ชจ๋ธ์ ํ์ต์ํค๋ ๊ฒ์ด ๊ฐ๋ฅํฉ๋๋ค. ๊ทธ๋ฌ๋ Vertex AI๋ ์๊ณ์ด์ด ๋ ๊ฐ ์ด์ ํฌํจ๋ ํ์ต ๋ฐ์ดํฐ์ ๋ ์ ํฉํฉ๋๋ค. ์ต์์ ๊ฒฐ๊ณผ๋ฅผ ์ป์ผ๋ ค๋ฉด ๋ชจ๋ธ์ ํ์ต์ํค๋ ๋ฐ ์ฌ์ฉ๋๋ ๋ชจ๋ ์ด์ ์๊ณ์ด์ 10๊ฐ ์ด์ ์ฌ์ฉํฉ๋๋ค. |
data_granularity_unit |
๋ฌธ์์ด | ํ์ต ๋ฐ์ดํฐ, ์์ธก ๋ฒ์, ์ปจํ
์คํธ ์๋์ฐ์ ์ธ๋ถ์ฌํญ์ ์ฌ์ฉํ ๋จ์์
๋๋ค. minute , hour , day , week , month , ๋๋ year ์ผ ์ ์์ต๋๋ค. ๋ฐ์ดํฐ ์ธ๋ถ์ฌํญ ์ ํ ๋ฐฉ๋ฒ์ ์์๋ณด์ธ์. |
data_source_csv_filenames |
๋ฌธ์์ด | Cloud Storage์ ์ ์ฅ๋ CSV์ URI์ ๋๋ค. |
data_source_bigquery_table_path |
๋ฌธ์์ด | BigQuery ํ ์ด๋ธ์ URI์ ๋๋ค. |
forecast_horizon |
์ ์ | ์์ธก ๋ฒ์๋ ๋ชจ๋ธ์ด ์์ธก ๋ฐ์ดํฐ ๊ฐ ํ์ ํ๊ฒ ๊ฐ ์์ธก์ ์ํํ ํฅํ ๊ธฐ๊ฐ์ ๊ฒฐ์ ํฉ๋๋ค. ์์ธก ๋ฒ์๋ ๋ฐ์ดํฐ ์ธ๋ถ์ฌํญ ๋จ์๋ก ์ง์ ๋ฉ๋๋ค. ์์ธํ ์์๋ณด๊ธฐ |
optimization_objective |
๋ฌธ์์ด | ๋ชจ๋ธ์ ์ต์ ํ ๋ชฉํ์ ๋๋ค. ์์ธํ ์์๋ณด๊ธฐ |
max_num_trials |
์ ์ | ์๊ณ์ด๋น ์ํํ ์ต๋ ์กฐ์ ์๋ ํ์์ ๋๋ค. |
Dataflow ํ๋ผ๋ฏธํฐ
๋ค์์ Dataflow ๋ง์ถค์ค์ ์ ์ํ get_prophet_train_pipeline_and_parameters
ํ๋ผ๋ฏธํฐ์ ํ์ ์งํฉ์
๋๋ค.
ํ๋ผ๋ฏธํฐ ์ด๋ฆ | ์ ํ | ์ ์ |
---|---|---|
trainer_dataflow_machine_type |
๋ฌธ์์ด | ํ์ต์ ์ฌ์ฉํ Dataflow ๋จธ์ ์ ํ์ ๋๋ค. |
trainer_dataflow_max_num_workers |
์ ์ | ํ์ต์ ์ฌ์ฉํ Dataflow ์์ ์์ ์ต๋ ๊ฐ์์ ๋๋ค. |
evaluation_dataflow_machine_type |
๋ฌธ์์ด | ํ๊ฐ์ ์ฌ์ฉํ Dataflow ๋จธ์ ์ ํ์ ๋๋ค. |
evaluation_dataflow_max_num_workers |
์ ์ | ํ๊ฐ์ ์ฌ์ฉํ ์ต๋ Dataflow ์์ ์ ์์ ๋๋ค. |
dataflow_service_account |
๋ฌธ์์ด | Dataflow ์์ ์ ์คํํ๊ธฐ ์ํ ์ปค์คํ ์๋น์ค ๊ณ์ ์ ๋๋ค. ๋น๊ณต๊ฐ IP์ ํน์ VPC ์๋ธ๋ท์ ์ฌ์ฉํ๋๋ก Dataflow ์์ ์ ๋น๊ณต๊ฐ IP์ ํน์ VPC ์๋ธ๋ท์ ์ฌ์ฉํ๋๋ก ๊ตฌ์ฑํ ์ ์์ต๋๋ค. ์ด ํ๋ผ๋ฏธํฐ๋ ๊ธฐ๋ณธ Dataflow ์์ ์ ์๋น์ค ๊ณ์ ์ ์ฌ์ ์ํฉ๋๋ค. |
Prophet ํ์ต ์์
์ Dataflow์์ ์คํ๋๋ฏ๋ก ์ด๊ธฐ ์์ ์๊ฐ์ 5~7๋ถ์
๋๋ค. ์ถ๊ฐ ๋ฐํ์์ ์ค์ด๋ ค๋ฉด ์์ง ํ์ฅ ๋๋ ์ํ ํ์ฅ์ ์ํํ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด ์์ง ํ์ฅ์ ์ํํ๋ ค๋ฉด ๋จธ์ ์ ํ์ n1-standard-1
์์ e2-highcpu-8
๋ก ๋ณ๊ฒฝํ๋ฉด ๋ฉ๋๋ค. ์ํ ํ์ฅํ๋ ค๋ฉด ์์
์ ์๋ฅผ 1
์์ 200
์ผ๋ก ๋๋ฆด ์ ์์ต๋๋ค.
๋ฐ์ดํฐ ๋ถํ ํ๋ผ๋ฏธํฐ
ํ์ต ํ์ดํ๋ผ์ธ์ ๋ฐ์ดํฐ ๋ถํ ์ ์ํด ๋ค์๊ณผ ๊ฐ์ ์ต์ ์ ์ ๊ณตํฉ๋๋ค.
๋ฐ์ดํฐ ๋ถํ | ์ค๋ช | ํ๋ผ๋ฏธํฐ |
---|---|---|
๊ธฐ๋ณธ ๋ถํ | Vertex AI๋ ํ์ต ๋ฐ์ดํฐ ์ธํธ์ 80%๋ฅผ ํ์ต ์ธํธ๋ก, 10%๋ฅผ ๊ฒ์ฆ ์ธํธ๋ก, 10%๋ฅผ ํ ์คํธ ์ธํธ๋ก ๋ฌด์์ ์ ํํฉ๋๋ค. Vertex AI๋ ์๊ฐ ์ด์ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ ํ์ ์๊ฐ ์์๋ฅผ ๊ฒฐ์ ํฉ๋๋ค. | ์์ |
๋น์จ ๋ถํ | Vertex AI๋ ์ฌ์ฉ์๊ฐ ์ ๊ณตํ๋ ๊ฐ์ ์ฌ์ฉํด์ ๋ฐ์ดํฐ๋ฅผ ํ์ต ์ธํธ, ๊ฒ์ฆ ์ธํธ, ํ ์คํธ ์ธํธ๋ก ๋ถํ ํฉ๋๋ค. Vertex AI๋ ์๊ฐ ์ด์ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ ํ์ ์๊ฐ ์์๋ฅผ ๊ฒฐ์ ํฉ๋๋ค. |
|
ํ์์คํฌํ ๋ถํ | Vertex AI๋ training_fraction , validation_fraction , test_fraction ๊ฐ์ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ํ์ต ์ธํธ, ๊ฒ์ฆ ์ธํธ, ํ
์คํธ ์ธํธ๋ก ๋ถํ ํฉ๋๋ค. Vertex AI๋ timestamp_split_key ์ด์ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ ํ์ ์๊ฐ ์์๋ฅผ ๊ฒฐ์ ํฉ๋๋ค. |
|
์๋(์ฌ์ ์ ์) ๋ถํ | Vertex AI๋ predefined_split_key ์ด์ TRAIN, VALIDATE, TEST ๊ฐ์ ์ฌ์ฉํ์ฌ ๋ฐ์ดํฐ๋ฅผ ๋ถํ ํฉ๋๋ค. |
|
๋ค์๊ณผ ๊ฐ์ด get_prophet_train_pipeline_and_parameters
์์ ๋ฐ์ดํฐ ๋ถํ ํ๋ผ๋ฏธํฐ๋ฅผ ์ ์ํฉ๋๋ค.
ํ๋ผ๋ฏธํฐ ์ด๋ฆ | ์ ํ | ์ ์ |
---|---|---|
predefined_split_key |
๋ฌธ์์ด | TRAIN, VALIDATE, TEST ๊ฐ์ ํฌํจํ ์ด์ ์ด๋ฆ์ ๋๋ค. ์๋(์ฌ์ ์ ์) ๋ถํ ์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ ์ด ๊ฐ์ ์ค์ ํฉ๋๋ค. |
training_fraction |
๋ถ๋ ์์์ ์ | ํ์ต ์ธํธ์ ํ ๋นํ ๋ฐ์ดํฐ์ ๋ฐฑ๋ถ์จ์ ๋๋ค. ๋น์จ ๋ถํ ๋๋ ํ์์คํฌํ ๋ถํ ์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ ์ด ๊ฐ์ ์ค์ ํฉ๋๋ค. |
validation_fraction |
๋ถ๋ ์์์ ์ | ๊ฒ์ฆ ์ธํธ์ ํ ๋นํ ๋ฐ์ดํฐ์ ๋ฐฑ๋ถ์จ์ ๋๋ค. ๋น์จ ๋ถํ ๋๋ ํ์์คํฌํ ๋ถํ ์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ ์ด ๊ฐ์ ์ค์ ํฉ๋๋ค. |
test_fraction |
๋ถ๋ ์์์ ์ | ํ ์คํธ ์ธํธ์ ํ ๋นํ ๋ฐ์ดํฐ์ ๋ฐฑ๋ถ์จ์ ๋๋ค. ๋น์จ ๋ถํ ๋๋ ํ์์คํฌํ ๋ถํ ์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ ์ด ๊ฐ์ ์ค์ ํฉ๋๋ค. |
timestamp_split_key |
๋ฌธ์์ด | ๋ฐ์ดํฐ ๋ถํ ์ ์ํด ํ์์คํฌํ๊ฐ ํฌํจ๋ ์ด์ ์ด๋ฆ์ ๋๋ค. ํ์์คํฌํ ๋ถํ ์ ์ฌ์ฉํ๋ ๊ฒฝ์ฐ ์ด ๊ฐ์ ์ค์ ํฉ๋๋ค. |
๊ธฐ๊ฐ ํ๋ผ๋ฏธํฐ
Vertex AI๋ ์ํ ๊ธฐ๊ฐ ์ ๋ต์ ์ฌ์ฉํ์ฌ ์
๋ ฅ ๋ฐ์ดํฐ์์ ์์ธก ๊ธฐ๊ฐ์ ์์ฑํฉ๋๋ค. ๊ธฐ๊ฐ ํ๋ผ๋ฏธํฐ๋ฅผ ์ค์ ํ์ง ์์ ์ํ๋ก ๋๋ฉด Vertex AI์์ ๊ธฐ๋ณธ ์ต๋๊ฐ์ด 100,000,000
์ธ Count ์ ๋ต์ ์ฌ์ฉํฉ๋๋ค. ํ์ต ํ์ดํ๋ผ์ธ์ ๋ค์๊ณผ ๊ฐ์ ์ํ ๊ธฐ๊ฐ ์ ๋ต์ ์ ๊ณตํฉ๋๋ค.
์ํ ๊ธฐ๊ฐ ์ ๋ต | ์ค๋ช | ํ๋ผ๋ฏธํฐ |
---|---|---|
์นด์ดํธ |
Vertex AI์์ ์์ฑ๋ ๊ตฌ๊ฐ ์๋ ์ฌ์ฉ์๊ฐ ์ ๊ณตํ ์ต๋๊ฐ์ ์ด๊ณผํ์ง ์์์ผ ํฉ๋๋ค. ์
๋ ฅ ๋ฐ์ดํฐ ์ธํธ์ ํ ์๊ฐ ์ต๋ ๊ตฌ๊ฐ ์๋ณด๋ค ์ ์ผ๋ฉด ๋ชจ๋ ํ์ด ๊ตฌ๊ฐ์ ์์ฑํ๋ ๋ฐ ์ฌ์ฉ๋ฉ๋๋ค.
๊ทธ๋ ์ง ์์ผ๋ฉด Vertex AI๊ฐ ๋ฌด์์ ์ํ๋ง์ ์ํํ์ฌ ํ์ ์ ํํฉ๋๋ค.
์ต๋ ๊ตฌ๊ฐ ์์ ๊ธฐ๋ณธ๊ฐ์ 100,000,000 ์
๋๋ค.
์ต๋ ๊ตฌ๊ฐ ์๋ 100,000,000 ๊ฐ๋ฅผ ์ด๊ณผํ ์ ์์ต๋๋ค.
|
window_max_count |
Stride |
Vertex AI๋ ๋ชจ๋ X ์
๋ ฅ ํ ์ค ํ๋๋ฅผ ์ฌ์ฉํ์ฌ ์ต๋ 100,000,000๊ฐ์ ๊ตฌ๊ฐ์ ์์ฑํฉ๋๋ค. ์ด ์ต์
์ ๊ณ์ ๋ณ ๋๋ ๊ธฐ๊ฐ๋ณ ์์ธก์ ์ ์ฉํฉ๋๋ค. ์๋ฅผ ๋ค์ด ์คํธ๋ผ์ด๋ ๊ธธ์ด ๊ฐ์ 7 ๋ก ์ค์ ํ์ฌ ์์ธก์ ํน์ ์์ผ๋ก ์ ํํ ์ ์์ต๋๋ค. ๊ฐ์ 1 ์์ 1000 ์ฌ์ด์ผ ์ ์์ต๋๋ค.
|
window_stride_length |
์ด |
๊ฐ์ด True ๋๋ False ์ธ ์ด์ ์
๋ ฅ ๋ฐ์ดํฐ์ ์ถ๊ฐํ ์ ์์ต๋๋ค. Vertex AI๋ ์ด์ ๊ฐ์ด True ์ธ ๋ชจ๋ ์
๋ ฅ ํ์ ๊ตฌ๊ฐ์ ์์ฑํฉ๋๋ค. True ํ์ ์ด ๊ฐ์๊ฐ 100,000,000 ๋ฏธ๋ง์ด๋ฉด True ๋ฐ False ๊ฐ์ ์ํ๋ ์์๋ก ์ค์ ํ ์ ์์ต๋๋ค. ๋ถ๋ฆฌ์ธ ๊ฐ์ด ์ ํธ๋์ง๋ง ๋ฌธ์์ด ๊ฐ๋ ํ์ฉ๋ฉ๋๋ค. ๋ฌธ์์ด ๊ฐ์ ๋์๋ฌธ์๋ฅผ ๊ตฌ๋ถํ์ง ์์ต๋๋ค.
|
window_column |
get_prophet_train_pipeline_and_parameters
์์ ๊ธฐ๊ฐ ํ๋ผ๋ฏธํฐ๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ์ ์ํฉ๋๋ค.
ํ๋ผ๋ฏธํฐ ์ด๋ฆ | ์ ํ | ์ ์ |
---|---|---|
window_column |
๋ฌธ์์ด | True ๋ฐ False ๊ฐ์ด ์๋ ์ด์ ์ด๋ฆ์
๋๋ค. |
window_stride_length |
์ ์ | ์คํธ๋ผ์ด๋ ๊ธธ์ด์ ๊ฐ์ ๋๋ค. |
window_max_count |
์ ์ | ์ต๋ ์๋์ฐ ์์ ๋๋ค. |
Prophet์ผ๋ก ์ถ๋ก ์ํ
Prophet์ ์ํ Vertex AI ๋ชจ๋ธ ํ์ต ํ์ดํ๋ผ์ธ์ ๋ฐ์ดํฐ์ ๊ฐ ์๊ณ์ด์ ๋ํด ํ๋์ Propet ๋ชจ๋ธ์ ๋ง๋ญ๋๋ค. ์ถ๋ก ํ์ดํ๋ผ์ธ์ ์ ๋ ฅ ๋ฐ์ดํฐ๋ฅผ ์๊ณ์ด ID๋ณ๋ก ์ง๊ณํ๊ณ ๊ฐ ์๊ณ์ด์ ๋ํ ์ถ๋ก ์ ๊ฐ๋ณ์ ์ผ๋ก ๊ณ์ฐํฉ๋๋ค. ๊ทธ๋ฐ ํ ํ์ดํ๋ผ์ธ์ Vertex AI ์์ธก ํ์๊ณผ ์ผ์นํ๋๋ก ์ถ๋ก ๊ฒฐ๊ณผ๋ฅผ ๋ถ๋ฆฌํฉ๋๋ค.
๋ค์ ์ํ ์ฝ๋๋ Prophet ์ถ๋ก ํ์ดํ๋ผ์ธ์ ์คํํ๋ ๋ฐฉ๋ฒ์ ๋ณด์ฌ์ค๋๋ค.
job = aiplatform.PipelineJob(
...
template_path=prediction_job_spec_path,
parameter_values=prediction_parameter_values,
...
)
job.run(...)
ํ์ดํ๋ผ์ธ๊ณผ ํ๋ผ๋ฏธํฐ ๊ฐ์ ๋ค์ ํจ์๋ก ์ ์๋ฉ๋๋ค.
(
prediction_job_spec_path,
prediction_parameter_values,
) = utils.get_prophet_prediction_pipeline_and_parameters(
...
)
๋ค์์ get_prophet_prediction_pipeline_and_parameters
ํ๋ผ๋ฏธํฐ์ ํ์ ์งํฉ์
๋๋ค.
ํ๋ผ๋ฏธํฐ ์ด๋ฆ | ์ ํ | ์ ์ |
---|---|---|
project |
๋ฌธ์์ด | ํ๋ก์ ํธ ID |
location |
๋ฌธ์์ด | ๋ฆฌ์ . |
model_name |
๋ฌธ์์ด | ๋ชจ๋ธ ๋ฆฌ์์ค์ ์ด๋ฆ์
๋๋ค. ๋ฌธ์์ด์ ํ์์ projects/{project}/locations/{location}/models/{model} ๋ก ์ง์ ํฉ๋๋ค. |
time_column |
๋ฌธ์์ด | ์๊ฐ ์ด. ์๊ฐ ์ด์ ์ง์ ํด์ผ ํ๋ฉฐ ์ด ์ด์ ๋ชจ๋ ํ์ ๊ฐ์ด ์์ด์ผ ํฉ๋๋ค. ์๊ฐ ์ด์ ์ง์ ๋ ๊ด์ฐฐ์ด ์ํ๋ ์๊ฐ์ ๋ํ๋ ๋๋ค. |
time_series_identifier_column |
๋ฌธ์์ด | ์๊ณ์ด ์๋ณ์ ์ด์ ๋๋ค. ์๊ณ์ด ์๋ณ์ ์ด์ ์ง์ ํด์ผ ํ๋ฉฐ ์ด ์ด์๋ ๋ชจ๋ ํ์ ๊ฐ์ด ์์ด์ผ ํฉ๋๋ค. ์์ธก ํ์ต ๋ฐ์ดํฐ์๋ ์ผ๋ฐ์ ์ผ๋ก ์ฌ๋ฌ ์๊ณ์ด์ด ํฌํจ๋๋ฉฐ, ์๋ณ์๋ ํ์ต ๋ฐ์ดํฐ์์ ์ง์ ๋ ๊ด์ฐฐ์ด ์ํ ์๊ณ์ด์ Vertex AI์ ์๋ ค์ค๋๋ค. ํน์ ์๊ณ์ด์ ๋ชจ๋ ํ์ ์๊ณ์ด ์๋ณ์ ์ด์ ๊ฐ์ด ๋์ผํฉ๋๋ค. ์ผ๋ฐ์ ์ธ ์๊ณ์ด ์๋ณ์๋ ์ ํ ID, ๋งค์ฅ ID ๋๋ ๋ฆฌ์ ์ผ ์ ์์ต๋๋ค. ์๊ณ์ด ์๋ณ์ ์ด์ ์๋ ๋ชจ๋ ํ์ ๋์ผํ ๊ฐ์ ์ฌ์ฉํด์ ๋จ์ผ ์๊ณ์ด๋ก ์์ธก ๋ชจ๋ธ์ ํ์ต์ํค๋ ๊ฒ์ด ๊ฐ๋ฅํฉ๋๋ค. ๊ทธ๋ฌ๋ Vertex AI๋ ์๊ณ์ด์ด ๋ ๊ฐ ์ด์ ํฌํจ๋ ํ์ต ๋ฐ์ดํฐ์ ๋ ์ ํฉํฉ๋๋ค. ์ต์์ ๊ฒฐ๊ณผ๋ฅผ ์ป์ผ๋ ค๋ฉด ๋ชจ๋ธ์ ํ์ต์ํค๋ ๋ฐ ์ฌ์ฉ๋๋ ๋ชจ๋ ์ด์ ์๊ณ์ด์ 10๊ฐ ์ด์ ์ฌ์ฉํฉ๋๋ค. |
target_column |
๋ฌธ์์ด | ์ด ๋ชจ๋ธ์์ ์์ธกํ ์ด(๊ฐ)์ ๋๋ค. |
data_source_csv_filenames |
๋ฌธ์์ด | Cloud Storage์ ์ ์ฅ๋ CSV์ URI์ ๋๋ค. |
data_source_bigquery_table_path |
๋ฌธ์์ด | BigQuery ํ ์ด๋ธ์ URI์ ๋๋ค. |
bigquery_destination_uri |
๋ฌธ์์ด | ์ ํํ ๋์ ๋ฐ์ดํฐ ์ธํธ์ URI์ ๋๋ค. ์ด ๊ฐ์ ์ค์ ํ์ง ์์ผ๋ฉด ๋ฆฌ์์ค๊ฐ ํ๋ก์ ํธ์์ ์ ๋ฐ์ดํฐ ์ธํธ ์๋์ ์์ฑ๋ฉ๋๋ค. |
machine_type |
๋ฌธ์์ด | ์ผ๊ด ์ถ๋ก ์ ์ฌ์ฉํ ๋จธ์ ์ ํ์ ๋๋ค. |
max_num_workers |
์ ์ | ์ผ๊ด ์ถ๋ก ์ ์ฌ์ฉํ ์ต๋ ์์ ์ ์์ ๋๋ค. |