๋ค์ ๋ชฉํ ์น์ ์๋ ๋ฐ์ดํฐ ์๊ตฌ์ฌํญ, ์ ๋ ฅ/์ถ๋ ฅ ์คํค๋ง ํ์ผ, ์คํค๋ง๋ก ์ ์๋๋ ๋ฐ์ดํฐ ๊ฐ์ ธ์ค๊ธฐ ํ์ผ ํ์(JSON Lines ๋ฐ CSV)์ด ํฌํจ๋์ด ์์ต๋๋ค.
๋จ์ผ ๋ผ๋ฒจ ๋ถ๋ฅ
๋ฐ์ดํฐ ์๊ตฌ์ฌํญ
- ํ์ต ๋ฐ์ดํฐ: ๋ชจ๋ธ์ ํ์ต์ํฌ ๋ ๋ค์๊ณผ ๊ฐ์ ์ด๋ฏธ์ง ํ์์ด ์ง์๋ฉ๋๋ค. Vertex AI API๋ ์ด๋ ๊ฒ ๊ฐ์ ธ์จ ์ด๋ฏธ์ง๋ฅผ ์ฌ์ ์ฒ๋ฆฌํ ํ ๋ชจ๋ธ์ ํ์ต์ํค๋ ๋ฐ ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ๋ก ์ ๊ณตํฉ๋๋ค. ์ด๋ฏธ์ง๋น ์ต๋ ํ์ผ ํฌ๊ธฐ๋ 30MB์ ๋๋ค.
- JPEG
- GIF
- PNG
- BMP
- ICO
- ์์ธก ๋ฐ์ดํฐ: ๋ชจ๋ธ์์ ์์ธก์ ์์ฒญ (์ฟผ๋ฆฌ)ํ ๋ ์ง์๋๋ ์ด๋ฏธ์ง ํ์์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค. ์ต๋ ํ์ผ ํฌ๊ธฐ๋ 1.5MB์ ๋๋ค.
- JPEG
- GIF
- PNG
- WEBP
- BMP
- TIFF
- ICO
- AutoML ๋ชจ๋ธ์ ํ์ค์ ๋ฌผ์ฒด๋ฅผ ์ฐ์ ์ฌ์ง์ ์ต์ ํ๋์ด ์์ต๋๋ค.
- ํ์ต ๋ฐ์ดํฐ๋ ์์ธก์ ์ํํ ๋ฐ์ดํฐ์ ์ต๋ํ ์ ์ฌํด์ผ ํฉ๋๋ค. ์๋ฅผ ๋ค์ด ์ฌ์ฉ ์ฌ๋ก์ ๋ณด์ ์นด๋ฉ๋ผ ์์์ฒ๋ผ ํ๋ฆฟํ ์ ํด์๋ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋๋ ๊ฒฝ์ฐ ํ๋ฆฟํ ์ ํด์๋ ์ด๋ฏธ์ง๋ก ํ์ต ๋ฐ์ดํฐ๋ฅผ ๊ตฌ์ฑํด์ผ ํฉ๋๋ค. ๋ํ ์ผ๋ฐ์ ์ผ๋ก ๋ค์ํ ๊ฐ๋, ํด์๋, ๋ฐฐ๊ฒฝ์ผ๋ก ์ดฌ์ํ ํ์ต ์ด๋ฏธ์ง๋ฅผ ์ ๊ณตํ๋ ๊ฒ์ด ์ข์ต๋๋ค.
- ์ธ๊ฐ์ด ์ง์ ํ ์ ์๋ ๋ผ๋ฒจ์ Vertex AI ๋ชจ๋ธ๋ ์ผ๋ฐ์ ์ผ๋ก ์์ธกํ ์ ์์ต๋๋ค. ๋ฐ๋ผ์ ์ด๋ฏธ์ง๋ฅผ 1~2์ด ๋ณด๊ณ ๋ผ๋ฒจ์ ์ง์ ํ๋๋ก ์ฌ๋์ ํ์ต์ํฌ ์ ์๋ค๋ฉด ์ด ๋ชจ๋ธ๋ ๊ทธ๋ ๊ฒ ํ๋๋ก ํ์ต์ํฌ ์ ์์ต๋๋ค.
- ๊ถ์ฅ๋๋ ํ์ต ์ด๋ฏธ์ง ๊ฐ์๋ ๋ผ๋ฒจ๋น 1,000๊ฐ์ ๋๋ค. ๋ผ๋ฒจ๋น ์ต์ ๊ฐ์๋ 10๊ฐ์ ๋๋ค. ์ด๋ฏธ์ง ํ๋์ ๋ผ๋ฒจ์ด ์ฌ๋ฌ ๊ฐ์ธ ๋ชจ๋ธ์ ํ์ต์ํค๋ ๊ฒฝ์ฐ ์ผ๋ฐ์ ์ผ๋ก ๋ผ๋ฒจ๋น ํ์ํ ์์ ์๊ฐ ๋์ด๋๋ฉฐ, ๊ฒฐ๊ณผ ์ ์๋ฅผ ํด์ํ๊ธฐ๋ ์ด๋ ค์์ง๋๋ค.
- ๊ฐ์ฅ ํํ ๋ผ๋ฒจ์ ์ด๋ฏธ์ง๊ฐ ๊ฐ์ฅ ํํ์ง ์์ ๋ผ๋ฒจ์ ์ด๋ฏธ์ง๋ณด๋ค ์ต๋ 100๋ฐฐ ๋ง์ ๋ ๋ชจ๋ธ ํจ๊ณผ๊ฐ ๊ฐ์ฅ ๋ฐ์ด๋ฉ๋๋ค. ๋น๋๊ฐ ๊ทนํ ๋ฎ์ ๋ผ๋ฒจ์ ์ญ์ ํ๋ ๊ฒ์ด ์ข์ต๋๋ค.
- ์ ์๋ ๋ผ๋ฒจ ์ค ์ด๋ ๊ฒ๊ณผ๋ ์ผ์นํ์ง ์๋ None_of_the_above ๋ผ๋ฒจ๊ณผ ์ด๋ฏธ์ง๋ฅผ ํฌํจํ๋ฉด ์ ์ฉํฉ๋๋ค. ์๋ฅผ ๋ค์ด ๊ฝ ๋ฐ์ดํฐ ์ธํธ์ ๊ฒฝ์ฐ ๋ผ๋ฒจ์ ์ง์ ํ ํ์ข ์ ์ํ์ง ์๋ ๊ฝ์ ์ด๋ฏธ์ง๋ฅผ ํฌํจํ๊ณ None_of_the_above ๋ผ๋ฒจ์ ๋ถ์ ๋๋ค.
AutoML ๋ชจ๋ธ ํ์ต์ ์ฌ์ฉ๋๋ ์ด๋ฏธ์ง ๋ฐ์ดํฐ๋ฅผ ์ํ ๊ถ์ฅ์ฌํญ
๋ค์ ๊ถ์ฅ์ฌํญ์ AutoML์ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ ํ์ต์ํค๋ ๋ฐ์ดํฐ ์ธํธ์ ์ ์ฉ๋ฉ๋๋ค.
YAML ์คํค๋ง ํ์ผ
๊ณต๊ฐ์ ์ผ๋ก ์ก์ธ์คํ ์ ์๋ ๋ค์ ์คํค๋ง ํ์ผ์ ์ฌ์ฉํ์ฌ ๋จ์ผ ๋ผ๋ฒจ ์ด๋ฏธ์ง ๋ถ๋ฅ ์ฃผ์์ ๊ฐ์ ธ์ต๋๋ค. ์ด ์คํค๋ง ํ์ผ์ ๋ฐ์ดํฐ ์ ๋ ฅ ํ์ผ์ ํ์์ ์ง์ ํฉ๋๋ค. ์ด ํ์ผ์ ๊ตฌ์กฐ๋ OpenAPI ์คํค๋ง๋ฅผ ๋ฐ๋ฆ ๋๋ค.
gs://google-cloud-aiplatform/schema/dataset/ioformat/image_classification_single_label_io_format_1.0.0.yaml
์ ์ฒด ์คํค๋ง ํ์ผ
title: ImageClassificationSingleLabel description: > Import and export format for importing/exporting images together with single-label classification annotation. Can be used in Dataset.import_schema_uri field. type: object required: - imageGcsUri properties: imageGcsUri: type: string description: > A Cloud Storage URI pointing to an image. Up to 30MB in size. Supported file mime types: `image/jpeg`, `image/gif`, `image/png`, `image/webp`, `image/bmp`, `image/tiff`, `image/vnd.microsoft.icon`. classificationAnnotation: type: object description: Single classification Annotation on the image. properties: displayName: type: string description: > It will be imported as/exported from AnnotationSpec's display name, i.e. the name of the label/class. annotationResourceLabels: description: Resource labels on the Annotation. type: object additionalProperties: type: string dataItemResourceLabels: description: Resource labels on the DataItem. type: object additionalProperties: type: string
์ ๋ ฅ ํ์ผ
JSON Lines
๊ฐ ํ์ JSON:
{ "imageGcsUri": "gs://bucket/filename.ext", "classificationAnnotation": { "displayName": "LABEL", "annotationResourceLabels": { "aiplatform.googleapis.com/annotation_set_name": "displayName", "env": "prod" } }, "dataItemResourceLabels": { "aiplatform.googleapis.com/ml_use": "training/test/validation" } }
ํ๋ ์ฐธ๊ณ ์ฌํญ:
imageGcsUri
- ์ ์ผํ ํ์ ํ๋์ ๋๋ค.annotationResourceLabels
- ํค-๊ฐ ๋ฌธ์์ด ์์ ํฌํจํ ์ ์์ต๋๋ค. ์์คํ ์ ์์ฝ๋ ์ ์ผํ ํค-๊ฐ ์์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.- 'aiplatform.googleapis.com/annotation_set_name': 'value'
์ฌ๊ธฐ์ value๋ ๋ฐ์ดํฐ ์ธํธ์ ์๋ ๊ธฐ์กด ์ฃผ์ ์งํฉ์ ํ์ ์ด๋ฆ ์ค ํ๋์ ๋๋ค.
dataItemResourceLabels
- ํค-๊ฐ ๋ฌธ์์ด ์์ ํฌํจํ ์ ์์ต๋๋ค. ์์คํ ์์ ์์ฝํ ์ ์๋ ์ ์ผํ ํค-๊ฐ ์์ ๋ค์๊ณผ ๊ฐ์ด ๋ฐ์ดํฐ ํญ๋ชฉ์ ๋จธ์ ๋ฌ๋ ์ฌ์ฉ ์ธํธ๋ฅผ ์ง์ ํฉ๋๋ค.- 'aiplatform.googleapis.com/ml_use': 'training/test/validation'
JSON Lines ์์ - image_classification_single_label.jsonl
:
{"imageGcsUri": "gs://bucket/filename1.jpeg", "classificationAnnotation": {"displayName": "daisy"}, "dataItemResourceLabels": {"aiplatform.googleapis.com/ml_use": "test"}} {"imageGcsUri": "gs://bucket/filename2.gif", "classificationAnnotation": {"displayName": "dandelion"}, "dataItemResourceLabels": {"aiplatform.googleapis.com/ml_use": "training"}} {"imageGcsUri": "gs://bucket/filename3.png", "classificationAnnotation": {"displayName": "roses"}, "dataItemResourceLabels": {"aiplatform.googleapis.com/ml_use": "training"}} {"imageGcsUri": "gs://bucket/filename4.bmp", "classificationAnnotation": {"displayName": "sunflowers"}, "dataItemResourceLabels": {"aiplatform.googleapis.com/ml_use": "training"}} {"imageGcsUri": "gs://bucket/filename5.tiff", "classificationAnnotation": {"displayName": "tulips"}, "dataItemResourceLabels": {"aiplatform.googleapis.com/ml_use": "validation"}} ...
CSV
CSV ํ์:
[ML_USE],GCS_FILE_PATH,[LABEL]
ML_USE
(์ ํ์ฌํญ) - ๋ชจ๋ธ์ ํ์ต์ํฌ ๋ ๋ฐ์ดํฐ ๋ถํ ๋ชฉ์ ์ผ๋ก ์ฌ์ฉ๋ฉ๋๋ค. TRAINING, TEST, VALIDATION์ด ์ฌ์ฉ๋ฉ๋๋ค. ์๋ ๋ฐ์ดํฐ ๋ถํ ์ ๋ํ ์์ธํ ๋ด์ฉ์ AutoML ๋ชจ๋ธ์ ๋ํ ๋ฐ์ดํฐ ๋ถํ ์ ๋ณด๋ฅผ ์ฐธ์กฐํ์ธ์.GCS_FILE_PATH
- ์ด ํ๋์๋ ์ด๋ฏธ์ง์ ๋ํ Cloud Storage URI๊ฐ ํฌํจ๋ฉ๋๋ค. Cloud Storage URI๋ ๋์๋ฌธ์๋ฅผ ๊ตฌ๋ถํฉ๋๋ค.LABEL
(์ ํ์ฌํญ). ๋ผ๋ฒจ์ ๋ฌธ์๋ก ์์ํด์ผ ํ๋ฉฐ ๋ฌธ์, ์ซ์, ๋ฐ์ค๋ง ํฌํจํ ์ ์์ต๋๋ค.
CSV ์์ - image_classification_single_label.csv
:
test,gs://bucket/filename1.jpeg,daisy training,gs://bucket/filename2.gif,dandelion gs://bucket/filename3.png gs://bucket/filename4.bmp,sunflowers validation,gs://bucket/filename5.tiff,tulips ...
๋ฉํฐ ๋ผ๋ฒจ ๋ถ๋ฅ
๋ฐ์ดํฐ ์๊ตฌ์ฌํญ
- ํ์ต ๋ฐ์ดํฐ: ๋ชจ๋ธ์ ํ์ต์ํฌ ๋ ๋ค์๊ณผ ๊ฐ์ ์ด๋ฏธ์ง ํ์์ด ์ง์๋ฉ๋๋ค. Vertex AI API๋ ์ด๋ ๊ฒ ๊ฐ์ ธ์จ ์ด๋ฏธ์ง๋ฅผ ์ฌ์ ์ฒ๋ฆฌํ ํ ๋ชจ๋ธ์ ํ์ต์ํค๋ ๋ฐ ์ฌ์ฉ๋๋ ๋ฐ์ดํฐ๋ก ์ ๊ณตํฉ๋๋ค. ์ด๋ฏธ์ง๋น ์ต๋ ํ์ผ ํฌ๊ธฐ๋ 30MB์ ๋๋ค.
- JPEG
- GIF
- PNG
- BMP
- ICO
- ์์ธก ๋ฐ์ดํฐ: ๋ชจ๋ธ์์ ์์ธก์ ์์ฒญ (์ฟผ๋ฆฌ)ํ ๋ ์ง์๋๋ ์ด๋ฏธ์ง ํ์์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค. ์ต๋ ํ์ผ ํฌ๊ธฐ๋ 1.5MB์ ๋๋ค.
- JPEG
- GIF
- PNG
- WEBP
- BMP
- TIFF
- ICO
- AutoML ๋ชจ๋ธ์ ํ์ค์ ๋ฌผ์ฒด๋ฅผ ์ฐ์ ์ฌ์ง์ ์ต์ ํ๋์ด ์์ต๋๋ค.
- ํ์ต ๋ฐ์ดํฐ๋ ์์ธก์ ์ํํ ๋ฐ์ดํฐ์ ์ต๋ํ ์ ์ฌํด์ผ ํฉ๋๋ค. ์๋ฅผ ๋ค์ด ์ฌ์ฉ ์ฌ๋ก์ ๋ณด์ ์นด๋ฉ๋ผ ์์์ฒ๋ผ ํ๋ฆฟํ ์ ํด์๋ ์ด๋ฏธ์ง๊ฐ ํฌํจ๋๋ ๊ฒฝ์ฐ ํ๋ฆฟํ ์ ํด์๋ ์ด๋ฏธ์ง๋ก ํ์ต ๋ฐ์ดํฐ๋ฅผ ๊ตฌ์ฑํด์ผ ํฉ๋๋ค. ๋ํ ์ผ๋ฐ์ ์ผ๋ก ๋ค์ํ ๊ฐ๋, ํด์๋, ๋ฐฐ๊ฒฝ์ผ๋ก ์ดฌ์ํ ํ์ต ์ด๋ฏธ์ง๋ฅผ ์ ๊ณตํ๋ ๊ฒ์ด ์ข์ต๋๋ค.
- ์ธ๊ฐ์ด ์ง์ ํ ์ ์๋ ๋ผ๋ฒจ์ Vertex AI ๋ชจ๋ธ๋ ์ผ๋ฐ์ ์ผ๋ก ์์ธกํ ์ ์์ต๋๋ค. ๋ฐ๋ผ์ ์ด๋ฏธ์ง๋ฅผ 1~2์ด ๋ณด๊ณ ๋ผ๋ฒจ์ ์ง์ ํ๋๋ก ์ฌ๋์ ํ์ต์ํฌ ์ ์๋ค๋ฉด ์ด ๋ชจ๋ธ๋ ๊ทธ๋ ๊ฒ ํ๋๋ก ํ์ต์ํฌ ์ ์์ต๋๋ค.
- ๊ถ์ฅ๋๋ ํ์ต ์ด๋ฏธ์ง ๊ฐ์๋ ๋ผ๋ฒจ๋น 1,000๊ฐ์ ๋๋ค. ๋ผ๋ฒจ๋น ์ต์ ๊ฐ์๋ 10๊ฐ์ ๋๋ค. ์ด๋ฏธ์ง ํ๋์ ๋ผ๋ฒจ์ด ์ฌ๋ฌ ๊ฐ์ธ ๋ชจ๋ธ์ ํ์ต์ํค๋ ๊ฒฝ์ฐ ์ผ๋ฐ์ ์ผ๋ก ๋ผ๋ฒจ๋น ํ์ํ ์์ ์๊ฐ ๋์ด๋๋ฉฐ, ๊ฒฐ๊ณผ ์ ์๋ฅผ ํด์ํ๊ธฐ๋ ์ด๋ ค์์ง๋๋ค.
- ๊ฐ์ฅ ํํ ๋ผ๋ฒจ์ ์ด๋ฏธ์ง๊ฐ ๊ฐ์ฅ ํํ์ง ์์ ๋ผ๋ฒจ์ ์ด๋ฏธ์ง๋ณด๋ค ์ต๋ 100๋ฐฐ ๋ง์ ๋ ๋ชจ๋ธ ํจ๊ณผ๊ฐ ๊ฐ์ฅ ๋ฐ์ด๋ฉ๋๋ค. ๋น๋๊ฐ ๊ทนํ ๋ฎ์ ๋ผ๋ฒจ์ ์ญ์ ํ๋ ๊ฒ์ด ์ข์ต๋๋ค.
- ์ ์๋ ๋ผ๋ฒจ ์ค ์ด๋ ๊ฒ๊ณผ๋ ์ผ์นํ์ง ์๋ None_of_the_above ๋ผ๋ฒจ๊ณผ ์ด๋ฏธ์ง๋ฅผ ํฌํจํ๋ฉด ์ ์ฉํฉ๋๋ค. ์๋ฅผ ๋ค์ด ๊ฝ ๋ฐ์ดํฐ ์ธํธ์ ๊ฒฝ์ฐ ๋ผ๋ฒจ์ ์ง์ ํ ํ์ข ์ ์ํ์ง ์๋ ๊ฝ์ ์ด๋ฏธ์ง๋ฅผ ํฌํจํ๊ณ None_of_the_above ๋ผ๋ฒจ์ ๋ถ์ ๋๋ค.
AutoML ๋ชจ๋ธ ํ์ต์ ์ฌ์ฉ๋๋ ์ด๋ฏธ์ง ๋ฐ์ดํฐ๋ฅผ ์ํ ๊ถ์ฅ์ฌํญ
๋ค์ ๊ถ์ฅ์ฌํญ์ AutoML์ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ ํ์ต์ํค๋ ๋ฐ์ดํฐ ์ธํธ์ ์ ์ฉ๋ฉ๋๋ค.
YAML ์คํค๋ง ํ์ผ
๊ณต๊ฐ์ ์ผ๋ก ์ก์ธ์คํ ์ ์๋ ๋ค์ ์คํค๋ง ํ์ผ์ ์ฌ์ฉํ์ฌ ๋ฉํฐ ๋ผ๋ฒจ ์ด๋ฏธ์ง ๋ถ๋ฅ ์ฃผ์์ ๊ฐ์ ธ์ต๋๋ค. ์ด ์คํค๋ง ํ์ผ์ ๋ฐ์ดํฐ ์ ๋ ฅ ํ์ผ์ ํ์์ ์ง์ ํฉ๋๋ค. ์ด ํ์ผ์ ๊ตฌ์กฐ๋ OpenAPI ์คํค๋ง๋ฅผ ๋ฐ๋ฆ ๋๋ค.
์ ์ฒด ์คํค๋ง ํ์ผ
title: ImageClassificationMultiLabel description: > Import and export format for importing/exporting images together with multi-label classification annotations. Can be used in Dataset.import_schema_uri field. type: object required: - imageGcsUri properties: imageGcsUri: type: string description: > A Cloud Storage URI pointing to an image. Up to 30MB in size. Supported file mime types: `image/jpeg`, `image/gif`, `image/png`, `image/webp`, `image/bmp`, `image/tiff`, `image/vnd.microsoft.icon`. classificationAnnotations: type: array description: Multiple classification Annotations on the image. items: type: object description: Classification annotation. properties: displayName: type: string description: > It will be imported as/exported from AnnotationSpec's display name, i.e. the name of the label/class. annotationResourceLabels: description: Resource labels on the Annotation. type: object additionalProperties: type: string dataItemResourceLabels: description: Resource labels on the DataItem. type: object additionalProperties: type: string
์ ๋ ฅ ํ์ผ
JSON Lines
๊ฐ ํ์ JSON:
{ "imageGcsUri": "gs://bucket/filename.ext", "classificationAnnotations": [ { "displayName": "LABEL1", "annotationResourceLabels": { "aiplatform.googleapis.com/annotation_set_name":"displayName", "label_type": "flower_type" } }, { "displayName": "LABEL2", "annotationResourceLabels": { "aiplatform.googleapis.com/annotation_set_name":"displayName", "label_type": "image_shot_type" } } ], "dataItemResourceLabels": { "aiplatform.googleapis.com/ml_use": "training/test/validation" } }
ํ๋ ์ฐธ๊ณ ์ฌํญ:
imageGcsUri
- ์ ์ผํ ํ์ ํ๋์ ๋๋ค.annotationResourceLabels
- ํค-๊ฐ ๋ฌธ์์ด ์์ ํฌํจํ ์ ์์ต๋๋ค. ์์คํ ์ ์์ฝ๋ ์ ์ผํ ํค-๊ฐ ์์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.- 'aiplatform.googleapis.com/annotation_set_name': 'value'
์ฌ๊ธฐ์ value๋ ๋ฐ์ดํฐ ์ธํธ์ ์๋ ๊ธฐ์กด ์ฃผ์ ์งํฉ์ ํ์ ์ด๋ฆ ์ค ํ๋์ ๋๋ค.
dataItemResourceLabels
- ํค-๊ฐ ๋ฌธ์์ด ์์ ํฌํจํ ์ ์์ต๋๋ค. ์์คํ ์์ ์์ฝํ ์ ์๋ ์ ์ผํ ํค-๊ฐ ์์ ๋ค์๊ณผ ๊ฐ์ด ๋ฐ์ดํฐ ํญ๋ชฉ์ ๋จธ์ ๋ฌ๋ ์ฌ์ฉ ์ธํธ๋ฅผ ์ง์ ํฉ๋๋ค.- 'aiplatform.googleapis.com/ml_use': 'training/test/validation'
JSON Lines ์์ - image_classification_multi_label.jsonl
:
{"imageGcsUri": "gs://bucket/filename1.jpeg", "classificationAnnotations": [{"displayName": "daisy"}, {"displayName": "full_shot"}], "dataItemResourceLabels": {"aiplatform.googleapis.com/ml_use": "test"}} {"imageGcsUri": "gs://bucket/filename2.gif", "classificationAnnotations": [{"displayName": "dandelion"}, {"displayName": "medium_shot"}], "dataItemResourceLabels": {"aiplatform.googleapis.com/ml_use": "training"}} {"imageGcsUri": "gs://bucket/filename3.png", "classificationAnnotations": [{"displayName": "roses"}, {"displayName": "extreme_closeup"}], "dataItemResourceLabels": {"aiplatform.googleapis.com/ml_use": "training"}} {"imageGcsUri": "gs://bucket/filename4.bmp", "classificationAnnotations": [{"displayName": "sunflowers"}, {"displayName": "closeup"}], "dataItemResourceLabels": {"aiplatform.googleapis.com/ml_use": "training"}} {"imageGcsUri": "gs://bucket/filename5.tiff", "classificationAnnotations": [{"displayName": "tulips"}, {"displayName": "extreme_closeup"}], "dataItemResourceLabels": {"aiplatform.googleapis.com/ml_use": "validation"}} ...
CSV
CSV ํ์:
[ML_USE],GCS_FILE_PATH,[LABEL1,LABEL2,...LABELn]
ML_USE
(์ ํ์ฌํญ) - ๋ชจ๋ธ์ ํ์ต์ํฌ ๋ ๋ฐ์ดํฐ ๋ถํ ๋ชฉ์ ์ผ๋ก ์ฌ์ฉ๋ฉ๋๋ค. TRAINING, TEST, VALIDATION์ด ์ฌ์ฉ๋ฉ๋๋ค. ์๋ ๋ฐ์ดํฐ ๋ถํ ์ ๋ํ ์์ธํ ๋ด์ฉ์ AutoML ๋ชจ๋ธ์ ๋ํ ๋ฐ์ดํฐ ๋ถํ ์ ๋ณด๋ฅผ ์ฐธ์กฐํ์ธ์.GCS_FILE_PATH
- ์ด ํ๋์๋ ์ด๋ฏธ์ง์ ๋ํ Cloud Storage URI๊ฐ ํฌํจ๋ฉ๋๋ค. Cloud Storage URI๋ ๋์๋ฌธ์๋ฅผ ๊ตฌ๋ถํฉ๋๋ค.LABEL
(์ ํ์ฌํญ). ๋ผ๋ฒจ์ ๋ฌธ์๋ก ์์ํด์ผ ํ๋ฉฐ ๋ฌธ์, ์ซ์, ๋ฐ์ค๋ง ํฌํจํ ์ ์์ต๋๋ค.
CSV ์์ - image_classification_multi_label.csv
:
test,gs://bucket/filename1.jpeg,daisy,full_shot training,gs://bucket/filename2.gif,dandelion,medium_shot gs://bucket/filename3.png gs://bucket/filename4.bmp,sunflowers,closeup validation,gs://bucket/filename5.tiff,tulips,extreme_closeup ...