Cloud Data Loss Prevention (Cloud DLP) kini menjadi bagian dari Sensitive Data Protection. Nama API tetap sama: Cloud Data Loss Prevention API (DLP API). Untuk informasi tentang layanan yang membentuk Perlindungan Data Sensitif, lihat Ringkasan Perlindungan Data Sensitif.
Tetap teratur dengan koleksi
Simpan dan kategorikan konten berdasarkan preferensi Anda.
Sensitive Data Protection berisi banyak pendeteksi infoType bawaan, tetapi Anda juga dapat membuat pendeteksi sendiri. Anda dapat menyesuaikan perilaku deteksi dengan menentukan pendeteksi infoType kustom Anda sendiri, sehingga Sensitive Data Protection akan memeriksa atau melakukan de-identifikasi data sensitif yang cocok dengan pola yang Anda tentukan. Berikut adalah jenis pendeteksi infoType kustom:
Pendeteksi kamus kustom reguler adalah daftar kata dan frasa sederhana yang dicocokkan oleh Perlindungan Data Sensitif. Gunakan pendeteksi kamus kustom reguler
jika Anda memiliki paling banyak beberapa ratus ribu kata.
Detektor kamus kustom besar dibuat oleh Sensitive Data Protection menggunakan daftar besar kata atau frasa yang disimpan di Cloud Storage atau BigQuery. Gunakan detektor kamus kustom besar jika Anda memiliki daftar kata atau frasa yang besarโhingga puluhan juta.
Pendeteksi ekspresi reguler (regex) memungkinkan Perlindungan Data Sensitif mendeteksi kecocokan berdasarkan pola ekspresi reguler.
Detektor infoType pengganti mendeteksi output dari transformasi de-identifikasi
Perlindungan Data Sensitif
CryptoReplaceFfxFpeConfig.
Detektor infoType kustom ini hanya digunakan dengan metode
content:reidentify
untuk membalikkan de-identifikasi menggunakan enkripsi yang mempertahankan format (FPE)
dalam mode FFX. Oleh karena itu, pengganti tidak dijelaskan secara ekstensif dalam topik ini. Untuk mengetahui informasi selengkapnya tentang cara dan waktu penggunaan pendeteksi infoType kustom pengganti, lihat Pseudonimisasi.
Selain itu, Sensitive Data Protection mencakup konsep aturan inspeksi,
yang memungkinkan Anda menyesuaikan hasil pemindaian menggunakan hal berikut:
Aturan pengecualian memungkinkan Anda mengecualikan temuan palsu atau yang tidak diinginkan dengan menambahkan aturan ke detektor infoType bawaan atau kustom.
Aturan frasa pengaktif memungkinkan Anda meningkatkan kuantitas atau akurasi
temuan yang ditampilkan dengan menambahkan aturan ke detektor infoType bawaan atau kustom.
Untuk mempelajari lebih lanjut detektor infoType kustom, lihat halaman konsep InfoType dan detektor infoType. Untuk beberapa contoh yang dapat Anda gunakan atau ubah sesuai keinginan, lihat Contoh detektor infoType kustom. Bagian selanjutnya dalam topik ini menjelaskan cara
menggunakan Perlindungan Data Sensitif untuk membuat detektor infoType kustom Anda sendiri.
Tempat penggunaan pendeteksi infoType kustom
Pendeteksi infoType khusus ditentukan dalam objek
CustomInfoType. Anda menentukan CustomInfoType dalam objek
InspectConfig
saat mengonfigurasi hal berikut:
Identifikasi ulang konten yang telah di-de-identifikasi dengan FPE dalam mode FFX menggunakan projects.content.reidentify.
Skenario ini khusus untuk pendeteksi infoType kustom pengganti.
Ringkasan API
Objek
CustomInfoType
memungkinkan Anda membuat pendeteksi infoType kustom untuk konten baru atau
menyesuaikan hasil yang ditampilkan oleh pendeteksi infoType standar.
Objek CustomInfoType terdiri dari kolom berikut, yang ditetapkan
seperti yang dijelaskan:
"infotype": Nama detektor infoType kustom, yang ada dalam objek
InfoType.
"likelihood": Nilai
Likelihood
default yang akan ditampilkan untuk detektor infoType kustom ini. Anda dapat menentukan nilai
Likelihood alternatif di "detectionRules" yang akan menggantikan
Likelihood dasar ini jika temuan memenuhi kriteria yang ditentukan oleh aturan. Jika
Anda tidak menyertakan kolom "likelihood", pendeteksi infoType kustom
secara default adalah VERY_LIKELY. Untuk mengetahui informasi selengkapnya tentang kemungkinan, lihat halaman konsep
Kemungkinan.
"detectionRules": Kumpulan objek
DetectionRule
yang juga akan diterapkan ke semua temuan detektor infoType kustom ini. Di sinilah Anda menentukan aturan kata kunci, sebagai objek
HotwordRule. Aturan diterapkan sesuai urutan yang ditentukan. Kolom ini tidak berlaku untuk objek SurrogateType.
"sensitivityScore": Nilai
SensitivityScore
yang akan ditampilkan untuk detektor infoType kustom ini. Jika Anda tidak menyertakan kolom
"sensitivityScore", pendeteksi infoType kustom akan ditetapkan secara default ke
VERY_LIKELY.
Skor sensitivitas digunakan dalam profil data. Saat
membuat profil data Anda, Sensitive Data Protection menggunakan skor sensitivitas infoType untuk
menghitung tingkat sensitivitas.
Salah satu kolom berikut, bergantung pada jenis detektor infoType kustom yang Anda buat:
"dictionary": Objek
Dictionary, yang berisi daftar kata atau frasa yang akan dicari.
"regex": Objek
Regex, yang berisi satu pola yang menentukan ekspresi reguler.
"surrogateType": Objek
SurrogateType, jika ada, menunjukkan bahwa detektor infoType kustom adalah
pengganti. Untuk mengetahui informasi selengkapnya tentang cara menggunakan detektor infoType kustom pengganti, lihat Pseudonimisasi.
"storedType": Referensi ke objek
StoredInfoType
yang ada. Kolom ini wajib diisi saat membuat pendeteksi kamus kustom besar. Meskipun Anda dapat membuat pendeteksi kamus reguler atau
pendeteksi ekspresi reguler dengan menentukan kolom ini, lebih mudah
membuatnya dengan menentukan kolom dictionary atau kolom regex
masing-masing.
Langkah berikutnya
Pelajari lebih lanjut cara membuat infoType kustom dari topik berikut:
Membuat pendeteksi kamus kustom besar:
Pelajari cara mencocokkan temuan pada daftar kata dan frasa yang sangat besar.
Pendeteksi infoType kustom tersimpan dapat mencocokkan hingga puluhan juta kata.
Menyesuaikan kemungkinan kecocokan:
Pelajari cara menggunakan aturan deteksi dan kata kunci untuk menyesuaikan nilai kemungkinan yang ditetapkan ke kecocokan pendeteksi kustom.
Contoh pendeteksi infoType kustom: Beberapa contoh definisi pendeteksi infoType kustom JSON yang dapat Anda gunakan atau ubah sesuai kebutuhan.
[[["Mudah dipahami","easyToUnderstand","thumb-up"],["Memecahkan masalah saya","solvedMyProblem","thumb-up"],["Lainnya","otherUp","thumb-up"]],[["Sulit dipahami","hardToUnderstand","thumb-down"],["Informasi atau kode contoh salah","incorrectInformationOrSampleCode","thumb-down"],["Informasi/contoh yang saya butuhkan tidak ada","missingTheInformationSamplesINeed","thumb-down"],["Masalah terjemahan","translationIssue","thumb-down"],["Lainnya","otherDown","thumb-down"]],["Terakhir diperbarui pada 2025-09-04 UTC."],[],[],null,["# Custom infoType detectors\n\nSensitive Data Protection contains many built-in [infoType\ndetectors](/sensitive-data-protection/docs/concepts-infotypes), but you can also create your own. You can\ncustomize detection behavior by defining your own *custom infoType detectors*,\nso that Sensitive Data Protection will inspect or de-identify sensitive data that\nmatches patterns that you specify. The following are the types of custom\ninfoType detectors:\n\n- *Regular custom dictionary detectors* are simple word and phrase lists that Sensitive Data Protection matches on. Use regular custom dictionary detectors when you have at most several hundred thousand words.\n- *Large custom dictionary detectors* are generated by Sensitive Data Protection using large lists of words or phrases stored in either Cloud Storage or BigQuery. Use large custom dictionary detectors when you have a large list of words or phrases---up to tens of millions.\n- *Regular expression (regex) detectors* enable Sensitive Data Protection to detect matches based on a regular expression pattern.\n- *Surrogate infoType detectors* detect output from Sensitive Data Protection de-identification transformation [`CryptoReplaceFfxFpeConfig`](/sensitive-data-protection/docs/reference/rest/v2/organizations.deidentifyTemplates#cryptoreplaceffxfpeconfig). This custom infoType detector is only used with the [`content:reidentify`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/reidentify) method to reverse de-identification using format-preserving encryption (FPE) in FFX mode. For this reason, surrogates are not extensively described in these topics. For more information about how and when to use surrogate custom infoType detectors, see [Pseudonymization](/sensitive-data-protection/docs/pseudonymization).\n\nIn addition, Sensitive Data Protection includes the concept of *inspection rules*,\nwhich enable you to fine-tune scan results using the following:\n\n- *Exclusion rules* enable you to exclude false or unwanted findings by adding rules to a built-in or custom infoType detector.\n- *Hotword rules* enable you to increase the quantity or accuracy of findings returned by adding rules to a built-in or custom infoType detector.\n\nTo learn more about custom infoType detectors, see the [InfoTypes and infoType\ndetectors](/sensitive-data-protection/docs/concepts-infotypes#custom) concept page. For several examples that\nyou can use or alter as you see fit, see [Examples of custom infoType\ndetectors](/sensitive-data-protection/docs/examples-custom-infotypes). The rest of this topic describes how to\nuse Sensitive Data Protection to create your own custom infoType detectors.\n\nWhere to use custom infoType detectors\n--------------------------------------\n\nCustom infoType detectors are defined in the\n[`CustomInfoType`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#CustomInfoType)\nobject. You specify a `CustomInfoType` in the\n[`InspectConfig`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig)\nobject when configuring the following:\n\n- Inspection using [`projects.content.inspect`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/inspect).\n- Inspection jobs inside [`InspectJobConfig`](/sensitive-data-protection/docs/reference/rest/v2/InspectJobConfig).\n- Inspection templates inside [`InspectTemplate`](/sensitive-data-protection/docs/reference/rest/v2/organizations.inspectTemplates#InspectTemplate).\n- De-identification using [`projects.content.deidentify`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/deidentify).\n- De-identification templates inside [`DeidentifyTemplate`](/sensitive-data-protection/docs/reference/rest/v2/projects.deidentifyTemplates#resource-deidentifytemplate).\n- Re-identification of content that has been de-identified with FPE in FFX mode using [`projects.content.reidentify`](/sensitive-data-protection/docs/reference/rest/v2/projects.content/reidentify). This scenario is specific to surrogate custom infoType detectors.\n\nAPI overview\n------------\n\nThe\n[`CustomInfoType`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#CustomInfoType)\nobject allows you to create a custom infoType detector for new content or to\nfine-tune the results returned by pre-defined infoType detectors.\n\nThe `CustomInfoType` object is comprised of the following fields, which are set\nas described:\n\n- `\"infotype\"`: The name of the custom infoType detector, contained in an [`InfoType`](/sensitive-data-protection/docs/reference/rest/v2/InfoType) object.\n- `\"likelihood\"`: The default [`Likelihood`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#Likelihood) value to return for this custom infoType detector. You can specify alternate `Likelihood` values in `\"detectionRules\"` that will supersede this base `Likelihood` if the finding meets the criteria specified by the rule. If you don't include the `\"likelihood\"` field, the custom infoType detector defaults to `VERY_LIKELY`. For more information about likelihood, see the [Likelihood](/sensitive-data-protection/docs/likelihood) concept page.\n- `\"detectionRules\"`: A set of [`DetectionRule`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#DetectionRule) objects to additionally apply to all findings of this custom infoType detector. This is where you specify hotword rules, as [`HotwordRule`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#HotwordRule) objects. Rules are applied in the order in which they are specified. This field does not apply to `SurrogateType` objects.\n- `\"sensitivityScore\"`: The\n [`SensitivityScore`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#CustomInfoType.FIELDS.sensitivity_score)\n value to return for this custom infoType detector. If you don't include the\n `\"sensitivityScore\"` field, the custom infoType detector defaults to\n `VERY_LIKELY`.\n\n\n Sensitivity scores are used in [data profiles](/sensitive-data-protection/docs/data-profiles). When\n profiling your data, Sensitive Data Protection uses the sensitivity scores of the infoTypes to\n [calculate the sensitivity level](/sensitive-data-protection/docs/sensitivity-risk-calculation).\n\n\n- One of the following fields, depending on the kind of custom infoType\n detector you're creating:\n\n - `\"dictionary\"`: A [`Dictionary`](/sensitive-data-protection/docs/reference/rest/v2/Dictionary) object, which contains a list of words or phrases to search for.\n - `\"regex\"`: A [`Regex`](/sensitive-data-protection/docs/reference/rest/v2/Regex) object, which contains a single pattern defining the regular expression.\n - `\"surrogateType\"`: A [`SurrogateType`](/sensitive-data-protection/docs/reference/rest/v2/InspectConfig#SurrogateType) object, if present, indicates that the custom infoType detector is a surrogate. For more information about how to use surrogate custom infoType detectors, see [Pseudonymization](/sensitive-data-protection/docs/pseudonymization).\n - `\"storedType\"`: A reference to an existing [`StoredInfoType`](/sensitive-data-protection/docs/reference/rest/v2/projects.locations.storedInfoTypes) object. This field is required when creating a large custom dictionary detector. Although you can create regular dictionary detectors or regular expression detectors by defining this field, it's simpler to create those by defining the `dictionary` field or `regex` field respectively.\n\nNext steps\n----------\n\nLearn more about creating custom infoTypes from the following topics:\n\n- [Creating a regular custom dictionary detector](/sensitive-data-protection/docs/creating-custom-infotypes-dictionary): Learn how to create a custom infoType detector to match findings on a list of words and phrases.\n- [Creating a large custom dictionary detector](/sensitive-data-protection/docs/creating-stored-infotypes): Learn how to match findings on a very large list of words and phrases. Stored custom infoType detectors can match on up to tens of millions of words.\n- [Creating a custom regex detector](/sensitive-data-protection/docs/creating-custom-infotypes-regex): Learn how to create a custom infoType detector to match findings on a regular expression.\n- [Modifying infoType detectors to refine scan results](/sensitive-data-protection/docs/creating-custom-infotypes-rules): Learn how to create modifiers for both built-in and custom infoType detectors that can fine-tune scan results.\n- [Customizing match likelihood](/sensitive-data-protection/docs/creating-custom-infotypes-likelihood): Learn how to use detection rules and hotwords to customize the likelihood values that are assigned to custom detector matches.\n- [Examples of custom infoType detectors](/sensitive-data-protection/docs/examples-custom-infotypes): Several example JSON custom infoType detector definitions that you can use or alter as you see fit."]]