custom_classifier
!ADD_REGEX¶
- Voir aussi :
Utilisation de classificateurs personnalisés pour la classification des données sensibles
Ajoute des catégories et une expression réguliÚre au classificateur personnalisé, tout en spécifiant éventuellement une expression réguliÚre pour le nom de la colonne et un commentaire.
Syntaxe¶
<custom_classifier>!ADD_REGEX(
'<semantic_category>' ,
'<privacy_category>' ,
'<value_regex>' ,
[ <column_name_regex> ] ,
[ <description> ] ,
[ <threshold> ]
)
Arguments¶
Obligatoire :
semantic_category
SpĂ©cifie lâidentificateur (le nom) de la catĂ©gorie sĂ©mantique.
Pour plus de détails sur les catégories sémantiques, voir Balises systÚme et catégories.
privacy_category
SpĂ©cifie lâune des valeurs suivantes :
'IDENTIFIER'
,'QUASI_IDENTIFIER'
, ou'SENSITIVE'
Pour plus de détails sur les catégories de confidentialité, voir Balises systÚme et catégories.
value_regex
SpĂ©cifie lâexpression rĂ©guliĂšre qui doit correspondre aux valeurs dâune colonne.
Vous pouvez tester la syntaxe de lâexpression rĂ©guliĂšre en appelant la fonction REGEXP_LIKE.
Facultatif :
column_name_regex
SpĂ©cifie lâexpression rĂ©guliĂšre correspondant au nom de la colonne Ă classifier.
description
SpĂ©cifie un commentaire pour les valeurs que vous ajoutez Ă lâinstance.
threshold
Spécifie la valeur seuil pour la rÚgle de notation.
La plage acceptable est supĂ©rieure Ă
0.0
et infĂ©rieure ou Ă©gale Ă1.0
.Par défaut :
0.8
.
Sortie¶
Renvoie un message de statut indiquant lâassociation de la catĂ©gorie avec le classificateur personnalisĂ© dans ce format : classifier_name:category_name
.
Exigences en matiĂšre de contrĂŽle dâaccĂšs¶
Un rÎle utilisé pour exécuter cette opération doit au minimum disposer des privilÚges suivants :
RĂŽle de lâinstance |
Objet |
Remarques |
---|---|---|
|
Lâinstance de classification personnalisĂ©e. |
Le rĂŽle de compte qui appelle cette mĂ©thode doit se voir attribuer ce rĂŽle dâinstance sur le classificateur personnalisĂ©. Par dĂ©faut, le rĂŽle de compte utilisĂ© pour crĂ©er lâinstance peut appeler cette mĂ©thode. |
Le privilĂšge USAGE relatif Ă la base de donnĂ©es et au schĂ©ma parents est exigĂ© pour effectuer des opĂ©rations sur tout objet dâun schĂ©ma.
Pour obtenir des instructions sur la crĂ©ation dâun rĂŽle personnalisĂ© avec un ensemble spĂ©cifique de privilĂšges, voir CrĂ©ation de rĂŽles personnalisĂ©s.
Pour des informations gĂ©nĂ©rales sur les rĂŽles et les privilĂšges accordĂ©s pour effectuer des actions SQL sur des objets sĂ©curisables, voir Aperçu du contrĂŽle dâaccĂšs.
Notes sur lâutilisation¶
Lâappel multiple de cette mĂ©thode donne un rĂ©sultat additif pour le nombre dâexpressions rĂ©guliĂšres associĂ©es Ă lâinstance.
Appeler chaque méthode dans une instruction SQL distincte (pas de chaßnage de méthodes).
Toutes les recherches dâexpressions rĂ©guliĂšres Ă des fins de classification ne sont pas sensibles Ă la casse.
Testez lâexpression rĂ©guliĂšre avant dâajouter une expression rĂ©guliĂšre Ă lâinstance de classification personnalisĂ©e. Par exemple, utilisez la fonction [ NOT ] REGEXP pour vous assurer que seules les valeurs correspondant Ă lâexpression rĂ©guliĂšre sont renvoyĂ©es dans le rĂ©sultat :
SELECT <col_to_classify> FROM <table_with_col_to_classify> WHERE <col_to_classify> REGEXP('<regex>');
Pour plus de détails, voir Fonctions de chaßne (expressions réguliÚres).
Exemples¶
Ajoutez des catĂ©gories et une expression rĂ©guliĂšre Ă lâinstance medical_codes
:
CALL medical_codes!ADD_REGEX(
'ICD_10_CODES',
'IDENTIFIER',
'[A-TV-Z][0-9][0-9AB]\.?[0-9A-TV-Z]{0,4}',
'ICD.*',
'Add a regex to identify ICD-10 medical codes in a column',
0.8
);
Renvoie :
+---------------+
| ADD_REGEX |
+---------------+
| ICD_10_CODES |
+---------------+