custom_classifier !ADD_REGEX¶

Voir aussi :

Utilisation de classificateurs personnalisés pour la classification des données sensibles

Ajoute des catégories et une expression réguliÚre au classificateur personnalisé, tout en spécifiant éventuellement une expression réguliÚre pour le nom de la colonne et un commentaire.

Syntaxe¶

<custom_classifier>!ADD_REGEX(
  '<semantic_category>' ,
  '<privacy_category>' ,
  '<value_regex>' ,
  [ <column_name_regex> ] ,
  [ <description> ] ,
  [ <threshold> ]
  )
Copy

Arguments¶

Obligatoire :

semantic_category

SpĂ©cifie l’identificateur (le nom) de la catĂ©gorie sĂ©mantique.

Pour plus de détails sur les catégories sémantiques, voir Balises systÚme et catégories.

privacy_category

SpĂ©cifie l’une des valeurs suivantes : 'IDENTIFIER', 'QUASI_IDENTIFIER', ou 'SENSITIVE'

Pour plus de détails sur les catégories de confidentialité, voir Balises systÚme et catégories.

value_regex

SpĂ©cifie l’expression rĂ©guliĂšre qui doit correspondre aux valeurs d’une colonne.

Vous pouvez tester la syntaxe de l’expression rĂ©guliĂšre en appelant la fonction REGEXP_LIKE.

Facultatif :

column_name_regex

SpĂ©cifie l’expression rĂ©guliĂšre correspondant au nom de la colonne Ă  classifier.

description

SpĂ©cifie un commentaire pour les valeurs que vous ajoutez Ă  l’instance.

threshold

Spécifie la valeur seuil pour la rÚgle de notation.

La plage acceptable est supérieure à 0.0 et inférieure ou égale à 1.0.

Par dĂ©faut : 0.8.

Sortie¶

Renvoie un message de statut indiquant l’association de la catĂ©gorie avec le classificateur personnalisĂ© dans ce format : classifier_name:category_name.

Exigences en matiĂšre de contrĂŽle d’accĂšs¶

Un rĂŽle utilisĂ© pour exĂ©cuter cette opĂ©ration doit au minimum disposer des privilĂšges suivants :

Rîle de l’instance

Objet

Remarques

custom_classifier !PRIVACY_USER

L’instance de classification personnalisĂ©e.

Le rĂŽle de compte qui appelle cette mĂ©thode doit se voir attribuer ce rĂŽle d’instance sur le classificateur personnalisĂ©.

Par dĂ©faut, le rĂŽle de compte utilisĂ© pour crĂ©er l’instance peut appeler cette mĂ©thode.

Le privilĂšge USAGE relatif Ă  la base de donnĂ©es et au schĂ©ma parents est exigĂ© pour effectuer des opĂ©rations sur tout objet d’un schĂ©ma.

Pour obtenir des instructions sur la crĂ©ation d’un rĂŽle personnalisĂ© avec un ensemble spĂ©cifique de privilĂšges, voir CrĂ©ation de rĂŽles personnalisĂ©s.

Pour des informations gĂ©nĂ©rales sur les rĂŽles et les privilĂšges accordĂ©s pour effectuer des actions SQL sur des objets sĂ©curisables, voir Aperçu du contrĂŽle d’accĂšs.

Notes sur l’utilisation¶

  • L’appel multiple de cette mĂ©thode donne un rĂ©sultat additif pour le nombre d’expressions rĂ©guliĂšres associĂ©es Ă  l’instance.

  • Appeler chaque mĂ©thode dans une instruction SQL distincte (pas de chaĂźnage de mĂ©thodes).

  • Toutes les recherches d’expressions rĂ©guliĂšres Ă  des fins de classification ne sont pas sensibles Ă  la casse.

  • Testez l’expression rĂ©guliĂšre avant d’ajouter une expression rĂ©guliĂšre Ă  l’instance de classification personnalisĂ©e. Par exemple, utilisez la fonction [ NOT ] REGEXP pour vous assurer que seules les valeurs correspondant Ă  l’expression rĂ©guliĂšre sont renvoyĂ©es dans le rĂ©sultat :

    SELECT <col_to_classify>
    FROM <table_with_col_to_classify>
    WHERE <col_to_classify> REGEXP('<regex>');
    
    Copy

    Pour plus de détails, voir Fonctions de chaßne (expressions réguliÚres).

Exemples¶

Ajoutez des catĂ©gories et une expression rĂ©guliĂšre Ă  l’instance medical_codes :

CALL medical_codes!ADD_REGEX(
  'ICD_10_CODES',
  'IDENTIFIER',
  '[A-TV-Z][0-9][0-9AB]\.?[0-9A-TV-Z]{0,4}',
  'ICD.*',
  'Add a regex to identify ICD-10 medical codes in a column',
  0.8
);
Copy

Renvoie :

+---------------+
|   ADD_REGEX   |
+---------------+
| ICD_10_CODES  |
+---------------+