Que contient le système de prévention des pertes de données ?


  • FrançaisFrançais


  • Les solutions de prévention des pertes de données (DLP) étaient auparavant principalement utilisées pour se protéger contre les violations de données. Aujourd’hui, la donne a changé.

    Les technologies modernes se développent non seulement de manière expansive mais aussi intensive. Cela signifie le Outils DLP ont commencé à se développer en profondeur où leurs créateurs se concentrent sur l’amélioration de l’interception et de l’analyse des données. Les informations reçues par les solutions DLP deviennent particulièrement importantes pour prendre des décisions commerciales. Les outils InfoSec tels que DLP se transforment en services supplémentaires pour de nombreuses unités commerciales, de la comptabilité aux RH.

    Portée des solutions DLP

    Certes, une once de prévention vaut mieux que guérir. La DLP, bien sûr, est avant tout conçue pour prévenir. Les mesures de prévention des pertes de données peuvent-elles tirer parti de l’absence d’analyse ? En théorie, oui, c’est possible. En pratique, s’il suit cette approche, les restrictions et les contraintes vont être excessives. Une grande entreprise ne peut survivre si elle adopte une politique d’interdiction absolue. L’analyse DLP aide à sélectionner des entités et des processus spéciaux à restreindre. L’approche sélective du blocage domine dans le DLP.

    Le système DLP surveille et intercepte en permanence différents types de contenu. Il marque et organise le contenu. Les modèles et les étiquettes transforment la majeure partie des informations que vous détenez en un système consultable. Sinon, toute demande de recherche devra traiter toutes les données interceptées. Cela peut prendre trop de temps et ne pas renvoyer les résultats appropriés.

    Disons que vous allez rechercher un numéro de carte de crédit dans votre dump DLP. Un numéro de carte de crédit se compose de 16 chiffres. Cependant, en raison du formatage variable, il peut être écrit avec, les requêtes en texte intégral sont susceptibles de ne pas renvoyer toutes les correspondances ou aucune. Si vous étiquetez différentes options de formatage avec une étiquette « carte de crédit » et appliquez des formulaires standard, la recherche sera réussie. Votre recherche traite uniquement les données de carte de crédit. Le formulaire standard nettoiera plus tard tout formatage et stockera toutes les données sous forme de texte. Attribué à la balise « carte de crédit », le numéro capturé est répertorié dans votre base de données.

    Un système DLP examine également les chaînes d’événements. Cela cède la place aux outils d’analyse du comportement des utilisateurs (UBA). Les utilitaires UBA explorent les événements générés par les utilisateurs, évaluant le comportement de l’utilisateur. Une classification appropriée des événements permet une détection précoce à la fois de la non-conformité et exposition des appareils aux logiciels malveillants.

    Par exemple, vous pouvez voir la probabilité que votre membre du personnel démissionne en formant des chaînes égales. Une telle chaîne d’événements peut inclure – un employé envoie son curriculum vitae par courrier électronique, visite un site Web d’emploi ou contacte des employeurs potentiels.

    Formats de données à traiter

    Les données sont disponibles dans de nombreuses représentations. Les archives économisent une énorme quantité de mémoire. Les fichiers Office combinent des balises complexes, des images, des unités de texte et d’autres éléments auxiliaires.

    Le traitement rapide des informations nécessite une disponibilité instantanée des données pour le traitement. Pour éviter de graves dommages, la cybersécurité nécessite des actions toujours plus rapides. À cette fin, DLP propose des récupérateurs de données spécifiques au format. Ces récupérateurs dérivent des primitives de tous les formats de données que votre entreprise peut utiliser, tels que des bases de données, des images, des fichiers texte.

    Inutile de dire que les données présentées sous forme de texte brut fonctionnent mieux pour tout type d’analyse. La reconnaissance optique de caractères (OCR) est largement utilisée en DLP pour transformer des fichiers image en texte. À jour systèmes de vision industrielle traiter les photos en un clin d’œil en fournissant de nombreuses données pertinentes et consultables.

    Lorsqu’ils sont devenus disponibles pour examen dans le format structuré, les graphiques vectoriels ont récemment dérivé vers leur primitive de données unique.

    Il y a de fortes chances que les développements informatiques à venir nous permettront de récupérer des détails textuels complets de tous les types de données.

    Trois façons d’analyser les données DLP

    1. Sémantique

    Cette méthode utilise généralement un classificateur. Lorsqu’il n’y a pas d’échantillon exact sur lequel rechercher, la recherche sémantique détecte des classes d’informations dans les données à analyser.

    1. Formel

    Cette approche cherche à établir des modèles et des formes de données plutôt qu’une sémantique. Les expressions régulières sont une implémentation courante de cette méthode.

    1. Basé sur l’échantillon

    Comme son nom l’indique, cette technique permet de trouver un échantillon. Il utilise une ou plusieurs de ces entrées pour détecter les cibles à travers les primitives de données interrogeables.

    Affectation à une classe

    Lorsque vos données ont des valeurs distinctes, elles peuvent être affectées à une certaine catégorie ou classe d’informations en fonction de ces valeurs. Pics n’avait pas fait l’objet de cette mission jusqu’à récemment. Les progrès de l’informatique et la croissance des capacités informatiques ont également permis d’attribuer des classes aux images.

    DLP n’adopte de nouvelles méthodes que dans la mesure où elles améliorent sérieusement le rendement, tant en termes de qualité que de temps de traitement. Le traitement des données ne peut pas attendre là où la sécurité est en jeu. Une réponse tardive pourrait être inutile. Le nombre d’événements traités par un système de prévention des fuites de données dépasse généralement le million par jour. Les principes de sécurité actuels ne permettent pas tout retard car les dommages anticipés sont énormes.

    Un ensemble d’apprentissage étiqueté alimente la classification des données. Le système DLP attribue chaque fichier suivi à une ou plusieurs de ses catégories établies. Les dossiers de fichiers sur votre ordinateur sont un exemple d’un tel système. Le classificateur est entraîné de la manière suivante : d’abord, les fichiers de la collection subissent une sorte d’échantillonnage qui sélectionne leurs traits distincts. Par exemple, dans les photos, il recherche des points distinctifs ; dans docs, il recherche des mots-clés et de la terminologie. La formation est basée sur les traits établis. Un classificateur entraîné est prêt à traiter le flux de données.

    Les entreprises d’un même secteur ont tendance à avoir des lexiques différents, peu importe qu’elles décrivent le même sujet. Ils utilisent également différents formats et types de données. Cela implique que les entreprises ne peuvent pas utiliser le même classificateur. Les opérateurs de systèmes DLP doivent former individuellement leurs classificateurs pour chaque entreprise. Étant donné que les classes, les traits distincts et les types de données peuvent changer, votre classificateur doit également être réformé à l’avenir pour intégrer toutes les mises à jour.

    En ce qui concerne les formats de texte, il existe de nombreux développements en matière d’apprentissage automatique, tels que la régression logistique et la similarité en cosinus.

    « Au commencement, il y avait la Parole. DLP utilise les mots comme des traits distincts. Pour chaque mot (morphème), les langues ont des ensembles de formes (lexèmes). Les morphèmes ont tendance à rester inchangés. Les classificateurs ne recherchent pas de lexèmes. Ils travaillent avec des morphèmes où tous sont ramenés à une forme normale. Les dictionnaires morphologiques contribuent le mieux à la classification des données textuelles. Sinon, le classificateur ne peut traiter que des formes de mots spécifiques. Une autre façon d’améliorer les performances du système est la détection et la correction des mots mal orthographiés.

    Correspondance floue

    La correspondance approximative (également connue sous le nom d’analyse du droit d’auteur) est utilisée pour rechercher des parties de votre échantillon de référence dans les données à analyser. La correspondance floue se divise en techniques spécifiques au type de données qu’elle traite. Cependant, chacune de ces techniques met en œuvre des flux de travail similaires. DLP utilise les exemples définis comme références pour rechercher des correspondances parmi les éléments de données qu’il capture. Alors que chaque méthode de correspondance floue cible un seul type de données, le système DLP peut gérer un grand nombre d’échantillons de référence. Vous pouvez définir un million de fichiers comme références pour la correspondance approximative.

    Jetons un coup d’œil aux méthodes d’appariement floues les plus courantes.

    1. Si vous définissez un fichier texte comme référence et travaillez exclusivement avec des primitives, effectuez une analyse de copyright classique. L’algorithme DLP calcule la proportion d’éléments suivis correspondant à certains fragments d’un ou plusieurs échantillons de référence. Il montre la pertinence des documents interceptés. Il met également en évidence les correspondances dans l’interface graphique.
    2. Les données binaires sont également disponibles pour la correspondance floue classique. Il est entendu que pour les données binaires, il n’y a pas de comparaison de texte exacte. Il ne détermine que la pertinence.
    3. Les graphiques raster sont également éligibles pour la correspondance floue. Dans ce cas, les performances dépendent de manière critique de la définition d’un rapport vitesse/qualité réalisable.
    4. La correspondance floue traite également les graphiques vectoriels. Il récupère les primitives et compare la position dans l’image aux échantillons définis comme références. Vous pouvez configurer la plupart des systèmes DLP pour récupérer des parties d’images vectorielles.
    5. La correspondance floue dédiée entre en jeu lorsque vous traitez un problème spécifique qui se produit assez souvent. Diverses formes les sondages sont un atout commercial sans cesse croissant. Par exemple, vous pouvez souhaiter être averti lorsque le document est un questionnaire. Vous pouvez définir un modèle vierge comme échantillon de référence pour détecter ses correspondances approximatives parmi les fichiers suivis. Le système DLP peut récupérer les réponses des questionnaires analysés.
    6. Une autre implémentation populaire de la correspondance floue analyse les données graphiques où les sceaux et les tampons sont définis comme échantillons de référence.
    7. Avec la correspondance floue, vous pouvez même trouver une image qui fait partie d’une autre image. Vous pouvez détecter les cartes de crédit non seulement par 16 chiffres, mais aussi par un logo de système de paiement.

    Conclusion

    Les systèmes de prévention des pertes de données sont devenus un élément indispensable de l’infrastructure informatique des entreprises. Cependant, pour tirer le meilleur parti d’un outil DLP, chaque client doit faire de son mieux pour ajuster un système DLP à ses besoins spécifiques. L’engagement des fournisseurs dans ce réglage est essentiel.

    La demande de prévention des pertes de données augmente et, ce qui est encore plus important, évolue. Cela présente de nouveaux défis, car de nouveaux types de données, d’événements et de canaux de communication nécessitent une sécurité renforcée. Comme toujours plus de gens travailler à distance la demande de DLP sur site et dans le cloud augmente considérablement.

    Le marché du DLP a beaucoup évolué tant au niveau des performances des systèmes que de leurs capacités d’analyse. Les caractéristiques des produits mis à disposition sur le marché incluent, sans s’y limiter, le suivi et l’examen des liaisons du personnel avec des tiers, des représentations visuelles de ces relations, la détection des comportements étranges des employés, la détermination des liens informels avec l’entreprise, la réponse préalable aux défis et aux urgences.

    Les solutions DLP se développent depuis le début des années 2000. Leur marché offre une grande variété de produits. Dans le même temps, des rumeurs disent que le jeu est terminé car il n’y a plus de place pour une nouvelle croissance. Ne vous y trompez pas car nous constatons que la prévention des pertes de données ne se limite pas à la cybersécurité. Les utilisateurs professionnels et privés tirent parti de ses fonctionnalités pour répondre à une variété de nouveaux problèmes commerciaux.

    privacy-pc.com

    Source

    La Rédaction

    L'équipe rédactionnnelle du site

    Pour contacter personnellement le taulier :

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

    Copy code