Des chercheurs simulent des fuites de confidentialité dans des études de génomique fonctionnelle –

  • FrançaisFrançais



  • Le domaine de la génomique fonctionnelle, qui examine les activités du génome et les niveaux d’expression génique plutôt que des mutations génétiques particulières, repose généralement sur l’agrégation d’informations provenant de nombreux échantillons pour sa puissance statistique. Cela signifie qu’il est vital de partager largement les données brutes; Cependant, le partage de ces données est actuellement difficile en raison des préoccupations de confidentialité des individus au sein de ces ensembles de données, ce qui fait que ces données sont largement inaccessibles derrière des pare-feu.

    Dans une étude publiée le 12 novembre dans la revue Cellule, une équipe d’enquêteurs démontre qu’il est possible de désidentifier ces données pour garantir la confidentialité des patients. Ils démontrent également comment ces données brutes pourraient être reliées à des individus spécifiques grâce à leurs variantes génétiques par quelque chose d’aussi simple qu’une tasse de café abandonnée si ces mesures d’assainissement ne sont pas mises en place.

    «Le but de cette étude est de trouver des moyens pratiques de partager largement les données brutes sans créer de problèmes de confidentialité excessifs», déclare l’auteur principal Mark Gerstein, professeur de bioinformatique à l’Université de Yale.

    La recherche en génomique fonctionnelle est souvent liée à une maladie spécifique. Par exemple, une enquête sur une condition psychiatrique particulière pourrait examiner l’expression de certains gènes dans un type de neurone. Et, de par la nature de l’inclusion de leur matériel génétique dans une telle étude, le statut médical d’un individu par rapport à cette condition pourrait être révélé par inadvertance.

    Cela peut se produire via ce que l’on appelle un quasi-identifiant. Le fonctionnement d’un quasi-identifiant est que si quelqu’un a suffisamment de points de données individuels sur vous, même si ces données ne sont pas sensibles ou uniques, elles peuvent être combinées pour créer un identifiant qui vous est unique. Dans un contexte non génétique, cela signifie que si quelqu’un a votre code postal, votre anniversaire, le modèle de voiture que vous conduisez et d’autres données similaires qui pourraient ne pas être considérées comme privées ou sensibles en soi, ils pourraient éventuellement les combiner et créez un profil unique qui vous lierait à d’autres données que vous ne voudriez pas voir publiques – des données telles que des dossiers financiers qui ont été collectés lorsque vous avez demandé un prêt automobile. La même chose pourrait arriver si quelqu’un pouvait obtenir certaines de vos variantes génétiques et lier ces variantes à la présence de votre matériel génétique dans une étude sur une maladie particulière. Cela pourrait à son tour révéler un diagnostic, tel que le statut VIH ou une prédisposition héréditaire au cancer, que vous préféreriez garder privé.

    Dans leur étude, les chercheurs ont construit un scénario «d’attaque de liaison» pour démontrer comment quelqu’un pouvait établir ce type de connexions à partir des données d’études de génomique fonctionnelle en utilisant l’ADN obtenu à partir d’une tasse de café jetée. Après avoir ajouté des échantillons de deux participants consentants à une base de données génomique fonctionnelle, les chercheurs ont rassemblé des tasses à café usagées des mêmes individus. Ils ont séquencé le matériel génétique laissé sur les coupelles et ont réussi à faire correspondre ce matériel aux échantillons de la base de données et à déduire des informations de santé sensibles sur les participants. Les chercheurs ont également pu utiliser des informations ADN «volées» dans une base de données de génotypage pour faire correspondre les identités de 421 personnes avec des informations phénotypiques trouvées dans un ensemble de données de génomique fonctionnelle que les chercheurs ont construit pour 436 personnes.

    Cependant, les chercheurs ont également identifié des mesures qui peuvent être prises pour contrecarrer ces types d’attaques de liaison et protéger les informations sur la santé des participants lorsque des ensembles de données génomiques fonctionnelles sont partagés. «La génomique fonctionnelle est particulière car les variantes ne sont généralement pas nécessaires pour le traitement des données», déclare le premier auteur Gamze Gürsoy, chercheur postdoctoral au laboratoire de Gerstein. “Pour cette raison, nous pouvons désinfecter les variantes pour éviter que les données ne soient reliées aux informations privées liées aux phénotypes inclus dans ces études, tout en conservant l’utilité des données.”

    Pour atteindre cet équilibre entre confidentialité et utilité des données, les chercheurs proposent une manipulation du format de fichier qui permettra de partager des données brutes de génomique fonctionnelle tout en réduisant largement les fuites d’informations sensibles en généralisant les informations sur les variantes phénotypiques. Le format de fichier est basé sur un système de format de fichier standard largement utilisé, est compatible avec une gamme de logiciels et de pipelines et, une fois testé, a montré une faible perte d’utilité. Les chercheurs ont également développé un cadre avec lequel d’autres chercheurs peuvent ajuster le niveau de confidentialité et d’équilibre d’utilité qu’ils souhaitent atteindre avec le format de fichier basé sur les politiques et les consentements des donateurs.

    «À mesure que de plus en plus de données sont publiées pour ces types d’études de génomique fonctionnelle, les préoccupations concernant la sécurité et la confidentialité ne devraient pas être perdues», déclare Gerstein. «À l’aube d’Internet, les gens ne réalisaient pas à quel point leurs activités en ligne deviendraient importantes. Maintenant, ce type de confidentialité numérique est devenu si important pour nous. Si nous entrons dans une ère où le séquençage de votre génome devient une routine, nous ne Je ne veux pas que ces inquiétudes au sujet de la confidentialité en matière de santé deviennent dominantes. “

    Ce travail a été soutenu par les National Institutes of Health, le fonds AL Williams Professorship et le Chan Zuckerberg Initiative Donor-Advised Fund.

    Source de l’histoire:

    Matériel fourni par Presse cellulaire. Remarque: le contenu peut être modifié pour le style et la longueur.

    Source

    N'oubliez pas de voter pour cet article !
    1 Star2 Stars3 Stars4 Stars5 Stars (No Ratings Yet)
    Loading...

    Houssen Moshinaly

    Rédacteur web depuis 2009 et webmestre depuis 2011.

    Je m'intéresse à tous les sujets comme la politique, la culture, la géopolitique, l'économie ou la technologie. Toute information permettant d'éclairer mon esprit et donc, le vôtre, dans un monde obscur et à la dérive.

    Je suis l'auteur de plusieurs livre

    Pour me contacter personnellement :

    Laisser un commentaire

    Votre adresse e-mail ne sera pas publiée.