IDENTIFYING AND PREVENTING LEAKS OF SENSITIVE INFORMATION

Determining sensitive information and preventing the unauthorized or unintended dissemination of such information are disclosed. Terms are determined from documents associated with users in a network. Distributions among users and relative frequencies with which the terms are used are determined. Li...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Hauptverfasser: HURWITZ, JOSHUA B, KUHLMAN, DOUGLAS A, FU, ZHI
Format: Patent
Sprache:eng ; fre
Schlagworte:
Online-Zugang:Volltext bestellen
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Beschreibung
Zusammenfassung:Determining sensitive information and preventing the unauthorized or unintended dissemination of such information are disclosed. Terms are determined from documents associated with users in a network. Distributions among users and relative frequencies with which the terms are used are determined. Link strengths between users are calculated. Based on the distribution of the terms, the relative frequencies of use among the user profiles and link strengths between users conducting information transactions that include the terms, a sensitivity level for each term can be determined. To determine whether a particular information transaction with particular terms may be conducted between two users in the network, a combination of link strength between the users and sensitivity level of the terms with respect to the users or users' profiles are considered. If the information transaction includes terms that are unknown to one of the users, then a warning or alarm can be raised. La présente invention se rapporte à un procédé adapté pour déterminer des informations sensibles et empêcher que ces informations ne soient disséminées de façon involontaire ou non autorisée. Le procédé selon l'invention consiste : à déterminer des termes à partir de documents associés à des utilisateurs au sein d'un réseau ; à déterminer des distributions entre des utilisateurs ainsi que des fréquences relatives auxquelles les termes sont employés ; à calculer des intensités de liens entre des utilisateurs ; à déterminer un niveau de sensibilité de chaque terme sur la base de la distribution des termes, des fréquences relatives d'utilisation entre les profils d'utilisateurs et des intensités de liens entre des utilisateurs qui exécutent des transactions d'informations qui contiennent les termes ; à prendre en compte une combinaison des intensités de liens entre des utilisateurs et du niveau de sensibilité des termes par rapport aux utilisateurs ou aux profils d'utilisateurs, dans le but de déterminer si une transaction d'informations particulière qui contient des termes particuliers peut être exécutée entre deux utilisateurs au sein du réseau ; et à déclencher une mise en garde ou une alarme si la transaction d'informations contient des termes qui sont inconnus de l'un des utilisateurs.