AUTOMATIC IDENTIFICATION OF ABSTRACT ONLINE GROUPS
Online abstract groups, in which members aren't explicitly connected, can be automatically identified by computer-implemented methods. The methods involve harvesting records from social media and extracting content-based and structure-based features from each record. Each record includes a soci...
Gespeichert in:
Hauptverfasser: | , , , , |
---|---|
Format: | Patent |
Sprache: | eng ; fre |
Online-Zugang: | Volltext bestellen |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Zusammenfassung: | Online abstract groups, in which members aren't explicitly connected, can be automatically identified by computer-implemented methods. The methods involve harvesting records from social media and extracting content-based and structure-based features from each record. Each record includes a social-media posting and is associated with one or more entities. Each feature is stored on a data storage device and includes a computer-readable representation of an attribute of one or more records. The methods further involve grouping records into record groups according to the features of each record. Further still the methods involve calculating an n-dimensional surface representing each record group and defining an outlier as a record having feature-based distances measured from every n-dimensional surface that exceed a threshold value. Each of the n-dimensional surfaces is described by a footprint that characterizes the respective record group as an online abstract group.
Des groupes réduits en ligne, dont les membres ne sont pas connectés explicitement, peuvent être identifiés automatiquement grâce à des procédés mis en oeuvre par ordinateur. Lesdits procédés consistent à collecter des enregistrements à partir de médias sociaux et à extraire de chaque enregistrement des caractéristiques basées sur des contenus et basées sur des structures. Chaque enregistrement inclut une publication sur média social et est associé à une ou plusieurs entités. Chaque caractéristique est stockée dans un dispositif de stockage de données et comporte une représentation lisible par ordinateur d'un attribut d'un ou plusieurs enregistrements. Lesdits procédés comprennent en outre le regroupement des enregistrements pour former des groupes d'enregistrements selon les caractéristiques de chaque enregistrement. De plus, les procédés impliquent le calcul d'une surface à n dimensions qui représente chaque groupe d'enregistrements et qui définit une observation aberrante sous la forme d'un enregistrement ayant des distances, basées sur des caractéristiques, qui sont mesurées à partir de chaque surface à n dimensions excédant une valeur seuil. Chacune des surfaces à n dimensions est décrite par une empreinte qui fait du groupe d'enregistrements concerné un groupe réduit en ligne. |
---|