Movatterモバイル変換


[0]ホーム

URL:


FR2937759A1 - Advertisement selecting system for broadcasting advertisement during consultation of e.g. consumer advice on online sale site, has selection module selecting advertisement to be broadcasted during content consultation, based on expressions - Google Patents

Advertisement selecting system for broadcasting advertisement during consultation of e.g. consumer advice on online sale site, has selection module selecting advertisement to be broadcasted during content consultation, based on expressions
Download PDF

Info

Publication number
FR2937759A1
FR2937759A1FR0805977AFR0805977AFR2937759A1FR 2937759 A1FR2937759 A1FR 2937759A1FR 0805977 AFR0805977 AFR 0805977AFR 0805977 AFR0805977 AFR 0805977AFR 2937759 A1FR2937759 A1FR 2937759A1
Authority
FR
France
Prior art keywords
content
advertisement
published
regular expressions
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
FR0805977A
Other languages
French (fr)
Inventor
David Tilloy
Bastien Hillen
Didier Sprunck
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sacan & Target
Original Assignee
Sacan & Target
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sacan & TargetfiledCriticalSacan & Target
Priority to FR0805977ApriorityCriticalpatent/FR2937759A1/en
Publication of FR2937759A1publicationCriticalpatent/FR2937759A1/en
Withdrawnlegal-statusCriticalCurrent

Links

Classifications

Landscapes

Abstract

The system (10) has a receiving interface (3) accessible by an Internet (1) for users (2) to receive content to be advertised, where the content is created by the users and contains text. An automated analyzing module (4) is provided in communication with the interface. The module analyzes, in real time, a group of text included in the content by identifying regular expressions satisfied by the text, during reception of the content. A selection module (5) selects an advertisement to be broadcasted during consultation of the content, based on the identified expressions. Independent claims are also included for the following: (1) a system for broadcasting an advertisement comprising an advertisement selecting system (2) a method for selecting an advertisement.

Description

Translated fromFrench

SYSTEME DE DIFFUSION DE PUBLICITESADVERTISEMENT DIFFUSION SYSTEM

L'invention concerne la publication de contenu sur Internet, et en particulier l'affichage de publicités sur des sites Internet dont le contenu éditorial 5 est en partie généré par des utilisateurs. Le mode d'édition ou de publication du contenu des sites Internet a très fortement évolué ces dernières années. La fréquence de mise à jour des sites Internet s'est très fortement accrue, le contenu des ces sites devenant ainsi de plus en plus dynamique. De plus, le contenu des sites était initialement généré 10 et publié par l'éditeur d'un service lui-même. Les visiteurs de ces sites étaient essentiellement consommateurs de l'information publiée. Avec la généralisation des accès Internet à haut débit, un nombre croissant de sites Internet publient dorénavant du contenu généré par des utilisateurs, dit contenu UGC (pour User Generated Content en langue anglaise). Les sites Internet deviennent ainsi 15 beaucoup plus participatifs. Le nombre d'utilisateurs auteurs de contenus UGC s'élèverait ainsi à 157 millions en 2008 selon des estimations. Les contenus UGC apparaissent notamment sur des sites marchands sous forme de commentaires concernant les produits mis en vente. Les réseaux sociaux ou sites communautaires sont également d'importants éditeurs de 20 contenus UGC. D'autres sites publient du contenu UGC, sous la forme de blogs, de forums de discussion, d'annonces ou de pages personnelles. La plupart des éditeurs de service accroît ainsi la publication de contenus UGC afin de dynamiser leurs services et de fidéliser leurs utilisateurs. Du fait du trafic de consultation de ces contenus UGC (plus d'un 25 internaute européen sur deux consulte au moins une fois par semaine un site de réseau social par exemple), les sites Internet publiant ces contenus présentent un intérêt économique certain pour les publicitaires. Les méthodes publicitaires classiques sont aujourd'hui utilisées pour ces sites, à savoir : 30 L'éditeur du site sélectionne au préalable des bandeaux ou des fenêtres publicitaires qu'il associe aux différents thèmes de son service (sport/santé/Cinéma...). Ces bandeaux ou fenêtres publicitaires sont alors diffusés vers l'utilisateur qui consulte des contenus publiés (dont des UGC) appartenant à un thème donné. 35 Cependant, ces publicités ne prennent pas en compte les sujets des contenus au moment où ils sont publiés sur le service. L'éditeur peut également mettre en place des liens sponsorisés afin de monétiser l'audience de son service. Dans ce cas, les liens sont redéfinis après que le contenu publié ait été analysé par un moteur de recherche tel que Google. II faut cependant attendre plusieurs heures (de 6 heures à plusieurs jours) pour que les robots du moteur de recherche de liens sponsorisés viennent indexer les mises à jour du site (y compris les UGC) et donc redéfinir des liens sponsorisés en adéquation avec le thème du contenu publié. Avant que les robots du moteur de recherche n'aient réalisé leur indexation, les publicités sélectionnées ne sont pas particulièrement bien adaptées aux contenus UGC publiés, donc souvent hors sujet. Par conséquent, le taux de consultation des publicités sélectionnées est assez bas. Les revenus publicitaires actuels de ces services sont ainsi beaucoup plus faibles que leur audience ne le laisserait supposer. Par ailleurs, le cadre juridique pour les éditeurs ou responsables de contenus Web devient de plus en plus contraignant. En effet, un nombre croissant de législations rend l'éditeur du site responsable du contenu créé par ses utilisateurs. L'éditeur du site peut ainsi être poursuivi pour des atteintes aux droits de propriété intellectuelle, pour diffamations, pour menaces ou encore pour incitations à la violence, à la consommation de drogue ou au racisme, du simple fait de publier du texte créé par ses utilisateurs. L'éditeur doit également s'assurer que les contenus UGC sont conformes à la ligne éditoriale définie, pour éviter de dégrader son image auprès de ses utilisateurs. L'éditeur doit notamment s'assurer de l'absence de vulgarité, pornographie ou dénigrement de ces contenus. L'éditeur doit en outre s'assurer de l'absence de tentatives de détournement de trafic réalisées par l'intermédiaire de contenus UGC.The invention relates to the publication of content on the Internet, and in particular the display of advertisements on websites whose editorial content 5 is partly generated by users. The way of publishing or publishing the content of Internet sites has evolved considerably in recent years. The frequency with which websites have been updated has greatly increased, as the content of these sites is becoming more and more dynamic. In addition, the content of the sites was initially generated and published by the publisher of a service itself. Visitors to these sites were primarily consumers of the published information. With the generalization of broadband Internet access, a growing number of Internet sites now publish user-generated content, known as User Generated Content (UGC) content. The Internet sites thus become much more participative. The number of UGC content authors is estimated at 157 million in 2008. The UGC contents appear in particular on commercial sites in the form of comments concerning the products put on sale. Social networks or community sites are also major publishers of 20 UGC content. Other sites post UGC content in the form of blogs, discussion boards, ads or personal pages. Most service publishers increase the publication of UGC content to boost their services and retain their users. Because of the traffic of consultation of these UGC content (more than 25 out of every two Internet users consult a social network site at least once a week), the websites publishing this content are of economic interest for advertisers. . The standard advertising methods are currently used for these sites, namely: The publisher of the site first selects banners or pop-ups that he associates with the different themes of his service (sport / health / cinema ... ). These banners or advertising windows are then distributed to the user who consults published contents (including UGC) belonging to a given theme. However, these advertisements do not take into account the topics of the content as they are published on the service. The publisher can also set up sponsored links to monetize the audience of his service. In this case, the links are redefined after the published content has been analyzed by a search engine such as Google. However, it is necessary to wait several hours (from 6 hours to several days) so that the robots of the search engine of sponsored links come to index the updates of the site (including the UGC) and thus to redefine sponsored links in adequacy with the theme published content. Before the search engine robots have indexed, the ads selected are not particularly well suited to published UGC content, so often off topic. As a result, the consultation rate of the selected advertisements is quite low. The current advertising revenues of these services are thus much lower than their audience would suggest. In addition, the legal framework for publishers or web content managers is becoming more and more restrictive. Indeed, an increasing number of legislations makes the publisher of the site responsible for the content created by its users. The publisher of the site can be prosecuted for infringement of intellectual property rights, for defamation, for threats or for incitement to violence, drug use or racism, simply to publish text created by his users. The publisher must also ensure that UGC content is consistent with the editorial line defined, to avoid degrading its image among its users. The publisher must ensure the absence of vulgarity, pornography or disparagement of these contents. The publisher must also ensure that there are no attempts to divert traffic through UGC content.

Dans le processus de publication, le contenu UGC est mis en ligne, puis des services de modération de l'éditeur du service analysent ce contenu et le retirent lorsque celui-ci est jugé incorrect. Pour éviter au maximum d'être confronté à ces problèmes, l'éditeur doit mettre en oeuvre des services de modération d'autant plus importants que le volume de contenu UGC publié est élevé. De telles équipes de modérations ont un coût qui peut rendre le modèle économique du site Internet non viable. En pratique, les équipes de modération deviennent rapidement incapables de traiter la totalité du contenu UGC à publier. L'invention vise à résoudre un ou plusieurs de ces inconvénients.In the publishing process, the UGC content is put online, and moderation services from the service publisher analyze this content and remove it when it is deemed incorrect. To avoid as much as possible of having to deal with these problems, the publisher must implement moderation services that are all the more important as the volume of published UGC content is high. Such moderation teams have a cost that can make the economic model of the website unsustainable. In practice, moderation teams quickly become unable to process all of the UGC content to be published. The invention aims to solve one or more of these disadvantages.

L'invention porte ainsi sur un système de sélection d'une publicité, la publicité sélectionnée étant destinée à être diffusée lors de la consultation du contenu publié par l'éditeur d'un site Internet et créé par un utilisateur du site Internet, le système comprenant: - une interface de réception accessible par Internet pour des utilisateurs, apte à recevoir un contenu à publier créé par ces utilisateurs, ce contenu incluant du texte; - un module d'analyse automatisée en communication avec l'interface de réception, incluant une base de données d'expressions régulières, et analysant en temps réel lors de la réception du contenu l'ensemble du texte inclus dans le contenu à publier par identification des expressions régulières satisfaites par ce texte ; - un module de sélection d'une publicité, sélectionnant une publicité à diffuser lors de la consultation du contenu en fonction des expressions régulières identifiées. Selon une variante, le module d'analyse automatisée et le module de sélection sont connectés par l'intermédiaire d'un réseau informatique longue distance.The invention thus relates to a system for selecting an advertisement, the selected advertisement being intended to be broadcast during the consultation of the content published by the publisher of a website and created by a user of the website, the system comprising: - a reception interface accessible by the Internet for users, able to receive a content to be published created by these users, this content including text; an automated analysis module in communication with the reception interface, including a database of regular expressions, and analyzing in real time when the content is received all the text included in the content to be published by identification regular expressions satisfied by this text; a module for selecting an advertisement, selecting an advertisement to be displayed when the content is viewed according to the identified regular expressions. According to one variant, the automated analysis module and the selection module are connected via a long-distance computer network.

Selon encore une variante, le module d'analyse automatisée comprend une interface d'ajout d'expressions régulières dans la base de données. Selon encore une variante, le module d'analyse automatisée comprend une interface de réception de mots transmis par le module de sélection et destinés à être transformés en expressions régulières à ajouter dans la base de données. Selon une autre variante, le module d'analyse comprend plusieurs bases de données comprenant chacune un ensemble d'expressions régulières associées à un thème syntaxique. Selon encore une autre variante, le module d'analyse automatisée calcule un score pour chaque thème syntaxique en fonction de ses expressions régulières identifiées, le module de sélection sélectionnant la publicité à diffuser en fonction des scores calculés. L'invention porte également sur un système de diffusion d'une publicité, comprenant : -un système de sélection d'une publicité tel que décrit ci-dessus ; -une interface de diffusion accessible par Internet pour des utilisateurs, l'interface de diffusion publiant le contenu reçu et diffusant ladite publicité sélectionnée dès la publication du contenu. Selon une variante, l'analyse, la sélection de la publicité et la publication 35 du contenu sont effectuées en temps réel. L'invention porte en outre sur un procédé de sélection d'une publicité destinée à être diffusée lors de la consultation du contenu d'un site Internet publié par un éditeur et créé par un utilisateur du site Internet, comprenant les étapes de : -recevoir d'un utilisateur par Internet un contenu à publier créé par cet utilisateur, ce contenu incluant du texte ; - en temps réel et automatiquement lors de la réception, analyser l'ensemble du texte du contenu à publier par identification d'expressions régulières satisfaites par le texte et contenues dans une base de données; -sélectionner une publicité à diffuser lors de la consultation du contenu en fonction des expressions régulières identifiées. L'invention porte par ailleurs sur un système de filtration d'un contenu publié par l'éditeur d'un site Internet et créé par un utilisateur du site Internet: -une interface de réception accessible par Internet pour des utilisateurs, apte à recevoir un contenu à publier créé par ces utilisateurs, ce contenu incluant du texte; - un module d'analyse automatisée en communication avec l'interface de réception, incluant une base de données d'expressions régulières, analysant en temps réel lors de la réception du contenu l'ensemble du texte inclus dans le contenu à publier par identification des expressions régulières satisfaites par ce texte, et générant un avis identifiant si le contenu peut être publié ou non, ou si le contenu est à risque en fonction des expressions régulières identifiées ; -des moyens de transmissions à un modérateur humain du contenu pour lequel l'avis identifie que le contenu est à risque.According to another variant, the automated analysis module includes an interface for adding regular expressions in the database. According to another variant, the automated analysis module comprises a word receiving interface transmitted by the selection module and intended to be transformed into regular expressions to be added in the database. According to another variant, the analysis module comprises several databases each comprising a set of regular expressions associated with a syntactic theme. According to yet another variant, the automated analysis module calculates a score for each syntactic theme according to its regular expressions identified, the selection module selecting the advertisement to be broadcast based on the scores calculated. The invention also relates to a system for broadcasting an advertisement, comprising: a system for selecting an advertisement as described above; an Internet-accessible broadcast interface for users, the broadcast interface publishing the received content and broadcasting said selected advertisement as soon as the content is published. According to one variant, the analysis, the selection of the advertisement and the publication of the content are carried out in real time. The invention furthermore relates to a method of selecting an advertisement intended to be broadcast during the consultation of the content of a website published by an editor and created by a user of the website, comprising the steps of: -receceive a user via the Internet a content to be published created by this user, this content including text; - in real time and automatically during the reception, analyze all the text of the content to be published by identification of regular expressions satisfied by the text and contained in a database; -select an advertisement to broadcast when viewing the content based on the identified regular expressions. The invention furthermore relates to a system for filtering content published by the publisher of a website and created by a user of the website: a reception interface accessible via the Internet for users, able to receive a content to be published created by these users, this content including text; an automated analysis module in communication with the reception interface, including a database of regular expressions, analyzing in real time when the content is received all the text included in the content to be published by identification of the contents; regular expressions satisfied by this text, and generating a notice identifying whether the content may be published or not, or whether the content is at risk based on the regular expressions identified; means for transmitting to a human moderator the content for which the notice identifies that the content is at risk.

D'autres caractéristiques et avantages de l'invention ressortiront clairement de la description qui en est faite ci-après, à titre indicatif et nullement 25 limitatif, en référence aux dessins annexés, dans lesquels : - la figure 1 est une représentation schématique d'un exemple de système de diffusion de publicité selon invention ; - la figure 2 est un algorithme de diffusion d'une publicité par le système de la figure 1 ; 30 -la figure 3 est une représentation schématique d'un exemple de système de filtrage pour de la modération ; - la figure 4 est un algorithme de fonctionnement du système de la figure 3.Other features and advantages of the invention will emerge clearly from the description which is given below, by way of indication and in no way limitative, with reference to the appended drawings, in which: FIG. 1 is a diagrammatic representation of an example of an advertising distribution system according to the invention; FIG. 2 is an algorithm for broadcasting an advertisement by the system of FIG. 1; FIG. 3 is a schematic representation of an exemplary filtering system for moderation; FIG. 4 is an operating algorithm of the system of FIG. 3.

35 L'invention propose un système de sélection d'une publicité destinée à être diffusée lors de la consultation d'un contenu publié par un éditeur d'un site Internet et créé par un utilisateur du site. Le contenu créé par l'utilisateur inclut du texte et est reçu par Internet. Ce contenu est destiné à être consulté par d'autres utilisateurs après sa publication. Le texte de ce contenu est analysé en temps réel lors de la réception, en identifiant dans une base de données une ou plusieurs expressions régulières ou expressions rationnelles satisfaites par ce texte. Une publicité à diffuser lors de la consultation du contenu est ensuite sélectionnée en fonction des expressions régulières identifiées.The invention proposes a system for selecting an advertisement intended to be broadcast during the consultation of a content published by an editor of a website and created by a user of the site. User-created content includes text and is received over the Internet. This content is intended to be viewed by other users after its publication. The text of this content is analyzed in real time during reception, by identifying in a database one or more regular expressions or regular expressions satisfied by this text. An advertisement to be diffused during the consultation of the content is then selected according to the identified regular expressions.

La figure 1 représente de façon schématique un système de diffusion d'une publicité 10. Le système de diffusion d'une publicité inclut un système de sélection de la publicité. Le système de sélection de publicité comprend une interface de réception 3, un module d'analyse automatisée 4 et un module de sélection 5. Le réseau Internet 1 fournit à un utilisateur 2 un accès à l'interface 3. Par cet accès, l'interface 3 reçoit (étape 201) un contenu incluant du texte créé par l'utilisateur 2 et destiné à être publié. Dans l'exemple, l'interface de réception 3 est également hébergée par le serveur d'un éditeur de service Internet publiant les contenus créés par des utilisateurs pour les rendre accessibles à d'autres utilisateurs du service. L'interface de réception 3 transmet (étape 202) le contenu reçu au module d'analyse automatisée 4. L'interface de réception 3 est avantageusement connectée au module d'analyse 4 par l'intermédiaire d'un réseau informatique longue distance, le réseau Internet 1 dans l'exemple. Le module d'analyse 4 pourra notamment être géré par un prestataire proposant un service d'analyse à distance de contenus à publier à différents éditeurs de contenus. Le prestataire pourra notamment proposer une application installée sur le serveur hébergeant l'interface de réception 3, cette application transmettant automatiquement le texte du contenu au module d'analyse 4 lors de sa réception. Le module d'analyse 4 comprend une base de données 41 d'expressions régulières. En temps réel lors de la réception du contenu à publier, le module d'analyse 4 identifie (étape 203) les expressions régulières de la base de données 41 qui sont satisfaites par le texte du contenu à publier. La formulation et la syntaxe des expressions régulières sont connues en soi de l'homme du métier. Du fait que l'analyse est effectuée en temps réel lors de la réception du contenu à publier, il n'est pas nécessaire d'attendre plusieurs heures ou jours avant de disposer d'informations permettant de sélectionner une publicité à diffuser avec le contenu.Figure 1 schematically illustrates an advertisement broadcast system 10. The advertisement broadcast system includes an advertisement selection system. The advertising selection system comprises a reception interface 3, an automated analysis module 4 and a selection module 5. The Internet network 1 provides a user 2 access to the interface 3. By this access, the interface 3 receives (step 201) content including text created by the user 2 and intended to be published. In the example, the reception interface 3 is also hosted by the server of an Internet service publisher publishing the contents created by users to make them accessible to other users of the service. The reception interface 3 transmits (step 202) the received content to the automated analysis module 4. The reception interface 3 is advantageously connected to the analysis module 4 via a long-distance computer network, the Internet network 1 in the example. The analysis module 4 may in particular be managed by a provider offering a remote analysis service for content to be published to different content editors. The provider may in particular propose an application installed on the server hosting the reception interface 3, this application automatically transmitting the text of the content to the analysis module 4 when it is received. The analysis module 4 includes a database 41 of regular expressions. In real time when receiving the content to be published, the analysis module 4 identifies (step 203) the regular expressions of the database 41 which are satisfied by the text of the content to be published. The formulation and the syntax of the regular expressions are known to those skilled in the art. Because the analysis is done in real time when receiving the content to be published, it is not necessary to wait several hours or days before having information to select an advertisement to broadcast with the content.

Le module d'analyse 4 transmet (étape 204) des informations concernant les expressions régulières identifiées à un module de sélection d'une publicité 5. Le module d'analyse 4 est connecté au module de sélection 5 par l'intermédiaire du réseau Internet 1. En fonction des expressions régulières identifiées dans le texte du contenu à publier, le module de sélection 5 sélectionne (étape 205) une publicité à diffuser lors de la consultation du contenu par des utilisateurs. La publicité pourra être sélectionnée dans une base de données 51. Lorsque plusieurs publicités de la base de données 51 correspondront aux expressions régulières identifiées, le choix de la publicité à diffuser pourra être réalisé en fonction de la fréquence de diffusion requise pour ces publicités. La publicité pourra être diffusée (étape 206) par le module 5 depuis la base de données 51. La publicité diffusée pourra se présenter sous forme de vidéo, d'animation au format Flash (marque déposée), d'images, ou de lien vers un site Internet. Si l'expression régulière baladeur+ mp3+ a été identifiée dans le texte, le module 5 sélectionnera par exemple une publicité pour un nouveau modèle de baladeur numérique ou alors une publicité sous forme de lien vers un site de vente de musique en ligne. Le contenu soumis par l'utilisateur pourra être publié en temps réel après sa réception, ou être publié (étape 207) seulement après que le module de sélection 5 ait sélectionné la publicité à diffuser. Dans ce dernier cas, le module de sélection 5 pourra donner l'ordre au serveur de publication de mettre en ligne le contenu et la publicité sélectionnée. L'application installée par un prestataire sur le serveur hébergeant l'interface de réception 3 pourra réceptionner la publicité sélectionnée, ou le choix de la publicité sélectionnée. La sélection de la publicité et la publication du contenu pourront notamment être effectuées en temps réel. Ainsi, lorsque d'autres utilisateurs accéderont au contenu publié, le serveur leur diffusera la publicité sélectionnée. Le contenu à publier pourra être de différents types : par exemple forum de discussion, blogs, clavardage, avis de consommateurs sur un site de vente 25 en ligne, petites annonces en ligne... Un gestionnaire 6 du module de sélection 5 pourra déterminer au fur et à mesure de nouvelles expressions régulières à ajouter dans la base de données 41, afin de sélectionner une publicité appropriée lorsque certains nouveaux mots-clés apparaissent dans le texte du contenu à publier, ou lorsque des 30 publicités pour de nouveaux produits ou services doivent être diffusées. Le gestionnaire 6 pourra ainsi disposer d'une interface dans le module d'analyse automatisée 4, par l'intermédiaire de laquelle il pourra ajouter des expressions régulières dans la base de données 41. Chaque éditeur de service publiant du contenu pourra disposer de sa propre base de données 41 d'expressions 35 régulières, qu'il mettra à jour en fonction de ses besoins. L'éditeur de service pourra notamment transmettre des mots qu'il a identifiés dans du texte destiné à être publié, et pourra requérir que ces mots soient transformés en expressions régulières par un gestionnaire du module d'analyse automatisée 4. Les expressions régulières pourront être stockées dans la base de données 41 dans différents thèmes syntaxiques. Par exemple, les expressions régulières suivantes pourront être stockées dans le thème syntaxique matériel informatique : disque+ dur+ , écran+ , memoire+ ?RAM ... Le module d'analyse 4 pourra calculer un score du texte pour les différents thèmes syntaxiques de la base de données 41. Ce score sera par exemple calculé en fonction des expressions régulières identifiées dans chaque thème syntaxique. Le module de sélection 5 pourra sélectionner la publicité à diffuser en fonction des scores obtenus pour le texte pour différents thèmes syntaxiques.The analysis module 4 transmits (step 204) information concerning the regular expressions identified to an advertisement selection module 5. The analysis module 4 is connected to the selection module 5 via the Internet network 1 According to the regular expressions identified in the text of the content to be published, the selection module 5 selects (step 205) an advertisement to be broadcast when the content is viewed by users. The advertisement may be selected in a database 51. When several advertisements of the database 51 correspond to the regular expressions identified, the choice of the advertisement to be broadcast may be made according to the broadcast frequency required for these advertisements. The advertisement may be broadcast (step 206) by the module 5 from the database 51. The advertising broadcast may be in the form of video, Flash animation (trademark), images, or link to an Internet site. If the regular expression Walkman + mp3 + has been identified in the text, the module 5 will for example select an advertisement for a new model of digital music player or an advertisement in the form of a link to an online music sales site. The content submitted by the user may be published in real time after receipt, or be published (step 207) only after the selection module 5 has selected the advertisement to be broadcast. In the latter case, the selection module 5 will be able to instruct the publishing server to put the content and the selected advertisement on line. The application installed by a provider on the server hosting the reception interface 3 may receive the selected advertisement, or the choice of the selected advertisement. The selection of the advertisement and the publication of the content may in particular be carried out in real time. Thus, when other users access the published content, the server will broadcast the selected advertisement. The content to be published can be of different types: for example discussion forum, blogs, chat, consumer reviews on an online sales site, online classifieds ... A manager 6 of the selection module 5 can determine at as new regular expressions to be added to the database 41, in order to select an appropriate advertisement when certain new keywords appear in the text of the content to be published, or when advertisements for new products or services are required. to be broadcast. The manager 6 can thus have an interface in the automated analysis module 4, through which he can add regular expressions in the database 41. Each service publisher publishing content may have its own database 41 of regular expressions, which he will update according to his needs. The service editor may in particular transmit words that he has identified in text intended to be published, and may require that these words be transformed into regular expressions by a manager of the automated analysis module 4. The regular expressions may be stored in the database 41 in different syntactic themes. For example, the following regular expressions can be stored in the computer hardware syntactic theme: disk + hard +, screen +, memory +? RAM ... The analysis module 4 can calculate a text score for the different syntactic themes of the database 41. This score will for example be calculated according to the regular expressions identified in each syntactic theme. The selection module 5 can select the advertisement to be broadcast based on the scores obtained for the text for different syntactic themes.

La figure 3 représente de façon schématique un système de filtration 11 de contenus créés par les utilisateurs, selon un autre aspect de l'invention.Figure 3 schematically shows a filtration system 11 of contents created by users, according to another aspect of the invention.

Le système de filtration 11 comprend une interface de réception 3, destinée à recevoir un contenu incluant du texte destiné à être publié et créé par l'utilisateur 2. Le système de filtration 11 comprend également un module d'analyse automatisée 7. Le module d'analyse automatisée 7 est destiné à identifier du contenu dont la publication doit être évitée. Le système de filtration 11 comprend par ailleurs un serveur de modération 8, destiné à filtrer le contenu à publier, le contenu dont la publication est interdite, et le contenu nécessitant une analyse humaine. L'interface 3, le module 7 et le serveur 8 sont en communication par l'intermédiaire du réseau Internet 1. L'interface 3 pourra être hébergée par le serveur de l'éditeur de services Internet publiant les contenus créés par ses utilisateurs pour les rendre accessibles à d'autres utilisateurs. L'interface 3 est configurée pour recevoir (étape 401) le contenu soumis par ses utilisateurs. L'interface 3 est également configurée pour transmettre automatiquement (étape 402) le contenu reçu au module d'analyse automatisée 7. En temps réel lors de la réception du contenu à publier, le module d'analyse 7 (étape 403) génère un avis concernant la publication. L'avis pourra notamment prendre 3 états : autorisation de publier, interdiction de publier ou soumettre à un modérateur un contenu à risque. Le module 7 transmet (étape 404) l'avis au serveur 8. Lorsque l'avis a l'état 'soumission à un modérateur', le module 7 transmet également le contenu à publier. Pour les deux autres états, la transmission du contenu à publier au serveur 8 est optionnelle. Dans l'hypothèse où l'avis est systématiquement transmis au serveur 8 avec le contenu à publier, le serveur 8 réalise un routage (étape 405) de ce contenu. Si l'avis est 'autorisation de publier', le serveur 8 retransmet (étape 406) le contenu à publier au serveur d'édition accompagné de l'avis. Le serveur d'édition procède alors à la publication du contenu (étape 407), celui-ci devenant accessible aux utilisateurs du service. Si l'avis est 'interdiction de publier', le serveur 8 détruit le contenu (étape 408) et transmet (étape 409) un ordre de non publication au serveur d'édition. Si l'avis est 'soumettre à un modérateur', le serveur 8 transmet (étape 410) le contenu à un modérateur 9. Le modérateur 9 étudie (étape 411) le contenu et transmet (étape 412) un ordre de publication ou de non publication au serveur d'édition. L'étude du contenu par un modérateur 9 permet d'éviter la majeure partie des faux positifs, c'est-à-dire des contenus licites qui auraient été interdits par une analyse purement automatique. L'étude du contenu 9 permet ainsi d'améliorer la qualité de filtrage des contenus avec une intervention réduite aux contenus pour laquelle une décision automatique serait risquée. Le module d'analyse 7 pourra également transmettre directement des 15 ordres de publication ou de non publication au serveur 3, pour les contenus qui n'ont pas à être soumis au modérateur. Ainsi, une très grande quantité de contenus à publier pourra être analysée, sans nécessiter l'intervention systématique d'un modérateur. L'intervention d'un modérateur pourra ainsi être limitée à l'analyse de contenus 20 dont l'interdiction est incertaine. Le nombre de modérateurs nécessaires pourra ainsi être limité, en garantissant une qualité de filtrage élevée, et en permettant de prendre une décision de publication ou d'interdiction en temps réel pour le plus grand nombre des contenus.The filtration system 11 comprises a reception interface 3 intended to receive a content including text intended to be published and created by the user 2. The filtration system 11 also comprises an automated analysis module 7. The module Automated analysis 7 is intended to identify content whose publication must be avoided. The filtration system 11 also includes a moderation server 8, for filtering the content to be published, the content whose publication is prohibited, and the content requiring human analysis. The interface 3, the module 7 and the server 8 are in communication via the Internet network 1. The interface 3 can be hosted by the server of the publisher of Internet services publishing the contents created by its users for the make it accessible to other users. The interface 3 is configured to receive (step 401) the content submitted by its users. The interface 3 is also configured to automatically transmit (step 402) the received content to the automated analysis module 7. In real time when receiving the content to be published, the analysis module 7 (step 403) generates a notice concerning publication. The opinion may include 3 states: permission to publish, ban on publication or submit to a moderator content at risk. The module 7 transmits (step 404) the notification to the server 8. When the notice has the state 'submission to a moderator', the module 7 also transmits the content to be published. For the other two states, the transmission of the content to be published to the server 8 is optional. In the event that the notice is systematically transmitted to the server 8 with the content to be published, the server 8 performs a routing (step 405) of this content. If the notice is 'authorization to publish', the server 8 retransmits (step 406) the content to be published to the publishing server together with the notice. The publishing server then proceeds to the publication of the content (step 407), which becomes accessible to the users of the service. If the notice is 'forbidden to publish', the server 8 destroys the content (step 408) and transmits (step 409) an order of non-publication to the publishing server. If the notice is 'submit to a moderator', the server 8 transmits (step 410) the content to a moderator 9. The moderator 9 studies (step 411) the content and transmits (step 412) an order of publication or not publishing to the publishing server. The study of the content by a moderator 9 makes it possible to avoid most of the false positives, ie legal contents which would have been prohibited by a purely automatic analysis. The study of the content 9 thus makes it possible to improve the filtering quality of the contents with a reduced intervention to the contents for which an automatic decision would be risky. The analysis module 7 may also directly transmit publication or non-publication orders to the server 3, for content that does not have to be submitted to the moderator. Thus, a very large amount of content to be published can be analyzed, without requiring the systematic intervention of a moderator. The intervention of a moderator may thus be limited to the analysis of content 20, the prohibition of which is uncertain. The number of moderators needed can thus be limited, by guaranteeing a high quality of filtering, and by making it possible to take a publication or ban decision in real time for the largest number of contents.

25 Le module d'analyse 7 pourra notamment être géré par un prestataire proposant un service d'analyse à distance de contenus à publier à différents éditeurs de contenus. Le prestataire pourra notamment proposer une application installée sur le serveur hébergeant l'interface 3, cette application transmettant automatiquement le texte du contenu à publier au module d'analyse 7 lors de sa 30 réception. L'application pourra également permettre la réception des ordres de publication ou de non publication provenant du modérateur 9 ou du module d'analyse 7. Le module 7 pourra réaliser différents types d'analyses du texte reçu. Le module 7 pourra notamment accéder à une base de données 35 d'expressions régulières, afin de déterminer celles qui sont satisfaites par le texte reçu. La base de données comprendra un ensemble d'expressions régulières correspondant à des contenus qu'il y a lieu d'interdire ou de faire examiner par un modérateur. Les expressions régulières de la base de données pourront être classées par thèmes : par exemple insultes raciales, incitation à la violence, pornographie, commerce illégal ou insultes. Les différents thèmes pourront être enrichis par retour d'expérience des utilisateurs. L'analyse pourra également reposer sur le positionnement relatif de différents mots dans le contenu ou dans une succession de contenus. Par exemple, dans un clavardage (pour chat en langue anglaise), une réponse mentionnant un jeune âge (du type j'ai 6 ans ) suite à une question pourrait conduire à un avis 'soumettre à un modérateur'. Par contre, une réponse mentionnant une durée (du type je travaille depuis 6 ans ) conduirait à un avis d'autorisation de publier.The analysis module 7 may in particular be managed by a provider offering a remote analysis service for content to be published to different content editors. The provider may in particular propose an application installed on the server hosting the interface 3, this application automatically transmitting the text of the content to be published to the analysis module 7 when it is received. The application may also allow the reception of publication or non-publication orders from moderator 9 or analysis module 7. Module 7 may perform different types of analysis of the received text. Module 7 may notably access a database of regular expressions, in order to determine those which are satisfied by the received text. The database will include a set of regular expressions corresponding to content that should be banned or examined by a moderator. Regular expressions in the database may be classified by themes: for example, racial slurs, incitement to violence, pornography, illegal trade or insults. The different themes can be enriched by feedback from users. The analysis may also be based on the relative positioning of different words in the content or in a succession of contents. For example, in a chat (for English-speaking chat), a response mentioning a young age (of the type I am 6 years old) following a question could lead to a notice 'submit to a moderator'. On the other hand, a response mentioning a duration (of the type I have been working for 6 years) would lead to a notice of authorization to publish.

Le module 7 pourra déterminer un indice de risque concernant le contenu, en fonction du nombre et de la gravité des mots identifiés dans le texte du contenu. Le serveur 8 pourra comparer l'indice du contenu à différents seuils de décision pour déterminer l'action à entreprendre sur le contenu. Les seuils de décisions pourront notamment être fixés en fonction d'un niveau de service ou d'un niveau de contrôle requis pour la publication.Module 7 may determine a risk index for the content, depending on the number and severity of the words identified in the text of the content. The server 8 will be able to compare the content index with different decision thresholds to determine the action to be taken on the content. In particular, decision thresholds may be set according to the level of service or level of control required for publication.

Selon le résultat du filtrage du contenu, différentes mesures pourront être prises par le serveur de publication. Ces mesures pourront notamment comprendre la suppression du compte d'un utilisateur ayant souhaité publier un contenu illégal, l'émission d'un message d'avertissement à destination de cet utilisateur, la non publication du contenu ou toutes autres mesures appropriées.Depending on the result of the content filtering, different measures may be taken by the Publisher. Such measures may include, among other things, removing the account of a user who wished to post illegal content, issuing a warning message to that user, not publishing the content, or any other appropriate measures.

Bien que l'invention ait été décrite dans son application à la publication de sites Internet, elle peut également s'appliquer à l'analyse de messages courts (SMS), de sites de type WAP (pour Wireless Application Protocol en langue anglaise), de télévision interactive, ou tout autre type de diffusion par l'intermédiaire d'un service de télécommunication d'un contenu créé par un utilisateur à destination d'un autre utilisateur.Although the invention has been described in its application to the publication of Internet sites, it can also be applied to the analysis of short messages (SMS), sites of WAP type (for Wireless Application Protocol in English), interactive television, or any other type of broadcast via a telecommunication service of content created by a user to another user.

Claims (10)

Translated fromFrench
REVENDICATIONS1. Système de sélection d'une publicité, la publicité sélectionnée étant destinée à être diffusée lors de la consultation du contenu publié par l'éditeur d'un site Internet et créé par un utilisateur du site Internet, caractérisé en ce qu'il comprend : -une interface de réception (3) accessible par Internet pour des utilisateurs (2), apte à recevoir un contenu à publier créé par ces utilisateurs, ce contenu incluant du texte; -un module d'analyse automatisée (4) en communication avec l'interface de réception, incluant une base de données (41) d'expressions régulières, et analysant en temps réel lors de la réception du contenu l'ensemble du texte inclus dans le contenu à publier par identification des expressions régulières satisfaites par ce texte ; -un module de sélection (5) d'une publicité, sélectionnant une publicité à diffuser lors de la consultation du contenu en fonction des expressions régulières identifiées.REVENDICATIONS1. System for selecting an advertisement, the selected advertisement being intended to be broadcast during the consultation of the content published by the publisher of a website and created by a user of the website, characterized in that it comprises: a reception interface (3) accessible via the Internet for users (2), able to receive a content to be published created by these users, this content including text; an automated analysis module (4) in communication with the reception interface, including a database (41) of regular expressions, and analyzing in real time when receiving the content all the text included in the content to be published by identification of the regular expressions satisfied by this text; a selection module (5) for an advertisement, selecting an advertisement to be broadcast when the content is viewed according to the identified regular expressions.2. Système de sélection selon la revendication 1, dans lequel le module d'analyse automatisée (4) et le module de sélection (5) sont connectés par l'intermédiaire d'un réseau informatique longue distance (1).2. Selection system according to claim 1, wherein the automated analysis module (4) and the selection module (5) are connected via a long-distance computer network (1).3. Système de sélection selon la revendication 2, dans lequel le module d'analyse automatisée (4) comprend une interface d'ajout d'expressions régulières dans la base de données.The selection system of claim 2, wherein the automated analysis module (4) comprises an interface for adding regular expressions in the database.4. Système de sélection selon la revendication 3, dans lequel le module d'analyse automatisée (4) comprend une interface de réception de mots transmis par le module de sélection (3) et destinés à être transformés en expressions régulières à ajouter dans la base de données (41).A selection system according to claim 3, wherein the automated analysis module (4) comprises a word receiving interface transmitted by the selection module (3) and intended to be transformed into regular expressions to be added in the base data (41).5. Système de sélection selon l'une quelconque des revendications précédentes, dans lequel le module d'analyse (4) comprend plusieurs bases de données comprenant chacune un ensemble d'expressions régulières associées à un thème syntaxique.A selection system according to any one of the preceding claims, wherein the analysis module (4) comprises a plurality of databases each comprising a set of regular expressions associated with a syntactic theme.6. Système de sélection selon la revendication 5, dans lequel le module d'analyse automatisée (4) calcule un score pour chaque thème syntaxique en fonction de ses expressions régulières identifiées, le module de sélection (3) sélectionnant la publicité à diffuser en fonction des scores calculés.A selection system according to claim 5, wherein the automated analysis module (4) calculates a score for each syntactic theme according to its identified regular expressions, the selection module (3) selecting the advertisement to be broadcast based on calculated scores.7. Système de diffusion d'une publicité, comprenant :- un système de sélection d'une publicité selon l'une quelconque des revendications précédentes ; -une interface de diffusion (3) accessible par Internet pour des utilisateurs, l'interface de diffusion publiant le contenu reçu et diffusant ladite publicité sélectionnée dès la publication du contenu.An advertisement broadcast system, comprising: - an advertisement selection system according to any one of the preceding claims; a broadcast interface (3) accessible via the Internet for users, the broadcast interface publishing the received content and broadcasting said selected advertisement as soon as the content is published.8. Système de diffusion selon la revendication 7, dans lequel l'analyse, la sélection de la publicité et la publication du contenu sont effectuées en temps réel.8. Broadcast system according to claim 7, wherein the analysis, the selection of the advertisement and the publication of the content are carried out in real time.9. Procédé de sélection d'une publicité destinée à être diffusée lors de la consultation du contenu d'un site Internet publié par un éditeur et créé par un utilisateur du site Internet, comprenant les étapes de : - recevoir d'un utilisateur par Internet un contenu à publier créé par cet utilisateur, ce contenu incluant du texte ; -en temps réel et automatiquement lors de la réception, analyser l'ensemble du texte du contenu à publier par identification d'expressions régulières satisfaites par le texte et contenues dans une base de données; - sélectionner une publicité à diffuser lors de la consultation du contenu en fonction des expressions régulières identifiées.9. A method of selecting an advertisement intended to be broadcast during the consultation of the content of a website published by an editor and created by a user of the website, comprising the steps of: - receiving a user via the Internet content to be published created by this user, this content including text; in real time and automatically when receiving, analyze all the text of the content to be published by identification of regular expressions satisfied by the text and contained in a database; - select an advertisement to broadcast when viewing the content according to the identified regular expressions.10. Système de filtration d'un contenu publié par l'éditeur d'un site Internet et créé par un utilisateur du site Internet, caractérisé en ce qu'il comprend : -une interface de réception (3) accessible par Internet pour des utilisateurs (2), apte à recevoir un contenu à publier créé par ces utilisateurs, ce contenu incluant du texte; - un module d'analyse automatisée (7) en communication avec l'interface de réception, incluant une base de données d'expressions régulières, analysant en temps réel lors de la réception du contenu l'ensemble du texte inclus dans le contenu à publier par identification des expressions régulières satisfaites par ce texte, et générant un avis identifiant si le contenu peut être publié ou non, ou si le contenu est à risque en fonction des expressions régulières identifiées ; -des moyens de transmissions à un modérateur humain du contenu pour lequel l'avis identifie que le contenu est à risque.10. Filtration system for content published by the publisher of a website and created by a user of the website, characterized in that it comprises: a reception interface (3) accessible via the Internet for users (2), able to receive a content to be published created by these users, this content including text; an automated analysis module (7) in communication with the reception interface, including a database of regular expressions, analyzing in real time when the content is received all the text included in the content to be published by identifying the regular expressions satisfied by this text, and generating a notice identifying whether the content can be published or not, or whether the content is at risk based on the identified regular expressions; means for transmitting to a human moderator the content for which the notice identifies that the content is at risk.
FR0805977A2008-10-282008-10-28Advertisement selecting system for broadcasting advertisement during consultation of e.g. consumer advice on online sale site, has selection module selecting advertisement to be broadcasted during content consultation, based on expressionsWithdrawnFR2937759A1 (en)

Priority Applications (1)

Application NumberPriority DateFiling DateTitle
FR0805977AFR2937759A1 (en)2008-10-282008-10-28Advertisement selecting system for broadcasting advertisement during consultation of e.g. consumer advice on online sale site, has selection module selecting advertisement to be broadcasted during content consultation, based on expressions

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
FR0805977AFR2937759A1 (en)2008-10-282008-10-28Advertisement selecting system for broadcasting advertisement during consultation of e.g. consumer advice on online sale site, has selection module selecting advertisement to be broadcasted during content consultation, based on expressions

Publications (1)

Publication NumberPublication Date
FR2937759A1true FR2937759A1 (en)2010-04-30

Family

ID=40785430

Family Applications (1)

Application NumberTitlePriority DateFiling Date
FR0805977AWithdrawnFR2937759A1 (en)2008-10-282008-10-28Advertisement selecting system for broadcasting advertisement during consultation of e.g. consumer advice on online sale site, has selection module selecting advertisement to be broadcasted during content consultation, based on expressions

Country Status (1)

CountryLink
FR (1)FR2937759A1 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
WO2003023548A2 (en)*2001-09-122003-03-20Raqia Networks, Inc.High speed data stream pattern recognition
US20050165642A1 (en)*2002-05-072005-07-28Gabriel-Antoine BrouzeMethod and system for processing classified advertisements
US20080091521A1 (en)*2006-10-172008-04-17Yahoo! Inc.Supplemental display matching using syndication information
EP1962242A1 (en)*2007-02-222008-08-27Research In Motion LimitedCommunity based method and system for creating and subscribing to dynamic push channels
US20080243905A1 (en)*2007-03-302008-10-02Pavlov Dmitri YAttribute extraction using limited training data

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
WO2003023548A2 (en)*2001-09-122003-03-20Raqia Networks, Inc.High speed data stream pattern recognition
US20050165642A1 (en)*2002-05-072005-07-28Gabriel-Antoine BrouzeMethod and system for processing classified advertisements
US20080091521A1 (en)*2006-10-172008-04-17Yahoo! Inc.Supplemental display matching using syndication information
EP1962242A1 (en)*2007-02-222008-08-27Research In Motion LimitedCommunity based method and system for creating and subscribing to dynamic push channels
US20080243905A1 (en)*2007-03-302008-10-02Pavlov Dmitri YAttribute extraction using limited training data

Similar Documents

PublicationPublication DateTitle
US10992720B1 (en)Measuring page viewership in a social network
Zhang et al.Search engine optimization: Comparison of link building and social sharing
US9342802B2 (en)System and method of tracking rate of change of social network activity associated with a digital object
US10089402B1 (en)Display of videos based on referrers
KR102196592B1 (en)Social scores for network elements
US8655916B2 (en)System and method for creating user profiles
US8151194B1 (en)Visual presentation of video usage statistics
EP3485450B1 (en)Network based advertisement data traffic latency reduction
AU2013331156B2 (en)Trackable sharing of on-line video content
US20080147487A1 (en)Methods and apparatus for conversational advertising
US20220006661A1 (en)Access and communicate live audio streaming under micro channel or keyword(s)
US20150180989A1 (en)Methods and apparatus to measure media using media object characteristics
US20110066730A1 (en)System and method for delivering content to users on a ntework
US20080183672A1 (en)Dynamically altering search result page layout to increase user response
WO2010037031A2 (en)System and method for aggregating web feeds relevant to a geographical locale from multiple sources
Papadogiannakis et al.Who funds misinformation? A systematic analysis of the ad-related profit routines of fake news sites
US20150186940A1 (en)Techniques For Generating Advertisements
US10432633B1 (en)Replacing unauthorized media items with authorized media items across platforms
EP2695098A1 (en)Method of parameterizing rules for broadcasting personal data
US20090055405A1 (en)Increasing Website Revenue Generation Through Distribution of Interactive Web Content
US20180225024A1 (en)System and method for generating an integrated mobile graphical experience using compiled-content from multiple sources
US20240022790A1 (en)Digital content controller
EP3528501A1 (en)Methods and apparatus to measure media using media object characteristics
EP2336967B1 (en)Customised messaging in website inserts
EP3031000A1 (en)Method of providing a licence in a system for providing multimedia contents

Legal Events

DateCodeTitleDescription
STNotification of lapse

Effective date:20140630


[8]ページ先頭

©2009-2025 Movatter.jp