Elsnet
 
   


ELSNET-list archive

Category:   E-Announce
Subject:   DEFT'07 2nd Call for participation
From:   Martine Hurault-Plantet
Email:   mhp_(on)_limsi.fr
Date received:   15 Jan 2007
Start date:   03 Jul 2007

[Apologies for multiple postings] ****************************************************************** 2nd CALL for PARTICIPATION DEFT'07 : Evaluation Campaign on opinion text classification using french corpora ****************************************************************** DEFT'07 Appel à participation Atelier d'évaluation en fouille de textes sur la classification de textes d'opinions http://deft07.limsi.fr/ ****************************************************************** Dates importantes : Inscription : à partir du 18 décembre 2006 Diffusion des corpus d'apprentissage : 4 janvier 2007 Test : 3 jours pris dans la dernière quinzaine de mars 2007 Atelier : le 3 juillet lors de la plate-forme de AFIA 2007 ****************************************************************** L'intérêt d'une conférence d'évaluation est de permettre de confronter, sur un même corpus, des méthodes et logiciels d'équipes différentes. Depuis deux ans, l'atelier d'évaluation DEFT propose des thèmes relevant de la fouille de textes en langue française. Les deux éditions précédentes ont été consacrées à l'identification du locuteur d'un discours (DEFT'05 http://www.lri.fr/ia/fdt/DEFT05/) et à la segmentation thématique de textes (DEFT'06 http://www.lri.fr/ia/fdt/DEFT06/). DEFT'07 se tiendra début juillet dans le cadre de la plate-forme AFIA 2007 (http://afia2007.imag.fr/). Le thème de cette nouvelle édition de DEFT est la classification de textes d'opinion. Un texte d'opinion présente un avis argumenté, positif ou négatif, sur un sujet donné. Les domaines faisant l'objet de textes d'opinions sont nombreux : critiques de films ou de livres, jugements qualitatifs de produits, controverses sur un projet politique ... les exemples ne manquent pas. Est-il possible de classer automatiquement un texte d'opinion suivant le jugement, favorable ou défavorable, qu'il exprime ? C'est l'enjeu du défi que nous proposons. Pour ce défi, nous avons choisi des textes d'opinion venant de différents domaines : * les critiques de films, livres, spectacles et BD ; * les tests de jeux vidéo ; * les relectures d'articles de conférences, * les interventions des parlementaires et du gouvernement dans les débats sur les projets de lois votés à l'Assemblée nationale. Ces textes présentent la particularité d'être associés d'emblée à un jugement exprimé sous la forme d'une note ou d'un vote. Ce sont ces jugements qui serviront de référence lors de l'évaluation des résultats. A partir de ces jugements, nous avons défini pour chaque corpus un ensemble de classes d'opinion : * les classes bien, moyen, mauvais, pour les corpus sur les films, livres, spectacles, BD, sur les jeux vidéos, et les relectures d'articles * les classes pour et contre pour le corpus sur les projets de lois. La tâche des participants à DEFT'07 consistera à attribuer automatiquement une classe d'opinion à chaque texte - critique, test, ou intervention - de chaque corpus. Les équipes participant à DEFT'07 devront s'inscrire à l'aide du formulaire en ligne, et signer les accords de restriction d'usage des corpus (http://deft07.limsi.fr/inscription.php). Des corpus d'apprentissage sont fournis aux participants inscrits. Ces corpus sont composés de 60 0es corpus d'origine. Ils contiennent la classe attribuée à chaque texte. Les participants ont jusqu'à la mi-mars pour mettre en place leurs méthodes de classification sur les corpus d'apprentissage. Seuls les corpus d'apprentissage fournis sont autorisés pour l'entraînement à la tâche. Les 40 0e corpus restants seront utilisés pour le test. Le test aura lieu sur une fenêtre de 15 jours, à partir de la mi-mars. A partir de la date qu'ils auront choisie dans cet intervalle, les participants auront trois jours pour appliquer, sur les corpus de test, les méthodes mises en oeuvre sur les corpus d'apprentissage. ****************************************************************** Comités : Comité d'organisation : Co-responsables : Thomas Heitz (LRI) et Martine Hurault-Plantet (LIMSI) Membres : Jean-Baptiste Berthelin (LIMSI), Sarra El Ayari (LIMSI), Cyril Grouin (LIMSI), Michèle Jardino (LIMSI), Zohra Khalis (Epigénomique), et Michel Lastes (LIMSI), webmestre Comité de programme : Co-présidents : Benoît Habert (LIMSI), Patrick Paroubek (LIMSI), et Violaine Prince (LIRMM) Membres : Nathalie Aussenac-Gilles (IRIT), Catherine Berrut (CLIPS), Fabrice Clérot (France Telecom), Guillaume Cleuziou (LIFO), Béatrice Daille (LINA), Marc El-Bèze (LIA), Patrick Gallinari (LIP6), Éric Gaussier (Xerox Research), Thierry Hamon (LIPN), Fidélia Ibekwe-SanJuan (URSIDOC-SII), Éric Laporte (IGM-LabInfo), Pascal Poncelet (LGI2P), Christophe Roche (LISTIC), Mathieu Roche (LIRMM), Pascale Sébillot (IRISA), Yannick Toussaint (LORIA), François Yvon (ENST). _______________________________________________ Elsnet-list mailing list Elsnet-list_(on)_elsnet.org http://mailman.elsnet.org/mailman/listinfo/elsnet-list
 

[print/pda] [no frame] [navigation table] [navigation frame]     Page generated 14-02-2008 by Steven Krauwer Disclaimer / Contact ELSNET