- From: BOUALEM Malek RD-TECH-LAN <malek.boualem@francetelecom.com>
- Date: Tue, 15 Feb 2005 21:42:15 +0900
- To: www-international@w3.org
[French version below] =========================================== CALL FOR PAPERS for the Workshop NLP for Under-Resourced Languages Friday, 10 June 2005 in Dourdan, near Paris ============================================ Held in conjunction with the conference TALN 2005 (6-10 June 2005) http://www.limsi.fr/TALN05 Many languages have little or no information technology available: they have no substantial presence on the Internet, and existing software has not been adapted for their use. These are languages of countries in the developing world (e.g. Wolof in Senegal), or regional languages in countries where the first language is a global one (e.g. Breton in France). Linguistic work on these languages is often lacking, and must overcome a number of difficulties: - the presence of many lexical alternatives - multiple spellings for the same word, - the lack of exhaustive lexicons, - non-standardized transcription methods - etc. This is why we describe these languages as "under-resourced" or "pi-languages": for political and economic reasons they lack sufficient resources in terms of both linguistic study and information technology. The goal of this workshop is to provide a progress report on techniques being used for Natural Language Processing of under-resourced languages. THEMES Researchers are invited to present work related to any of the following topics: - Methods for measuring the level of technology available for a given language - Assessment of resources for basic computerization, and standardization of these resources (editors, virtual keyboards, printing, sorting, etc.) - Collection of corpora and other linguistic resources (lexicons, grammars); the role of the Internet, diasporas, unsupervised training algorithms - Methodologies for computerization of under-resourced languages (details of techniques) - Specific technologies (OCR, PDA) - Encoding of linguistic data (lexicons, morphology, syntax, and semantics) and genericity of formats. - Reports concerning the computerization of a particular language or group of pi-languages. - Architectures for NLP technologies : adaptation of existing technologies to pi-languages. - Surveys of major problems encountered in this area. SELECTION CRITERIA ------------------------------ Authors are invited to submit papers concerning original research. All submissions will be examined by at least two specialists in the area. Particular attention will be paid to: - appropriateness for the themes of the workshop - importance and originality of the contribution - validity of the technical and scientific content - critical discussion of the results, in particular as they relate to other work in the field - organization and clarity of the presentation The selected articles will be published in the conference proceedings. METHODS OF SUBMISSION ------------------------------ * Submitted articles may not exceed 10 pages in Times 12, single-spaced (about 3000 words), figures, examples, and references included. Articles are to be written in French for French speakers and in English for non-French speakers. * A LaTeX style file and Word template file will be available from the conference web site http://www.limsi.fr/TALN05. * Articles must be submitted as an attachment to an email with the subject "atelier TALN soumission" and containing the title of the article, principal author's name, affiliation, postal address, email address, telephone number, and fax number. Send this email to chantal.enguehard@ univ-nantes.fr. * It is IMPERATIVE that one of the following file formats be used, formatted for A4 paper: PS, PDF, RTF (Word). * In case an email submission is not possible, paper submissions may be accepted. Send 3 paper copies of the article to the following address: Chantal Enguehard - TALN 2005 LINA 2, rue de la Houssini$BoS(Be BP 92208 44322 Nantes Cedex 03 France CALENDAR Submission deadline: Thursday, 10 March 2005 Notification to authors: Tuesday, 5 April 2005 Final version: Friday, 15 April 2005 Conference : Friday, 10 June 2005 PROGRAM COMMITTEE . Denis B$BqD(Bhet - Laboratoire d'Informatique Nantes-Atlantique . Vincent Berment - Laboratoire Communication Langagi$BoS(Be et Interaction Personne-Syst$BoN(Be . Christian Boitet - Laboratoire Communication Langagi$BoS(Be et Interaction Personne-Syst$BoN(Be . Malek Boualem - France Telecom . Marcel Diki-Kidiri - Langage, Langues et Cultures d'Afrique Noire . Chantal Enguehard - Laboratoire d'Informatique Nantes-Atlantique (President) . Laura Monceaux - Laboratoire d'Informatique Nantes-Atlantique . Kevin Scannell - Saint Louis University . Monique Slodzian - Centre de Recherche en Ing$BqO(Bierie Multilingue ============================================ APPEL A COMMUNICATIONS de l'atelier TAL et langues peu dot$BqF(Bs vendredi 10 juin 2005 $B_(BDourdan en r$BqH(Bion parisienne ============================================ Dans le cadre de TALN 2005 (6 au 10 juin 2005) http://www.limsi.fr/TALN05 De nombreuses langues n'ont pas franchi l'$BqU(Bape de l'informatisation : elles sont peu pr$BqT(Bentes sur Internet, les logiciels existants ne sont pas adapt$BqT(B. Il s'agit de langues de pays en voie de d$BqW(Beloppement (comme le wolof au S$BqOqH(Bal par exemple), ou bien de langues r$BqH(Bionales dans des pays o $B‘(Bla langue officielle est une langue de dimension internationale (le breton en France). Ces langues souffrent souvent de lacunes dans les travaux linguistiques qui leur sont consacr$BqT(B et doivent faire face $B_(Bdiverses difficult$BqT(B : - pr$BqT(Bence de nombreuses variantes lexicales, - graphies concurrentes pour un m$BsN(Be mot, - inexistence de lexiques exhaustifs, - transcription non compl$BoU(Bement standardis$BqF(B - etc. C'est pourquoi nous qualifions ces langues de $B%)(B peu dot$BqF(Bs $B%5(B ou $B%)(B langues-pi $B%5(B : elles sont $B_(Bla fois peu informatis$BqF(Bs et peu $BqU(Budi$BqF(Bs, que ce soit pour des raisons politiques ou $BqD(Bonomiques. Cet atelier vise $B_(Bfaire le point sur les m$BqU(Bhodes $B_(Badopter pour d$BqW(B elopper le Traitement Automatique des Langues pour des langues peu dot$BqF(Bs. THEMES Les chercheurs seront invit$BqT(B $B_(Bpr$BqT(Benter des communications autour des th$BoN(B es suivants : - M$BqU(Bhodes de mesure du niveau d'informatisation d'une langue. - Bilan des solutions apport$BqF(Bs en informatisation de base, standardisation de ces solutions ($BqE(Biteurs, claviers virtuels, impression , tri lexicographique etc.). - Recueil de corpus et de ressources langagi$BoS(Bes (lexiques, grammaires) : r$B‡M(Be d'Internet et des diasporas, apport des algorithmes d'apprentissage. - M$BqU(Bhodologie d'informatisation pour les langues-pi (sp$BqD(Bificit$Bq(Bdes techniques d'informatisation). - Technologies d'actualit$Bq(B(ROC ou PDA). - Mod$BqM(Bisation des donn$BqF(Bs linguistiques (lexiques, morphologie, syntaxe et s$BqN(Bantique) et g$BqOqS(Bicit$Bq(Bdes formats adopt$BqT(B. - Rapports d'exp$BqS(Biences sur l'informatisation d'une langue ou d'un groupe de langues-pi. - Architectures des technologies de TALN : adaptation des technologies existantes aux langues-pi. - Panorama des grands types de probl$BoN(Bes linguistiques rencontr$BqT(B lors du traitement automatique de langues-pi. CRITERES DE S$B%N(BLECTION ------------------------------ Les auteurs sont invit$BqT(B $B_(Bsoumettre des travaux de recherche originaux. Les soumissions seront examin$BqF(Bs par au moins deux sp$BqD(Bialistes du domaine. Seront consid$BqSqF(Bs en particulier: - l'ad$BqR(Buation $B_(Bla th$BqN(Batique de l'atelier. - l'importance et l'originalit$Bq(Bde la contribution, - la correction du contenu scientifique et technique, - la discussion critique des r$BqT(Bultats, en particulier par rapport aux autres travaux du domaine, - l'organisation et la clart$Bq(Bde la pr$BqT(Bentation, Les articles s$BqM(Bectionn$BqT(B seront publi$BqT(B dans les actes de la conf$BqS(Bence. MODALIT$B%N(BS DE SOUMISSION ----------------------------------- * Les articles soumis ne devront pas d$BqQ(Basser 10 pages en Times 12, espacement simple, soit environ 3000 mots, figures, exemples et r$BqGqS(Bences compris. Les articles seront r$BqE(Big$BqT(B en fran$BmB(Bis pour les francophones, en anglais pour les non-francophones. * Une feuille de style LaTeX et un mod$BoM(Be Word seront disponibles sur le site web de la conf$BqS(Bence http://www.limsi.fr/TALN05. * Les auteurs devront envoyer leur soumission sous la forme d'un document attach$Bq_(Bun courrier $BqM(Bectronique ayant pour titre "atelier TALN soumission" et contenant le titre de la communication, le nom, l'affiliation, l'adresse postale, l'adresse $BqM(Bectronique, le num$BqS(Bo de t$BqMqQ(B hone et le fax de l'auteur principal. Adresser ce courrier $B_(B chantal.enguehard@univ-nantes.fr * L'un des formats suivants devra IMP$B%N(BRATIVEMENT $BsU(Bre employ$Bq(B: PS, PDF, RTF (Word). Les versions devront $BsU(Bre au format A4. * En cas d'impossibilit$Bq(Bd'envoi par courrier $BqM(Bectronique, une soumission "papier" pourra $BsU(Bre admise. 3 exemplaires papier de la contribution devront $BsU(Bre envoy$BqT(B $B_(Bl'adresse suivante: Chantal Enguehard - TALN 2005 LINA 2, rue de la Houssini$BoS(Be BP 92208 44322 Nantes Cedex 03 France CALENDRIER Date limite de soumission : jeudi 10 mars 2005 Notification aux auteurs : mardi 5 avril 2005 Version finale : vendredi 15 avril 2005 Conf$BqS(Bence : vendredi 10 juin 2005 COMITE DE PROGRAMME . Denis B$BqD(Bhet - Laboratoire d'Informatique Nantes-Atlantique . Vincent Berment - Laboratoire Communication Langagi$BoS(Be et Interaction Personne-Syst$BoN(Be . Christian Boitet - Laboratoire Communication Langagi$BoS(Be et Interaction Personne-Syst$BoN(Be . Malek Boualem - France Telecom . Marcel Diki-Kidiri - Langage, Langues et Cultures d'Afrique Noire . Chantal Enguehard - Laboratoire d'Informatique Nantes-Atlantique (Pr$BqT(Bidente) . Laura Monceaux - Laboratoire d'Informatique Nantes-Atlantique . Kevin Scannell - Saint Louis University . Monique Slodzian - Centre de Recherche en Ing$BqO(Bierie Multilingue
Received on Tuesday, 15 February 2005 12:42:21 UTC