AlbanLex est un projet en lexicographie mené par les étudiants en deuxième année de Master (2023/2024) « Traitement Informatique et Linguistique des Documents Ecrits » (TILDE), spécialité : Traitement Automatique des Langues (TAL) de l’Université Sorbonne Paris Nord. Il s’agit, en effet, d’une ressource linguistique de recensement des locutions et expressions figées (ou en voie de figement) du français vers l’Albanais et inversement.
Ainsi, ce projet, en cours de développement et d’amélioration, se présente, dans sa globalité, comme une application-dictionnaire web ouverte au public du monde linguistique, et ce en vue de créer un lexique riche et varié. Un vrai travail de définition lexicographique.
Dans un premier temps, nous avons saisi des expressions françaises et albanaises et nous avons, au fur et à mesure, enrichi ces données, en passant par la description, la modification et l’exploitation de notre corpus, avant la validation des expressions en question.
Vous pouvez trouver pour chaque expression : sa définition en langue française, l’expression équivalente et sa définition en langue albanaise et, enfin, un tag (mot-clé) pour décrire une caractéristique de l'objet et permettre un regroupement facile des informations contenant les mêmes mots-clés pour toutes les expressions figées recensées.
Il est à noter que ce projet, intitulé : AlbanLex, a été développé à l’aide du Système de Gestion de Base de Données « BaseX ». Par ailleurs, notre promotion d’étudiants étant culturellement et linguistiquement très variée, il nous paraissait important que nos expressions le soient aussi ! Ainsi vous pouvez trouver toutes sortes de registres de langues, du familier vers le soutenu et également des variétés linguistiques de chacun. Tout comme le français, les expressions figées, issues de la langue albanaise, ont été principalement puisées des deux dialectes « Geg » et « Tosk ». En plus des expressions figées que nous avons pu collectées de la langue française, il en existe également celles qui proviennent du monde de la francophonie, principalement des pays d’Afrique et du Maghreb, qui ont constitué également notre corpus.
Tout au long de notre projet, nous avons appris de belles choses, culturellement et linguistiquement. La raison pour laquelle ce projet nous tient à cœur. Nous nous sommes beaucoup amusés à comparer nos expressions, entre francophones, tout d’abord, mais aussi nous étions surpris de constater qu’il existait, dans un nombre significatif de cas, un équivalent Albanais. Dans d’autres cas, les expressions, bien qu’exprimant la même idée, sont vraiment propres à la culture de chaque langue et donc très éloignées d’une traduction littérale. Nous avons parfois dû passer par l’anglais afin d’être sûrs que le sens ne soit pas biaisé.
Nous sommes fiers de vous présenter ce travail. Il est l’ADN et le fruit de nos échanges culturels et linguistiques…!
Le projet est porté par Xavier-Laurent Salvador dans le cadre du Master TILDE de l'Université Paris 13.
Chef de projet linguistique albanaise: Ueda.
Chef de projet linguistique française: Félicie.
Chef de projet Technologie du Web: Hanine.