Le Cross-Linguisme
Un moteur de recherche crosslingue rend possible des recherches dans un corpus documentaire multilingue
Il découle de cela que nous manipulons des documents rédigés dans notre langue natale mais aussi dans d’autres langues, avec des difficultés que nous imaginons aisément, par exemple la traduction de concepts dans l’autre langue et l’interrogation d’un moteur de recherche dans les différentes langues souhaitées. Dès lors, il devient délicat d’effectuer des recherches dans un corpus documentaire multilingue.
Quelle que soit sa langue de rédaction un document devient accessible à tous
Dans ce contexte, il est intéressant d’utiliser un moteur de recherche crosslingue. Ce type de moteur de recherche va reformuler la question de l’utilisateur – par exemple posée en français – dans la ou les autres langues supportées, en se basant sur des dictionnaires de reformulation. Il va donc pouvoir ainsi interroger l’ensemble de la base documentaire et remonter l’ensemble des documents pertinents, quelle que soit leur langue (dans la limite des langues supportées).
Il convient de noter qu’il ne s’agit pas ici de traduction automatique du texte des documents mais bien d’une reformulation de la question de l’utilisateur qui lui permet d’accéder à des documents rédigés dans une autre langue. Un outil de traduction automatique du contenu peut donc utilement compléter le moteur de recherche crosslingue.
La reformulation pour mieux saisir les concepts d’autres langues
Le moteur de recherche embarqué dans la solution ANT’box de ANT’inno est crosslingue. Il supporte actuellement les reformulations dans quatre langues : Français, Anglais, Arabe et Espagnol. Il a été développé par le Laboratoire Vision et Ingénierie du Contenu (LVIC) du CEA List ( http://www.kalisteo.fr/fr/index.htm ) et industrialisé par nos soins. L’image ci-dessous illustre les résultats que peuvent fournir ce moteur :
Le développement des échanges entre les entreprises européennes et la Chine nous a conduit à travailler sur l’intégration du chinois comme nouvelle langue de reformulation. Les premiers résultats sont prometteurs et devraient rapidement être mis à disposition de nos clients.
Grâce au moteur cross-lingue, la Primature de Mauritanie a pu ainsi développer pour son usage interne un portail de consultation des documents législatifs bilingue français-arabe.
Airbus Helicopters réalise sa veille stratégique à l’aide d’ANT’box qui lui permet de traiter des documents de différentes provenances et rédigés principalement en anglais et en français.