Publications

[2018]

Ngoc Tan Le, Fatiha Sadat, Lucie Ménard. Système de translittération neuronal pour une paire de langues peu dotée. Revue du Traitement Automatique des Langues (TAL), numéro spécial traitement automatique des langues peu dotées (59-3), 2018. (soumis)

Ngoc Tan Le, Fatiha Sadat, Lucie Ménard. Low Resource Machine Transliteration Using Recurrent Neural Network. In Proceedings of ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), ISSN 2375-4699, Volume X, 2018. (accepté)

Ngoc Tan Le et al. Data Adaptation for Named Entity Recognition in Twitter with Features-Rich CRF. In Proceedings of NAACL HLT 2018, Widening Natural Language Processing workshop, New Orleans, Louisiana, USA, 1 to 6 June 2018.

Ngoc Tan Le et al. Neural Network-based Model for Named Entity Recognition in Low-Resource Settings. In Proceedings of NAACL HLT 2018, Widening Natural Language Processing workshop, New Orleans, Louisiana, USA, 1 to 6 June 2018.

Ngoc Tan Le, Fatiha Sadat, Lucie Ménard. Nouvelle méthode de construction d’un système de translittération pour une paire de langues peu dotée en utilisant l’approche à base des réseaux de neurones. 86ème Congrès de l’ACFAS – Association francophone pour le savoir, Université du Québec à Chicoutimi, Québec, Canada, 7-11 Mai 2018, communication libre.

[2017]

Ngoc Tan Le and Fatiha Sadat. Cross-linguistic Projection for French-Vietnamese Named Entity Recognition. Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, Springer LNAI (Lecture Notes in Artificial Intelligence) Series, Lecture Notes in Computer Science, 2017. (en cours | in process)

Ngoc Tan Le and Fatiha Sadat. A neural network architecture for low-resource machine transliteration. In proceeding of the 8th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, in the 5th LRL Workshop (a Joint LTC-ELRA-FLaReNet-META_NET Workshop on Less-Resourced Languages): « Language Technology for Less Resourced Languages », November 17-19, 2017, Poznań, Poland.

Phuoc Tran, Dien Dinh, Tan Le, Long H. B. Nguyen. Linguistic-Relationships-Based Approach for Improving Word Alignment. In Proceedings of ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), ISSN 2375-4699, doi 10.1145/3133323, Volume 17 Issue 1, Article No. 5, 5:1–5:16, November 2017.

Ngoc Tan Le, Fatiha Sadat, Lucie Ménard. A Neural Network Transliteration Model in Low Resource Settings. In Proceedings of the 16th International Conference of Machine Translation Summit, September 18-22 2017, Nagoya, Japan, volume 1, Research Track. 337–345.

Ngoc Tan Le, Fatiha Sadat, Lucie Ménard. Translittération automatique pour une paire de langues peu dotée24ème Traitement Automatique des Langues Naturelles, Orléans, France, 2017.

Ngoc Tan Le, Long Nguyen, Damien Nouvel, Fatiha Sadat, Dien Dinh. Named Entity Recognition for tweets : a case study French. In Proceedings of 19ème Conférence sur l’apprentissage automatique, Grenoble, France, 28-30 Juin 2017.

Ngoc Tan Le, Fatma Mallek, Alexandro Fonseca, Billal Bilainine, Fatiha Sadat. Reconnaissance des entités nommées dans les messages Twitter en français.In Proceedings of 19ème Conférence sur l’apprentissage automatique, Grenoble, France, 28-30 Juin 2017.

Fatma Mallek, Ngoc Tan Le, Fatiha Sadat. Automatic Machine Translation for Arabic TweetsIntelligent Natural Language Processing: Trends and Applications. Scientific Research Group in Egypt (SRGE), editor Springer, 2017, book chapter.

Mallek F, Le Ngoc T,  Sadat F. (2017). Improved Machine Translation for Arabic Tweets on Scarce-resource settings. In proceedings of The Workshop on Social Media and User Generated Content Machine Translation, May 31st 2017, EAMT, Prague, Czech Republic.

Ngoc Tan Le, Fatiha Sadat. Information Extraction in Real-World Business Documents. CICLing : International Conference on Computational Linguistics and Intelligent Text Processing, April 17-23, 2017 Budapest, Hungary.

[2016]

Ngoc Tan Le, Fatiha Sadat. UQAM-NTL: Named entity recognition in Twitter messages. COLING 2016, the 26th International Conference on Computational Linguistics, Association for Natural Language Processing (ANLP), the 2nd Workshop on Noisy User-generated Text Osaka, Japan, 11-16 December 2016. 

Benoit Potvin, Roger Villemaire, Ngoc Tan Le. A Position-Based Method for the Extraction of Financial Information in PDF Documents. In the proceedings of the 21st Australasian Document Computing Symposium, SIGIR – Special Interest Group on Information Retrieval, Monash University, Melbourne, Australia, 6-7 December 2016.

Ngoc Tan Le, Fatiha Sadat. Construction de ressources linguistiques pour un corpus annoté bilingue franco-vietnamien et traduction automatique des entités nommées pour Français-Vietnamien. 84ème Congrès de l’ACFAS – Association francophone pour le savoir, Université du Québec à Montréal, Québec, Canada, 9-13 Mai 2016.

Pulizzotto, D., López Gónzalez, J. A., Chartier, Jean-François, Meunier, J.-G., Chartrand, L., Laureau, F., Le, N. T..  Recherche de « périsegments » dans un contexte d’analyse conceptuelle assistée par ordinateur : le concept d’« esprit » chez Peirce. JEP-TALN-RECITAL 2016, vol. 2, 2016.

Ngoc Tan Le, Jean-Guy Meunier, Louis Chartrand, Davide Pulizzotto, Jose A Lopez, Francis Lareau, Jean-François Chartier. Nouvelle méthode d’analyse syntactico-sémantique profonde dans la lecture et l’analyse de textes assistées par ordinateur (LATAO). JADT 2016 : 13ème Journées internationales d’Analyse statistique des Données Textuelles, 7-10 juin 2016 Nice (France), volume 2.  

Chartrand, L., Meunier, J.-G., Pulizzotto, D., López González, J., Chartier, J.-F., Ngoc Le, T., Trujillo Amaya, J.  CoFiH: A heuristic for concept discovery in computer- assisted conceptual analysis. JADT 2016 : 13ème Journées internationales d’Analyse statistique des Données Textuelles, 7-10 juin 2016 Nice (France), volume 1.

[2015]
Ngoc Tan Le, Fatiha Sadat. Building a Bilingual Vietnamese-French Named Entity Annotated Corpus through Cross-Linguistic Projection. 22ème Traitement Automatique des Langues Naturelles, Caen, France, 2015.

Ngoc Tan Le, Fatiha Sadat. Error Analysis of Named Entity Translation output for Poor-Resourced Bilingual Vietnamese-French Pair. 7th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, November 27-29, 2015, Poznań, Poland, p.304-308.

[2013]

Ngoc Tan Le, Ngoc Tien LE, Dien DINH. An Approach of Chunk Alignment for French-Vietnamese Bilingual Corpora. IJCSI International Journal of Computer Science Issues, ISSN (Print): 1694-0814 | ISSN (Online): 1694-0784, Vol. 10, Issue 2, No 3, March 2013, p.111-117.

Ngoc Tan Le, Ngoc Tien Le, Dien Dinh. French-Vietnamese statistical machine translation combining with chunk alignmentsJournal of Computer Science and Cybernetics ISSN: 1813-9663, Vol 29, No 4, 2013, p.358-368.