MỘT CÁCH MỞ RỘNG TRUY VẤN TRONG TRUY XUẤT THÔNG TIN

  • Nguyễn Chánh Thành Khoa Công nghệ thông tin, Đại học Kỹ thuật Công nghệ Tp.HCM
  • Nguyễn Văn Hiếu Khoa Công nghệ thông tin, Đại học Kỹ thuật Công nghệ Tp.HCM

Abstract

Cho đến nay, nhiều phương pháp chuyển ngữ cụm danh từ được đề xuất trong các nghiên cứu thuộc lĩnh vực xử lý ngôn ngữ tự nhiên, nhưng hầu hết các phương pháp này dựa trên cơ sở chuyển ngữ các từ thành phần thông qua từ điển và tính độ kết hợp. Bài báo này đề xuất một cách tiếp cận khác, dựa trên việc sử dụng kết hợp lý thuyết tập hợp với mẫu luật sinh, để chuyển ngữ cụm danh từ với độ chính xác tương đối khả quan trong cặp ngôn ngữ Việt-Anh.

References

[1] Fernando López - Ostenero, Julio Gonzalo, Felisa Verdejo, Noun phrases as building blocks for cross - language Search Assistance, Information Processing and Management: an International Journal archive, Volume 41, Issue 3, pp549-568, ISSN: 0306-4573, May 2005.
[2] Juan M. Cigarr‟an, Anselmo Pe˜nas, Julio Gonzalo, and Felisa Verdejo, Automatic Selection of Noun Phrases as Document Descriptors in an FCA-Based Information Retrieval System, Springer LNCS 3403; ICFCA 2005.
[3] Ryan Richardson, Ben Goertzel, Edward A. Fox, Hugo Pinto, Automatic creation and translation of concept maps for Computer science-related theses and dissertations, Second International Conference on Concept Mapping/Segundo Congreso Internacional Sobre Mapas Conceptuales San José, Costa Rica Sept. 5-8, 2006.
[4] Jianfeng Gao, Jian-Yun Nie, Endong Xun, Jian Zhang, Ming Zhou, Changning Huang, Improving Query Translation for Cross - Language Information Retrieval using Statistical Model, ACM 1-58113-331-6/01/0009, 2001.
[5] Rossitsa Petcova, Katya Alahverdzhieva, Transfer rules in Bulgarian-English Machine Translation - The POS (Noun) and the Noun Phrase, RoCoLi 2005 Summer School (Romania Computational Linguistics Summer School).
[6] Philipp Koehn, Christof Monz, Shared Task: Statistical Machine Translation between European Languages, Building and Using Parallel Texts: Data-Driven, Machine Translation and Beyond, Proceedings of the Workshop, ACL-05, 29-30 June 2005, University of Michigan - Ann Arbor, Michigan, USA.
[7] Ashish Venugopal, Andreas Zollmann, Alex Waibel, Training and Evaluating Error Minimization Rules for Statistical Machine Translation, Building and Using Parallel Texts: Data-Driven, Machine Translation and Beyond, Proceedings of the Workshop, ACL-05, 29-30 June 2005, University of Michigan - Ann Arbor, Michigan, USA.
[8] Juan Miguel Vilar, Enrique Vidal, A Recursive Statistical Translation Model, Building and Using Parallel Texts: Data-Driven, Machine Translation and Beyond, Proceedings of the Workshop, ACL-05, 29-30 June 2005, University of Michigan - Ann Arbor, Michigan, USA.
[9] Stephan Kanthak, David Vilar, Evgeny Matusov, Richard Zens, and Hermann Ney, Novel Reordering Approaches in Phrase-Based Statistical Machine Translation, Building and Using Parallel Texts: Data-Driven, Machine Translation and Beyond, Proceedings of the Workshop, ACL-05, 29-30 June 2005, University of Michigan - Ann Arbor, Michigan, USA.
[10] Marcus, M., G. Kim, M. A. Marcinkiewicz, R. MacIntyre, A. Bies, M. Ferguson, M. Katz and B. Schasberger, The Penn Treebank: Annotating Predicate-Argument Structure, Proceedings of the ARPA Workshop on Human Language Technology, pages 110-115, Princeton, NJ, 1994.
[11] Vietnamese Ministry of Trade, http://www.mot.gov.vn
[12] Text REtrieval Conference (TREC), http://trec.nist.gov
[13] PC World, http://www.pcworld.com.
[14] GATE, A General Architecture for Text Engineering, http://gate.ac.uk.
[15] HO NGOC DUC, http://www.informatik.uni-leipzig.de/~duc/Dict, Open-source dictionary,
[16] PC World Vietnam, http://www.pcworld.com.vn.
Published
2014-11-26
How to Cite
THÀNH, Nguyễn Chánh; HIẾU, Nguyễn Văn. MỘT CÁCH MỞ RỘNG TRUY VẤN TRONG TRUY XUẤT THÔNG TIN. JBIS, [S.l.], nov. 2014. Available at: <http://jbis.ueh.edu.vn/index.php/TSTHQL/article/view/14>. Date accessed: 22 july 2024.

Keywords

chuyển ngữ cụm danh từ; lý thuyết tập hợp; mẫu luật