Sciweavers

Free Online Productivity Tools i2Speak i2Symbol i2OCR iTex2Img iWeb2Print iWeb2Shot i2Type iPdf2Split iPdf2Merge i2Bopomofo i2Arabic i2Style i2Image i2PDF iLatex2Rtf Sci2ools

15

IRFC
2010
Springer

favoriteEmaildiscussreport

147views Information Technology» more IRFC 2010»

Combining Wikipedia-Based Concept Models for Cross-Language Retrieval

13 years 9 months ago

Combining Wikipedia-Based Concept Models for Cross-Language Retrieval

Download www.lsv.uni-saarland.de

Abstract. As a low-cost ressource that is up-to-date, Wikipedia recently gains attention as a means to provide cross-language brigding for information retrieval. Contradictory to a previous study, we show that standard Latent Dirichlet Allocation (LDA) can extract cross-language information that is valuable for IR by simply normalizing the training data. Furthermore, we show that LDA and Explicit Semantic Analysis (ESA) complement each other, yielding signiﬁcant improvements when combined. Such a combination can signiﬁcantly contribute to retrieval based on machine translation, especially when query translations contain errors. The experiments were perfomed on the Multext JOC corpus und a CLEF dataset. Key words: Latent dirichlet allocation, explicit semantic analysis, crosslanguage information retrieval, machine translation

Benjamin Roth, Dietrich Klakow

Real-time Traffic

Explicit Semantic Analysis | Information Management | Information Retrieval | IRFC 2010 | Latent Dirichlet Allocation |

claim paper

Related Content

» Cross Language Information Retrieval for Biomedical Literature

» Combining resources with confidence measures for cross language information retrieval

» A WikipediaBased Multilingual Retrieval Model

» Ontologies in CrossLanguage Information Retrieval

» CrossLanguage and CrossMedia Image Retrieval An Empirical Study at ImageCLEF2007

» Easing Erroneous Translations in CrossLanguage Image Retrieval Using Word Associations

» Dublin City University at CLEF 2006 CrossLanguage Speech Retrieval CLSR Experiments

» CUHK at ImageCLEF 2005 CrossLanguage and CrossMedia Image Retrieval

» Language Identification Strategies for Cross Language Information Retrieval

Post Info
More Details (n/a)

Added	19 Jul 2010
Updated	19 Jul 2010
Type	Conference
Year	2010
Where	IRFC
Authors	Benjamin Roth, Dietrich Klakow

Comments (0)