Sciweavers

Free Online Productivity Tools i2Speak i2Symbol i2OCR iTex2Img iWeb2Print iWeb2Shot i2Type iPdf2Split iPdf2Merge i2Bopomofo i2Arabic i2Style i2Image i2PDF iLatex2Rtf Sci2ools

194

WSDM
2012
ACM

252views Data Mining» more WSDM 2012»

WebSets: extracting sets of entities from the web using unsupervised information extraction

14 years 20 days ago

WebSets: extracting sets of entities from the web using unsupervised information extraction

Download www.cs.cmu.edu

We describe a open-domain information extraction method for extracting concept-instance pairs from an HTML corpus. Most earlier approaches to this problem rely on combining clusters of distributionally similar terms and conceptinstance pairs obtained with Hearst patterns. In contrast, our method relies on a novel approach for clustering terms found in HTML tables, and then assigning concept names to these clusters using Hearst patterns. The method can be efﬁciently applied to a large corpus, and experimental results on several datasets show that our method can accurately extract large numbers of concept-instance pairs. Categories and Subject Descriptors: I.2.6[Artiﬁcial Intelligence]: Learning - Knowledge acquisition General Terms: Algorithms, Experimentation.

Bhavana Bharat Dalvi, William W. Cohen, Jamie Call

Real-time Traffic

Concept Names | Data Mining | Knowledge Acquisition | Open Domain | WSDM 2012 |

claim paper

Related Content

» Relational duality unsupervised extraction of semantic relations between entities on the w...

» Unsupervised knowledge acquisition for Extracting Named Entities from speech

» URES an Unsupervised Web Relation Extraction System

» Domainindependent entity extraction from web search query logs

» Unsupervised Relation Extraction by Mining Wikipedia Texts Using Information from the Web

» Unsupervised Relation Extraction From Web Documents

» People Summarization by Combining Named Entity Recognition and Relation Extraction

» FineGrained Entity Recognition

» Unsupervised Learning of Tree Alignment Models for Information Extraction

Post Info
More Details (n/a)

Added	25 Apr 2012
Updated	25 Apr 2012
Type	Journal
Year	2012
Where	WSDM
Authors	Bhavana Bharat Dalvi, William W. Cohen, Jamie Callan

Comments (0)