LRE Map

577 results found.

Clear all filters

Resource Type

Production Status

Availability

Modality

Ressource Use

Language Type

Languages

Conference

4REAL

ACL

ACLHT

AREA

AsianLang

BioTxtM

BR-LRE

BUCC

CCURL

CIDTD

CMLC-2

CMLC-6

CNL

COLING

EMNLP

ES3LOD

FNP

Games4NLP

GLOBALEX

IJCNLP

IndustryTrack

Interspeech

IS

isa-10

ISINLP2

LB-IRL

LDL

LiNCR

LRE-Rel2

LREC

LRT4HDA

LTC

MMC

MomenT

MTE

MultilingualBIO

NAACL

O-COCOSDA

OCOCOSDA18

OSACT

OSACT3

ParlaCLARIN

RANLP

SaLTMiL

SignLanguage

SPLET

TA-COS

The International Conference on Language Resources and Evaluation

WILDRE

PDT-VALLEX 2.0

Written Lexicon,

Language Type:

Multilingual

Languages:

Czech

Availability:

Freely Available

License:

Creative Commons 3.0 - BY - NC - SA

LREC2014 Expand/Collapse

Size:

11656 entries

Production Status:

Existing-used

Use:

Linking lexicons

Paper title:
Automatic Mapping Lexical Resources: A Lexical Unit as the Keystone
Paper track:
Written
Paper status:
Accept Poster

Author Number	Name	Affiliation	Country
Author 1	Eduard Bejček	Charles University in Prague, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics	CZ
Author 2	Kettnerová Václava	Charles University in Prague	CZ
Author 3	Marketa Lopatkova	Charles University in Prague	CZ
Main Contact	Eduard Bejček	Charles University in Prague, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics	None

Documentation:

http://ufal.mff.cuni.cz/PDT-Vallex/

Location Phrase Dataset v1.0

Written Corpus,

Language Type:

Bilingual

Languages:

English Russian

Availability:

From Data Center(s)

License:

CC-BY-SA, public domain

LREC2020 Expand/Collapse

Size:

115,000 tokens

Production Status:

Newly created-finished

Use:

Named Entity Recognition

Paper title:
Tagging Location Phrases in Text
Paper track:
Written/poster presentation
Paper status:
Accept Poster

Author Number	Name	Affiliation	Country
Main Contact	Paul McNamee	Location Phrase Dataset v1.0	/N

Documentation:

None

The Stanford Question Answering Dataset (SQuAD) v2.0

Written Terminology,

Language Type:

Monolingual

Languages:

English

Availability:

Freely Available

License:

COLING2020 Expand/Collapse

Size:

44 MByte

Production Status:

Existing-used

Use:

Question Answering

Paper title:
How Far Does BERT Look At: Distance-based Clustering and Analysis of BERT's Attention
Paper track:
Short paper/
Paper status:
Accept Poster

Author Number	Name	Affiliation	Country
Main Contact	Yue Guan	The Stanford Question Answering Dataset (SQuAD) v2.0	/N

Documentation:

None

TAC 2010 KBP Training Entity Linking V2.0 Written Corpus,

Language Type:

Monolingual

Languages:

Availability:

From Data Center(s)

License:

LDC

LREC2012 Expand/Collapse

Size:

1500 queries Other

Production Status:

Newly created-finished

Use:

Information Extraction, Information Retrieval

Paper title:
Linguistic Resources for Entity Linking Evaluation: from Monolingual to Cross-lingual
Paper track:
Written
Paper status:
Accept Oral

Author Number	Name	Affiliation	Country
Author 1	Xuansong Li	<Not Specified>	None	University of Pennsylvania	None
Author 2	Stephanie Strassel	<Not Specified>	None	LDC	None
Author 3	Heng Ji	<Not Specified>	None
Author 4	Kira Griffitt	<Not Specified>	None
Author 5	Joe Ellis	<Not Specified>	None
Main Contact	Xuansong Li	Linguistic Data Consortium, University of Pennsylvania	US	Linguistic Data Consortium at the University of Pennsylvania	US

Documentation:

yes, English, will soon be publicly available

Corpus of Polish Spatial Texts 2.0 (PST 2.0)

Written Corpus,

Language Type:

Monolingual

Languages:

Polish

Availability:

Freely Available

License:

CreativeCommons

LREC2020 Expand/Collapse

Size:

61315 tokens

Production Status:

Existing-updated

Use:

Information Extraction, Information Retrieval

Paper title:
PST 2.0 – Corpus of Polish Spatial Texts
Paper track:
Written/poster presentation
Paper status:
Accept Poster

Author Number	Name	Affiliation	Country
Main Contact	Michał Marcińczuk	Corpus of Polish Spatial Texts 2.0 (PST 2.0)	/N

Documentation:

None

Arabic Treebank Part 1 v 4.0 Written Corpus,

Language Type:

Language Independent

Languages:

Availability:

Not Available

License:

LREC2010 Expand/Collapse

Size:

Production Status:

Existing-updated

Use:

Information Extraction, Information Retrieval

Paper title:
From Speech to Trees: Applying Treebank Annotation to Arabic Broadcast News
Paper track:
General issues
Paper status:
Accept Poster

Author Number	Name	Affiliation	Country
Author 1	Mohamed Maamouri	<Not Specified>	None	LDC	None	Linguistic Data Consortium	US
Author 2	Ann Bies	<Not Specified>	None	LDC	None	Linguistic Data Consortium, University of Pennsylvania	None
Author 3	Seth Kulick	<Not Specified>	None	LDC	None	Linguistic Data Consortium	US
Author 4	Wajdi Zaghouani	LDC	None
Author 5	Dave Graff	LDC	None
Author 6	Mike Ciul	LDC	None
Main Contact	Ann Bies	LDC	US	Linguistic Data Consortium, University of Pennsylvania	US

Documentation:

Arabic Treebank Part 2 v 3.0 Written Corpus,

Language Type:

Language Independent

Languages:

Availability:

Not Available

License:

LREC2010 Expand/Collapse

Size:

Production Status:

Existing-updated

Use:

Information Extraction, Information Retrieval

Paper title:
From Speech to Trees: Applying Treebank Annotation to Arabic Broadcast News
Paper track:
General issues
Paper status:
Accept Poster

Author Number	Name	Affiliation	Country
Author 1	Mohamed Maamouri	<Not Specified>	None	LDC	None	Linguistic Data Consortium	US
Author 2	Ann Bies	<Not Specified>	None	LDC	None	Linguistic Data Consortium, University of Pennsylvania	None
Author 3	Seth Kulick	<Not Specified>	None	LDC	None	Linguistic Data Consortium	US
Author 4	Wajdi Zaghouani	LDC	None
Author 5	Dave Graff	LDC	None
Author 6	Mike Ciul	LDC	None
Main Contact	Ann Bies	LDC	US	Linguistic Data Consortium, University of Pennsylvania	US

Documentation:

The Bangla RST Discourse Treebank Written <Not Specified>,

Language Type:

Monolingual

Languages:

Availability:

Contact the author

License:

WILDRE2018 Expand/Collapse

Italian CCG Treebank (CCG-TUT)

Written Corpus,

Language Type:

Multilingual

Languages:

italian

Availability:

Freely Available

License:

COLING2010 Expand/Collapse

Russian Dependency Syntax Multi-Treebank

Written Corpus,

Language Type:

Multilingual

Languages:

Russian

Availability:

Freely Available

License:

OpenSource

COLING2012 Expand/Collapse

Previous | Next

LRE Map

Resource-Dataset

Resource-Tool

Resource-Guidelines

Evaluation

Other

4REAL

ACL

ACLHT

AREA

AsianLang

BioTxtM

BR-LRE

BUCC

CCURL

CIDTD

CMLC-2

CMLC-6

CNL

COLING

EMNLP

ES3LOD

FNP

Games4NLP

GLOBALEX

IJCNLP

IndustryTrack

Interspeech

IS

isa-10

ISINLP2

LB-IRL

LDL

LiNCR

LRE-Rel2

LREC

LRT4HDA

LTC

MMC

MomenT

MTE

MultilingualBIO

NAACL

O-COCOSDA

OCOCOSDA18

OSACT

OSACT3

ParlaCLARIN

RANLP

SaLTMiL

SignLanguage

SPLET

TA-COS

The International Conference on Language Resources and Evaluation

WILDRE