|
Vorläufiger Plan für Seminar
SS 2005 an der Uni Heidelberg,
Lehrstuhl für
Computerlinguistik
Erschließung großer Korpora mit
Verfahren der lexikalischen Semantik
Seminarleiterin: Dr. Iryna Gurevych
Das Seminar wird die
Erschließung der Korpora mit den Verfahren untersuchen, die
sich auf die Wissensquellen der lexikalischen Semantik,
beispielsweise WordNet oder GermaNet, stützen.
Nach einer Klärung
der Begriffe und einer Einführung in die Methoden der
Lexikalischen Semantik sowie korpus-basierte Arbeiten, werden in der
1. Hälfte des Seminars unterschiedliche Maße semantischer
Ähnlichkeit in Detail diskutiert. In der 2. Hälfte des
Seminars wird die Anwendung dieser Verfahren auf die Fragestellungen
der automatischen Sprachverarbeitung besprochen.
Die Teilnehmer werden
die Gelegenheit haben:
Die Verfahren der
lexikalischen Semantik sollen im Seminar auf eine bestimmte Aufgabe
selbständig angewandt werden. Die experimentelle Arbeit wird
korpus-basiert durchgeführt, im Seminar vorgestellt und
diskutiert und schriftlich dokumentiert.
Nachfolgend befindet sich eine Auflistung der möglichen Themen:
|
Datum
|
Thema
|
Literatur
|
|
|
Einführung:
lexikalische Semantik,
Wissensquellen, z.B. WordNet,
semantische Ähnlichkeit,
semantische Distanz.
|
|
|
|
Überblick über Methoden
der lexikalischen Semantik. Semantic Similarity
package.
Korpus-basierte Arbeiten.
|
Budanitsky
A. and Hirst G. 2001. Semantic distance in WordNet: An
experimental, application-oriented evaluation of five measures.
In Workshop on WordNet and Other Lexical Resources, Second
meeting of the North American Chapter of the Association for
Computational Linguistics. Pittsburgh, PA.
Budanitsky,
Alexander and Hirst, Graeme. Evaluating WordNet-based measures
of semantic distance. Submitted for publication, 2004.
(http://www.cs.toronto.edu/compling/Publications/h-i.html#Hirst)
Pedersen,
Patwardhan, and Michelizzi. 2004.WordNet::Similarity -
Measuring the Relatedness of Concepts In Proceedings of
Fifth Annual Meeting of the North American Chapter of the
Association for Computational Linguistics (NAACL-04), May
3-5, 2004, Boston, MA
Pedersen,
Patwardhan, and Michelizzi.2004. WordNet::Similarity -
Measuring the Relatedness of Concepts. In Proceedings of
the Nineteenth National Conference on Artificial Intelligence
(AAAI-04), July 25-29, 2004, San Jose, CA
|
|
|
Leacock
& Chodorow (1998)
|
|
|
|
Jiang
& Conrath (1997)
|
|
|
|
Resnik (1995)
|
Resnik P. 1995. Using
information content to evaluate semantic similarity. In
Proceedings of the 14th International Joint Conference on
Artificial Intelligence, pages 448-453, Montreal.
Resnik P.
1999. Semantic Similarity in a Taxonomy: An Information- Based
Measure and its Applications to Problems of Ambiguity in Natural
Language. Journal of Artificial Intelligence Research,
11, 95-130.
|
|
|
Lin (1998)
|
|
|
|
Hirst
& St-Onge (1998)
|
|
|
|
Wu
& Palmer (1994)
|
|
|
|
Banerjee
and Pedersen (2002)
|
Banerjee
S. and Pedersen T. 2002. An Adapted Lesk Algorithm for Word
Sense Disambiguation Using WordNet. In Proceeding of the
Fourth International Conference on Computational Linguistics and
Intelligent Text Processing (CICLING-02). Mexico City.
Banerjee
S. Adapting the Lesk algorithm for word sense disambiguation
to WordNet. Master Thesis, University of Minnesota, Duluth,
2002.
|
|
|
Patwardhan
(2003)
|
Patwardhan
S. Incorporating dictionary and corpus information into a
vector measure of semantic relatedness. Master Thesis,
University of Minnesota, Duluth, 2003.
|
|
|
Anwendung:
Wortlesartendisambiguierung
|
Schütze
H. 1998. Automatic Word Sense Discrimination.
Computational Linguistics, 24(1):97-123.
Patwardhan
S., Banerjee S. and Pedersen T. 2002. Using Semantic
Relatedness for Word Sense Disambiguation. In Proceedings
of the Fourth International Conference on Intelligent Text
Processing and Computational Linguistics, Mexico City.
|
|
|
Anwendung:
Rechtschreibkorrektur
|
Hirst,
Graeme and Budanitsky, Alexander. Correcting real-word
spelling errors by restoring lexical cohesion. Submitted for
publication.
(http://www.cs.toronto.edu/compling/Publications/h-i.html#Hirst)
|
|
|
Anwendung:
Informationserschließung und Extraktion
|
Gonzalo,
J., F. Verdejo, I. Chugur and J. Cigarrán (1998)
Indexing
with WordNet synsets can improve text retrieval,
in ACL/COLING Workshop on Usage of WordNet for Natural
Language Processing.
Sanderson, M. (1994)
Word
Sense Disambiguation and Information Retrieval,
SIGIR'94.
Richardson, R. and
Smeaton, A. (1995) Using
WordNet in a Knowledge-Based Approach to Information Retrieval,
Dublin City Univ.
TR CA-0395.
Smeaton,
A. and Quigley, I. (1996) Experiments
on Using Semantic Distances between words in Image Caption
Retrieval,
SIGIR'96.
|
|
|
Anwendung:
Text-/Dialogzusammenfassung
|
Iryna
Gurevych and Michael Strube. 2004. Semantic Similarity Applied
to Spoken Dialogue Summarization. In Proceedings of
COLING, Geneva, Switzerland, August. To appear.
|
|
|
Anwendung:
Dialogsysteme
|
Iryna
Gurevych, Rainer Malaka, Robert Porzel, Hans-Peter Zorn. 2003.
Semantic coherence scoring using an ontology. In
Proceedings of the Joint Human Language Technology and
Northern Chapter of the Association for Computational Linguistics
Conference (HLT-NAACL), Edmonton, Canada, p.p. 88 - 95.
|
<< zurück
|