:: Home | English | Druck ::



Vorläufiger Plan für Seminar

                                         SS 2005 an der Uni Heidelberg, Lehrstuhl für Computerlinguistik

Erschließung großer Korpora mit Verfahren der lexikalischen Semantik

Seminarleiterin: Dr. Iryna Gurevych


Das Seminar wird die Erschließung der Korpora mit den Verfahren untersuchen, die sich auf die Wissensquellen der lexikalischen Semantik, beispielsweise WordNet oder GermaNet, stützen.

Nach einer Klärung der Begriffe und einer Einführung in die Methoden der Lexikalischen Semantik sowie korpus-basierte Arbeiten, werden in der 1. Hälfte des Seminars unterschiedliche Maße semantischer Ähnlichkeit in Detail diskutiert. In der 2. Hälfte des Seminars wird die Anwendung dieser Verfahren auf die Fragestellungen der automatischen Sprachverarbeitung besprochen.

Die Teilnehmer werden die Gelegenheit haben:

Die Verfahren der lexikalischen Semantik sollen im Seminar auf eine bestimmte Aufgabe selbständig angewandt werden. Die experimentelle Arbeit wird korpus-basiert durchgeführt, im Seminar vorgestellt und diskutiert und schriftlich dokumentiert.

Nachfolgend befindet sich eine Auflistung der möglichen Themen:

Datum

Thema

Literatur


Einführung:

lexikalische Semantik, Wissensquellen, z.B. WordNet,

semantische Ähnlichkeit,

semantische Distanz.


Überblick über Methoden der lexikalischen Semantik. Semantic Similarity package.

Korpus-basierte Arbeiten.

  • Budanitsky A. and Hirst G. 2001. Semantic distance in WordNet: An experimental, application-oriented evaluation of five measures. In Workshop on WordNet and Other Lexical Resources, Second meeting of the North American Chapter of the Association for Computational Linguistics. Pittsburgh, PA.

  • Budanitsky, Alexander and Hirst, Graeme. Evaluating WordNet-based measures of semantic distance. Submitted for publication, 2004. (http://www.cs.toronto.edu/compling/Publications/h-i.html#Hirst)

  • Pedersen, Patwardhan, and Michelizzi. 2004.WordNet::Similarity - Measuring the Relatedness of Concepts In Proceedings of Fifth Annual Meeting of the North American Chapter of the Association for Computational Linguistics (NAACL-04), May 3-5, 2004, Boston, MA

  • Pedersen, Patwardhan, and Michelizzi.2004. WordNet::Similarity - Measuring the Relatedness of Concepts. In Proceedings of the Nineteenth National Conference on Artificial Intelligence (AAAI-04), July 25-29, 2004, San Jose, CA


Leacock & Chodorow (1998)

  • Leacock C. and Chodorow M. 1998. Combining local context and WordNet similarity for word sense identification. In Fellbaum 1998, pp. 265-283.


Jiang & Conrath (1997)

  • Jiang J. and Conrath D. 1997. Semantic similarity based on corpus statistics and lexical taxonomy. In Proceedings of International Conference on Research in Computational Linguistics, Taiwan.


Resnik (1995)

  • Resnik P. 1995. Using information content to evaluate semantic similarity. In Proceedings of the 14th International Joint Conference on Artificial Intelligence, pages 448-453, Montreal.

  • Resnik P. 1999. Semantic Similarity in a Taxonomy: An Information- Based Measure and its Applications to Problems of Ambiguity in Natural Language. Journal of Artificial Intelligence Research, 11, 95-130.


Lin (1998)

  • Lin D. 1998. An information-theoretic definition of similarity. In Proceedings of the 15th International Conference on Machine Learning, Madison, WI.


Hirst & St-Onge (1998)

  • Hirst G. and St-Onge D. 1998. Lexical Chains as representations of context for the detection and correction of malapropisms. In Fellbaum 1998, pp. 305-332.


Wu & Palmer (1994)

  • Wu Z. and Palmer M. 1994. Verb Semantics and Lexical Selection. In Proceedings of the 32nd Annual Meeting of the Association for Computational Linguistics. Las Cruces, New Mexico.


Banerjee and Pedersen (2002)

  • Banerjee S. and Pedersen T. 2002. An Adapted Lesk Algorithm for Word Sense Disambiguation Using WordNet. In Proceeding of the Fourth International Conference on Computational Linguistics and Intelligent Text Processing (CICLING-02). Mexico City.

  • Banerjee S. Adapting the Lesk algorithm for word sense disambiguation to WordNet. Master Thesis, University of Minnesota, Duluth, 2002.


Patwardhan (2003)

  • Patwardhan S. Incorporating dictionary and corpus information into a vector measure of semantic relatedness. Master Thesis, University of Minnesota, Duluth, 2003.


Anwendung: Wortlesartendisambiguierung

  • Schütze H. 1998. Automatic Word Sense Discrimination. Computational Linguistics, 24(1):97-123.

  • Patwardhan S., Banerjee S. and Pedersen T. 2002. Using Semantic Relatedness for Word Sense Disambiguation. In Proceedings of the Fourth International Conference on Intelligent Text Processing and Computational Linguistics, Mexico City.


Anwendung: Rechtschreibkorrektur

  • Hirst, Graeme and Budanitsky, Alexander. Correcting real-word spelling errors by restoring lexical cohesion. Submitted for publication. (http://www.cs.toronto.edu/compling/Publications/h-i.html#Hirst)


Anwendung: Informationserschließung und Extraktion


Anwendung: Text-/Dialogzusammenfassung

  • Iryna Gurevych and Michael Strube. 2004. Semantic Similarity Applied to Spoken Dialogue Summarization. In Proceedings of COLING, Geneva, Switzerland, August. To appear.


Anwendung: Dialogsysteme

  • Iryna Gurevych, Rainer Malaka, Robert Porzel, Hans-Peter Zorn. 2003. Semantic coherence scoring using an ontology. In Proceedings of the Joint Human Language Technology and Northern Chapter of the Association for Computational Linguistics Conference (HLT-NAACL), Edmonton, Canada, p.p. 88 - 95. 






<< zurück

© EML Research gGmbH