Was haben
Biowissenschaftler im Labor mit Linguisten im Seminar gemeinsam? Sie
nehmen beide immer intensiver die Dienste der Informatik in Anspruch,
um ihre Forschungsarbeiten schneller, umfassender und besser
reproduzierbar zu machen -durch Simulationen von biochemischen
Reaktionen, oder durch Software, die das Annotieren von Texten
erleichtert. Was der Computer dafür tun kann, erforschen die
Wissenschaftler des Heidelberger Forschungsinstituts EML Research in
mehreren Arbeitsgruppen. Die Arbeitsfelder reichen von der
Bioinformatik über wissenschaftliche Datenbanken bis hin zur
Computerlinguistik. Das 2003 neu gegründete Institut wird von der
gemeinnützigen Klaus Tschira Stiftung getragen. Im ersten Jahresbericht
der EML Research gGmbH, der jetzt erschienen ist, werden Projekte aus
diesen Gebieten vorgestellt.
Ein
Beispiel dafür ist COPASI, ein Softwarepaket für Biowissenschaftler,
das biochemische Prozesse analysiert und simuliert. Es eignet sich für
den Forscher im Labor, der eine Hypothese überprüfen oder ein
Experiment zur Überprüfung derselben vorbereiten will. Die Simulation
von biochemischen Prozessen hilft dem Experimentalforscher also ähnlich
wie die Simulation eines Crash-Tests dem Automobilbauer: Sie spart Zeit
und einige aufwändige Versuche. Die Bioinformatik-Forschungsgruppe
unter der Leitung von Dr. Ursula Kummer hat die Software gemeinsam mit
dem Virginia Bioinformatics Institute (USA) entwickelt.
COPASI
ist ein wichtiger Baustein in einem Paket von rechnerischen Werkzeugen
und Methoden, an dem die Forscher derzeit unter dem Namen „SYCAMORE“
arbeiten. Das weltweit Neue und Besondere daran ist, dass es nicht nur
Rechenmethoden zur Verfügung stellt, sondern auch dem
Biowissenschaftler dabei hilft, die richtige Methode, zum Beispiel bei
der Simulation, auszuwählen. Der Rechner kann und soll dabei das
Reagenzglas nicht ersetzen, sondern die Experimente sinnvoll ergänzen.
Ein Beispiel: Ein Wissenschaftler sucht nach einem Hemmstoff für ein
Eiweiß, das bestimmte Stoffwechselprozesse auslöst. „SYCAMORE“ zeigt
ihm, ob es möglich ist, diesen Hemmstoff rechnerisch zu bestimmen, und
welcher biochemische Prozess dadurch am stärksten gehemmt wird. Zwei
Forschungsgruppen der EML Research arbeiten an diesem Projekt,
das vom Bundesministerium für Bildung und Forschung (BMBF)
gefördert wird.
Mit
molekularen Prozessen und der Dynamik von Proteinen befasst sich die
Forschungsgruppe von Dr. Rebecca Wade. Das Verständnis dafür, wann und
an welcher Stelle ein Protein an ein anderes „andockt“, ist sehr
wichtig für die Entwicklung neuer Medikamente mit weniger
Nebenwirkungen. Die Wissenschaftler entwickeln vor allem
Computermodelle für die Interaktion zwischen Proteinen. Wie hoch das
Interesse der Industrie an dieser Grundlagenforschung ist, lässt sich
auch daran erkennen, dass EML Research in einem Projekt mit einem
pharmazeutischen Unternehmen kooperiert.
Ein
System, das Biowissenschaftlern dabei helfen soll, den Datendschungel
der Stoffwechselwege besser zu durchforsten, entwickelt die
Forschungsgruppe Wissenschaftliche Datenbanken unter der Leitung von
Dr. Isabel Rojas. In „AMBOS“ werden Informationen zu Genen, Proteinen
und über biochemische Reaktionen aus weltweit verstreuten Datenbanken
integriert und visualisiert. So kann sich ein Biologe biochemische
Reaktionen, die er im Labor untersucht, am PC als Grafik darstellen
lassen.
Die
Forschungsgruppe „Natural Language Processing“ unter der Leitung von
Dr. Michael Strube hat eine spezielle Software für Computerlinguisten
entwickelt, die diesen beim mühsamen Geschäft der Annotation hilft.
Darunter versteht man, dass Texte von Hand mit linguistischer und
anderer Information angereichert werden müssen – eine wichtige
Voraussetzung für die automatische Sprachverarbeitung. Das digitale
Werkzeug mit dem Namen MMAX ist plattformunabhängig und
nutzerfreundlich. MMAX integriert auch bereits annotierte Texte und
unterstützt die Forschung bei der Lösung verschiedener linguistischer
Probleme. Mit dem Annotationstool aus Heidelberg arbeiten inzwischen
schon circa fünfzehn Forschungsteams in aller Welt.
Ein
weiteres Projekt beschäftigt sich mit der Sprache, wie sie täglich in
unzähligen Besprechungen, Verhandlungen und Diskussionen gesprochen
wird. Oft schreibt einer der Teilnehmer fleißig Notizen, um später ein
Protokoll anzufertigen – eine meist ungeliebte Aufgabe. Wie schön wäre
es, ein prägnantes und aussagekräftiges Protokoll auf Knopfdruck zu
erhalten! Die Computerlinguisten der EML Research arbeiten daran, diese
Vorstellung in die Tat umzusetzen: Sie wollen mit intelligenter
Software gesprochene Dialoge automatisch zusammenfassen. Ziel des
Projekts „DIANA-Summ“ (DIalog ANAphors and Summarization) ist es, die
automatische Erzeugung von Gesprächsprotokollen zu ermöglichen. Das
Projekt wird von der Deutschen Forschungsgemeinschaft (DFG) gefördert.
Die EML
Research gGmbH kooperiert eng mit nationalen und internationalen
Partnern. Beispielhaft dafür ist das erste deutsche Zentrum für
Modellierung und Simulation in den Biowissenschaften (BIOMS), das in
Heidelberg gegründet wurde. EML Research ist einer der Partner des
Zentrums, neben dem Deutschen Krebsforschungszentrum, dem EMBL
(European Molecular Biology Laboratory), dem Max-Planck-Institut für
Medizinische Forschung und der Universität Heidelberg.
Mit 2,5
Millionen Euro finanziert die Klaus Tschira Stiftung ein Drittel des
Zentrums, ein weiteres Drittel steuert das Land Baden-Württemberg bei.
Die restlichen Mittel erbringen die Universität und beteiligte
Forschungsinstitute. Das Projekt dient ausschließlich zur Förderung von
Nachwuchswissenschaftlern in der Spitzenforschung.
Wenn Sie
Interesse am Annual Report (Buch und CD in englischer Sprache) der EML
Research gGmbH haben, bestellen Sie bitte per E-Mail bei
Dr. Peter Saueressig
EML Research gGmbH
Presse- und Öffentlichkeitsarbeit
Tel: +49-6221-533-245
Fax: +49-6221-533-198
[email protected]
Sie können sich den Bericht auch gerne herunterladen.