9. April 2021

«Es ist ganz was anders, als wenn du vor der Klasse stehst und siehst, wie sie reagieren»

Vom 14. bis 16. Juni findet zum 6. Mal die Swiss Text Analytics Conference statt. Wir haben den Kopf hinter der Veranstaltung, Prof. Dr. Mark Cieliebak von der ZHAW, getroffen und mit ihm auch über Corona-Herausforderungen und laufende Forschungsprojekte gesprochen.

Interview: Simon Zaugg

Was hat Corona an deiner Arbeit zum Guten verändert?

Mark Cieliebak: Ich kann viel mehr Zeit mit meinen Kids verbringen, bin viel mehr zu Hause und kann da zu Mittag essen. Ich merke, dass ich effizienter bin. Ich verbringe weniger Zeit mit Reisen. Ich wohne und arbeite ja in Winterthur. Eigentlich habe ich keinen langen Arbeitsweg, aber Meetings sind oft woanders, zum Beispiel in Zürich, Basel oder St. Gallen. Solche Reisen sind viel seltener geworden und das spart mir viel Zeit.

Was ich auch merke: Termine sind leichter zu finden. Wenn du immer noch eine Stunde Reisezeit einplanen muss, dann ist es viel schwieriger, irgendwo eine halbe Stunde mal einen Termin zu machen.

Was vermisst du am meisten aus der Zeit vorher?

Mark Cieliebak: Die Leute persönlich zu treffen und mit ihnen am Whiteboard zu stehen. Online Brainstormen finde ich eine Katastrophe. Es gibt zwar elektronische Whiteboards und gute Tools. Aber so richtig mit dem Stift in der Hand zu arbeiten, das ist was anderes.

Ein zweiter Punkt sind die Vorlesungen. Die sind ja im Moment auch alle online. Leider haben die Studierenden ihre Kameras grösstenteils ausgeschaltet. Es ist ganz was anders, als wenn du vor der Klasse stehst und siehst, wie sie reagieren und das Gespür dafür kriegst, was verstehen sie und was nicht.

Wir führen gerade in unserer KI-Vorlesung eine Diskussion zum Thema autonome Fahrzeuge und wie sie ethisch Entscheidungen treffen in Extremsituationen. Das haben wir kürzlich das erste Mal online gemacht und die Studierenden eingeteilt in Kleingruppen in Breakouträumen. Wenn sie zurückkommen aus den Breakouträumen, dann wirkt die Diskussion oft ein bisschen künstlich.

Du kannst doch auch in Breakouträume reinhören?

Mark Cieliebak: Klar. Aber wenn du da reingehst, dann unterbrichst du meistens die Diskussion. Und sie verliert an Dynamik. Dann muss ich fragen: was habt ihr jetzt besprochen? Im Klassenraum kann ich mich unscheinbarer dazustellen zu einer Gruppe und mitlauschen, das ist viel niederschwelliger.

Bei Studierenden, welche die Kamera ausgeschaltet haben, sieht du ja auch nicht, ob sie etwas anderes machen parallel.

Mark Cieliebak: Das stimmt. Und das ist genauso in allen anderen Meetings: Wenn das Meeting nicht wahnsinnig spannend ist, fängt man automatisch an, E-Mails zu beantworten.

Die Studierenden, welche die Kameras eingeschaltet haben, sind typischerweise jene, die wirklich mitmachen in der Vorlesung und die auch Fragen beantworten oder selber mit Fragen kommen.

Ich nutze auch Umfragen, die meistens von allen beantwortet werden. Aber ob sie wirklich mit vollem Geist bei der Sache sind, das weiss ich leider nicht.

Hast du das Gefühl, dass die Quote jener, die einschalten, vergleichbar ist mit der Aufmerksamkeit im Klassenraum vor Ort?

Mark Cieliebak: Sie ist online tiefer. Im Klassenraum sind mehr Leute voll dabei. Die erste Reihe bleibt ja meistens auch frei, und was die letzte Reihe hinten macht, das kriege ich vielleicht nicht so richtig mit. Aber der Rest ist sehr nah dran, da kann ich wirklich die Energie rüberbringen.

Wie schaut es bei den Prüfungen aus? Ist die Durchfallquote vergleichbar?

Mark Cieliebak: Es ist schwer vergleichbar, weil wir die Prüfungsfrage natürlich auch anders stellen. Das Setting ist anders.

Das Bauchgefühl sagt mir, dass die Lernkurve ähnlich ist. Es gibt immer noch Leute, die super Noten schreiben und solche, wo du dich fragst, was die gemacht haben während der Vorlesung, die einfach das Grundkonzept nicht mitgekriegt haben. Die Spannweite ist immer noch gleich gross.

Kommen wir nun auf die SwissText Konferenz zu sprechen. Was ist der aktuelle Stand der Planung?

Mark Cieliebak: Wir haben entschieden, dass die Konferenz online stattfinden wird. Leider – aber mit den aktuellen Corona-Zahlen können wir nicht davon ausgehen, dass im Juni eine Konferenz mit mehr als 200 Personen vor Ort möglich ist.

Letztes Jahr hatten wir kurzfristig umgeschaltet auf eine komplette Online Konferenz, und es hat einigermassen gut funktioniert. Vorträge gehen prima, aber fürs Networking ist es halt nicht das gleiche. In der Zwischenzeit haben wir einige coole Tools dafür angeschaut, die wir einsetzen wollen. Wir haben letztes Jahr gelernt, dass wir das Networking nicht einfach auf die Pausen legen können. Das geht bei einer Konferenz vor Ort, bei einem Kaffee kann man da Pause machen und mit anderen reden. Bei einer Online-Konferenz haben wir gelernt, dass die Teilnehmer nach zwei Stunden Vorträgen mal vom Computer weg gehen wollen.

Networking ist bei Konferenzen eine wichtige Komponente, deshalb macht es auch Sinn, dem mehr Gewicht zu geben.

Mark Cieliebak: Es ist zum Beispiel eine Speed-Dating-Ecke geplant, wo man alle fünf Minuten jemand anders kennenlernt, sich austauscht und dann in kurzer Zeit zehn Leute kennengelernt hat. Am Ende guckt man, mit wem man weiter Kontakt haben möchte. Ich glaube, wir nennen das dann nicht Speeddating, sondern Instant Connection oder ähnlich.

Was sind inhaltlich die Schwerpunkte 2021?

Mark Cieliebak: Wir fokussieren auf die Schweiz, haben ganz dediziert auch den Call for Papers auf Schweizer Themen fokussiert. Ein wichtiges Thema dieses Jahr ist Schweizerdeutsch, da gibt es viel Forschung und mehrere spannende Vorträge. Das passt sehr gut, denn die Hauptorganisatorin der Konferenz, Manuela Hürlimann, forscht ja auch selber an dem Thema.

Parallel haben wir sehr gute Keynote Speaker eingeladen. Die erste ist Lucia Specia vom Imperial College in London. Sie ist eine Top-Forscherin und erzählt über Multimodal Machine Translation, also wie man Sprache übersetzen kann, aber nicht nur basierend auf dem Text, sondern unter Einbezug von Kontext wie zum Beispiel Bildern. Das ist eine Art Rocket Science zur Zeit.

Dann haben wir Lluís Màrquez von Amazon, der vermutlich zum Thema Question Answering vortragen wird. Es gibt dafür schon Systeme, unter anderem Alexa. Es gibt Sachen, die Alexa gut beantworten kann – und andere noch nicht. Der Vortrag wird vermutlich in die Richtung gehen, wie man aus Wikipedia und ähnlichen Quellen strukturierte Informationen zurückgewinnen kann. Mit anderen Worten: nicht nur sagen «Schau mal nach in Wikipedia» sondern eben die strukturierten Informationen extrahieren. Das funktioniert jetzt schon teilweise. Da bin ich sehr gespannt, wie sie das machen auch wie es weiter geht.

Last but not least: Sebastian Welter von Accenture. Ihn kenne ich persönlich, er hält schon seit Jahren einen Gastvortrag in meinen Vorlesungen. Thema: Wie führt man eigentlich Machine-Learning-Projekte oder KI-Projekte in der Praxis durch?

KI-Projekte funktionieren anders als klassische Software-Projekte, weil man erst noch die Daten finden musst. Diese sind dann typischerweise nicht so, wie man sich die vorstellt. Man muss ständig lernen, mit Fehlern umzugehen. Und wann ist das Projekt abgeschlossen? Das interessiert am Ende das Management, und Sebastian hat sehr viel Erfahrung mit solchen Projekten.

Was sind zurzeit deine drei brennendsten Fragen, denen du als Forscher nachgehst?

Mark Cieliebak: Wir haben ein Produkt entwickelt, womit wir Texte, zum Beispiel ein Interview wie dieses hier, automatisch transkribieren können. Aktuell geht das in Deutsch und Englisch relativ gut. Das System kann auch erkennen, wer was gesagt hat. Aber natürlich wollen wir noch besser werden. Das Ziel ist es, dass vollautomatisch eine genügend gute Qualität ausgespuckt wird, die man nicht mehr gross bearbeiten muss. Voraussetzung ist eine gute Aufnahme. Es funktioniert zum Beispiel noch nicht, wenn man das Smartphone im Restaurant auf den Tisch legt oder der Fernseher im Hintergrund läuft.

Weiteres Thema: Wir wollen Meetings zusammenfassen, wo zwei bis fünf Leute teilnehmen, z.B. ein wöchentliches Teammeeting. Da passiert es häufiger, dass eine Person nicht teilnehmen kann. Das Ziel ist, dass am Ende ein One-Pager entsteht, mit dem man auf einen Blick weiss, worum es gegangen ist und was die wichtigsten Themen und Entscheide waren. Es ist klar, dass das jemand von Hand schreiben kann. Das ist aber mühsam und die wenigsten machen es, darum wollen wir solche Zusammenfassungen automatisch generieren.

Das dritte Thema ist noch mal was ganz anderes: Wie kann man mit natürlicher Sprache automatisch Datenbank-Abfragen machen?

Nimm an, du hast strukturierte Daten in einer Datenbank, zum Beispiel die Daten aller Fussballspieler aus den europäischen Ligen, wann sie wo gespielt haben und wie die Ergebnisse waren. Wenn du aus diesen Daten Informationen rausziehen willst, dann musst du deine Frage in eine Programmiersprache übersetzen, also eine sogenannte «Query» schreiben.

Zum Beispiel: Welcher Spieler hat man hat 1966 am meisten Tore geschossen? Daraus kann ein Datenbank-Experte eine entsprechende Query bauen. Wir entwickeln nun ein System, dass solche Fragen automatisch in eine Query übersetzt, sodass jeder direkt mit der Datenbank «sprechen» kann.

Wenn ich annehme, die Datenbank sagt dir dann, dass es Gerd Müller war. Woher weiss ich jetzt, dass das richtig ist? Wie könnt ihr das überprüfen?

Mark Cieliebak: Unser Ansatz ist, dass wir in einem zweiten Schritt, und mit einer anderen Methode, die generierte Query zurückübersetzen in eine Frage in natürlicher Sprache. Dann kann ich als Benutzer feststellen, ob diese «künstliche» Frage das gleiche ist was ich ursprünglich gefragt habe. Da sind wir schon bald soweit, dass wir einen spannenden Showcase zeigen können.

Sehr spannend. Vielen Dank für die spannenden Einblicke.

Weiterführende Links

Zur Swiss Text Konferenz

swissICT unterstützt die SwissText, die vom 14. bis 16. Juni online stattfindet, mit Kommunikation. Es ist eine jährlich stattfindende Konferenz, die Textanalytik-Experten aus Industrie und Wissenschaft zusammenbringt. Sie wird von der Swiss Association for Natural Language Processing (SwissNLP) in Zusammenarbeit mit der Fachhochschule Nordwestschweiz (FHNW) sowie der Zürcher Hochschule für Angewandte Wissenschaften (ZHAW) und der data innovation alliance organisiert. Die ZHAW, die FHNW wie auch weitere Partner der Veranstaltung sind Mitglieder von swissICT.

Weitere Informationen

Transkriptions App

Dieses Interview wurde mit der vom Team von Mark Cieliebak entwickelten App Interscriber transkribiert. Der Bearbeitungsaufwand war dann – wie erwartet –grösser als wenn es von einem Menschen transkribiert wurde. Die Qualität war aber erstaunlich gut. Bedingung ist, dass die Audio-Aufnahme auf (Hoch)Deutsch oder Englisch zur Verfügung steht. Die App ist in der Beta-Phase und kann gratis getestet werden.

Weitere Informationen