Effiziente Beurteilung: Wertvoll für Dozierende und Studierende

Text: Tobias Zimmermann

Die Nervosität der Studierenden grenzte an Panik. Dem Professor war das nicht recht, denn mit seinem Hinweis, wie schwierig die Schlussprüfung zu seiner Vorlesung ausfallen werde, hatte er sie motivieren wollen – nicht verunsichern. So überlegte er sich, wie er sie wieder etwas beruhigen könnte und bot ihnen für die Prüfung eine Art Joker an. Dieser funktionierte ähnlich wie der Telefonjoker bei «Wer wird Millionär»: Bei der Multiple-Choice-Frage, bei der sie am unsichersten über die richtige Antwort waren, konnten die Studierenden den Namen einer Kommilitonin notieren. Wenn diese in ihrer Prüfung die richtige Antwort gab, kriegten die Joker-Verwender die Antwort ebenfalls als richtig bewertet.

Kleine Massnahme, grosse Wirkung

Bei der Auswertung der Prüfung stellte der Professor zu seiner Überraschung fest, dass der Durchschnitt der Prüfungsresultate gegenüber den Vorjahren markant angestiegen war. Und es lag nicht am Effekt des Jokers, der ja das Resultat um maximal eine richtige Antwort pro Studentin steigern konnte. Vielmehr ging die Leistungssteigerung weit darüber hinaus und zeigte sich auch in den Folgejahren.

Beim Professor handelte es sich um den bekannten Psychologen und Sachbuchautor Adam Grant, der nun natürlich wissen wollte, weshalb diese kleine Massnahme eine so grosse Wirkung hatte (die obige Episode schildert er in seinem lesenswerten Buch «Hidden Potential» ). Dabei fand er heraus: Um den Joker optimal zu nutzen, mussten die Studierenden wissen, wo die Stärken ihrer Kolleginnen und Kollegen liegen. Um das herauszufinden, begannen sie, vermehrt gemeinsam zu studieren, statt allein zu pauken. Nur so konnten sie sich das kollektive Wissen der Gruppe zunutze machen. Dadurch kamen zwei Effekte zum Tragen, welche das Lernen der Studierenden intensivierten und vertieften:

  • Intensivierung: Die Studierenden verbrachten mehr Zeit mit den zu lernenden Inhalten, weil sie neben dem «normalen» Lernen auch noch herausfinden mussten, wer sich womit besonders gut auskennt. Dies erhöhte die Time on Task, die ein zentraler Einflussfaktor für den Lernerfolg ist.
  • Vertiefung: Mindestens ein Teil der Leistungssteigerung dürfte auch dadurch entstanden sein, dass die Studierenden einander beim gemeinsamen Lernen wesentliche Aspekte gegenseitig erklärt haben. So kam der Teaching-Effekt zum Tragen: Jemandem etwas zu erklären, ist zugleich eine der wirksamsten Lernhandlungen. Als Lehrende kennen wir das aus eigener Erfahrung: Man lernt selten mehr über ein Thema, als wenn man dazu unterrichten muss.

Das Erlebnis von Adam Grant zeigt, wie Massnahmen im Umgang mit Leistungsbeurteilung, die Lehrenden nur wenig Aufwand bereiten, grosse Effekte erzielen können. Sie ist für mich symbolisch dafür, dass wir im Umgang mit Beurteilungssituationen durch umsichtiges Vorgehen ohne nennenswerten Mehraufwand mehr Lernen bewirken können – in Grants Fall durch Anreize für zusätzliches Peer Learning.

Teaching-Effekt: Sich gegenseitig Dinge zu erklären, ist besonders lernwirksam.

In diesem Zusammenhang möchte ich nachfolgend zwei Massnahmen exemplarisch herausgreifen: Das Formulieren von Feedback auf möglichst motivierende Weise und das Verwenden von mehrphasigen Leistungsnachweisen. Die beiden Massnahmen hängen insofern zusammen, als sie beide dazu beitragen, dass erteiltes Feedback tatsächlich für weiteres Lernen genutzt wird.

Motivierendes Feedback: Die Wirkung von Rückmeldungen optimieren

Oft investieren Lehrende viel in das Geben von (häufig schriftlichem) Feedback, während es ungewiss bleibt, ob die Studierenden dieses tatsächlich für ihr weiteres Lernen berücksichtigen. Das ist für die Lehrenden nicht effizient. Eine aufwandsneutrale Massnahme, um die Wirkung von Feedback zu erhöhen, besteht in der motivationsförderlichen Gestaltung. Das gilt übrigens auch für Peer Feedback oder Rückmeldungen im Arbeitskontext. Dafür sind drei Elemente zentral:

  1. Hohe Erwartungen haben und sie auch kommunizieren: Die Erwartungen der Lehrenden haben einen erheblichen Einfluss auf die Leistung der Studierenden. Der sogenannte Pygmalion-Effekt (berühmteste Studie: Rosenthal und Jacobson 1968) besagt, dass Studierende desto bessere Leistungen erbringen, je mehr Lehrende ihnen zutrauen. Um den Lernfortschritt zu maximieren, ist es daher entscheidend, dass Feedback hohe Erwartungen kommuniziert – inhaltlich fokussiert auf jeweils zwei bis drei zentrale Aspekte.  Wichtig ist, dass diese Erwartungen mit der Zuversicht verbunden sind, dass die Studierenden sie erfüllen können.
  2. Entwicklungsorientierung: Feedback sollte so gestaltet sein, dass es den Studierenden hilft, ihre eigenen Lernprozesse als etwas zu verstehen, das sie steuern können. Dabei geht es um die Förderung einer Wachstumsorientierung («Growth Mindset»), wie sie von Carol Dweck beschrieben wird. Lob für Anstrengung motiviert Studierende, sich kontinuierlich zu verbessern. (Lob für Talent, Begabung oder Intelligenz hingegen führt dazu, dass Studierende einfachere Aufgaben aussuchen, um ihre Begabung zu beweisen, und sich dadurch weniger weiterentwickeln.)
  3. Beziehungsebene stärken: Feedback ist am wirksamsten, wenn es in einem positiven, wertschätzenden Ton gegeben wird. Dies stärkt die Beziehungsebene zwischen Lehrenden und Studierenden und motiviert letztere, das Feedback konstruktiv zu nutzen. Humor und Freundlichkeit können hier ebenfalls eine Rolle spielen, um eine offene und unterstützende Lernatmosphäre zu schaffen.
Im Buch «Leistungsbeurteilungen an Hochschulen lernförderlich gestalten» finden sich zahlreiche Hinweise für die effiziente und lernwirksame Gestaltung von Leistungsnachweisen.

Eine wirkungsvolle Möglichkeit, diese drei Aspekte zu kombinieren, sind so genannte Rückmeldungsvideos. Mehr über das Gestalten und die Wirkung von Rückmeldungsvideos erfahren Sie im Buch «Leistungsbeurteilungen an Hochschulen lernförderlich gestalten»  (Kap. 8.5.3).

Screenshot eines Rückmeldungsvideos (Bild von Tobias Zimmermann)

Mehrphasige Leistungsnachweise: Mehr als Benotung

Ein weiterer effektiver Ansatz zur Verbesserung des Lernprozesses und zur Steigerung der Effizienz von Leistungsrückmeldungen ist der Einsatz von mehrphasigen Leistungsnachweisen. Hier kommen die oben beschriebenen Vorteile von motivationsförderlichen Rückmeldungen ebenfalls gut zur Geltung.

Mehrphasige Leistungsnachweise kombinieren formative und summative Beurteilungen (siehe Grafik). So folgt zuerst mindestens eine Phase, nach der ausschliesslich eine formative Leistungsrückmeldung erfolgt, also ein Feedback, das nur verbal Stärken und Schwächen der bisherigen Lernhandlungen oder des bisher erarbeiteten Lernprodukts rückmeldet. Wichtig ist, dass es auch Hinweise für das weitere Lernen gibt: Welche nächsten Schritte wären besonders wertvoll? Was sollte ggf. nochmals überarbeitet werden? Nach dieser formativen Rückmeldung arbeiten die Studierenden weiter und erhalten  entweder nochmals eine formative Rückmeldung oder eine abschliessende Bewertung (Prädikat oder Note).

Grafik: Mehrphasige Leistungsnachweise (Abbildung von Tobias Zimmermann)

Dieses Vorgehen hat zwei wesentliche Stärken:

  • Erhöhung der Lernwirksamkeit: Durch das kontinuierliche Feedback in den verschiedenen Phasen des Leistungsnachweises können Studierende ihre Lernprozesse besser steuern und reflektieren. Formative Beurteilungen geben ihnen die Möglichkeit, Feedback zu verarbeiten und anzuwenden, bevor eine abschliessende summative Bewertung erfolgt.
  • Fördern hochwertiger Endprodukte: Die Struktur mehrphasiger Leistungsnachweise ermutigt Studierende, qualitativ hochwertige Arbeiten abzuliefern. Da sie wissen, dass eine abschliessende summative Beurteilung erfolgt, nehmen sie das formative Feedback ernster und nutzen es gezielt zur Verbesserung ihrer Leistungen.

Zu beachten ist das Risiko von Rollenkonflikten: Bei mehrphasigen Leistungsnachweisen ist es wichtig, zwischen der fördernden Rolle und der bewertenden Rolle zu unterscheiden. Lehrende sollten bei der abschliessenden Bewertung darauf achten, nicht nur zu bewerten, ob Studierende ihre vorangehenden formativen Rückmeldungen «brav» befolgt haben. Denn Studierende können auch unabhängig von erhaltenem Feedback lernen, und manchmal finden sie sogar bessere Wege, als sie ihnen in den Rückmeldungen vorgeschlagen wurden.

Wirksameres Lernen durch effiziente Beurteilung

Als Lehrende können wir mit einfachen Massnahmen sowohl die Effizienz von Beurteilungen steigern als auch die Lernmotivation und den Lernerfolg der Studierenden. Letzteres nützt nicht nur den Studierenden, sondern reduziert indirekt auch das Auftreten von Komplikationen wie hohen Durchfallquoten, Dropouts oder Protesten gegen unfaire Beurteilungen.

Die motivationsförderliche Gestaltung von Feedback und mehrphasige Leistungsnachweise sind nur zwei von vielen einfachen Massnahmen, mit denen wir Beurteilungsanlässe wirksamer gestalten können – für Lehrende und Lernende. Eine weitere Möglichkeit besteht z.B. in einer intensiven Kommunikation zwischen Lehrenden und Studierenden über die Kriterien der Leistungsbeurteilung (siehe Blogbeitrag «Woran mache ich meine Beurteilung fest?»).

INFOBOX

Zahlreiche weitere Anregungen finden sich im folgenden Buch, das sowohl als gedrucktes Buch käuflich als auch kostenlos im Open Access heruntergeladen werden kann:

Zimmermann, Tobias (2024). Leistungsbeurteilungen an Hochschulen lernförderlich gestalten. Prüfen, Beurteilen und Rückmelden von Lernleistungen. Opladen, Berlin, Toronto: Verlag Barbara Budrich. ISBN 978-3-8474-3045-2

Angebote der PH Zürich

- Buchvernissage «Leistungsbeurteilungen an Hochschulen lernförderlich gestalten». Dienstag, 22. Oktober 2024, 16–17 Uhr, Schloss Au (im Anschluss an die Veranstaltung «Barcamp Assessment»)

- Barcamp Assessment, KI-basierte Ansätze für Beurteilung und Feedback (Kurztagung). Dienstag, 22. Oktober 2024, 8.30–15.30 Uhr, Schloss Au.

Zum Autor

Tobias Zimmermann ist Leiter des Zentrums für Hochschuldidaktik und -entwicklung (ZHE) an der PH Zürich.

Woran mache ich meine Beurteilung fest? Transparenz in der Leistungsbeurteilung an Hochschulen

Text: Tobias Zimmermann

Wenn Sie den Begriff «Beurteilungskriterien» hören, denken Sie vermutlich zuerst an Prüfungen oder wissenschaftliche Arbeiten. Sie spielen aber auch sonst in der Hochschullehre eine wesentliche Rolle: Auch bei Übungsaufgaben geht es stets um die Frage, wie angemessen und/oder wie korrekt sie im Hinblick auf fachliche Ansprüche bearbeitet werden. Beurteilungskriterien werden in solch niederschwelligen Kontexten zwar nicht immer explizit thematisiert. Sie bilden aber implizit auch dort die Folie, auf deren Hintergrund die Bearbeitung der Aufgabe beurteilt wird.

Beurteilungskriterien als Chance zur Verständigung

Der Umgang mit Beurteilungskriterien wird von Dozierenden oft als notwendiges Übel empfunden. So können verschiedene Schwierigkeiten entstehen: Dozierende kommunizieren keine Beurteilungskriterien für eine anstehende Aufgabe oder Leistungsbeurteilung, oder sie investieren wenig Zeit dafür. Beides kann dazu führen, dass die offiziellen Beurteilungskriterien (sofern kommuniziert) oder die in der Modulbeschreibung aufgeführten Lernziele nur teilweise mit den tatsächlich angelegten (impliziten) Beurteilungskriterien übereinstimmen. Die resultierende Unberechenbarkeit von Dozierendenfeedback und/oder Leistungsbeurteilungen ist für Studierende unbefriedigend. Und für Dozierende mag es so aussehen, als würden die Studierenden zu wenig Lernaufwand betreiben.

Dabei bieten Beurteilungskriterien ein beträchtliches Potenzial für die fachliche Verständigung zwischen Dozierenden und Studierenden. Werden sie gemeinsam besprochen oder gar ausgearbeitet, reduzieren sich oben genannten Risiken. Bevor ich auf diese Chancen näher eingehe, möchte ich noch zwei wichtige Hinweise zur Gestaltung von Beurteilungskriterien geben. Sie helfen, das genannte Potenzial zu nutzen:

  • Wichtig ist, dass die Lernziele transparent gemacht werden, die den Beurteilungskriterien zugrunde liegen. Die Lernziele definieren, was die Studierenden am Ende können sollen, die Beurteilungskriterien sind bloss ein Mittel zum Erreichen dieses Ziels. Am besten sind die Lernziele auf dem Dokument mit den Beurteilungskriterien explizit aufgeführt. Im Minimum sollte das Dokument einen Verweis enthalten, wo die Lernziele zu finden sind (z.B. in der Modulbeschreibung).
  • Besonders empfehlenswert für das Formulieren von Beurteilungskriterien sind so genannte Beurteilungsraster, auf Englisch rubrics genannt. Unter dem Link finden Sie eine nähere Erläuterung dieses Instruments, das ich auch in meinem bald erscheinenden Buch zum Thema Leistungsbeurteilung (siehe Infobox am Ende) vorstellen werde.
Beurteilungsraster für einen argumentativen Text (ausgewählte Dimensionen aus Andrade 2000, S. 17, sinngem. Übers. tz) – aus Zimmermann (im Druck)

Die folgenden Verfahrensschritte führen dazu, dass die Studierenden die Beurteilungskriterien nicht nur kognitiv besser verstehen. Sie setzen sich auch verstärkt mit ihrem Sinn und Zweck auseinander, was ihre Akzeptanz der Kriterien erhöht und die Internalisierung von fachlichen Ansprüchen fördert.

Option 1: Kriterien gemeinsam besprechen

Bereits festgelegte Beurteilungskriterien mit den Studierenden eingehend zu besprechen, hat gegenüber einem reinen Bekanntgeben der Kriterien diverse Vorteile. Die dafür in der Lehrveranstaltung investierte Präsenzzeit lohnt sich nicht nur mit Blick auf das verbesserte Lernen der Studierenden. Sie führt auch zu einer langfristigen Zeitersparnis für uns Lehrende, indem die grössere Klarheit bezüglich der Beurteilungskriterien zu weniger Rückfragen der Studierenden im weiteren Lernprozess führt. Deshalb sollte für diesen Schritt mindestens eine halbe Stunde investiert werden.

Zur gemeinsamen Besprechung werden die Beurteilungskriterien auf Papier ausgeteilt oder online zur Verfügung gestellt. Die Studierenden erhalten Zeit, um sie durchzulesen. Anschliessend können sie im Plenum Verständnisfragen stellen. Es lohnt sich, ein bis zwei anregende oder gar provokative Fragen bereit zu haben, falls die Studierenden sich anfänglich nicht zu melden getrauen.

Beispiel: Beurteilungskriterien in einer Vorlesung besprechen

Hanna Felder, Professorin für Mikrobiologie, hält jährlich eine anspruchsvolle Grundlagenvorlesung. Deren Leistungsnachweis besteht in einer Posterkonferenz, wobei Poster und Konferenzteilnahme bewertet werden. Sie hat dafür ein Beurteilungsraster mit wesentlichen Anspruchsdimensionen hinsichtlich der fachlichen Kompetenzen und der Posterkonferenz erstellt. Sie teilt es jeweils in der letzten halben Stunde der dritten Vorlesungswoche aus. Die rund hundert Studierenden, die zu diesem Zeitpunkt schon in die Thematik der Vorlesung eingearbeitet sind, besprechen das Beurteilungsraster in Gruppen. Am Ende hält jede Gruppe eine bis zwei offene Fragen zum Raster fest. Diese tragen sie in einer dafür bereitstehenden Online-Umfrage auf der begleitenden Lernplattform ein. Frau Prof. Felder schaut sich die Fragen an, gruppiert sie, und beantwortet sie zu Beginn der folgenden Vorlesungsstunde. Wo nötig, stellt sie den Studierenden Rückfragen, um sich über den Hintergrund der Fragen zu verständigen. Gegen Semesterende können die Studierenden online nochmals Fragen zum Beurteilungsraster stellen, auf welche die Professorin in der letzten Vorlesung vor der Posterkonferenz eingeht.

Besprechen in Gruppen aktiviert die Studierenden

Das Beispiel zeigt eine wirksame Möglichkeit beim Besprechen von Beurteilungskriterien: Sie besteht darin, dass die Studierenden das Kriterienraster zuerst in Gruppen von ca. 4 Studierenden diskutieren. Sie können dabei ihre Fragen notieren, welche die Gruppensprecherinnen im Plenum stellen können (oder wie im Beispiel online, was sich bei grossen Studierendenzahlen lohnt). Viele Fragen können dadurch schon in Peer-Diskussionen geklärt werden, und es beteiligen sich auch Studierende an der Diskussion, die im Plenum zurückhaltend sind.

Die Fragen der Studierenden können verschiedene Aspekte betreffen, und manchmal kommen Unklarheiten des Kriterienrasters zum Vorschein. Diese Verständigung stellt eine wertvolle Lerngelegenheit für beide Seiten dar:

  • Studierende können dadurch Lücken oder Missverständnisse bezüglich der zu lernenden fachlichen Begriffe, Konzepte und Verfahrensweisen aufarbeiten. Dozierende können Lücken im Vorwissen der Studierenden erkennen und sich überlegen, wie sie darauf reagieren möchten.
  • Dozierende lernen besser zu verstehen, wo für die Studierenden entscheidende Hürden liegen. Dadurch können sie diese in ihrem künftigen Lehrhandeln lernwirksamer adressieren, etwa indem besonders schwierige Begriffe oder Konzepte vertiefter behandelt werden. Unter Umständen können auch Korrekturen in den Formulierungen der Beurteilungskriterien angezeigt sein, damit sich keine Schere zwischen expliziten und impliziten Ansprüchen öffnet.
Studierende besprechen die Beurteilungskriterien.

Option 2: Kriterien anhand von Beispielen anwenden

Als weitere Möglichkeit können wir den Studierenden Beispiele von früheren Bearbeitungen der vorliegenden Aufgabe zur Verfügung stellen und sie auffordern, die Beispiele anhand des Rasters zu beurteilen (Nicol 2010, S. 505f.; Sadler 1989). Diese Option kann gut kombiniert werden mit der oben genannten Diskussion der Beurteilungskriterien in Gruppen – die Gruppen versuchen dann, die Kriterien auf die Beispiele anzuwenden.

Bei den Beispielen früherer Aufgabenbearbeitungen kann es sich um (ggf. anonymisierte) Texte, Programmiercode, Tabellen, künstlerische Artefakte oder auch Aufzeichnungen von Vorträgen oder künstlerischen Aufführungen handeln (zu denen natürlich das Einverständnis der Aufgezeichneten eingeholt werden muss). Durch die Auseinandersetzung mit früheren Leistungen müssen die Studierenden einen Perspektivenwechsel von der Situation der beurteilten zu jener der beurteilenden Person vornehmen. Dies bedingt kognitive Umformungsprozesse, die das Verständnis der Kriterien begünstigen. Es empfiehlt sich für dieses Vorgehen in der Regel, ein gelungenes und ein nicht gelungenes Beispiel zur Verfügung zu stellen. Durch die Kontrastierung der Beispiele können die Studierenden besser herausarbeiten, woran sich das Erreichen von Lernzielen erkennen lässt bzw. welche Merkmale Anzeichen für deren Nichterfüllung sind. Auch bei diesem Vorgehen lohnt es sich, die Erfahrungen der Gruppen beim Anwenden der Kriterien auf die Beispiele sowie ihre offenen Fragen im Plenum zu besprechen.

Eine Alternative besteht darin, dass die Studierenden im Lauf des Semesters zu einer Aufgabe oder zu einem im Entstehen befindlichen Produkt ein Peer-Feedback geben. Im obigen Beispiel könnten sich z.B. Frau Felders Studierende basierend auf dem Beurteilungsraster gegenseitig Feedback zu ihren Postern geben.

Fazit: Lernwirksamkeit von Beurteilungskriterien nutzen, indem sie gemeinsam besprochen und angewendet werden

Indem wir Studierende direkter in den Prozess des Verstehens (Option 1) und Anwendens (Option 2) von Beurteilungskriterien einbeziehen, erhöhen wir ihre wahrgenommene Selbstbestimmung. Sie erleben sich dadurch sozial stärker in das Lehr- und Lernhandeln eingebunden, nehmen ihr Handeln als wirksamer wahr und erfahren mehr Autonomie in ihrem Lernprozess. Dies erhöht gemäss der Selbstbestimmungstheorie die intrinsische Motivation der Studierenden. Dadurch lernen sie stärker tiefenorientiert und somit nachhaltiger. Dieser Effekt kann noch erhöht werden, in dem die Studierenden nicht nur von den Dozierenden bereits festgelegte Kriterien interpretieren und anwenden, sondern die Kriterien ganz oder teilweise selbst entwickeln. Mögliche Vorgehensweisen dazu werden im hilfreichen Buch von Stevens und Levi (2013, S. 87-102) erläutert sowie im bald erscheinenden Buch (siehe Infobox).

INFOBOX

Der Umgang mit Beurteilungskriterien wird näher erläutert in:

Zimmermann, Tobias: Leistungsbeurteilungen an Hochschulen lernförderlich gestalten. Prüfen, Beurteilen und Rückmelden von Lernleistungen. Opladen, Berlin, Toronto: Verlag Barbara Budrich. ISBN 978-3-8474-3045-2. (vorgesehenes Erscheinungsdatum: April 2024, Open Access online)

Das Buch gibt anwendungsorientierte Hinweise zur Gestaltung, Beurteilung und Rückmeldung von Prüfungen und vielen weiteren Formaten von Leistungsnachweisen. Zudem thematisiert es lernpsychologische Grundlagen für eine wirkungsvolle und valide Beurteilungspraxis.

Aktuelle Veranstaltungen zum Thema Beurteilung an Hochschulen:

Assessment und Evaluation
13.–14. Juni 2024, PH Zürich

Beyond Exams: Designing Authentic Assessment and Feedback Practices
6.2.–16.5.2024, online/PH Zürich/Pristina

Zum Autor

Tobias Zimmermann ist Leiter des Zentrums für Hochschuldidaktik und -entwicklung der PH Zürich und leitet einen CAS-Studiengang in Hochschuldidaktik. Seine Spezialisierungen liegen im Beurteilen und Rückmelden von Lernleistungen, der Weiterbildungsdidaktik sowie der Mediendidaktik.

Folgen über E-Mail
LINKEDIN
Share