Analytics nutzen: Unterschied zwischen den Versionen

Aus MoodleDocs
Wechseln zu:Navigation, Suche
KKeine Bearbeitungszusammenfassung
 
(29 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
{{Analytics}}{{Übersetzen}}
{{Analytics}}
 
== Überblick ==
== Überblick ==
Die Moodle Learning Analytics API ist ein offenes System, das die Basis für eine Vielzahl von Modellen werden kann. Modelle können Indikatoren (Vorhersager), Ziele (Ausgang, den wir vorhersagen wollen), Einschätzungen (die Vorhersagen selbst), Benachrichtigungen (Mitteilungen, die aufgrund von Einschätzungen verschickt werden) und Aktionen (die den Empfänger/innen der Benachrichtigungen vorgeschlagen werden und die selbst wieder zu Indikatoren werden können) enthalten.
Die Moodle Learning Analytics API ist ein offenes System, das die Basis für eine Vielzahl von Modellen werden kann. Modelle können Indikatoren (Vorhersager), Ziele (Ausgang, den wir vorhersagen wollen), Einschätzungen (die Vorhersagen selbst), Benachrichtigungen (Mitteilungen, die aufgrund von Einschätzungen verschickt werden) und Aktionen (die den Empfänger/innen der Benachrichtigungen vorgeschlagen werden und die selbst wieder zu Indikatoren werden können) enthalten.
Zeile 17: Zeile 16:
Moodle kann mehrere Vorhersagemodelle gleichzeitig unterstützen, sogar innerhalb ein und desselben Kurses. Das kann für A/B-Tests verwendet werden, um die Leistungsfähigkeit und Genauigkeit verschiedener Modelle zu vergleichen.
Moodle kann mehrere Vorhersagemodelle gleichzeitig unterstützen, sogar innerhalb ein und desselben Kurses. Das kann für A/B-Tests verwendet werden, um die Leistungsfähigkeit und Genauigkeit verschiedener Modelle zu vergleichen.


{{Neu}}Moodle Learning Analytics unterstützt zwei Arten von Modellen.
Moodle Learning Analytics unterstützt zwei Arten von Modellen.
*'''Machine-Learning-basierte''' Modelle, inklusive Vorhersagemodelle, nutzen Modelle der künstlichen Intelligenz, die mit Daten aus der Moodle-Site-Historie trainiert werden, um verborgene Aspekte des Lernprozesses zu entdecken oder vorherzusagen.  
*'''Machine-Learning-basierte''' Modelle, inklusive Vorhersagemodelle, nutzen Modelle der künstlichen Intelligenz, die mit Daten aus der Moodle-Site-Historie trainiert werden, um verborgene Aspekte des Lernprozesses zu entdecken oder vorherzusagen.  
*'''Statische''' Modelle nutzen ein einfacheres, regel-basiertes System, um besondere Situation in der Moodle-Site zu entdeckenund ausgewählte Nutzer/innen darüber zu benachrichtigen.
*'''Statische''' Modelle nutzen ein einfacheres, regel-basiertes System, um besondere Situation in der Moodle-Site zu entdecken und ausgewählte Nutzer/innen darüber zu benachrichtigen.


Das Standardpaket von Moodle stellt drei Modelle bereit: ''[[Teilnehmer/innen sind gefährdet auszusteigen]]'' und die statischen Modelle ''Fälligkeit von Aktivitäten'' und ''Keine Lehrtätigkeit''. Sie können weitere Vorhersagemodelle anlegen, indem Sie die  [[dev:Analytics API| Analytics API]] oder die neue grafische Oberfläche verwenden. Jedes Modell basiert auf der Vorhersage eines einzelnen, spezifischen Ziels oder Ausgangs (der entweder erwünscht oder unerwünscht ist) und zu dem eine Reihe von ausgewählten Indikatoren gehören.
Das Standardpaket von Moodle stellt drei Modelle bereit: ''[[Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen]]'' und die statischen Modelle ''Fälligkeit für anstehende Aktivitäten'' und ''Kurse, bei denen die Gefahr besteht, dass sie nicht beginnen''. Sie können weitere Vorhersagemodelle anlegen, indem Sie die  [[dev:Analytics API| Analytics API]] oder die neue grafische Oberfläche verwenden. Jedes Modell basiert auf der Vorhersage eines einzelnen, spezifischen Ziels oder Ausgangs (der entweder erwünscht oder unerwünscht ist) und zu dem eine Reihe von ausgewählten Indikatoren gehören.


Sie können die Modelle auf der Seite ''Website-Administration > Analytics > Analytics-Modelle'' ansehen und verwalten.
Sie können die Modelle auf der Seite ''Website-Administration > Analytics > Analytics-Modelle'' ansehen und verwalten.
Zeile 28: Zeile 27:


== Vorhandene Modelle ==
== Vorhandene Modelle ==
Das Moodle-Standardpaket enthält drei Vorhersagemodelle: ''[[Teilnehmer/innen sind gefährdet auszusteigen]]'' sowie die statischen Modelle ''Fälligkeit von Aktivitäten'' und ''Keine Lehrtätigkeit''. Weitere Modelle können durch Installation eines Plugins oder über die grafische Oberfläche (siehe unten) hinzugefügt werden. Vorhande Modelle können auf der Seite ''Website-Administration > Analytics > Analytics-Modelle'' untersucht und geändert werden.
Das Moodle-Standardpaket enthält drei Vorhersagemodelle: ''[[Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen]]'' sowie die statischen Modelle ''Fälligkeit für anstehende Aktivitäten'' und ''Kurse, bei denen die Gefahr besteht, dass sie nicht beginnen''. Weitere Modelle können durch Installation eines Plugins oder über die grafische Oberfläche (siehe unten) hinzugefügt werden. Vorhandene Modelle können auf der Seite ''Website-Administration > Analytics > Analytics-Modelle'' untersucht und geändert werden.


[[File:analytics_models.png|400px]]
[[File:analytics_models.png|400px]]
Zeile 34: Zeile 33:
Für vorhandene Modelle können Sie u.a. folgende Aktionen durchführen:
Für vorhandene Modelle können Sie u.a. folgende Aktionen durchführen:
* '''Vorhersagen erstellen''': Trainieren Sie die Algorithmen des maschinellen Lernens mit neuen Daten der Moodle-Site und generieren Sie Vorhersagen für laufende Kurse. ''Vorhersagen sind nicht auf laufende Kurse beschränkt - das hängt vom Modell ab.''
* '''Vorhersagen erstellen''': Trainieren Sie die Algorithmen des maschinellen Lernens mit neuen Daten der Moodle-Site und generieren Sie Vorhersagen für laufende Kurse. ''Vorhersagen sind nicht auf laufende Kurse beschränkt - das hängt vom Modell ab.''
* '''Einschätzungen ansehen''': Sobald Sie die Algorithmen des maschinellen Lernens mit neuen Daten der Moodle-Site trainiert haben, sehen Sie Einschätzungen (Vorhersagen) für jedes analysierbare Element. Im Standardmodell ''[[Teilnehmer/innen sind gefährdet auszusteigen]]'' können die Einschätzungen pro Kurs ausgewählt werden. ''Vorhersagen sind nicht auf laufende Kurse beschränkt - das hängt vom Modell ab.''
* '''Einschätzungen ansehen''': Sobald Sie die Algorithmen des maschinellen Lernens mit neuen Daten der Moodle-Site trainiert haben, sehen Sie Einschätzungen (Vorhersagen) für jedes analysierbare Element. Im Standardmodell ''[[Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen]]'' können die Einschätzungen pro Kurs ausgewählt werden. ''Vorhersagen sind nicht auf laufende Kurse beschränkt - das hängt vom Modell ab.''
* '''Auswerten''': Das passiert normalerweise im Hintergrund als eine Reihe von geplanten Vorgängen. Sie können diesen Prozess jedoch manuell über ein Menü anstoßen. Werten Sie das Vorhersagemodell aus, indem Sie alle auf der Moodle-Site verfügbaren Trainingsdaten sammeln, die Indikatoren und Ziele berechnen und den daraus resultierenden Datensatz an die Backends des maschinellen Lernens übermitteln. Dieser Prozess teilt den Datensatz in Trainingsdaten und Testdaten auf und berechnet dessen Genauigkeit. Beachten Sie, dass der Auswertungsprozess alle Informationen, die auf der Moodle-Site verfügbar sind, verwendet, auch wenn sie sehr alt sind. Deshalb kann die Genauigkeit, die der Auswertungsprozess liefert, geringer als die tatsächliche Modellgenauigkeit sein, da die Indikatoren zuverlässiger berechnet werden, direkt nachdem Trainingsdaten verfügbar sind, da der Site-Zustand sich ständig ändert. Die Metrik, die zur Berechnung der Genauigkeit verwendet wird, ist der  ''[https://en.wikipedia.org/wiki/Matthews_correlation_coefficient Matthews Correlation Coefficient]'' (eine Metrik, die im maschinellen Lernen zur Berechnung binärer Klassifikationen verwendet wird)
* '''Auswerten''': Das passiert normalerweise im Hintergrund als eine Reihe von geplanten Vorgängen, siehe weiter unten.
 
* '''Log''' Schauen Sie sich vorherige Auswertungslogdaten an, inklusive der Modellgenauigkeit und anderer technischer Informationen, die von den Backends des maschinellen Lernens berechnet wurden, wie z.B. [https://de.wikipedia.org/wiki/ROC-Kurve ROC-Kurven], Lernkurven-Graphen oder der Matthews Correlation Coefficient des Modells. Die verfügbare Information hängt vom verwendeten Backend des maschinellen Lernens ab.
Sie können die Modellauswertung auch von Kommandozeile aus starten:
 
$ admin/tool/analytics/cli/evaluate_model.php
 
[[File:model-evaluation.jpeg|400px]]
 
* '''Log''' Schauen Sie sich vorherige Auswertunsglogdaten an, inklusive der Modellgenauigkeit und anderer technischer Informationen, die von den Backends des maschinellen Lernens berechnet wurden, wie z.B. [https://de.wikipedia.org/wiki/ROC-Kurve ROC-Kurven], Lernkurven-Graphen oder der Matthews Correlation Coefficient des Modells. Die verfügbare Information hängt vom verwendeten Backend des maschinellen Lernens ab.


[[File:log_info.png|400px]]
[[File:log_info.png|400px]]
Zeile 49: Zeile 41:
* '''Bearbeiten''': Sie können die Modelle bearbeiten, indem Sie die Liste der Indikatoren oder die Zeitaufteilungsmethode ändern. Wenn das Modell geändert wird, werden alle früheren Vorhersagen gelöscht. Modelle, die auf Annahmen basieren (statische Modelle), können nicht bearbeitet werden.
* '''Bearbeiten''': Sie können die Modelle bearbeiten, indem Sie die Liste der Indikatoren oder die Zeitaufteilungsmethode ändern. Wenn das Modell geändert wird, werden alle früheren Vorhersagen gelöscht. Modelle, die auf Annahmen basieren (statische Modelle), können nicht bearbeitet werden.
* '''Aktivieren / Deaktivieren''': Der geplante Vorgang, der die Algorithmen des maschinellen Lernens mit neuen auf der Moodle-Site verfügbaren Daten trainiert und Vorhersagen für laufende Kurse erstellt, übergeht deaktivierte Modelle. Frühere Vorhersagen, die von deaktivierten Modellen berechnet wurden, sind nicht verfügbar, solange das Modell nicht wieder aktiviert wird.
* '''Aktivieren / Deaktivieren''': Der geplante Vorgang, der die Algorithmen des maschinellen Lernens mit neuen auf der Moodle-Site verfügbaren Daten trainiert und Vorhersagen für laufende Kurse erstellt, übergeht deaktivierte Modelle. Frühere Vorhersagen, die von deaktivierten Modellen berechnet wurden, sind nicht verfügbar, solange das Modell nicht wieder aktiviert wird.
{{Neu}}* '''Exportieren''': Exportieren Sie die Trainingsdaten Ihrer Moodle-Site, um sie mit Partnereinrichtungen zu teilen oder in neuen Moodle-Sites zu verwenden. Beim Exportieren wird eine CSV-Datei generiert, die die Modelldaten zu Indikatoren und Gewichten enthält, ohne irgendwelche spezifischen Daten Ihrer Moodle-Site offenzulegen. Wir bitten Sie, uns solche CSV-Dateien zu schicken, um den Wert der Modelle für verschiedenen Arten von Moodle-Sites zu beurteilen. Siehe [https://moodle.org/project_inspire Learning Analytics Community] für mehr Informationen.
* '''Exportieren''': Exportieren Sie die Trainingsdaten Ihrer Moodle-Site, um sie mit Partnereinrichtungen zu teilen oder in neuen Moodle-Sites zu verwenden. Beim Exportieren wird eine CSV-Datei generiert, die die Modelldaten zu Indikatoren und Gewichten enthält, ohne irgendwelche spezifischen Daten Ihrer Moodle-Site offenzulegen. Wir bitten Sie, uns solche CSV-Dateien zu schicken, um den Wert der Modelle für verschiedenen Arten von Moodle-Sites zu beurteilen. Siehe [https://moodle.org/project_inspire Learning Analytics Community] für mehr Informationen.


* '''Ungültige Elemente''': Gibt an, welche Elemente auf Ihrer Moodle-Site nicht vom Modell analysiert werden können.
* '''Ungültige Elemente''': Gibt an, welche Elemente auf Ihrer Moodle-Site nicht vom Modell analysiert werden können.
Zeile 56: Zeile 48:
=== Standardmodelle ===
=== Standardmodelle ===


==== Teilnehmer/innen sind gefährdet auszusteigen ====
==== Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen ====


[[Teilnehmer/innen sind gefährdet auszusteigen|Dieses Modell]] sagt voraus, welche Teilnehmer/innen gefährdet sind, einen Moodle-Kurs nicht zu beenden, weil sie wenig Aktivität im Kurs zeigen. "Aussteigen" ist in diesem Zusammenhang so definiert, dass eine Person im letzten Viertel des Kurses keine Aktivität zeigt. Das Vorhersagemodell nutzt das Modell [https://en.wikipedia.org/wiki/Community_of_inquiry Community of Inquiry] von Engagement, das aus drei Teilen besteht:
[[Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen|Dieses Modell]] sagt voraus, welche Teilnehmer/innen gefährdet sind, einen Moodle-Kurs nicht zu beenden, weil sie wenig Aktivität im Kurs zeigen. "Aussteigen" ist in diesem Zusammenhang so definiert, dass eine Person im letzten Viertel des Kurses keine Aktivität zeigt. Das Vorhersagemodell nutzt das Modell [https://en.wikipedia.org/wiki/Community_of_inquiry Community of Inquiry] von Engagement, das aus drei Teilen besteht:


* [[Teilnehmer/innen_sind_gefährdet_auszusteigen#Kognitive Tiefe|Kognitive Präsenz]]
* [[Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen#Kognitive Tiefe|Kognitive Präsenz]]
* [[Teilnehmer/innen_sind_gefährdet_auszusteigen#Soziale Breite|Soziale Präsenz]]
* [[Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen#Soziale Breite|Soziale Präsenz]]
* [[Teilnehmer/innen_sind_gefährdet_auszusteigen#Potentielle Niveaustufen für ausgewählte Aktivitäten|Trainerpräsenz]]
* [[Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen#Potentielle Niveaustufen für ausgewählte Aktivitäten|Trainerpräsenz]]


Dieses Vorhersagemodell kann eine große Bandbreite von Kursen analysieren, daraus Schlussfolgerungen ziehen und diese Schlussfolgerungen anwenden, um Vorhersagen für neue Kurse zu erstellen. Das Modell ist nicht beschränkt auf das Erstellen von Vorhersagen zum Teilnehmererfolg in Kursen, die exakte Duplikate von frühren Kursen sind. Gleichwohl gibt es einige Einschränkungen:
Dieses Vorhersagemodell kann eine große Bandbreite von Kursen analysieren, daraus Schlussfolgerungen ziehen und diese Schlussfolgerungen anwenden, um Vorhersagen für neue Kurse zu erstellen. Das Modell ist nicht beschränkt auf das Erstellen von Vorhersagen zum Teilnehmererfolg in Kursen, die exakte Duplikate von früheren Kursen sind. Gleichwohl gibt es einige Einschränkungen:
# Das Modell erfordert eine gewisse Menge an Moodle-Daten, um damit Vorhersagen zu erstellen. Zum gegenwärtigen Zeitpunkt sind nur Aktivitäten des Moodle-Standardpakets in der Menge der [[Teilnehmer/innen sind gefährdet auszusteigen#Indikatoren|Indikatoren]] enthalten (siehe unten). Für Kurse, die keine Standard-Moodle-Aktivitäten "pro Zeitabschnitt" (abhängig von der Zeitaufteilungsmethode) enthalten,  gibt es nur schwache Vorhersagen. Das Vorhersagemodell ist am effektivsten für Kurse, die komplett als Online-Kurse oder Blended-Learning-Kurse mit hinreichend vielen Online-Aktivitäten arbeiten.
# Das Modell erfordert eine gewisse Menge an Moodle-Daten, um damit Vorhersagen zu erstellen. Zum gegenwärtigen Zeitpunkt sind nur Aktivitäten des Moodle-Standardpakets in der Menge der [[Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen#Indikatoren|Indikatoren]] enthalten (siehe unten). Für Kurse, die keine Standard-Moodle-Aktivitäten "pro Zeitabschnitt" (abhängig von der Zeitaufteilungsmethode) enthalten,  gibt es nur schwache Vorhersagen. Das Vorhersagemodell ist am effektivsten für Kurse, die komplett als Online-Kurse oder Blended-Learning-Kurse mit hinreichend vielen Online-Aktivitäten arbeiten.
# Das Modell nimmt an, dass Kurse feste Kursbeginn- und Kursende-Daten haben und es ist nicht gedacht für Kurse mit fortlaufenden Einschreibungen zu beliebigen Zeitpunkten. Modelle, die eine größere Bandbreite von Kursen unterstützen, werden in künftigen Moodle-versionen in das Standardpaket integriert. Wegen dieser Modellannahme ist es sehr wichtig, die Daten für Kursbeginn und Kursende für die zu analysierenden Kurse richtig einzustellen. Wenn diese daten nicht richtig konfiguriert sind, können die Vorhersagen nicht genau sein. Da das Kursende-Datum erst in Moodle 3.2 eingeführt wurde und einige Kurse in der Vergangenheit kein Kursbeginn-Datum haben können, stellen wir ein Skript zur Verfügung:
# Das Modell nimmt an, dass Kurse feste Kursbeginn- und Kursende-Daten haben und es ist nicht gedacht für Kurse mit fortlaufenden Einschreibungen zu beliebigen Zeitpunkten. Modelle, die eine größere Bandbreite von Kursen unterstützen, werden in künftigen Moodle-Versionen in das Standardpaket integriert. Wegen dieser Modellannahme ist es sehr wichtig, die Daten für Kursbeginn und Kursende für die zu analysierenden Kurse richtig einzustellen. Wenn diese Daten nicht richtig konfiguriert sind, können die Vorhersagen nicht genau sein. Da das Kursende-Datum erst in Moodle 3.2 eingeführt wurde und einige Kurse in der Vergangenheit kein Kursbeginn-Datum haben können, stellen wir ein Skript zur Verfügung:


  $ admin/tool/analytics/cli/guess_course_start_and_end.php  
  $ admin/tool/analytics/cli/guess_course_start_and_end.php  
Zeile 72: Zeile 64:
Dieses Skript versucht, die Kursbeginn- und Kursende-Daten vergangener Kurse abzuschätzen, indem es die Kurseinschreibungen und Teilnehmer-Logdaten der Kurse auswertet. Prüfen Sie nach der Ausführung des Skripts, ob die abgeschätzten Kursbeginn- und Kursende-Daten hinreichend korrekt sind.
Dieses Skript versucht, die Kursbeginn- und Kursende-Daten vergangener Kurse abzuschätzen, indem es die Kurseinschreibungen und Teilnehmer-Logdaten der Kurse auswertet. Prüfen Sie nach der Ausführung des Skripts, ob die abgeschätzten Kursbeginn- und Kursende-Daten hinreichend korrekt sind.


==== Fälligkeit von Aktivitäten ====
==== Fälligkeit für anstehende Aktivitäten ====
{{Neu}}
Das statische Modell ''Fälligkeit für anstehende Aktivitäten'' überprüft Aktivitäten mit anstehenden Fälligkeitsdaten und Ausgaben im persönlichen Kalender der Nutzer/innen.  
Das statische Modell ''Fälligkeit von Aktivitäten'' überprüft Aktivitäten mit anstehenden Fällligkeitsdaten und Ausgaben im persönlichen Kalender der Nutzer/innen.  


==== Keine Lehrtätigkeit ====
==== Kurse, bei denen die Gefahr besteht, dass sie nicht beginnen ====
Die Einschätzungen dieses Modells informieren Moodle-Site-Verwalter/innen, in welchen Kursen mit anstehendem Kursbeginn-Datum es keien Lehrtätigkeit gibt. Das ist ein einfaches statisches Modell, es verwendet keine Algorithmen des maschinellen Lernens, um Vorhersagen zu berechnen. Es trifft Vorhersagen auf der Basis von Annahmen, z.B. dass es keine Lehrtätigkeit gibt, wenn keine Teilnehmer/innen im Kurs eingeschrieben sind.
Die Einschätzungen dieses Modells informieren Moodle-Site-Verwalter/innen, in welchen Kursen mit anstehendem Kursbeginn-Datum es keine Lehrtätigkeit gibt. Das ist ein einfaches statisches Modell, es verwendet keine Algorithmen des maschinellen Lernens, um Vorhersagen zu berechnen. Es trifft Vorhersagen auf der Basis von Annahmen, z.B. dass es keine Lehrtätigkeit gibt, wenn keine Teilnehmer/innen im Kurs eingeschrieben sind.


== Modelle anlegen und bearbeiten ==
== Modelle anlegen und bearbeiten ==
{{Neu}}
Sie können neue Modelle anlegen, indem Sie die Analytics API verwenden, ein auf einer anderen Moodle-Site exportiertes Modell importieren oder die neue Oberfläche in Moodle verwenden.
New machine learning models can be created by using the Analytics API, by importing an exported model from another site, or by using the new web UI in 3.7. [[File:new_model.png|thumb]] If you delete a "default" model (shipped with Moodle core) you can restore it from the Create menu. (Note: "static" models cannot be created using the web UI at this time.)


There are four components of a model that can be defined through the web UI:
Wenn Sie ein Standardmodell (aus dem Standardpaket von Moodle) löschen, dann können Sie es über das Menü ''Neues Modell' wiederherstellen. (Hinweis: Statische Modelle können derzeit nicht über die Moodle-Oberfläche angelegt werden).
 
Es gibt vier Modell-Komponenten, die über die Moodle-Oberfläche definiert werden können:


=== Ziel ===
=== Ziel ===
[[File:create_model_2.png|400px]]
[[File:create_model_2.png|400px]]


Targets represent a “known good”-- something about which we have very strong evidence of value. Targets must be designed carefully to align with the [[Curriculum theory|curriculum priorities]] of the institution. Each model has a single target. The “Analyser” (context in which targets will be evaluated) is automatically controlled by the Target selection. Siehe [[Analytics-Ziele]] für mehr Informationen.
Ziele repräsentieren einen "bekannten Nutzen" - etwas, was einen bewiesenen Wert hat. Ziele müssen sorgfältig entworfen werden, damit sie mit den Prioritäten der [[Curriculum-Theorie|Curricula]] der Bildungseinrichtung in Einklang stehen. Jedes Modell hat ein einzelnes Ziel. Durch die Wahl des Ziels wird automatisch der Kontext festgelegt, in dem das Ziel analysiert wird. Siehe [[Analytics-Ziele]] für mehr Informationen.


=== Indikatoren ===
=== Indikatoren ===
Indicators are data points that may help to predict targets. We are free to add many indicators to a model to find out if they predict a target-- the only limit is that the data must be available within Moodle and must have a connection to the context of the model (e.g. the user, the course, etc.). The machine learning “training” process will determine how much weight to give to each indicator in the model.
Indikatoren sind Datenpunkte, die dabei helfen, Ziele vorherzusagen. Es  steht uns frei, viele Indikatoren zu einem Modell hinzuzufügen um herauszufinden, ob sie ein Ziel vorhersagen - die einzige Einschränkung ist, dass die Daten in  Moodle verfügbar sein und eine Verbindung zum Kontext des Modells (z.B. ein/e Nutzer/in, ein Kurs usw.) haben müssen. Der Trainingsprozess des maschinellen Lernens legt fest, wie viel Gewicht jeder einzelne Indikator im Modell bekommt.


We do want to make sure any indicators we include in a production model have a clear purpose and can be interpreted by participants, especially if they are used to make prescriptive or diagnostic decisions.
Wir wollen sicherstellen, dass alle Indikatoren, die in ein Modell einfließen, einen klaren Zweck haben und von den Beteiligten interpretiert werden können, insbesondere wenn sie verwendet werden, um vorgeschriebene oder diagnostische Entscheidungen zu treffen.


Indicators are constructed from data, but the data points need to be processed to make consistent, reusable indicators. In many cases, events are counted or combined in some way, though other ways of defining indicators are possible and will be discussed later. How the data points are processed involves important assumptions that affect the indicators. In particular, indicators can be absolute, meaning that the value of the indicator stays the same no matter what other samples are in the context, or relative, meaning that the indicator compares the sample to others in the context.
Indikatoren werden aus Daten konstruiert, aber die Datenpunkte müssen verarbeiten werden, um konsistente, wiederverwendbare Indikatoren zu erzeugen. In vielen Fällen werden Events gezählt oder auf eine bestimmte Art und Weise kombiniert. Es gibt jedoch auch andere Möglichkeiten, Indikatoren zu definieren; diese werden später diskutiert. Wie die Datenpunkte verarbeitet werden ist mit wichtigen Annahmen verbunden, die sich auf die Indikatoren auswirken. Insbesondere können Indikatoren absolut sein, d.h. der Wert des Indikators bleibt derselbe unabhängig davon, welche anderen Stichproben in einem Kontext vorliegen. Indikatoren können auch relativ sein, d.h. der Indikator vergleicht verschiedene Stichproben in einem Kontext.


Siehe [Analytics-Indikatoren]] für mehr Informationen.
Siehe [[Analytics-Indikatoren]] für mehr Informationen.


[[File:indicators.png|400px]]
[[File:indicators.png|400px]]


=== Zeitaufteilungsmethode ===
=== Zeitaufteilungsmethode ===
Die Analyseintervalle steuern, wie oft ein Modell ausgewertet wird, um Vorhersagen zu erstellen und wie viele Informationen in jedem Zyklus in die Auswertung einbezogen werden. Standardmäßig sind zwei Zeitintervalle aktiviert: ''Viertel'' und ''Viertel akkumuliert''.  Bei beiden Optionen wird das Modell vier Mal ausgewertet: nach dem ersten, zweiten, dritten und vierten Viertel des Kurses (die letzte Auswertung wird verwendet, um die Genauigkeit der Vorhersagen im Vergleich zum tatsächlichen Ausgang zu beurteilen). Der Unterschied zwischen beiden Optionen besteht darin, wie viele Informationen in die Auswertung einbezogen werden. Bei  ''Viertel'' werden die Vorhersagen nur auf Basis der Daten des gerade vergangenen Viertels berechnet. Bei ''Viertel akkumuliert'' verwendet die Daten aller vorangegangenen Viertel und liefert im Allgmeinen genauere Vorhersagen (allerdingskann die Berechnung mehr Zeit und Speicher benötigen). Das Moodle-Standardpaket bietet auch die Optionen ''Zehntel'' und ''Zehntel akkumuliert'', wenn die Moodle-Administration diese systemweit aktiviert hat. Diese Optionen generieren Vorhersagen in kürzeren Abständen.
[[File:zeitintervalle.png|thumb]]Die Analyseintervalle steuern, wie oft ein Modell ausgewertet wird, um Vorhersagen zu erstellen und wie viele Informationen in jedem Zyklus in die Auswertung einbezogen werden. Standardmäßig sind zwei Zeitintervalle aktiviert: "Viertel" und "Alle vorherigen Viertel" (früher "Viertel akkumuliert"). Das Moodle-Standardpaket bietet auch die Optionen "Zehntel" und "Zehntel akkumuliert", wenn die Moodle-Administration diese systemweit aktiviert hat. Diese Optionen generieren Vorhersagen in kürzeren Abständen.
*''Einzeln'' bedeutet, dass eine Vorhersage einmalig berechnet wird, aber es wird dabei eine bestimmte Zeitspanne berücksichtigt. Die Vorhersage wird am Ende der Zeitspanne berechnet, z.B. am Ende eines Kurses.
*'''Einzeln''' bedeutet, dass eine Vorhersage einmalig berechnet wird, aber es wird dabei eine bestimmte Zeitspanne berücksichtigt. Die Vorhersage wird am Ende der Zeitspanne berechnet, z.B. am Ende eines Kurses.
*''Nächste drei Tage / Woche / zwei Wochen'' bedeutet,  
*'''Nächste drei Tage / Woche / zwei Wochen''' bedeutet, dass das Modell Einschätzungen auf der Basis der Daten, die zu einem gegebenen Zeitpunkt vorliegen, generiert. Z.B. schaut das Modell "Kurse, bei denen die Gefahr besteht, dass sie nicht beginnen", ob es zum jetzigen Zeitpunkt eine Woche vor Kursbeginn Einschreibungen von Trainer/innen und Teilnehmer/innen in einem Kurs gibt und schickt dann eine Warnung an die Moodle-Administration, dass es in diesem leeren Kurs wahrscheinlich keine Lehrtätigkeit geben wird.
* '''Upcoming...''' indicates that the model generates an insight based on a snapshot of data at a given moment, e.g. the "no teaching" model looks to see if there are currently any teachers or students assigned to a course one week before the start of the term, and issues one insight warning the site administrator that no teaching is likely to occur in that empty course.
* '''Alle vorherigen ...''' (früher "akkumuliert") und '''Letztes ...''' unterscheiden sich darin, wie viele Informationen in die Vorhersage einbezogen werden. Bei beiden Optionen "Alle vorherigen Viertel" (früher "Viertel akkumuliert") und "Letztes Viertel" werden Vorhersagen am Ende eines Viertels einer Zeitspanne (z.B. einer Kurslaufzeit) generiert, wobei bei "Letztes Viertel" nur Informationen aus dem gerade vergangenen Viertel einbezogen werden, während bei "Alle vorherigen Viertel" alle Informationen aus allen vorangegangenen Viertel bis zum aktuellen Zeitpunkt verwendet werden.


* '''All previous...''' (formerly "accumulative") and '''Last...''' methods differ in how much data is included in the prediction. Both "All previous quarters" and "Last quarter" predictions are made at the end of each quarter of a time span (e.g. a course), but in "Last quarter," only the information from the most recent quarter is included in the prediction, whereas in "All previous quarters" all information up to the present is included in the prediction.
Die Methoden "Einzeln" und "Keine Zeitaufteilung" haben keine Zeitbeschränkungen. Die Vorhersagen werden beim nächsten geplanten Vorgang berechnet, gleichwohl wenden die Modell verschiedene Bedingungen an, um Vorhersagen zu erstellen (z.B. Bedingung, dass ein Kurs abgeschlossen ist, wenn er zum Trainieren des Modells verwendet werden soll oder die Bedingung, dass bestimmte Daten im Kurts vorliegen müssen und Teilnehmer/innen diese Daten verwenden). Die Zeiteinteilungsmethoden "Einzeln" und "Keine Zeitaufteilung" sind nicht geeignet, um Teilnehmer/innen zu identifizieren, die gefährdet sind auszusteigen. Sie sind gedacht für Modelle wie "Kurse, bei denen die Gefahr besteht, dass sie nicht beginnen" oder "Spammer", in denen nur eine Vorhersage pro Stichprobe berechnet wird. Z.B. kann das Modell "Kurse, bei denen die Gefahr besteht, dass sie nicht beginnen" die Zeitaufteilungsmethode "Einzeln" verwenden; die Zielklasse (das ist die Haupt-PHP-Klasse des Modells) akzeptiert nur Kurse, die in der kommenden Woche beginnen; die Vorhersage wird dann für alle diese Kurse einmalig berechnet, d.h. die Einschätzung "Kurse, bei denen die Gefahr besteht, dass sie nicht beginnen" für einen Kurs wird später nicht noch einmal für diesen Kurs berechnet.


Die Methoden ''Einzeln'' und ''Keine Zeitaufteilung'' haben keine Zeitbeschränkungen. Die Vorhersage-Engine wird beim nächsten geplanten Vorgang (dennoch kann das Modell Bedingungen haben, z.B. dass ein Kurs abgeschlossen sein muss, um ihn zum "trainieren" zu verwenden). Die Zeiteinteilungsmethoden ''Einzeln'' und ''Keine Zeitaufteilung'' sind nicht geeignet, um Teilnehmer/innen zu identifizieren, die gefährdet sind auszusteigen. Sie sollten stattdessen im Modell ''Keine Lehrtätigkeit'' verwendet werden oder um Nutzer/innen zu identifizieren, die Spam verursachen, d.h. in Modellen, in denen einmal eine Vorhersage gemacht wird und fertig. Z.B. kann das Modell ''Keine Lehrtätigkeit'' die Zeitaufteilungsmethode ''Einzeln'' verwenden; die Zielklasse (das ist die Haupt-PHP-Klasse des Modells) akzeptiert nur Kurse, die in der folgenden Woche beginnen; die Vorhersage wird dann für alle diese Kurse einmalig berechnet.
Der Unterschied zwischen den Methoden "Einzeln" und "Keine Zeitaufteilung" besteht darin, dass Modelle, die mit der Methode "Einzeln" analysiert wurden, auf die analysierbaren Elemente beschränkt sind (z.B. auf Kursbeginn- und Kursende-Daten im Fall des Modells "Teilnehmer/innen, die gefährdet sind auszusteigen"), während es bei der Zeitaufteilungsmethode "Keine Zeitaufteilung" keine zeitlichen Einschränkungen gibt und alle im System verfügbaren Daten zur Berechnung der Indikatoren verwendet werden.
 
Der Unterschied zwischen den Methoden ''Einzeln'' und ''Keine Zeitaufteilung'' besteht darin, dass Modelle, die mit der Methode ''Einzeln'' analysiert wurden, auf die analysierbaren Elemente beschränkt sind (z.B. auf die Daten Kursbeginn und Kursende im Fall des Modells ''Teilnehmer/innen, die gefährdet sind auszusteigen''). Bei der Zeitaufteilungsmethode ''Keine Zeitaufteilung'' gibt es keine zeitlichen Einschränkungen und alle im System verfügbaren Daten können zur Berechnung der Vorhersage verwendet werden.
'''Anmerkung''': Obwohl alle oben beschriebenen Beispiele sich auf Kurse bezogen, können Zeitaufteilungsmethoden auch auf andere analysierbare Elemente bezogen werden. Z.B. können Kurseinschreibungen ein Beginn- und ein Endedatum haben, so dass die Zeitaufteilungsmethode verwendet werden kann, um Vorhersagen in Bezug auf Aspekte der Kurseinschreibung zu machen. Für analysierbare Elemente ohne Beginn- und Endedatum sind andere Zeitaufteilungsmethoden erforderlich. Z.B. könnte eine "wöchentliche" Zeitaufteilungsmethode in einem Modell verwendet werden, das auf der Basis von Daten über seine Aktivitäten in der vergangenen Woche vorhersagt, ob eine Person sich in der Zukunftim System anmelden wird.
'''Anmerkung''': Obwohl alle oben beschriebenen Beispiele sich auf Kurse beziehen, können Zeitaufteilungsmethoden auch auf andere analysierbare Elemente bezogen werden. Z.B. können Kurseinschreibungen ein Beginn- und ein Endedatum haben, so dass die Zeitaufteilungsmethode verwendet werden kann, um Vorhersagen in Bezug auf Aspekte der Kurseinschreibung zu machen. Für analysierbare Elemente ohne Beginn- und Endedatum sind andere Zeitaufteilungsmethoden erforderlich. Z.B. könnte eine "wöchentliche" Zeitaufteilungsmethode in einem Modell verwendet werden, das auf der Basis von Daten über seine Aktivitäten in der vergangenen Woche vorhersagt, ob eine Person sich in der Zukunft im System anmelden wird.
 
[[File:analysis_intervals.png|thumb]]Analysis intervals control how often the model will run to generate insights, and how much information will be included in each generation cycle. The two analysis intervals enabled by default for selection are “Quarters” and “Quarters accumulative.” Both options will cause models to execute four times-- after the first, second, third and fourth quarters of the course (the final execution is used to evaluate the accuracy of the predictions against the actual outcome). The difference lies in how much information will be included. “Quarters” will only include information from the most recent quarter of the course in its predictions. “Quarters accumulative” will include the most recent quarter and all previous quarters, and tends to generate more accurate predictions (though it can take more time and memory to execute). Moodle Learning Analytics also includes “Tenths” and “Tenths accumulative” options in Core, if you choose to enable them from the Analytics Settings panel. These generate predictions more frequently.


=== Vorhersage-Prozessor ===
=== Vorhersage-Prozessor ===
Zeile 135: Zeile 123:
[[File:edit_model_name.png|400px]]
[[File:edit_model_name.png|400px]]


== Training models ==
== Modelle trainieren ==
Machine-learning based models require a training process using previous data from the site. "Static" models make use of sets of pre-defined rules, and do not need to be trained.
Modelle, die auf maschinellem Lernen basieren, müssen mit älteren Daten der Moodle-Site trainiert werden. Statische Modelle verwenden vordefinierte Regeln und müssen nicht trainiert werden.


There are two main categories of machine-learning based analytics models: '''supervised''' and '''unsupervised'''.  
Es gibt zwei Hauptkategorien von Analytics-Modellen, die auf maschinellem Lernen basieren: '''überwachte''' und '''nicht überwachte'''.
* Überwachte Modelle müssen mit Daten trainiert werden, wobei die Zielwerte bereits identifiziert sind. Wenn das Modell z.B. den Kursabschluss vorhersagen soll, muss das Modell mit Kursen und Einschreibungen trainiert werden, bei denen der Kursabschluss-Status bekannt ist.
* Nicht überwachte Modelle suchen nach Mustern in vorhandenen Daten, z.B. klassifizieren sie Teilnehmer/innen nach Ähnlichkeiten in ihrem Verhalten im Kurs.


* Supervised models must be trained by using a data set with the target values already identified. For example, if the model will predict course completion, the model must be trained on a set of courses and enrollments with known completion status.
Zum jetzigen Zeitpunkt unterstützt Moodle Learning Analytics nur überwachte Modelle.
* Unsupervised models look for patterns in existing data, e.g. grouping students based on similarities in their behavior in courses.  


At the present time, Moodle Learning Analytics only supports supervised models.
Wir hoffen, dass wir in Zukunft bereits trainierte Modelle im Standardpaket von Moodle bereitstellen können, derzeit haben wir jedoch noch nicht genügend Daten, um Modelle für eine externe Nutzung zu trainieren. (Wenn Sie unsere Bemühungen unterstützen und Daten bereitstellen möchten, wenden Sie sich bitte an die [https://moodle.org/course/view.php?id=17233&section=6 Moodle Learning Analytics Working Group].)


While we hope to include pre-trained models with the Moodle core installation in the future, at the current time we do not have large enough data sets to train a model for external use. (If you would like to help contribute data for this effort, please see the [https://moodle.org/course/view.php?id=17233&section=6 Moodle Learning Analytics Working Group].)
=== Trainingsdaten ===
Der Modell-Code enthält Kriterien für Trainingsdatensätze und für Vorhersagedatensätze. Z.B. können nur vergangene Kurse mit eingeschriebenen Teilnehmer/innen und einem Kursende-Datum verwendet werden, um das Modell [[Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen]] zu trainieren, weil es nicht möglich ist einzuschätzen, ob jemand aussteigt, bevor der Kurs zu Ende ist. Andererseits muss es einen Kurs mit eingeschriebenen Teilnehmer/innen geben, der begonnen hat, aber noch nicht beendet ist, um für dieses Modell eine Vorhersage zu generieren.


=== Training data ===
Der Trainingsdatensatz wird im PHP-Code für das Ziel definiert. Modelle können nur trainiert werden, wenn eine Moodle-Site genügend Daten enthält, die die Trainingskriterien erfüllen. Die meisten Modelle benötigen Moodle-Logdaten aus dem Zeitraum, in dem die Events liegen, die analysiert werden sollen. Z.B. kann das Modell  [[Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen]] nur trainiert werden, wenn Logdaten zu Teilnehmeraktivitäten in Kursen, die die Trainingskriterien erfüllen, vorliegen. Es ist möglich, die Modelle in einem "archivierten" System zu trainieren und die Modelle anschließend im Produktivsystem zu verwenden.
The model code includes criteria for "training" and "prediction" data sets. For example, only courses with enrolled students and an end date in the past can be used to train the [[Students at risk of dropping out]] model, because it is impossible to determine whether a student dropped out until a course has ended. On the other hand, for this model to make predictions, there must be a course with students enrolled that has started, but not yet ended.


The training set is defined in the php code for the Target. Models can only be trained if a site contains enough data matching the training criteria. Most models will require Moodle log data for the time period covering the events being analysed. For example, the [[Students at risk of dropping out]] model can only be trained if there is log data covering student activity in the courses that meet the training criteria. It is possible to train a model on an "archive" system and then use the model on a production system.
=== Modellauswertung anstoßen ===
Das passiert normalerweise im Hintergrund durch eine Reihe von geplanten Vorgängen, aber Sie können diesen Prozess auch über das Modell-Menü anstoßen.  


=== Triggering model evaluation ===
[[File:model_menu_evaluate.png|400px]]


[[File:model_menu_evaluate.png|thumb]]This is normally done in the background as a series of scheduled tasks, but you can trigger the start of the process from the model menu. This causes Moodle to assemble the training data available on the site, calculate all the indicators and the target and pass the resulting dataset to machine learning backends. This process will split the dataset into training data and testing data and calculate its accuracy. Note that the evaluation process uses all information available on the site, even if it is very old. Because of this, the accuracy returned by the evaluation process may be lower than the real model accuracy as indicators are more reliably calculated immediately after training data is available because the site state changes over time. The metric used to describe accuracy is the ''[https://en.wikipedia.org/wiki/Matthews_correlation_coefficient Matthews correlation coefficient]'' (a metric used in machine learning for evaluating binary classifications)
Das Modell sammelt dann alle Trainingsdaten, die auf der Moodle-Site verfügbar sind, berechnet alle Indikatoren und das Ziel und sendet die sich daraus ergebenden Datensätze an die Backends des maschinellen Lernens. Dieser Prozess teilt die Datensätze in Trainingsdaten und Testdaten auf und berechnet die Genauigkeit des Modells. Beachten Sie, dass der Auswertungsprozess alle Daten verwendet, die in der Moodle-Site verfügbar sind, auch wenn sie sehr alt sind. Deshalb kann die berechnete Genauigkeit des Modells kleiner sein als die tatsächliche Genauigkeit, da die Indikatoren zuverlässiger berechnet werden, direkt nachdem Trainingsdaten verfügbar sind, da der Site-Zustand sich ständig ändert. Die Metrik, die zur Berechnung der Genauigkeit verwendet wird, ist der  ''[https://en.wikipedia.org/wiki/Matthews_correlation_coefficient Matthews Correlation Coefficient]'' (eine Metrik, die im maschinellen Lernen zur Berechnung binärer Klassifikationen verwendet wird).


You can also force the model evaluation process to run from the command line:
[[File:model-evaluation.jpeg|400px]]
 
Sie können die Modellauswertung auch von Kommandozeile aus starten:


  $ admin/tool/analytics/cli/evaluate_model.php
  $ admin/tool/analytics/cli/evaluate_model.php


=== Review evaluation results ===
=== Auswertungsergebnisse überprüfen ===
[[File:model_menu_log.png|thumb]]
[[File:model_menu_log.png|thumb]]
Sie können die Ergebnisse des Modell-Trainingsprozesses ansehen, indem Sie über das Modell-Menü auf die Auswertungslogdaten zugreifen.
[[File:model_log.png|400px]]
[[File:log_info.png|400px]]
Prüfen Sie, ob Warnungen zum Abschluss des Auswertungsprozesses, zur Modellgenauigkeit und zur Modellvariabilität vorliegen.
Sie können auch die Liste der ungültigen Elemente kontrollieren, um zu prüfen, welche Site-Elemente in die Analyse einbezogen wurden und welche nicht. Wenn Sie eine große Anzahl an unerwarteten Elementen in diesem Bericht sehen, dann kann das bedeuten, dass Sie Ihre Daten prüfen müssen. Z.B. wenn Kurse keine passenden Kursbeginn- und Kursende-Daten haben oder die Kurseinschreibungsdaten gelöscht wurden, kann das System keine Daten aus diesen Kursen in den Modell-Trainingsprozess einbeziehen.
[[File:invalid_site_elements.png|400px]]
==Modelle exportieren und importieren==
Modelle können aus einer Moodle-Site exportiert und in eine andere Moodle-Site importiert werden.


You can review the results of the model training process by accessing the evaluation log.[[File:model_log.png|thumb]]
=== Modelle exportieren ===
[[File:log_info.png|thumb]]
Sie können Daten exportieren, um Modelle zu trainieren oder Sie können die Modellkonfiguration und die Gewichte des trainierten Modell exportieren.
Check for warnings about evaluation completion, model accuracy, and model variability.


[[File:invalid_site_elements.png|thumb]]
[[File:export_dialogue.png|400px]]
You can also check the ''invalid site elements'' list to verify which site elements were included or excluded in the analysis. If you see a large number of unexpected elements in this report, it may mean that you need to check your data. For example, if courses don't have appropriate start and end dates set, or enrolment data has been purged, the system may not be able to include data from those courses in the model training process.


== Exporting and Importing models ==
'''Hinweis''': Die Modellgewichte sind komplett anonym, sie enthalten keine personenbezogenen Daten! D.h. Sie können diese Gewichte mit anderen Forscher/innen teilen, ohne sich Gedanken zum Datenschutz machen zu müssen.
Models can also be exported from one site and imported to another. [[File:export_menu.png|thumb]]
=== Exporting models ===
You can export the data used to train the model, or the model configuration and the weights of the trained model. [[File:export_dialogue.png|thumb]]


'''Note''': the model weights are completely anonymous, containing no personally identifiable data! This means it is safe to share them with researchers without worrying about privacy regulations.
=== Modelle importieren ===
[[File:import_model.png|400px]]


=== Importing models ===
Wenn ein Modell mit Gewichten importiert wird, dann hat die Moodle-Administration die Wahl zwischen den Optionen, das trainierte Modell mit den Daten der Moodle-Site auszuwerten oder die Modellkonfiguration auszuwerten, indem das Modell erneut mit den Daten der Moodle-Site trainiert wird.  
When a model is imported with weights, the site administrator has the option to evaluate the trained model using site data, or to evaluate the model configuration by re-training it using the current site data. [[File:import_model.png|thumb]][[File:evaluate_model.png|thumb]]
[[File:evaluate_model.png|400px]]


[[Category:Analytics]]
[[Category:Analytics]]

Aktuelle Version vom 16. August 2020, 13:13 Uhr

Überblick

Die Moodle Learning Analytics API ist ein offenes System, das die Basis für eine Vielzahl von Modellen werden kann. Modelle können Indikatoren (Vorhersager), Ziele (Ausgang, den wir vorhersagen wollen), Einschätzungen (die Vorhersagen selbst), Benachrichtigungen (Mitteilungen, die aufgrund von Einschätzungen verschickt werden) und Aktionen (die den Empfänger/innen der Benachrichtigungen vorgeschlagen werden und die selbst wieder zu Indikatoren werden können) enthalten.

learning analytics components.png

Die meisten Modelle sind standardmäßig deaktiviert. Die Modelle sollten erst aktiviert werden, nachdem Sie sich Gedanken darüber gemacht haben, welche Bildungsziele durch die Modelle unterstützt werden sollen. Bei der Auswahl oder dem Anlegen von Learning Analytics Modellen sind folgende Schritte wichtig:

  • Welchen Ausgang wollen wir vorhersagen? Oder welchen Prozess wollen wir entdecken? (positiv oder negativ)
  • Wie entdecken wir diesen Ausgang oder Prozess?
  • Welche Anhaltspunkte können helfen, diesen Ausgang oder Prozess vorherzusagen?
  • Was sollten wir tun, wenn der Ausgang oder Prozess mit hoher Wahrscheinlichkeit eintritt oder nicht eintritt?
  • Wer sollte benachrichtigt werden? Welche Art von Benachrichtigung soll versendet werden?
  • Welche Möglichkeiten zur (Re-)Aktion sollten bei Benachrichtigung bereitgestellt werden?

Moodle kann mehrere Vorhersagemodelle gleichzeitig unterstützen, sogar innerhalb ein und desselben Kurses. Das kann für A/B-Tests verwendet werden, um die Leistungsfähigkeit und Genauigkeit verschiedener Modelle zu vergleichen.

Moodle Learning Analytics unterstützt zwei Arten von Modellen.

  • Machine-Learning-basierte Modelle, inklusive Vorhersagemodelle, nutzen Modelle der künstlichen Intelligenz, die mit Daten aus der Moodle-Site-Historie trainiert werden, um verborgene Aspekte des Lernprozesses zu entdecken oder vorherzusagen.
  • Statische Modelle nutzen ein einfacheres, regel-basiertes System, um besondere Situation in der Moodle-Site zu entdecken und ausgewählte Nutzer/innen darüber zu benachrichtigen.

Das Standardpaket von Moodle stellt drei Modelle bereit: Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen und die statischen Modelle Fälligkeit für anstehende Aktivitäten und Kurse, bei denen die Gefahr besteht, dass sie nicht beginnen. Sie können weitere Vorhersagemodelle anlegen, indem Sie die Analytics API oder die neue grafische Oberfläche verwenden. Jedes Modell basiert auf der Vorhersage eines einzelnen, spezifischen Ziels oder Ausgangs (der entweder erwünscht oder unerwünscht ist) und zu dem eine Reihe von ausgewählten Indikatoren gehören.

Sie können die Modelle auf der Seite Website-Administration > Analytics > Analytics-Modelle ansehen und verwalten.

manage models.png

Vorhandene Modelle

Das Moodle-Standardpaket enthält drei Vorhersagemodelle: Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen sowie die statischen Modelle Fälligkeit für anstehende Aktivitäten und Kurse, bei denen die Gefahr besteht, dass sie nicht beginnen. Weitere Modelle können durch Installation eines Plugins oder über die grafische Oberfläche (siehe unten) hinzugefügt werden. Vorhandene Modelle können auf der Seite Website-Administration > Analytics > Analytics-Modelle untersucht und geändert werden.

analytics models.png

Für vorhandene Modelle können Sie u.a. folgende Aktionen durchführen:

  • Vorhersagen erstellen: Trainieren Sie die Algorithmen des maschinellen Lernens mit neuen Daten der Moodle-Site und generieren Sie Vorhersagen für laufende Kurse. Vorhersagen sind nicht auf laufende Kurse beschränkt - das hängt vom Modell ab.
  • Einschätzungen ansehen: Sobald Sie die Algorithmen des maschinellen Lernens mit neuen Daten der Moodle-Site trainiert haben, sehen Sie Einschätzungen (Vorhersagen) für jedes analysierbare Element. Im Standardmodell Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen können die Einschätzungen pro Kurs ausgewählt werden. Vorhersagen sind nicht auf laufende Kurse beschränkt - das hängt vom Modell ab.
  • Auswerten: Das passiert normalerweise im Hintergrund als eine Reihe von geplanten Vorgängen, siehe weiter unten.
  • Log Schauen Sie sich vorherige Auswertungslogdaten an, inklusive der Modellgenauigkeit und anderer technischer Informationen, die von den Backends des maschinellen Lernens berechnet wurden, wie z.B. ROC-Kurven, Lernkurven-Graphen oder der Matthews Correlation Coefficient des Modells. Die verfügbare Information hängt vom verwendeten Backend des maschinellen Lernens ab.

log info.png

  • Bearbeiten: Sie können die Modelle bearbeiten, indem Sie die Liste der Indikatoren oder die Zeitaufteilungsmethode ändern. Wenn das Modell geändert wird, werden alle früheren Vorhersagen gelöscht. Modelle, die auf Annahmen basieren (statische Modelle), können nicht bearbeitet werden.
  • Aktivieren / Deaktivieren: Der geplante Vorgang, der die Algorithmen des maschinellen Lernens mit neuen auf der Moodle-Site verfügbaren Daten trainiert und Vorhersagen für laufende Kurse erstellt, übergeht deaktivierte Modelle. Frühere Vorhersagen, die von deaktivierten Modellen berechnet wurden, sind nicht verfügbar, solange das Modell nicht wieder aktiviert wird.
  • Exportieren: Exportieren Sie die Trainingsdaten Ihrer Moodle-Site, um sie mit Partnereinrichtungen zu teilen oder in neuen Moodle-Sites zu verwenden. Beim Exportieren wird eine CSV-Datei generiert, die die Modelldaten zu Indikatoren und Gewichten enthält, ohne irgendwelche spezifischen Daten Ihrer Moodle-Site offenzulegen. Wir bitten Sie, uns solche CSV-Dateien zu schicken, um den Wert der Modelle für verschiedenen Arten von Moodle-Sites zu beurteilen. Siehe Learning Analytics Community für mehr Informationen.
  • Ungültige Elemente: Gibt an, welche Elemente auf Ihrer Moodle-Site nicht vom Modell analysiert werden können.
  • Vorhersagen löschen: Löscht alle Vorhersagen und Trainingsdaten.

Standardmodelle

Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen

Dieses Modell sagt voraus, welche Teilnehmer/innen gefährdet sind, einen Moodle-Kurs nicht zu beenden, weil sie wenig Aktivität im Kurs zeigen. "Aussteigen" ist in diesem Zusammenhang so definiert, dass eine Person im letzten Viertel des Kurses keine Aktivität zeigt. Das Vorhersagemodell nutzt das Modell Community of Inquiry von Engagement, das aus drei Teilen besteht:

Dieses Vorhersagemodell kann eine große Bandbreite von Kursen analysieren, daraus Schlussfolgerungen ziehen und diese Schlussfolgerungen anwenden, um Vorhersagen für neue Kurse zu erstellen. Das Modell ist nicht beschränkt auf das Erstellen von Vorhersagen zum Teilnehmererfolg in Kursen, die exakte Duplikate von früheren Kursen sind. Gleichwohl gibt es einige Einschränkungen:

  1. Das Modell erfordert eine gewisse Menge an Moodle-Daten, um damit Vorhersagen zu erstellen. Zum gegenwärtigen Zeitpunkt sind nur Aktivitäten des Moodle-Standardpakets in der Menge der Indikatoren enthalten (siehe unten). Für Kurse, die keine Standard-Moodle-Aktivitäten "pro Zeitabschnitt" (abhängig von der Zeitaufteilungsmethode) enthalten, gibt es nur schwache Vorhersagen. Das Vorhersagemodell ist am effektivsten für Kurse, die komplett als Online-Kurse oder Blended-Learning-Kurse mit hinreichend vielen Online-Aktivitäten arbeiten.
  2. Das Modell nimmt an, dass Kurse feste Kursbeginn- und Kursende-Daten haben und es ist nicht gedacht für Kurse mit fortlaufenden Einschreibungen zu beliebigen Zeitpunkten. Modelle, die eine größere Bandbreite von Kursen unterstützen, werden in künftigen Moodle-Versionen in das Standardpaket integriert. Wegen dieser Modellannahme ist es sehr wichtig, die Daten für Kursbeginn und Kursende für die zu analysierenden Kurse richtig einzustellen. Wenn diese Daten nicht richtig konfiguriert sind, können die Vorhersagen nicht genau sein. Da das Kursende-Datum erst in Moodle 3.2 eingeführt wurde und einige Kurse in der Vergangenheit kein Kursbeginn-Datum haben können, stellen wir ein Skript zur Verfügung:
$ admin/tool/analytics/cli/guess_course_start_and_end.php 

Dieses Skript versucht, die Kursbeginn- und Kursende-Daten vergangener Kurse abzuschätzen, indem es die Kurseinschreibungen und Teilnehmer-Logdaten der Kurse auswertet. Prüfen Sie nach der Ausführung des Skripts, ob die abgeschätzten Kursbeginn- und Kursende-Daten hinreichend korrekt sind.

Fälligkeit für anstehende Aktivitäten

Das statische Modell Fälligkeit für anstehende Aktivitäten überprüft Aktivitäten mit anstehenden Fälligkeitsdaten und Ausgaben im persönlichen Kalender der Nutzer/innen.

Kurse, bei denen die Gefahr besteht, dass sie nicht beginnen

Die Einschätzungen dieses Modells informieren Moodle-Site-Verwalter/innen, in welchen Kursen mit anstehendem Kursbeginn-Datum es keine Lehrtätigkeit gibt. Das ist ein einfaches statisches Modell, es verwendet keine Algorithmen des maschinellen Lernens, um Vorhersagen zu berechnen. Es trifft Vorhersagen auf der Basis von Annahmen, z.B. dass es keine Lehrtätigkeit gibt, wenn keine Teilnehmer/innen im Kurs eingeschrieben sind.

Modelle anlegen und bearbeiten

Sie können neue Modelle anlegen, indem Sie die Analytics API verwenden, ein auf einer anderen Moodle-Site exportiertes Modell importieren oder die neue Oberfläche in Moodle verwenden.

Wenn Sie ein Standardmodell (aus dem Standardpaket von Moodle) löschen, dann können Sie es über das Menü Neues Modell' wiederherstellen. (Hinweis: Statische Modelle können derzeit nicht über die Moodle-Oberfläche angelegt werden).

Es gibt vier Modell-Komponenten, die über die Moodle-Oberfläche definiert werden können:

Ziel

create model 2.png

Ziele repräsentieren einen "bekannten Nutzen" - etwas, was einen bewiesenen Wert hat. Ziele müssen sorgfältig entworfen werden, damit sie mit den Prioritäten der Curricula der Bildungseinrichtung in Einklang stehen. Jedes Modell hat ein einzelnes Ziel. Durch die Wahl des Ziels wird automatisch der Kontext festgelegt, in dem das Ziel analysiert wird. Siehe Analytics-Ziele für mehr Informationen.

Indikatoren

Indikatoren sind Datenpunkte, die dabei helfen, Ziele vorherzusagen. Es steht uns frei, viele Indikatoren zu einem Modell hinzuzufügen um herauszufinden, ob sie ein Ziel vorhersagen - die einzige Einschränkung ist, dass die Daten in Moodle verfügbar sein und eine Verbindung zum Kontext des Modells (z.B. ein/e Nutzer/in, ein Kurs usw.) haben müssen. Der Trainingsprozess des maschinellen Lernens legt fest, wie viel Gewicht jeder einzelne Indikator im Modell bekommt.

Wir wollen sicherstellen, dass alle Indikatoren, die in ein Modell einfließen, einen klaren Zweck haben und von den Beteiligten interpretiert werden können, insbesondere wenn sie verwendet werden, um vorgeschriebene oder diagnostische Entscheidungen zu treffen.

Indikatoren werden aus Daten konstruiert, aber die Datenpunkte müssen verarbeiten werden, um konsistente, wiederverwendbare Indikatoren zu erzeugen. In vielen Fällen werden Events gezählt oder auf eine bestimmte Art und Weise kombiniert. Es gibt jedoch auch andere Möglichkeiten, Indikatoren zu definieren; diese werden später diskutiert. Wie die Datenpunkte verarbeitet werden ist mit wichtigen Annahmen verbunden, die sich auf die Indikatoren auswirken. Insbesondere können Indikatoren absolut sein, d.h. der Wert des Indikators bleibt derselbe unabhängig davon, welche anderen Stichproben in einem Kontext vorliegen. Indikatoren können auch relativ sein, d.h. der Indikator vergleicht verschiedene Stichproben in einem Kontext.

Siehe Analytics-Indikatoren für mehr Informationen.

indicators.png

Zeitaufteilungsmethode

zeitintervalle.png

Die Analyseintervalle steuern, wie oft ein Modell ausgewertet wird, um Vorhersagen zu erstellen und wie viele Informationen in jedem Zyklus in die Auswertung einbezogen werden. Standardmäßig sind zwei Zeitintervalle aktiviert: "Viertel" und "Alle vorherigen Viertel" (früher "Viertel akkumuliert"). Das Moodle-Standardpaket bietet auch die Optionen "Zehntel" und "Zehntel akkumuliert", wenn die Moodle-Administration diese systemweit aktiviert hat. Diese Optionen generieren Vorhersagen in kürzeren Abständen.

  • Einzeln bedeutet, dass eine Vorhersage einmalig berechnet wird, aber es wird dabei eine bestimmte Zeitspanne berücksichtigt. Die Vorhersage wird am Ende der Zeitspanne berechnet, z.B. am Ende eines Kurses.
  • Nächste drei Tage / Woche / zwei Wochen bedeutet, dass das Modell Einschätzungen auf der Basis der Daten, die zu einem gegebenen Zeitpunkt vorliegen, generiert. Z.B. schaut das Modell "Kurse, bei denen die Gefahr besteht, dass sie nicht beginnen", ob es zum jetzigen Zeitpunkt eine Woche vor Kursbeginn Einschreibungen von Trainer/innen und Teilnehmer/innen in einem Kurs gibt und schickt dann eine Warnung an die Moodle-Administration, dass es in diesem leeren Kurs wahrscheinlich keine Lehrtätigkeit geben wird.
  • Alle vorherigen ... (früher "akkumuliert") und Letztes ... unterscheiden sich darin, wie viele Informationen in die Vorhersage einbezogen werden. Bei beiden Optionen "Alle vorherigen Viertel" (früher "Viertel akkumuliert") und "Letztes Viertel" werden Vorhersagen am Ende eines Viertels einer Zeitspanne (z.B. einer Kurslaufzeit) generiert, wobei bei "Letztes Viertel" nur Informationen aus dem gerade vergangenen Viertel einbezogen werden, während bei "Alle vorherigen Viertel" alle Informationen aus allen vorangegangenen Viertel bis zum aktuellen Zeitpunkt verwendet werden.

Die Methoden "Einzeln" und "Keine Zeitaufteilung" haben keine Zeitbeschränkungen. Die Vorhersagen werden beim nächsten geplanten Vorgang berechnet, gleichwohl wenden die Modell verschiedene Bedingungen an, um Vorhersagen zu erstellen (z.B. Bedingung, dass ein Kurs abgeschlossen ist, wenn er zum Trainieren des Modells verwendet werden soll oder die Bedingung, dass bestimmte Daten im Kurts vorliegen müssen und Teilnehmer/innen diese Daten verwenden). Die Zeiteinteilungsmethoden "Einzeln" und "Keine Zeitaufteilung" sind nicht geeignet, um Teilnehmer/innen zu identifizieren, die gefährdet sind auszusteigen. Sie sind gedacht für Modelle wie "Kurse, bei denen die Gefahr besteht, dass sie nicht beginnen" oder "Spammer", in denen nur eine Vorhersage pro Stichprobe berechnet wird. Z.B. kann das Modell "Kurse, bei denen die Gefahr besteht, dass sie nicht beginnen" die Zeitaufteilungsmethode "Einzeln" verwenden; die Zielklasse (das ist die Haupt-PHP-Klasse des Modells) akzeptiert nur Kurse, die in der kommenden Woche beginnen; die Vorhersage wird dann für alle diese Kurse einmalig berechnet, d.h. die Einschätzung "Kurse, bei denen die Gefahr besteht, dass sie nicht beginnen" für einen Kurs wird später nicht noch einmal für diesen Kurs berechnet.

Der Unterschied zwischen den Methoden "Einzeln" und "Keine Zeitaufteilung" besteht darin, dass Modelle, die mit der Methode "Einzeln" analysiert wurden, auf die analysierbaren Elemente beschränkt sind (z.B. auf Kursbeginn- und Kursende-Daten im Fall des Modells "Teilnehmer/innen, die gefährdet sind auszusteigen"), während es bei der Zeitaufteilungsmethode "Keine Zeitaufteilung" keine zeitlichen Einschränkungen gibt und alle im System verfügbaren Daten zur Berechnung der Indikatoren verwendet werden.

Anmerkung: Obwohl alle oben beschriebenen Beispiele sich auf Kurse beziehen, können Zeitaufteilungsmethoden auch auf andere analysierbare Elemente bezogen werden. Z.B. können Kurseinschreibungen ein Beginn- und ein Endedatum haben, so dass die Zeitaufteilungsmethode verwendet werden kann, um Vorhersagen in Bezug auf Aspekte der Kurseinschreibung zu machen. Für analysierbare Elemente ohne Beginn- und Endedatum sind andere Zeitaufteilungsmethoden erforderlich. Z.B. könnte eine "wöchentliche" Zeitaufteilungsmethode in einem Modell verwendet werden, das auf der Basis von Daten über seine Aktivitäten in der vergangenen Woche vorhersagt, ob eine Person sich in der Zukunft im System anmelden wird.

Vorhersage-Prozessor

Diese Einstellung legt fest, welches Backend und welcher Algorithmus für maschinelles Lernen verwendet werden, um das Modell auszuwerten. Moodle stellt derzeit zwei Vorhersage-Prozessoren zur Verfügung:

  • PHP-Backend für maschinelles Lernen - implementiert logistische Regression unter Verwendung von php-ml (beigesteuert durch Moodle)
  • Python-Backend für maschinelles Lernen - implementiert ein einschichtiges Feedforward-Netz unter Verwendung von TensorFlow.

Sie können nur solche Prozessoren auswählen, die die Moodle-Administration systemweit aktiviert hat.

regression.png

ffnn.png

Jeder Vorhersage-Prozessor kann zukünftig mehrere Algorithmen unterstützen.

Modellnamen ändern

Der Modellname wird verwendet, um die Einschätzungen zu identifizieren, die das Modell generiert. Er ist standardmäßig derselbe wie der Zielname. Sie können den Modellnamen ändern, indem Sie in der Liste der Modelle auf das Stift-Symbol neben dem entsprechenden Modellnamen klicken.

edit model name.png

Modelle trainieren

Modelle, die auf maschinellem Lernen basieren, müssen mit älteren Daten der Moodle-Site trainiert werden. Statische Modelle verwenden vordefinierte Regeln und müssen nicht trainiert werden.

Es gibt zwei Hauptkategorien von Analytics-Modellen, die auf maschinellem Lernen basieren: überwachte und nicht überwachte.

  • Überwachte Modelle müssen mit Daten trainiert werden, wobei die Zielwerte bereits identifiziert sind. Wenn das Modell z.B. den Kursabschluss vorhersagen soll, muss das Modell mit Kursen und Einschreibungen trainiert werden, bei denen der Kursabschluss-Status bekannt ist.
  • Nicht überwachte Modelle suchen nach Mustern in vorhandenen Daten, z.B. klassifizieren sie Teilnehmer/innen nach Ähnlichkeiten in ihrem Verhalten im Kurs.

Zum jetzigen Zeitpunkt unterstützt Moodle Learning Analytics nur überwachte Modelle.

Wir hoffen, dass wir in Zukunft bereits trainierte Modelle im Standardpaket von Moodle bereitstellen können, derzeit haben wir jedoch noch nicht genügend Daten, um Modelle für eine externe Nutzung zu trainieren. (Wenn Sie unsere Bemühungen unterstützen und Daten bereitstellen möchten, wenden Sie sich bitte an die Moodle Learning Analytics Working Group.)

Trainingsdaten

Der Modell-Code enthält Kriterien für Trainingsdatensätze und für Vorhersagedatensätze. Z.B. können nur vergangene Kurse mit eingeschriebenen Teilnehmer/innen und einem Kursende-Datum verwendet werden, um das Modell Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen zu trainieren, weil es nicht möglich ist einzuschätzen, ob jemand aussteigt, bevor der Kurs zu Ende ist. Andererseits muss es einen Kurs mit eingeschriebenen Teilnehmer/innen geben, der begonnen hat, aber noch nicht beendet ist, um für dieses Modell eine Vorhersage zu generieren.

Der Trainingsdatensatz wird im PHP-Code für das Ziel definiert. Modelle können nur trainiert werden, wenn eine Moodle-Site genügend Daten enthält, die die Trainingskriterien erfüllen. Die meisten Modelle benötigen Moodle-Logdaten aus dem Zeitraum, in dem die Events liegen, die analysiert werden sollen. Z.B. kann das Modell Teilnehmer/innen, die Gefahr laufen, aus dem Kurs auszusteigen nur trainiert werden, wenn Logdaten zu Teilnehmeraktivitäten in Kursen, die die Trainingskriterien erfüllen, vorliegen. Es ist möglich, die Modelle in einem "archivierten" System zu trainieren und die Modelle anschließend im Produktivsystem zu verwenden.

Modellauswertung anstoßen

Das passiert normalerweise im Hintergrund durch eine Reihe von geplanten Vorgängen, aber Sie können diesen Prozess auch über das Modell-Menü anstoßen.

model menu evaluate.png

Das Modell sammelt dann alle Trainingsdaten, die auf der Moodle-Site verfügbar sind, berechnet alle Indikatoren und das Ziel und sendet die sich daraus ergebenden Datensätze an die Backends des maschinellen Lernens. Dieser Prozess teilt die Datensätze in Trainingsdaten und Testdaten auf und berechnet die Genauigkeit des Modells. Beachten Sie, dass der Auswertungsprozess alle Daten verwendet, die in der Moodle-Site verfügbar sind, auch wenn sie sehr alt sind. Deshalb kann die berechnete Genauigkeit des Modells kleiner sein als die tatsächliche Genauigkeit, da die Indikatoren zuverlässiger berechnet werden, direkt nachdem Trainingsdaten verfügbar sind, da der Site-Zustand sich ständig ändert. Die Metrik, die zur Berechnung der Genauigkeit verwendet wird, ist der Matthews Correlation Coefficient (eine Metrik, die im maschinellen Lernen zur Berechnung binärer Klassifikationen verwendet wird).

model-evaluation.jpeg

Sie können die Modellauswertung auch von Kommandozeile aus starten:

$ admin/tool/analytics/cli/evaluate_model.php

Auswertungsergebnisse überprüfen

model menu log.png

Sie können die Ergebnisse des Modell-Trainingsprozesses ansehen, indem Sie über das Modell-Menü auf die Auswertungslogdaten zugreifen.

model log.png

log info.png

Prüfen Sie, ob Warnungen zum Abschluss des Auswertungsprozesses, zur Modellgenauigkeit und zur Modellvariabilität vorliegen.

Sie können auch die Liste der ungültigen Elemente kontrollieren, um zu prüfen, welche Site-Elemente in die Analyse einbezogen wurden und welche nicht. Wenn Sie eine große Anzahl an unerwarteten Elementen in diesem Bericht sehen, dann kann das bedeuten, dass Sie Ihre Daten prüfen müssen. Z.B. wenn Kurse keine passenden Kursbeginn- und Kursende-Daten haben oder die Kurseinschreibungsdaten gelöscht wurden, kann das System keine Daten aus diesen Kursen in den Modell-Trainingsprozess einbeziehen.

invalid site elements.png

Modelle exportieren und importieren

Modelle können aus einer Moodle-Site exportiert und in eine andere Moodle-Site importiert werden.

Modelle exportieren

Sie können Daten exportieren, um Modelle zu trainieren oder Sie können die Modellkonfiguration und die Gewichte des trainierten Modell exportieren.

export dialogue.png

Hinweis: Die Modellgewichte sind komplett anonym, sie enthalten keine personenbezogenen Daten! D.h. Sie können diese Gewichte mit anderen Forscher/innen teilen, ohne sich Gedanken zum Datenschutz machen zu müssen.

Modelle importieren

import model.png

Wenn ein Modell mit Gewichten importiert wird, dann hat die Moodle-Administration die Wahl zwischen den Optionen, das trainierte Modell mit den Daten der Moodle-Site auszuwerten oder die Modellkonfiguration auszuwerten, indem das Modell erneut mit den Daten der Moodle-Site trainiert wird.

evaluate model.png