Grundskolans datapipeline och databehandling – tekniska utmaningar och möjligheter
Postat den 23rd oktober, 2023, 12:40 av Susanna
Information – data – betraktas som en avgörande resurs för det moderna samhället, med egenskaper som kan utlösa en teknologisk revolution [1]. Användningen av digital teknik inom utbildning har möjliggjort insamling av en bred mängd data om elever och deras utbildning.
Olika typer av utbildningsdata, till exempel text, betyg, tester, tidsstämplar, närvaro och beteendedata om användningen av digitala läromedel, kan vara omfattande, komplexa och heterogena [2]. Stora mängder utbildningsdata finns dessutom spridda över olika digitala tjänster och huvudmän, vilket gör det minst sagt utmanande att använda data på ett strategiskt sätt. Även om datastandarder syftar till att underlätta anslutning och spridning av information mellan olika digitala utbildningsverktyg inom skolorna, så finns inga etablerade standarder specifikt för insamling, bearbetning, analys och presentation av utbildningsdata. Som ett resultat av det utnyttjar inte skolledare, lärare och elever möjligheten att fatta beslut kring undervisning och lärande baserade på redan befintliga data. Inom vårt forskningsprojekt Utbildningsteknologi i grundskolan vill vi etablera säkra datapipeliner och för ändamålet utformade datastandarder för att kunna bidra till såväl pedagogisk som organisatorisk verksamhetsnytta genom att strategiskt använda och analysera utbildningsdata.
Datapipeliner består av en komplex kedja av sammanlänkade aktiviteter som börjar med en datakälla och slutar med en datamottagare via överbryggade serier av operationer. I forskningsprojektet föreslår vi en teknisk lösning som innehåller en datapipeline genom att använda ett säkert svenskt datalager – Swedish University Computer Network (SUNET). I början av pipelinen laddas data in i lagringsutrymmet. Därefter följer ett antal steg, där varje steg producerar en ”utdata” som fungerar som ”indata” för det följande steget, och detta fortsätter tills pipelinen är klar. För alla involverade parter är datasäkerhet, integritet och ett etiskt förhållningssätt de viktigaste övervägandena. För att hantera dessa frågor och hålla data för olika intressenter åtskild (såsom läromedelsföretag och kommuner) använder vi SUNET-drive och Simple Storage Service (S3). För att kunna göra en grundlig bedömning av elevernas framsteg var det avgörande att sammanföra elevernas data från olika S3:or.
Trots den användarvänliga datapipeline som byggdes för projektet stötte majoriteten av intressenterna på svårigheter när det kom till att formatera sina data enligt den föreslagna datastandarden och ladda upp data till S3:orna på vår SUNET-drive. Utmaningen uppstod på grund av bristande expertis inom skolor och kommuner, samt begränsade ekonomiska resurser och tidsbegränsningar för läromedelsföretagen. För att ta itu med detta problem utvecklade vi individuella skript för varje intressent baserat på deras specifika data. Genom att låta intressenterna köra dessa skript en gång i veckan kunde vi säkerställa en enhetlig datamatning över alla S3:or. Denna extra, men nödvändiga process blev dock kostsam och mycket tidskrävande.
När intressenterna har laddat upp sina formaterade data till sina respektive S3:or ’hashar’ forskarna data som blir pseudoanonymiserad. All pseudonymiserad data lagras sedan som en backup i SUNET-drive. Det är viktigt att notera att endast pseudoanonymiserad data används av forskarna. Enligt den allmänna dataskyddsförordningen (GDPR) innebär pseudoanonymisering att behandla personuppgifter på ett sätt som förhindrar association med en specifik individ utan ytterligare information. Denna ytterligare information hålls separat och omfattas av åtgärder som förhindrar kopplingen av personuppgifter till identifierbara individer [9]. Endast involverade lärare och rektorer kan matcha dataanalyser till respektive individ.
Data bearbetas, analyseras och visualiseras för olika intressenter med ett VLA (Visual Learning Analytics) verktyg. Ett inloggningssystem och backuper skapas via en virtuell maskin på vårt universitetsmoln. Med flera intressenter involverade får varje intressent unik tillgång via ett API till ett personligt dashboard inom det utvecklade VLA-verktyget, vilket säkerställer säker åtkomstkontroll och -behörighet. Den föreslagna tekniska lösningen underlättar för olika intressenter hur data hanteras, transporteras, analyseras och visualiseras, för att i förlängningen bidra till väl underbyggda och strategiskt genomtänkta beslut för individanpassad utbildning och lärande. Vi hoppas att projektet kan bidra till standarder för hur skolväsendet och digitala läromedelsföretag i Sverige hanterar, delar och använder utbildningsdata.
Zeynab (Artemis) Mohseni & Italo Masiello // EdTechLnu
Referenser
- Perez, C. (2002). Technological revolutions and financial capital: the dynamics of bubbles and golden ages. Cheltenham (UK): Edward Elgar.
- Mohseni, Z., Martins, R. M., & Masiello, I. (2022). SBGTool v2. 0: An Empirical Study on a Similarity-Based Grouping Tool for Students’ Learning Outcomes. Data, 7(7), 98.
- Munappy, A. R., Bosch, J., Olsson, H. H. (2020). Data pipeline management in practice: Challenges and opportunities. In International Conference on Product-Focused Software Process Improvement, Springer, Cham, pp. 168-184.
- Pervaiz, F., Vashistha, A., Anderson, R. (2019). Examining the challenges in development data pipeline. In Proceedings of the 2nd ACM SIGCAS Conference on Computing and Sustainable Societies, pp. 13-21.
- Raman, K., Swaminathan, A., Gehrke, J., Joachims, T. (2013). Beyond myopic inference in big data pipelines. In Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining, pp. 86-94.
- Mohseni, Z., Masiello, I., Martins, R. M. (manuscript in preparation). Practical Implementation of Data Pipeline and Data Standard for Educational Data in Primary and Secondary Education: Challenges and Opportunities.
- Swedish University Computer Network (2023). URL: https://www.sunet.se/om-sunet (accessed 2023-06-15).
- SUNET S3 (2023). URL: https://wiki.sunet.se/pages/viewpage.action?pageId=18612359 (accessed 2023-06-15).
- Voigt, P., Von dem Bussche, A. (2017). The EU general data protection regulation (GDPR), A Practical Guide, 1st Ed., Cham: Springer International Publishing, 10(3152676), pp. 10-5555.
Det här inlägget postades den oktober 23rd, 2023, 12:40 och fylls under Uncategorized