Cold-Start Generalization in Educational Interaction Data: Comparing Student-Wise and Question-Wise Splits with Probabilistic Calibration

Purwadi Purwadi; Othman Bin Mohd; Nor Azman Bin Abu

doi:10.66472/ijoml.v1i1.4

PDF

Published: Jan 28, 2026

DOI: https://doi.org/10.66472/ijoml.v1i1.4

Keywords:

Cold-start Problem Domain Generalization Educational Data Mining Knowledge Tracing, Probability Calibration

Purwadi Purwadi

Informatics, Universitas Amikom Purwokerto, Indonesia

Othman Bin Mohd

Center for Advanced Computing Technology (C-ACT), Faculty of Information and Communication Technology, Universiti Teknikal Malaysia Melaka, Melaka, Malaysia

Nor Azman Bin Abu

Faculty of Artificial Intelligence and Cyber Security (FAIX), Universiti Teknikal Malaysia Melaka, Melaka, Malaysia

Abstract

Predictive models in Intelligent Tutoring Systems often face performance degradation due to sparse data and the cold-start problem, further compounded by a lack of probability calibration in standard evaluations. This study bridges this gap by systematically evaluating the trade-off between discriminative accuracy and probabilistic reliability through student-wise and question-wise splits, utilizing interaction data from the MathE platform across eight countries. By comparing identifier-based and metadata-based Logistic Regression models under a Leave-One-Country-Out protocol, we assessed generalization capabilities against distribution shifts. The results reveal a fundamental dichotomy: while identifier-based models achieve superior precision (AUC 0.687) and calibration in scenarios with historical context, they suffer from significant performance drops in student cold-start settings and exhibit negative transfer during cross-country deployment. Conversely, metadata-based models demonstrate higher robustness and invariance across varying demographics. We conclude that relying solely on accuracy metrics masks model uncertainty in new domains and recommend a "safe-start" strategy that prioritizes metadata-based features for system initialization to ensure reliable pedagogical decision-making before personalizing based on accumulated user history.

How to Cite

Purwadi, P., Othman Bin Mohd, & Nor Azman Bin Abu. (2026). Cold-Start Generalization in Educational Interaction Data: Comparing Student-Wise and Question-Wise Splits with Probabilistic Calibration. International Journal of Machine Learning (IJOML), 1(1), 38–50. https://doi.org/10.66472/ijoml.v1i1.4

Issue

Vol. 1 No. 1 (2026): IJOML Volume 1, Number 1, June 2026

Section

Articles

This work is licensed under a Creative Commons Attribution 4.0 International License.

Article Sidebar

Main Article Content

Abstract

Article Details