最近發表在《Journal of Research on Educational Effectiveness》的一項統合分析研究了 1990 年代至 2017 年美國 PreK-12 數學干預的效果,目的是檢視哪些研究特徵導致不同的效果(異質性)。選擇研究的標準很廣泛,為要對在美國進行、用英語撰寫的數學干預隨機研究進行全面回顧。因此,作者納入了在方法上具不同質素(例如,測量工具、流失率、基線差異)的研究,並試圖在分析中控制這些因素。
共191項研究符合納入標準,平均效應值為+0.31,並且存在顯著的異質性,95%的預測區間(真實效應值的95%範圍)為-0.60至+1.23。為了解釋這種異質性,作者測試了不同組別的調節因素(可能引致不同效果的因素)。在獨立測試每組後,建立了一個組合模型,其中包括在先前分析中發現的略為重要的所有調節因素。
組合模型的結果表明,干預類型、干預實施、研究發表年份和測量工具是重要調節因素。
- 在干預類型方面,補充時間干預(ES = +0.53)比課程干預(ES = +0.34)或教學方法/指導干預(ES = +0.27)更有效。
- 在干預實施方面,教師(ES = +0.37)和校外干預人員(ES = +0.39)實施的計劃比科技(ES = +0.12)更有效。
- 關於發表時間,前幾十年發表的研究比最近的研究具有更高的效應值。
- 最後,研究人員自訂的測量工具(ES = +0.45)的效果是標準化評量(ES = +0.15)的三倍。
作者的結論是,效應值於不同研究之間的差異大部分不能用此次分析中包含的因素來解釋。研究應盡量報告有關計劃和方法的詳細資訊,以便能夠檢視和發現哪些是影響干預措施有效性的因素。
文獻來源:Williams, R., Citkowicz, M., Miller, D. I., Lindsay, J., & Walters, K. (2022). Heterogeneity in mathematics intervention effects: Evidence from a meta-analysis of 191 randomized experiments. Journal of Research on Educational Effectiveness, 15(3), 584–634. https://doi.org/10.1080/19345747.2021.2009072