諸如OpenAI的GPT-4等生成式AI工具,被越來越多地整合到教育環境中,有望增強學習和效率。然而,AI對學習成果的長期影響仍待考查。賓夕法尼亞大學沃頓商學院(Wharton School)最近的一篇研究論文詳細介紹了一項大規模隨機對照試驗(RCT),該試驗旨在評估生成式 AI 如何影響學生學習,特別專注高中教育的數學課程。該研究涉及三個年級(9-10年級)的近1,000 名學生,評估了兩個以GPT-4為本的輔助工具:GPT Base和 GPT Tutor。GPT Base 提供了一個標準的 ChatGPT 介面,而 GPT Tutor 則結合了安全措施來支援學習,而無需提供直接答案。
結果顯示,雖然GPT-4顯著即時提升了學生解答難題的成績——GPT Base 提升了48%,GPT Tutor 提高了127%——但這些成效並沒有轉化為長期學習成果。當在考試期間,學生不許使用GPT-4時,使用過GPT Base的學生的表現比從未使過的學生差17%,這表明其對學習產生了不利影響。然而,GPT Tutor 卻減輕了這種負面影響,學習成績的差異在統計學上變得不顯著。
該研究強調了生成式 AI 提高短期效用的潛力,但也強調了過度依賴這些工具的風險,這可能會防礙學生解答難題技能的發展。在教育機構越來越傾向於使用AI驅動工具的背景下,研究結果強調了設計周全安措施的必要性,以確保學生能持續學習並保留關鍵技能。
文獻來源(開放取用):Bastani, H., Bastani, O., Sungu, A., Ge, H., Kabakcı, Ö., & Mariman, R. (2024). Generative AI can harm learning. The Wharton School Research Paper. https://www.ssrn.com/abstract=4895486