Авторы:
Энкелейда Каснеджи, Катрин Сесслер, Стефан Кюхеманн, Мария Баннерт, Дарина Дементьева, Фрэнк Фишер, Урс Гассер, Георг Грох, Стефан Гюннеманн, Эйке Хюллермайер, Стефа Круше, Гитта Кутинёк, Тилман Михаэли, Клаудия Нердель, Юрген Пфеффер, Александра Поке, Майкл Сайлер,Альбрехт Шмидт, Тина Зайдель ,Матиас Стадлер, Йохен Веллер, Йохен Кун, Гьерджи Каснечи
Основные моменты
• Текущие исследования и приложения больших языковых моделей в образовании
• Возможности и проблемы, связанные с использованием языковых моделей в образовании с точки зрения учителя и ученика
• Возможности использования больших языковых моделей для инновационных образовательных технологий
• Ключевые проблемы, риски и стратегии их смягчения, связанные с применением моделей большого языка в образовании
• Дополнительные вопросы и обсуждение, связанные с пользовательскими интерфейсами, честным доступом, этичным и ответственным использованием таких технологий
Аннотация Большие языковые модели представляют собой значительный прогресс в области ИИ. Базовая технология является ключом к дальнейшим инновациям, и, несмотря на критические взгляды и даже запреты в сообществах и регионах, большие языковые модели никуда не денутся. В этом комментарии представлены потенциальные преимущества и проблемы образовательных приложений больших языковых моделей с точки зрения учащихся и учителей. Мы кратко обсудим текущее состояние больших языковых моделей и их приложений. Затем мы расскажем, как эти модели можно использовать для создания образовательного контента, повышения вовлеченности и взаимодействия учащихся, а также персонализации учебного процесса. Что касается проблем, мы утверждаем, что большие языковые модели в образовании требуют от учителей и учащихся развития набора компетенций и грамотности, необходимых как для понимания технологии, так и для понимания их ограничений и неожиданной хрупкости таких систем. Кроме того, четкая стратегия в рамках образовательных систем и четкий педагогический подход с упором на критическое мышление и стратегии проверки фактов необходимы для интеграции и полного использования больших языковых моделей в условиях обучения и учебных программах. Другие проблемы, такие как потенциальная систематическая ошибка в результатах, необходимость постоянного человеческого контроля и возможность неправильного использования, не являются уникальными для применения ИИ в образовании. Но мы считаем, что при разумном подходе к этим проблемам можно получить информацию и возможности в образовательных сценариях, чтобы на раннем этапе познакомить учащихся с потенциальными социальными предубеждениями, критическими моментами и рисками применения ИИ.
1 . Введение
Большие языковые модели , такие как Генеративный предварительно обученный преобразователь (GPT-3) ( Floridi & Chiriatti, 2020 ), в последние годы добились значительных успехов в обработке естественного языка (NLP). Эти модели обучаются на огромных объемах текстовых данных и способны генерировать человекоподобный текст, отвечать на вопросы и выполнять другие языковые задачи с высокой точностью.
Одним из ключевых достижений в этой области является использование архитектур-трансформеров ( Devlin et al., 2018 , Tay et al., 2022 ) и лежащего в их основе механизма внимания ( Vaswani et al., 2017 ), которые значительно улучшили возможности языковых моделей. для обработки долгосрочных зависимостей в текстах на естественном языке. В частности, архитектура трансформатора, представленная Vaswani et al. (2017) использует механизм внутреннего внимания для определения релевантности различных частей входных данных при создании прогнозов. Это позволяет модели лучше понимать отношения между словами в предложении независимо от их положения.
Еще одним важным нововведением является использование предварительного обучения, когда языковая модель сначала обучается на большом наборе данных, а затем настраивается для конкретной задачи. Это оказалось эффективным методом повышения производительности при выполнении широкого круга языковых задач ( Min et al., 2021 ). Например, представления двунаправленного кодировщика от трансформаторов (или сокращенно BERT) ( Девлин и др., 2018 г.).) — это предварительно обученная модель кодировщика на основе преобразователя, которую можно точно настроить для различных задач НЛП, таких как классификация предложений, ответы на вопросы и распознавание именованных объектов. Фактически, так называемая способность больших языковых моделей к быстрому обучению для эффективной адаптации к последующим задачам или даже другим, казалось бы, несвязанным задачам (например, как в трансферном обучении) была эмпирически обнаружена и изучена для различных естественно-языковых моделей. задачи ( Brown et al., 2020 ), например, совсем недавно в контексте создания синтетических и в то же время реалистичных разнородных табличных данных ( Borisov et al., 2022 ).
Недавние достижения также включают ChatGPT ( Team, 2022 ), который был обучен на гораздо большем наборе данных, т. е. на текстах из очень большого веб-корпуса, и продемонстрировал современную производительность в широком диапазоне задач на естественном языке. от перевода до ответов на вопросы, написания связных эссе и компьютерных программ. Кроме того, были проведены обширные исследования по точной настройке этих моделей на небольших наборах данных и применению трансферного обучения к новым проблемам. Это позволяет повысить производительность при выполнении определенных задач с меньшим объемом данных.
Несмотря на то, что в последние годы большие языковые модели добились больших успехов, все еще существует множество ограничений, которые необходимо устранить. Одним из основных ограничений является отсутствие интерпретируемости, поскольку трудно понять причины предсказаний модели. Существуют этические соображения, такие как опасения по поводу предвзятости и влияния этих моделей, например, на занятость, риски неправильного использования и неадекватного или неэтичного развертывания, потеря целостности и многое другое. В целом, большие языковые модели будут продолжать раздвигать границы возможного в обработке естественного языка. Тем не менее, предстоит еще много работы с точки зрения устранения их ограничений и связанных с ними этических соображений.
1.1 . Возможности для обучения
Использование больших языковых моделей в образовании — потенциальная область интереса из-за разнообразия предлагаемых ими способов применения. Благодаря использованию этих моделей возможности для улучшения обучения и опыта преподавания могут быть доступны для людей на всех уровнях образования, включая начальное, среднее, высшее и профессиональное развитие. Более того, поскольку каждый человек имеет уникальные предпочтения в обучении, способности и потребности, большие языковые модели предлагают уникальную возможность обеспечить персонализированный и эффективный опыт обучения.
Для учащихся начальной школы большие языковые модели могут помочь в развитии навыков чтения и письма (например, предлагая синтаксические и грамматические исправления), а также в развитии стиля письма и навыков критического мышления. Эти модели можно использовать для создания вопросов и подсказок, побуждающих учащихся критически относиться к тому, что они читают и пишут, а также анализировать и интерпретировать предоставленную им информацию. Кроме того, большие языковые модели также могут помочь в развитии навыков понимания прочитанного, предоставляя учащимся резюме и пояснения к сложным текстам, что может облегчить чтение и понимание материала.
Для учащихся средних и старших классов большие языковые модели могут помочь в изучении языка и стилей письма по различным предметам и темам, например, математике, физике, языку и литературе и другим предметам. Эти модели можно использовать для создания практических задач и тестов, которые могут помочь учащимся лучше понять, контекстуализировать и запомнить материал, который они изучают. Кроме того, большие языковые модели также могут помочь в развитии навыков решения проблем, предоставляя учащимся объяснения, пошаговые решения и интересные вопросы, связанные с проблемами, которые могут помочь им понять причины, лежащие в основе решений, и развить аналитические способности. и нестандартное мышление.
Для студентов университетов большие языковые модели могут помочь в исследовательских и письменных задачах, а также в развитии критического мышления и навыков решения проблем. Эти модели можно использовать для создания резюме и набросков текстов, которые могут помочь учащимся быстро понять основные моменты текста и организовать свои мысли для написания. Кроме того, большие языковые модели также могут помочь в развитии исследовательских навыков, предоставляя учащимся информацию и ресурсы по определенной теме и намекая на неисследованные аспекты и текущие темы исследований, что может помочь им лучше понять и проанализировать материал.
Для группового и дистанционного обучения, большие языковые модели могут использоваться для облегчения групповых дискуссий и дебатов, предоставляя структуру обсуждения, обратную связь в реальном времени и персонализированные рекомендации для студентов во время обсуждения. Это может помочь повысить вовлеченность и участие учащихся. В совместной письменной деятельности, когда несколько учащихся работают вместе над написанием документа или проекта, языковые модели могут помочь, предоставив рекомендации по стилю и редактированию, а также другие интегративные функции совместного написания. В исследовательских целях такие модели можно использовать для охвата ряда открытых исследовательских вопросов по отношению к уже исследованным темам и для автоматического назначения вопросов и тем участвующим членам команды. В целях удаленного обучения их можно использовать для автоматического создания вопросов и предоставления практических задач, объяснений,
Чтобы расширить возможности учащихся с ограниченными возможностями , можно использовать большие языковые модели в сочетании с решениями для преобразования речи в текст или текста в речь, чтобы помочь людям с нарушениями зрения . В сочетании с ранее упомянутыми возможностями группового и дистанционного обучения языковые модели могут использоваться для разработки инклюзивных стратегий обучения с адекватной поддержкой в таких задачах, как адаптивное письмо, перевод и выделение важного контента в различных форматах. Однако важно отметить, что использование больших языковых моделей должно сопровождаться помощью профессионалов, таких как логопеды , педагоги и другие специалисты, которые могут адаптировать технологию к конкретным потребностям учащихся с ограниченными возможностями.
Для профессионального обучения большие языковые модели могут помочь в развитии языковых навыков, характерных для конкретной области работы. Они также могут помочь в развитии таких навыков, как программирование, написание отчетов, управление проектами, принятие решений и решение проблем. Например, большие языковые модели могут быть точно настроены на предметно-ориентированном корпусе (например, юридическом, медицинском, ИТ) для создания предметно-ориентированного языка и помощи учащимся в написании технических отчетов, юридических документов, медицинских записей и т. д. Они могут также генерировать вопросы и подсказки, побуждающие учащихся критически относиться к своей работе, а также анализировать и интерпретировать предоставленную им информацию.
В заключение, большие языковые модели могут предоставить широкий спектр преимуществ и возможностей для студентов и специалистов на всех этапах образования. Они могут помочь в развитии навыков чтения, письма, математики, науки и языка, а также предоставить учащимся персонализированные практические материалы, резюме и пояснения, которые могут помочь улучшить успеваемость учащихся.и способствовать расширению опыта обучения. Кроме того, большие языковые модели могут также помочь в исследованиях, написании и решении задач, а также обеспечить языковые навыки, специфичные для предметной области, и другие навыки для профессионального обучения. Однако, как упоминалось ранее, использовать эти модели следует с осторожностью, так как они также имеют ограничения, такие как отсутствие интерпретируемости и вероятность систематической ошибки, неожиданная хрупкость в относительно простых задачах (Журнал, 2022), которые необходимо решить .
1.2 . Возможности для обучения
Большие языковые модели, такие как ChatGPT, могут произвести революцию в обучении и помочь в процессе обучения. Ниже мы приводим лишь несколько примеров того, как эти модели могут быть полезны учителям:
Для персонализированного обучения учителя могут использовать большие языковые модели, чтобы создавать персонализированный опыт обучения для своих учеников. Эти модели могут анализировать письмо и ответы учащегося, а также предоставлять индивидуальные отзывы и предлагать материалы, которые соответствуют конкретным потребностям учащегося в обучении. Такая поддержка может сэкономить время и усилия учителей при создании персонализированных материалов и обратной связи, а также позволить им сосредоточиться на других аспектах обучения, таких как создание увлекательных и интерактивных уроков.
Для планирования уроков большие языковые модели также могут помочь учителям в создании (инклюзивных) планов уроков и занятий. Преподаватели могут вводить в модели корпус документов, на основе которых они хотят построить курс. Результатом может быть программа курса с кратким описанием каждой темы. Языковые модели также могут генерировать вопросы и подсказки, поощряющие участие людей с разным уровнем знаний и способностей, а также побуждающие к критическому мышлению и решению проблем. Кроме того, их можно использовать для создания целевых и персонализированных практических задач и тестов, которые могут помочь учащимся усвоить материал.
Для изучения языка преподаватели языковых классов могут использовать большие языковые модели в вспомогательных целях, например, для выделения важных фраз, составления резюме и переводов, объяснения грамматики и словарного запаса, предложения по улучшению грамматики или стиля и помощи в разговорной практике. Языковые модели также могут предоставить учителям адаптивные и персонализированные средства, чтобы помочь учащимся в их изучении языка, что может сделать изучение языка более увлекательным и эффективным для учащихся.
Для исследований и написания, большие языковые модели могут помочь преподавателям университетов и средних школ выполнять исследовательские и письменные задачи (например, в семинарских работах, написании статей и обратной связи со студентами) более эффективно и действенно. Самая основная помощь может быть оказана на синтаксическом уровне, т. е. в выявлении и исправлении опечаток. На семантическом уровне большие языковые модели могут использоваться для выявления (потенциальных) грамматических несоответствий и предложения адекватных и персонализированных стратегий улучшения. Идя дальше, эти модели можно использовать для определения возможностей улучшения стиля для конкретной темы. Их также можно использовать для создания резюме и набросков сложных текстов, которые могут помочь учителям и исследователям выделить основные моменты текста таким образом, чтобы это было полезно для дальнейшего более глубокого погружения и понимания рассматриваемого содержания.
Для профессионального развития большие языковые модели также могут помочь учителям, предоставляя им ресурсы, резюме и объяснения новых методологий обучения, технологий и материалов. Это может помочь учителям быть в курсе последних разработок и технологий в области образования и способствовать повышению эффективности их обучения. Их можно использовать для повышения ясности учебных материалов, поиска информации или ресурсов, которые могут понадобиться профессионалам во время обучения на рабочем месте, а также для модулей обучения на рабочем месте, требующих навыков презентации и общения.
Для оценивания и оценивания учителя могут использовать большие языковые модели для полуавтоматической оценки работы учащихся, выделяя потенциальные сильные и слабые стороны рассматриваемой работы, например, эссе, научных работ и других письменных заданий. Это может сэкономить учителям значительное количество времени на задачи, связанные с индивидуальной обратной связью со студентами. Кроме того, большие языковые модели также могут использоваться для проверки на плагиат , что может помочь предотвратить мошенничество. Следовательно, большие языковые модели могут помочь учителям определить области, в которых учащиеся испытывают затруднения, что способствует более точной оценке развития учащихся и проблем в обучении. Целенаправленное обучение, обеспечиваемое моделями, может помочь учащимся преуспеть и предоставить возможности для дальнейшего развития.
Знакомство учащихся с проблемами ИИ, связанными с потенциальной предвзятостью результатов, необходимостью постоянного человеческого контроля и возможностью неправильного использования больших языковых моделей, характерно не только для образования. На самом деле, эти проблемы присущи трансформационным цифровым технологиям. Таким образом, мы считаем, что при разумном решении этих задач учителем эти проблемы могут быть полезными в сценариях обучения и образования, чтобы на раннем этапе ознакомить учащихся с потенциальными социальными предубеждениями и рисками применения ИИ.
В заключение, большие языковые модели могут революционизировать преподавание с точки зрения учителя, предоставляя учителям широкий спектр инструментов и ресурсов, которые могут помочь в планировании уроков, создании персонализированного контента, дифференцировании и персонализированном обучении, оценке и профессиональном развитии. В целом, большие языковые модели могут стать мощным инструментом в образовании, и в настоящее время проводится ряд исследований, изучающих их потенциальное применение в этой области.
2 . Текущие исследования и применение языковых моделей в образовании
В последние годы было разработано несколько крупных языковых моделей, включая GPT ( Radford et al., 2018 ), BERT ( Devlin et al., 2018 ), XLNet ( Yang et al., 2019 ), T5 ( Raffel et al., 2020 ), RoBERTa ( Liu et al., 2019 ) и наиболее широко используемый GPT-3 ( Floridi & Chiriatti, 2020 ; Scao et al., 2022 ). Эти модели основаны на архитектуре преобразователя и предварительно обучены на массивных наборах данных текста, чтобы генерировать человекоподобный текст, отвечать на вопросы, помогать в переводе и обобщении, а также выполнять многие НЛП .задачи с единым конвейером предварительной подготовки и тонкой настройки. BLOOM — последнее дополнение к этому семейству, разработанное сообществом BigScience и выпущенное как проект с открытым исходным кодом, предоставляющее прозрачно обучаемую многоязычную языковую модель, специально предназначенную для охвата 46 естественных языков и 13 языков программирования (Scao et al., 2022 ) . . Эти разработки знаменуют собой важные вехи в области НЛП и открывают огромные возможности для применения в исследовательских и промышленных контекстах. Мы ожидаем, что будущие достижения в НЛП и, в частности, в больших языковых моделях приведут к еще большему улучшению возможностей языковых моделей, тем самым подчеркнув необходимость изучения их потенциальных приложений в образовании.
Далее мы приводим обзор исследовательских работ, использующих большие языковые модели в образовании, которые были опубликованы после выпуска первой большой языковой модели в 2018 году. Далее эти исследования обсуждаются в соответствии с их целевыми группами, т. е. учащимися или учителя. Поскольку область продолжает развиваться, остается много неизвестных, которые еще предстоит изучить, и их можно выявить и решить только посредством систематических и тщательных эмпирических исследований и оценок.
2.1 . Исследовательские работы, затрагивающие точку зрения учащихся
С точки зрения учащегося, большие языковые модели могут использоваться различными способами, чтобы помочь процессу обучения. Одним из примеров является создание и дизайн образовательного контента. Например, исследователи использовали большие языковые модели для создания интерактивных образовательных материалов, таких как викторины и карточки, которые можно использовать для улучшения обучения и вовлеченности учащихся ( Dijkstra et al., 2022 ; Gabajiwala et al., 2022 ). В частности, в недавней работе Dijkstra et al. (2022), исследователи использовали GPT-3 для создания вопросов и ответов с несколькими вариантами ответов для задания на понимание прочитанного и утверждают, что автоматизированное создание тестов не только снижает нагрузку на учителя при разработке тестов вручную, но, прежде всего, предоставляет учащимся полезный инструмент для тренировать и проверять свои знания, изучая учебники и готовясь к экзаменам ( Dijkstra et al., 2022 ).
В другой недавней работе GPT-3 использовался в качестве педагогического агента для стимулирования любопытства детей и улучшения навыков постановки вопросов ( Abdelghani et al., 2022 ). В частности, авторы автоматизировали генерацию сигналов, вызывающих любопытство, в качестве стимула для того, чтобы задавать больше и более глубокие вопросы. Согласно их результатам, большие языковые модели не только могут значительно облегчить реализацию обучения, стимулирующего любопытство, но также могут служить эффективным инструментом для повышения выражения любопытства (Abdelghani et al., 2022 ) .
В компьютерном образовании недавняя работа MacNeil et al. (2022) использовал GPT-3 для создания пояснений к коду. Несмотря на несколько открытых исследовательских и педагогических вопросов, которые требуют дальнейшего изучения, эта работа успешно продемонстрировала потенциал GPT-3 для поддержки обучения путем объяснения аспектов данного фрагмента кода.
Для курса по науке о данных Бхат и др. (2022) предложил конвейер для создания оценочных вопросов на основе отлаженной модели GPT3 для текстовых учебных материалов. Сгенерированные вопросы были дополнительно оценены с точки зрения их полезности для результатов обучения на основе автоматической маркировки с помощью обученной модели GPT-3 и ручной проверки экспертами-людьми. Авторы сообщили, что сгенерированные вопросы были положительно оценены экспертами-людьми, что способствовало использованию больших языковых моделей в обучении науке о данных ( Bhat et al., 2022 ).
Студенты могут учиться друг у друга, рецензируя и оценивая решения друг друга. Это, конечно, дает лучший эффект, когда предоставленная обратная связь является исчерпывающей и качественной. Например, Jia et al. (2021) показали, как можно использовать BERT для оценки оценок сверстников, чтобы учащиеся могли научиться улучшать свои отзывы.
В недавнем обзоре разговорного ИИ в языковом образовании авторы обнаружили пять основных применений разговорного ИИ во время обучения ( Ji et al., 2022 ), наиболее распространенным из которых является использование больших языковых моделей в качестве собеседника в процессе обучения. письменная или устная форма, например, в контексте диалога, ориентированного на задачу, который предоставляет возможности языковой практики, такой как произношение ( Эль Шазли, 2021 ). Еще одним приложением является поддержка учащихся, когда они испытывают беспокойство при изучении иностранного языка ( Bao, 2019 ) или имеют более низкую готовность к общению ( Tai & Chen, 2020 ). В Чон (2021), было изучено применение предоставления обратной связи в качестве аналитика потребностей и оценщика, когда учащиеся начальной школы практикуют свой словарный запас. Авторы Лин и Мубарок (2021) обнаружили, что чат-бот, который руководствуется интеллект-картой, более успешно поддерживает студентов, предоставляя подмости во время изучения языка, чем обычный чат-бот с искусственным интеллектом.
Недавняя работа в области медицинского образования Kung et al. (2022) исследовали эффективность ChatGPT на экзамене на получение медицинской лицензии в США. Согласно результатам оценки, производительность ChatGPT в этом тесте была на пороге прохождения или близка к нему без какой-либо тонкой настройки домена. Основываясь на этих результатах, авторы утверждают, что большие языковые модели могут быть мощным инструментом, помогающим медицинскому образованию и, в конечном итоге, процессам принятия клинических решений ( Kung et al., 2022 ).
2.2 . Исследовательские работы, затрагивающие точку зрения учителей
Поскольку темпы внедрения ИИ в образовании по-прежнему низкие по сравнению с другими областями, такими как промышленные приложения (например, финансы, электронная коммерция, автомобилестроение) или медицина, меньше исследований, посвященных использованию больших языковых моделей в образовании ( Salas -Пилко и др., 2022 г. ). Недавний обзор возможностей и проблем чат-ботов в образовании показал, что исследования, связанные с чат-ботами в образовании, все еще находятся на ранней стадии, и мало эмпирических исследований, посвященных использованию эффективных учебных планов или стратегий обучения (Hwang & Chang, 2021 ) . Поэтому мы сначала обсудим взгляды учителей на ИИ и аналитику обучения в образовании, а затем перенесем их в гораздо более новую область больших языковых моделей.
С этой точки зрения, пилотное исследование с участием европейских учителей указывает на положительное отношение к ИИ в образовании и высокую мотивацию к внедрению контента, связанного с ИИ, в школу. В целом учителя, участвовавшие в исследовании, имели базовый уровень цифровых навыков, но низкий уровень навыков, связанных с ИИ ( Полак и др., 2022 ). В другом исследовании с нигерийскими учителями подчеркивалось, что желание и готовность учителей продвигать ИИ являются ключевыми предпосылками для интеграции технологий на основе ИИ в образование ( Ayanwale et al., 2022 ). В том же духе результаты исследования учителей из Южной Кореи показывают, что учителя с конструктивистскими убеждениями с большей вероятностью будут интегрировать образовательные инструменты на основе ИИ, чем учителя с трансмиссивной ориентацией (Choi et al., 2023) .). Кроме того, воспринимаемая полезность, воспринимаемая простота использования и предполагаемое доверие к этим инструментам на основе ИИ являются определяющими факторами, которые следует учитывать при прогнозировании их принятия учителями. Аналогичные результаты, касающиеся отношения учителей к чат-ботам в образовании, были получены в Chocarro et al. (2021) : восприятие чат-бота с искусственным интеллектом как простого в использовании и полезного приводит к большему признанию чат-бота. Что касается функций чат-ботов, формальный язык чат-бота приводит к более высокому намерению его использовать.
Поскольку кажется, что взгляды учителей на общее использование ИИ в образовании имеют много общего с упомянутым отношением, в частности, к чат-ботам, ответственная интеграция ИИ в образование с привлечением опыта различных сообществ имеет решающее значение (Fadel et al . , 2019 ).
Недавние работы, посвященные использованию больших языковых моделей с точки зрения учителя, были сосредоточены на автоматизированной оценке ответов учащихся, адаптивной обратной связи и создании учебного контента.
Например, недавняя работа Moore et al. (2022) использовали доработанную модель GPT-3 для оценки ответов учащихся в учебной среде для обучения химии ( Moore et al., 2022 ). Авторы утверждают, что большие языковые модели могут (особенно при точной настройке для конкретной области) быть мощным инструментом, помогающим учителям в качественной и педагогической оценке ответов учащихся ( Moore et al., 2022 ). Кроме того, в следующих исследованиях изучались основанные на НЛП модели создания автоматической адаптивной обратной связи: Zhu et al. (2020)изучили систему обратной связи на основе ИИ, включающую автоматизированные технологии подсчета очков, в контексте задачи климатической деятельности средней школы. Результаты показывают, что обратная связь помогла студентам пересмотреть свои научные аргументы. Сайлер и др. (2023) использовали адаптивную обратную связь на основе НЛП в контексте диагностики трудностей обучения учащихся в педагогическом образовании. В своем экспериментальном исследовании они обнаружили, что преподаватели до начала работы, получившие адаптивную обратную связь, лучше смогли обосновать свой диагноз, чем будущие учителя, получившие статическую обратную связь. Берниус и др. (2022) использовали модели на основе НЛП для создания обратной связи для текстовых ответов учащихся на больших курсах, где усилия по оцениванию могут быть сокращены до 85 % с высокой точностью и улучшенным качеством, воспринимаемым учащимися.
Большие языковые модели могут не только поддерживать оценку решений учащихся, но и помогать в автоматическом создании упражнений. Используя метод обучения с несколькими выстрелами, Sarsa et al. (2022) показали, что модель OpenAI Codex способна предоставить множество задач программирования вместе с правильным решением, автоматическими тестами для проверки решений учащегося и дополнительными пояснениями кода. Что касается проверки фактических знаний в целом, Qu et al. (2021)предложил структуру для автоматического создания пар вопрос-ответ. Это можно использовать при создании учебных материалов, например, для задач на понимание прочитанного. Помимо генерации правильного ответа, модели-трансформеры также могут создавать отвлекающие ответы, необходимые для создания вопросников с несколькими вариантами ответов ( Raina & Gales, 2022 ; Rodriguez-Torrealba et al., 2022 ). В нескольких работах, посвященных внедрению языковых моделей в математическое образование, обсуждается автоматическое создание математических текстовых задач ( Shen et al., 2021 ; Wang et al., 2021 ; Yu et al., 2021 ), которое сочетает в себе задачу понимания уравнений и их формулирования. в соответствующий контекст.
Наконец, в другой недавней работе ( Tack & Piech, 2022 ) исследовалась способность современных диалоговых агентов адекватно отвечать учащемуся в образовательном диалоге. Обе модели, использованные в этой работе (Blender и GPT-3), были способны адекватно отвечать ученику и генерировать диалоги, создающие впечатление, что эти модели понимают ученика (в частности, Blender). Однако они значительно отстают от человека, когда дело доходит до помощи ученику ( Tack & Piech, 2022 ), что подчеркивает необходимость дальнейших исследований.
2.3 . Неизвестные неизвестные
С точки зрения образования все еще существует много пробелов в знаниях и неопределенностей, когда речь идет об успешной и ответственной интеграции больших языковых моделей в процессы обучения и преподавания. В частности, адаптация моделей к конкретным потребностям, устранение предубеждений в конкретных случаях использования, рассмотрение этических соображений и вопросов авторского права требуют междисциплинарных научно-обоснованных исследований и оценок. В то время как большие языковые модели могут генерировать вопросы с несколькими вариантами ответов, создавать текст из маркированных списков и скаффолдное обучение, ясно, что они могут служить только вспомогательными инструментами для учащихся и преподавателей и не могут заменить учителя.
3 . Возможности инновационных образовательных технологий
В перспективе большие языковые модели могут значительно улучшить цифровые экосистемы для образования, такие как среды, основанные на дополненной реальности (AR), виртуальной реальности (VR) ( Ahuja et al., 2023 ; Gao et al., 2021 ; Rojas- Санчес и др., 2022 г.) и другие связанные цифровые возможности. В частности, их можно использовать для усиления нескольких ключевых факторов, имеющих решающее значение для иммерсивного взаимодействия пользователей с цифровым контентом. Например, большие языковые модели могут значительно улучшить возможности обработки и понимания естественного языка в системе AR/VR, чтобы обеспечить эффективную естественную коммуникацию и взаимодействие между пользователями и системой (например, виртуальный учитель или виртуальные сверстники). Последнее было определено на раннем этапе как ключевой аспект удобства использования иммерсивных образовательных технологий ( Руссоу, 2001 ) и в целом рассматривается как ключевой фактор для улучшения взаимодействия между людьми и системами ИИ ( Гузман и Льюис, 2020 ).
Большие языковые модели также можно использовать для разработки более естественных и сложных пользовательских интерфейсов, используя их способность генерировать контекстуализированные, персонализированные и разнообразные ответы на вопросы, задаваемые пользователями на естественном языке. Кроме того, их способность отвечать на вопросы на естественном языке в различных областях может облегчить интеграцию различных цифровых приложений в единую структуру или приложение, что также имеет решающее значение для расширения границ образовательных возможностей и опыта (Ahuja et al., 2023 ; Kerr & Лоусон, 2020 ).
В целом способность этих моделей генерировать контекстуализированные тексты на естественном языке, код для различных задач реализации ( Becker et al., 2022 ), а также различные типы мультимедийного контента (например, в сочетании с другими системами ИИ, такими как DALL- E ( Ramesh et al., 2021 )) может позволить и масштабировать создание привлекательных и захватывающих цифровых (например, AR / VR) впечатлений. От геймификации до подробных симуляций для иммерсивного обучения в цифровой среде — большие языковые модели являются ключевой технологией. Однако для полной реализации этого потенциала важно учитывать не только технические аспекты, но и этические, правовые, экологические и социальные последствия.
В следующем разделе мы кратко рассмотрим риски, связанные с применением больших языковых моделей в образовании, и предложим соответствующие стратегии их снижения.
4 . Ключевые вызовы и риски, связанные с применением больших языковых моделей в образовании
4.1 . Вопросы авторского права
Когда мы обучаем большие языковые модели задаче создания образовательного контента — программы курса, викторины, научной статьи — мода должна обучаться на примерах таких текстов. Во время генерации новой подсказки ответ может содержать полное предложение или даже абзац из обучающего набора, что приводит к проблемам с авторскими правами и плагиатом .
Важными шагами для ответственного решения такой проблемы могут быть следующие:
- •Прозрачный запрос у авторов исходных документов (т. е. цель и политика использования данных) разрешения на использование их контента для обучения модели.
- •Соблюдение условий авторского права на контент с открытым исходным кодом
- •Наследование и подробные условия использования контента, созданного моделью
- •Информирование и повышение осведомленности пользователей об этих политиках.
4.2 . Предвзятость и справедливость
Большие языковые модели могут увековечивать и усиливать существующие в обществе предубеждения и несправедливость, что может негативно сказаться на процессах и результатах преподавания и обучения. Например, если модель обучается на данных, предвзятых в отношении определенных групп людей, она может давать результаты, которые будут несправедливыми или дискриминационными по отношению к этим группам (например, местные знания о меньшинствах, таких как малые этнические группы или культуры, могут отойти на задний план). ). Таким образом, важно убедиться, что обучающие данные или данные, используемые для тонкой настройки последующих задач модели, разнообразны и репрезентативны для разных групп людей. Регулярный мониторинг и проверка эффективности модели на различных группах людей могут помочь выявить и устранить любые предубеждения на раннем этапе. Следовательно,
В частности, ответственная стратегия смягчения последствий будет сосредоточена на следующих ключевых аспектах:
- •Разнообразный набор данных для обучения или тонкой настройки модели, чтобы убедиться, что она не предвзято относится к какой-либо конкретной группе.
- •Регулярный мониторинг и оценка эффективности модели (на разных группах людей) для выявления и устранения любых предубеждений, которые могут возникнуть.
- •Меры справедливости и методы коррекции предвзятости, такие как методы предварительной или последующей обработки.
- •Механизмы прозрачности, которые позволяют пользователям понимать выходные данные модели, а также данные и предположения, которые использовались для ее создания.
- •Профессиональное обучение и ресурсы для преподавателей о том, как распознавать и устранять потенциальные предубеждения и другие сбои в результатах модели.
- •Непрерывное обновление модели разнообразными объективными данными и наблюдение экспертов для проверки результатов.
4.3 . Учащиеся могут слишком сильно полагаться на модель
Легко генерируемая информация может негативно повлиять на их критическое мышление и навыки решения проблем. Это связано с тем, что модель упрощает получение ответов или информации, что может усиливать лень и противодействовать заинтересованности учащихся в проведении собственных исследований и приходе к собственным выводам или решениям.
Чтобы столкнуться с этим риском, важно осознавать ограничения больших языковых моделей и использовать их только в качестве инструмента для поддержки и улучшения обучения ( Павлик, 2023 ), а не в качестве замены человеческих авторитетов и других авторитетных источников. Таким образом, ответственная стратегия смягчения последствий будет сосредоточена на следующих ключевых аспектах:
- •Повышение осведомленности об ограничениях и неожиданной уязвимости больших языковых моделей и систем ИИ в целом (т. е. экспериментирование с моделью для построения собственного понимания работы и ограничений)
- •Использование языковых моделей для выдвижения гипотез и изучения различных точек зрения, а не просто для получения ответов
- •Стратегии использования других образовательных ресурсов (например, книг, статей) и других авторитетных источников для оценки и подтверждения фактической правильности информации, предоставленной моделью (т. е. поощрения учащихся подвергать сомнению сгенерированный контент)
- •Включение критического мышления и действий по решению проблем в учебную программу, чтобы помочь учащимся развить эти навыки.
- •Привлечение человеческого опыта и учителей для проверки, проверки и объяснения информации, предоставляемой моделью.
Важно отметить, что использование больших языковых моделей должно быть интегрировано в учебную программу таким образом, чтобы дополнять и улучшать учебный процесс, а не заменять его.
4.4 . Учителя могут стать слишком зависимыми от моделей
Использование больших языковых моделей может предоставить точную и актуальную информацию, но они не могут заменить креативность, критическое мышление и навыки решения проблем, которые развиваются в результате обучения человека. Поэтому для учителей важно использовать эти модели в качестве дополнения к своему обучению, а не замены. Таким образом, решающими аспектами снижения риска чрезмерной зависимости от больших языковых моделей являются:
- •Использование языковых моделей только в качестве дополнительного дополнения к генерации инструкций
- •Непрерывное обучение и профессиональное развитие учителей, позволяющее им быть в курсе передового опыта использования языковых моделей в классе для выявления и развития творчества и критического мышления.
- •Критическое мышление и деятельность по решению проблем с помощью цифровых технологий как неотъемлемой части учебной программы, чтобы гарантировать, что учащиеся развивают эти навыки.
- •Вовлечение студентов в творческие и самостоятельные проекты, которые позволяют им развивать собственные идеи и решения
- •Мониторинг и оценка использования языковых моделей в классе, чтобы убедиться, что они используются эффективно и не оказывают негативного влияния на обучение учащихся.
- •Стимулы для учителей и школ для разработки (инклюзивных, совместных и персонализированных) стратегий обучения на основе больших языковых моделей и вовлечения учащихся в процессы решения проблем, такие как поиск и оценка информации, относящейся к курсу / заданию, с использованием моделей и других источников.
4.5 . Недостаток понимания и опыта
Многие преподаватели и образовательные учреждения могут не обладать знаниями или опытом для эффективной интеграции новых технологий в свое обучение ( Redecker et al., 2017 ). Это особенно относится к использованию и интеграции больших языковых моделей в педагогическую практику. Теория образования уже давно предложила способы интеграции новых инструментов в образовательную практику (например, Salomon, 1993 ). Как и в случае любых других технологических инноваций, интеграция больших языковых моделей в эффективную педагогическую практику требует понимания их возможностей и ограничений, а также того, как их эффективно использовать для дополнения или улучшения конкретных процессов обучения.
Есть несколько способов решить эти проблемы и столкнуться с этим риском:
- •Исследование проблем больших языковых моделей в образовании путем изучения существующих образовательных моделей интеграции технологий, процессов обучения студентов и переноса их в контекст больших языковых моделей, а также разработки новой образовательной теории специально для контекста больших языковых моделей
- •Оценка потребностей преподавателей и учащихся и предоставление рекомендаций на основе конкретных случаев (например, для безопасного этического использования больших языковых моделей в образовательных сценариях)
- •Ориентированное на спрос обучение и возможности профессионального развития для преподавателей и учреждений, чтобы узнать о возможностях и потенциальном использовании больших языковых моделей в образовании, а также предоставить передовой опыт для их интеграции в свои методы обучения.
- •Открытые образовательные ресурсы (например, учебные пособия, исследования, примеры использования и т. д.) и рекомендации для преподавателей и учреждений по доступу и изучению использования языковых моделей в образовании.
- •Стимулы для сотрудничества и создания сообществ (например, профессиональных учебных сообществ) среди преподавателей и учреждений, которые уже используют языковые модели в своей педагогической практике, чтобы они могли делиться своими знаниями и опытом с другими.
- •Регулярный анализ и обратная связь по использованию языковых моделей для обеспечения их эффективного использования и внесения корректировок по мере необходимости.
4.6 . Сложно отличить ответы, сгенерированные моделью, от ответов, сгенерированных учащимися.
Становится все труднее отличить текст, созданный человеком или машиной, что создает дополнительную серьезную проблему для учителей и педагогов ( Cotton et al., 2023 ; Elkins & Chun, 2020 ; Gao et al., 2022 ; Nassim, 2021 ). В результате Департамент образования Нью-Йорка недавно запретил использование ChatGPT в школьных устройствах и сетях ( Новости, 2023 г. ).
Совсем недавно Коттон и др. (2023) предложили несколько стратегий для обнаружения работы, созданной большими языковыми моделями, в частности ChatGPT. Кроме того, такие инструменты, как недавно выпущенный GPTZero ( Tian, 2023 ), который использует недоумение как меру, намекающую на возможности обобщения (агента, которым был написан текст), для обнаружения участия ИИ в написании текста, ожидается дополнительная поддержка. Более продвинутые методы направлены на нанесение водяных знаков на контент, созданный языковыми моделями ( Gu et al., 2022 ; Kirchenbauer et al., 2023).), например, путем смещения генерации контента в сторону терминов, которые вряд ли будут совместно использоваться людьми в отрывке текста. Однако в долгосрочной перспективе мы считаем, что ключом к решению этой проблемы станет разработка учебных программ и инструкций, поощряющих творческое и научно обоснованное использование больших языковых моделей. Следовательно, разумная стратегия снижения этого риска должна быть сосредоточена на:
- •Исследование прозрачности, методов объяснения и анализа и мер, позволяющих отличить текст, созданный компьютером, от текста, созданного человеком.
- •Стимулы и поддержка разработки учебных программ и инструкций, требующих творческого и дополнительного использования больших языковых моделей.
4.7 . Стоимость обучения и обслуживания
Поддержка больших языковых моделей может стать финансовым бременем для школ и учебных заведений, особенно с ограниченным бюджетом. Отправной точкой для решения этой проблемы может служить использование предварительно обученных моделей и облачных технологий в сочетании с совместными схемами использования в партнерстве с учреждениями и компаниями. В частности, стратегия снижения этого риска должна быть сосредоточена на следующих аспектах:
- •Использование предварительно обученных моделей с открытым исходным кодом, которые можно тонко настроить под конкретные задачи.
- •Развитие и изучение партнерских отношений с частными компаниями, исследовательскими институтами, а также государственными и некоммерческими организациями, которые могут предоставить финансовую поддержку, ресурсы и опыт для поддержки использования больших языковых моделей в образовании.
- •Общие затраты и совместное использование масштабируемых (например, облачных) вычислительных услуг, которые обеспечивают доступ к мощным вычислительным ресурсам по низкой цене.
- •Использование модели в первую очередь для высокоценных образовательных задач, таких как предоставление учащимся персонализированного и целевого учебного опыта (т. е. присвоение более низкого приоритета малоценным задачам)
- •Исследование и разработка методов сжатия, дистилляции и обрезки для уменьшения размера модели, данных и требуемых вычислительных ресурсов.
4.8 . Конфиденциальность и безопасность данных
Использование больших языковых моделей в образовании вызывает опасения по поводу конфиденциальности и безопасности данных, поскольку данные учащихся часто являются конфиденциальными и личными. Это может включать опасения по поводу утечки данных, несанкционированного доступа к данным учащихся и использования данных учащихся в целях, отличных от образования.
Вот некоторые конкретные области, в которых необходимо смягчить проблемы с конфиденциальностью и безопасностью при использовании больших языковых моделей в образовании:
- •Разработка и внедрение надежных политик конфиденциальности и безопасности данных, которые четко описывают сбор, хранение и использование данных учащихся в соответствии с нормативными актами (например, GDPR , HIPAA, FERPA) и этическими стандартами.
- •Прозрачность по отношению к учащимся и их семьям методов сбора, хранения и использования данных с обязательным получением согласия перед сбором и использованием данных
- •Современные технологии и меры по защите собранных данных от несанкционированного доступа, взломов или неэтичного использования (например, анонимизированные данные и защищенная инфраструктура с современными средствами шифрования, объединения, аналитики с сохранением конфиденциальности и т. д.)
- •Регулярные проверки мер по обеспечению конфиденциальности и безопасности данных для выявления и устранения любых потенциальных уязвимостей или областей, нуждающихся в улучшении.
- •План реагирования на инциденты для быстрого реагирования и смягчения последствий любых утечек данных или несанкционированного доступа к данным.
- •Обучение и осведомленность персонала, т. е. преподавателей и студентов, о политиках конфиденциальности и безопасности данных, правилах, этических проблемах и передовых методах обработки связанных рисков и сообщения о них.
4.9 . Устойчивое использование
Большие языковые модели требуют больших вычислительных ресурсов, что может привести к высокому энергопотреблению. Следовательно, энергоэффективное оборудование и общая (например, облачная) инфраструктура, основанная на возобновляемых источниках энергии, имеют решающее значение для их экологически устойчивой работы и масштабирования, необходимого в контексте образования.
Для обучения и обновления моделей следует учитывать только те данные, которые были собраны и аннотированы в соответствии с нормативными требованиями и этическими нормами. Следовательно, основы управления, включающие политики, процедуры и средства контроля, обеспечивающие такое надлежащее использование таких моделей, являются ключом к их успешному внедрению.
Аналогичным образом, для надежного и ответственного использования моделей в долгосрочной перспективе необходимы прозрачность, устранение предвзятости и постоянный мониторинг.
Таким образом, стратегия снижения этого риска будет включать:
- •Энергоэффективное оборудование и общая инфраструктура на основе возобновляемых источников энергии, а также исследования по снижению затрат на обучение и обслуживание (т. е. эффективные алгоритмы, представление и хранение)
- •Сбор, аннотирование, хранение и обработка данных в соответствии с нормативными требованиями и этическими нормами.
- •Методы прозрачности и объяснения для выявления и смягчения предубеждений и предотвращения несправедливости
- •Структуры управления, которые включают политики, процедуры и средства контроля для обеспечения вышеуказанных пунктов и надлежащего использования в образовании.
4.10 . Стоимость проверки информации и поддержания целостности
Важно проверить информацию, предоставленную моделью, обратившись к внешним авторитетным источникам, чтобы обеспечить точность и достоверность. Кроме того, могут быть финансовые затраты, связанные с поддержанием и обновлением модели, чтобы гарантировать, что она предоставляет точную актуальную информацию.
Ответственная стратегия снижения этого риска должна учитывать следующие ключевые аспекты:
- •Регулярно обновляет модель новой и точной информацией, чтобы гарантировать, что она предоставляет актуальную и точную информацию.
- •Использование нескольких авторитетных источников для проверки информации, предоставляемой моделью, для обеспечения правильности и целостности.
- •Использование модели в сочетании с человеческим опытом, например учителями или профильными экспертами, которые просматривают и подтверждают информацию, предоставленную моделью.
- •Разработка протокола и стандартов для проверки фактов и подтверждения информации, предоставленной моделью
- •Предоставьте четкую и прозрачную информацию о производительности модели, о том, на что она способна или не способна, и в каких условиях она работает.
- •Обучение и ресурсы для преподавателей и учащихся о том, как использовать модель, интерпретировать ее результаты и оценивать предоставленную информацию.
- •Регулярный обзор и оценка модели с прозрачной отчетностью о производительности модели, т. е. о том, на что она способна или не способна, и определение условий, при которых могут возникнуть неточности или другие проблемы.
4.11 . Трудно отличить реальные знания от убедительно написанных, но непроверенных результатов модели.
Способность больших языковых моделей генерировать человекоподобный текст может затруднить учащимся различение реальных знаний и непроверенной информации. Это может привести к тому, что учащиеся примут ложную или вводящую в заблуждение информацию за истинную, не подвергая сомнению ее достоверность.
Чтобы снизить этот риск, в дополнение к вышеупомянутой стратегии снижения риска, связанной с проверкой и целостностью, важно обеспечить обучение тому, как информация может быть оценена критически, и научить студентов стратегиям исследования, исследования, проверки и подтверждения.
4.12 . Отсутствие адаптивности
Большие языковые модели не способны адаптироваться к разнообразным потребностям учащихся и преподавателей и могут быть не в состоянии обеспечить уровень персонализации, необходимый для эффективного обучения. Это ограничение текущей технологии, но вполне возможно, что с более продвинутыми моделями адаптивность возрастет.
В частности, разумная стратегия смягчения последствий будет состоять из:
- •Использование технологий адаптивного обучения для персонализации выходных данных модели в соответствии с потребностями отдельных учащихся с использованием данных учащихся (например, о стиле обучения, предшествующих знаниях, успеваемости и т. д.)
- •Настройка выходных данных языковой модели в соответствии со стилем преподавания и учебным планом (с использованием данных, предоставленных учителем)
- •Использование мультимодальных подходов к обучению и преподаванию, которые сочетают в себе текст, аудио, видео и эксперименты, чтобы обеспечить более увлекательный и персонализированный опыт для учащихся и учителей.
- •Использование гибридных подходов, которые сочетают сильные стороны как учителей-людей, так и языковых моделей для создания целевых и персонализированных учебных материалов (на основе отзывов, рекомендаций и поддержки со стороны учителей)
- •Регулярный пересмотр модели и постоянное улучшение вариантов использования, связанных с учебной программой, для обеспечения адекватного и точного функционирования в образовательных целях.
- •Исследования и разработки для создания более совершенных моделей, которые могут лучше адаптироваться к разнообразным потребностям учащихся и преподавателей.
5 . Дополнительные проблемы, связанные с пользовательскими интерфейсами и справедливым доступом
5.1 . Соответствующие пользовательские интерфейсы
Для интеграции больших языковых моделей в образовательные рабочие процессы необходимы дальнейшие исследования взаимодействия человека с компьютером и дизайна пользовательского интерфейса.
В этой работе мы обсудили несколько возможных вариантов использования для учащихся разного возраста — от детей до взрослых. При создании таких помощников на основе ИИ следует учитывать степень психологической зрелости, мелкой моторики и технических возможностей потенциальных пользователей. Таким образом, пользовательский интерфейс должен соответствовать задаче, но также может иметь различную степень имитации человека — например, для детей может быть лучше скрыть артефакты машин в сгенерированном тексте и максимально использовать геймифицированные подходы к взаимодействию и обучению, чтобы чтобы обеспечить гладкое и увлекательное взаимодействие с такими технологиями, в то время как для учащихся старшего возраста машинный контент может использоваться для развития навыков решения проблем, критического мышления и проверки фактов.
В целом, дизайн пользовательских интерфейсов для помощи и инструментов обучения на основе ИИ должен способствовать развитию навыков обучения и решения проблем в 21 веке ( Kuhlthau et al., 2015 ), особенно критического мышления, творчества, общения и сотрудничества. для которых необходимы дальнейшие доказательные исследования. В этом контексте решающим аспектом является соответствующая интеграция помощи на основе ИИ, связанная с возрастом и фоном, чтобы максимизировать ее преимущества и свести к минимуму любые потенциальные недостатки.
5.2 . Многоязычие и справедливый доступ
Хотя большая часть исследований в области больших языковых моделей проводится для английского языка, в этой области все еще существует пробел в исследованиях других языков. Это потенциально может сделать обучение англоязычных пользователей проще и эффективнее, чем для других пользователей, что приведет к несправедливому доступу к таким образовательным технологиям для неанглоязычных пользователей. Несмотря на усилия различных исследовательских сообществ по обеспечению справедливости многоязычия для технологий ИИ, еще многое предстоит сделать.
Наконец, несправедливость, связанная с финансовыми средствами для доступа, обучения и обслуживания больших языковых моделей, возможно, должна регулироваться государственными организациями с целью предоставления средств, ориентированных на справедливость, всем образовательным учреждениям, заинтересованным в использовании этих современных технологий. Без справедливого доступа эта технология ИИ может серьезно увеличить разрыв в образовании, как никакая другая технология до нее.
Поэтому мы заканчиваем призывом ЮНЕСКО обеспечить, чтобы ИИ не увеличивал технологический и образовательный разрыв внутри стран и между ними, и рекомендовали важные стратегии ответственного и справедливого использования ИИ для сокращения этого существующего разрыва. В соответствии с Повесткой дня ЮНЕСКО в области образования на период до 2030 г. ( ЮНЕСКО, 2023 г. ): « Мандат ЮНЕСКО по своей сути требует применения ориентированного на человека подхода к ИИ. Он направлен на то, чтобы перевести разговор на роль ИИ в устранении существующего неравенства .в отношении доступа к знаниям, исследованиям и разнообразию форм культурного самовыражения, а также для обеспечения того, чтобы ИИ не увеличивал технологический разрыв внутри стран и между ними. Обещание «ИИ для всех» должно заключаться в том, что каждый может воспользоваться преимуществами происходящей технологической революции и получить доступ к ее плодам, особенно с точки зрения инноваций и знаний ».
6 . Заключительные замечания
Использование больших языковых моделей в образовании является многообещающей областью исследований, которая предлагает множество возможностей для повышения качества обучения учащихся и поддержки работы учителей. Однако, чтобы полностью раскрыть их потенциал для образования, крайне важно подходить к использованию этих моделей с осторожностью и критически оценивать их ограничения и потенциальные отклонения. Таким образом, интеграция больших языковых моделей в образование должна соответствовать строгим требованиям конфиденциальности, безопасности и — для устойчивого масштабирования — экологическим, нормативным и этическим требованиям и должна осуществляться в сочетании с постоянным человеческим контролем, руководством и критическим мышлением.
Хотя этот комментарий отражает оптимизм авторов в отношении возможностей больших языковых моделей как преобразующей технологии в образовании, он также подчеркивает необходимость дальнейших исследований для изучения передового опыта интеграции больших языковых моделей в образование и снижения выявленных рисков.
Мы считаем, что, несмотря на многие трудности и проблемы, обсуждаемые риски управляемы и должны быть устранены, чтобы обеспечить надежный и справедливый доступ к большим языковым моделям для образования. Для достижения этой цели стратегии смягчения последствий, предложенные в этом комментарии, могут служить отправной точкой.
Заявление об авторском вкладе CRediT
Энкелейда Каснеджи: Концептуализация, методология, написание — первоначальный проект. Кэтрин Сесслер: Написание – рецензирование и редактирование. Стефан Кюхеманн: Написание – рецензирование и редактирование. Мария Баннерт: Написание – рецензирование и редактирование. Дарина Дементьева: Написание – рецензирование и редактирование. Фрэнк Фишер: Написание – рецензирование и редактирование. Урс Гассер: Написание – рецензирование и редактирование. Георг Грох: Написание – рецензирование и редактирование. Стефан Гюннеманн: Написание – рецензирование и редактирование. Эйке Хюллермайер: Написание – рецензирование и редактирование. Стефа Круше: Написание – рецензирование и редактирование. Гитта Кутинёк:Написание – обзор и редактирование. Тилман Михаэли: Написание – рецензирование и редактирование. Клаудия Нердель: Написание – рецензирование и редактирование. Юрген Пфеффер: Написание – рецензирование и редактирование. Александра Поке: Написание – рецензирование и редактирование. Майкл Сайлер: Написание – рецензирование и редактирование. Альбрехт Шмидт: Написание — обзор и редактирование. Тина Зайдель: Написание – рецензирование и редактирование. Матиас Стадлер: Написание – рецензирование и редактирование. Йохен Веллер: Написание – рецензирование и редактирование. Йохен Кун: Написание – рецензирование и редактирование. Гьерджи Каснечи: концептуализация, методология, написание — первоначальный проект.
References
- Abdelghani et al., 2022R. Abdelghani, Y.-H. Wang, X. Yuan, T. Wang, H. Sauzéon, P.-Y. OudeyerGPT-3-driven pedagogical agents for training children’s curious question-asking skillsarXiv (2022)preprint arXiv:2211.14228Google Scholar
- Ahuja et al., 2023A.S. Ahuja, B.W. Polascik, D. Doddapaneni, E.S. Byrnes, J. SridharThe digital metaverse: Applications in artificial intelligence, medical education, and integrative healthIntegrative Medicine Research, 12 (1) (2023), Article 100917View PDFView articleView in ScopusGoogle Scholar
- Ayanwale et al., 2022M.A. Ayanwale, I.T. Sanusi, O.P. Adelana, K.D. Aruleba, S.S. OyelereTeachers’ readiness and intention to teach artificial intelligence in schoolsComputers and Education: Artificial Intelligence, 3 (2022), Article 100099View PDFView articleView in ScopusGoogle Scholar
- Bao, 2019M. BaoCan home use of speech-enabled artificial intelligence mitigate foreign language anxiety–investigation of a conceptArab World English Journal (AWEJ) (Special Issue on CALL) (2019), p. 5Google Scholar
- Becker et al., 2022B.A. Becker, P. Denny, J. Finnie-Ansley, A. Luxton-Reilly, J. Prather, E.A. SantosProgramming is hard–or at least it used to be: Educational opportunities and challenges of ai code generationarXiv (2022)preprint arXiv:2212.01020Google Scholar
- Bernius et al., 2022J.P. Bernius, S. Krusche, B. BrueggeMachine learning based feedback on textual student answers in large courses. Computers and educationArtificial Intelligence, 3 (2022)Google Scholar
- Bhat et al., 2022S. Bhat, H.A. Nguyen, S. Moore, J. Stamper, M. Sakr, E. NybergTowards automated generation and evaluation of questions in educational domainsProceedings of the 15th international conference on educational data mining, International Educational Data Mining Society, Durham, United Kingdom (2022), pp. 701-704View in ScopusGoogle Scholar
- Borisov et al., 2022V. Borisov, K. Seßler, T. Leemann, M. Pawelczyk, G. KasneciLanguage models are realistic tabular data generatorsarXiv (2022)preprint arXiv:2210.06280Google Scholar
- Brown et al., 2020T. Brown, B. Mann, N. Ryder, M. Subbiah, J.D. Kaplan, P. Dhariwal, A. Neelakantan, P. Shyam, G. Sastry, A. Askell, et al.Language models are few-shot learnersAdvances in Neural Information Processing Systems, 33 (2020), pp. 1877-1901Google Scholar
- Chocarro et al., 2021R. Chocarro, M. Cortiñas, G. Marcos-MatásTeachers’ attitudes towards chatbots in education: A technology acceptance model approach considering the effect of social language, bot proactiveness, and users’ characteristicsEducational Studies (2021), pp. 1-19View in ScopusGoogle Scholar
- Choi et al., 2023S. Choi, Y. Jang, H. KimInfluence of pedagogical beliefs and perceived trust on teachers’ acceptance of educational artificial intelligence toolsInternational Journal of Human-Computer Interaction, 39 (4) (2023), pp. 910-922View article CrossRefView in ScopusGoogle Scholar
- Cotton et al., 2023D.R. Cotton, P.A. Cotton, J. ShipwayChatting and cheatingEnsuring academic integrity in the era of ChatGPT, EdArXiv (2023)Google Scholar
- Devlin et al., 2018J. Devlin, M.-W. Chang, K. Lee, K. ToutanovaBERT: Pre-training of deep bidirectional transformers for language understandingarXiv (2018)preprint arXiv:1810.04805Google Scholar
- Dijkstra et al., 2022R. Dijkstra, Z. Genç, S. Kayal, J. KampsReading comprehension quiz generation using generative pre-trained transformers(2022)https://e.humanities.uva.nl/publications/2022/dijk_read22.pdfGoogle Scholar
- El Shazly, 2021R. El ShazlyEffects of artificial intelligence on english speaking anxiety and speaking performance: A case studyExpert Systems, 38 (3) (2021), Article e12667View in ScopusGoogle Scholar
- Elkins and Chun, 2020K. Elkins, J. ChunCan GPT-3 pass a writer’s turing test?Journal of Cultural Analytics, 5 (2020), p. 17212View in ScopusGoogle Scholar
- Fadel et al., 2019C. Fadel, W. Holmes, M. BialikArtificial intelligence in education: Promises and implications for teaching and learningThe Center for Curriculum Redesign (2019)Google Scholar
- Floridi and Chiriatti, 2020L. Floridi, M. ChiriattiGPT-3: Its nature, scope, limits, and consequencesMinds and Machines, 30 (4) (2020), pp. 681-694 View PDF This article is free to access.CrossRefView in ScopusGoogle Scholar
- Gabajiwala et al., 2022E. Gabajiwala, P. Mehta, R. Singh, R. KoshyQuiz maker: Automatic quiz generation from text using NLPFuturistic trends in networks and computing technologies, Springer, Singapore (2022), pp. 523-533View article CrossRefView in ScopusGoogle Scholar
- Gao et al., 2022C.A. Gao, F.M. Howard, N.S. Markov, E.C. Dyer, S. Ramesh, Y. Luo, A.T. PearsonComparing scientific abstracts generated by ChatGPT to original abstracts using an artificial intelligence output detector, plagiarism detector, and blinded human reviewersbioRxiv (2022)Google Scholar
- Gao et al., 2021H. Gao, E. Bozkir, L. Hasenbein, J.-U. Hahn, R. Göllner, E. KasneciDigital transformations of classrooms in virtual realityProceedings of the 2021 CHI conference on human factors in computing systems (2021), pp. 1-10Google Scholar
- Gu et al., 2022C. Gu, C. Huang, X. Zheng, K.-W. Chang, C.-J. HsiehWatermarking pre-trained language models with backdooringarXiv (2022)preprint arXiv:2210.07543Google Scholar
- Guzman and Lewis, 2020A.L. Guzman, S.C. LewisArtificial intelligence and communication: A human–machine communication research agendaNew Media & Society, 22 (1) (2020), pp. 70-86View article CrossRefView in ScopusGoogle Scholar
- Hwang and Chang, 2021G.-J. Hwang, C.-Y. ChangA review of opportunities and challenges of chatbots in educationInteractive Learning Environments (2021), pp. 1-14View article CrossRefGoogle Scholar
- Jeon, 2021J. JeonChatbot-assisted dynamic assessment (ca-da) for l2 vocabulary learning and diagnosisComputer Assisted Language Learning (2021), pp. 1-27View article CrossRefGoogle Scholar
- Ji et al., 2022H. Ji, I. Han, Y. KoA systematic review of conversational ai in language education: Focusing on the collaboration with human teachersJournal of Research on Technology in Education (2022), pp. 1-16View article CrossRefView in ScopusGoogle Scholar
- Jia et al., 2021Q. Jia, J. Cui, Y. Xiao, C. Liu, P. Rashid, E.F. GehringerALL-IN-ONE: Multi-task learning BERT models for evaluating peer assessmentsInternational Educational Data Mining Society (2021)Google Scholar
- Kerr and Lawson, 2020J. Kerr, G. LawsonAugmented reality in design education: Landscape architecture studies as ar experienceInternational Journal of Art & Design Education, 39 (1) (2020), pp. 6-21 View PDF This article is free to access.CrossRefView in ScopusGoogle Scholar
- Kirchenbauer et al., 2023J. Kirchenbauer, J. Geiping, Y. Wen, J. Katz, I. Miers, T. GoldsteinA watermark for large language modelsarXiv (2023)preprint arXiv:2301.10226v1Google Scholar
- Kuhlthau et al., 2015C.C. Kuhlthau, L.K. Maniotes, A.K. CaspariGuided inquiry: Learning in the 21st century: Learning in the 21st centuryAbc-Clio (2015)Google Scholar
- Kung et al., 2022T.H. Kung, M. Cheatham, A. Medenilla, C. Sillos, L. De Leon, C. Elepano, M. Madriaga, R. Aggabao, G. Diaz-Candido, J. Maningo, V. TsengPerformance of ChatGPT on USMLE: Potential for AI-assisted medical education using large language modelsmedRxiv (2022)Google Scholar
- Lin and Mubarok, 2021C.-J. Lin, H. MubarokLearning analytics for investigating the mind map-guided AI chatbot approach in an efl flipped speaking classroomEducational Technology & Society, 24 (4) (2021), pp. 16-35View article CrossRefGoogle Scholar
- Liu et al., 2019Y. Liu, M. Ott, N. Goyal, J. Du, M. Joshi, D. Chen, O. Levy, M. Lewis, L. Zettlemoyer, V. StoyanovRoberta: A robustly optimized bert pretraining approacharXiv (2019)preprint arXiv:1907.11692Google Scholar
- MacNeil et al., 2022S. MacNeil, A. Tran, D. Mogil, S. Bernstein, E. Ross, Z. HuangGenerating diverse code explanations using the GPT-3 large language modelProceedings of the 2022 ACM conference on international computing education research — Volume 2, ICER ’22, page 37–39, New York, NY, USA, Association for Computing Machinery (2022)Google Scholar
- Magazine, 2022T.A.A.I. MagazineFreaky ChatGPT fails that caught our eyes!(2022)Accessed: 2023-01-22https://analyticsindiamag.com/freaky-chatgpt-fails-that-caught-our-eyes/Google Scholar
- Mengxiao Zhu and Lydia Liu, 2020O. Mengxiao Zhu, H.-S.L. Lydia LiuThe effect of automated feedback on revision behavior and learning gains in formative assessment of scientific argument writingComputers & Education, 143 (2020), Article 103668Google Scholar
- Min et al., 2021B. Min, H. Ross, E. Sulem, A.P.B. Veyseh, T.H. Nguyen, O. Sainz, E. Agirre, I. Heinz, D. RothRecent advances in natural language processing via large pre-trained language models: A surveyarXiv (2021)preprint arXiv:2111.01243Google Scholar
- Moore et al., 2022S. Moore, H.A. Nguyen, N. Bier, T. Domadia, J. StamperAssessing the quality of student-generated short answer questions using GPT-3Educating for a new future: Making sense of technology-enhanced learning adoption: 17th European conference on technology enhanced learning, EC-TEL 2022, Toulouse, France, September 12–16, 2022, Proceedings, Springer (2022), pp. 243-257View article CrossRefView in ScopusGoogle Scholar
- Nassim, 2021D. NassimPlagiarism in the age of massive generative pre-trained transformers (GPT-3)Ethics in Science and Environmental Politics, 21 (2021), pp. 17-23Google Scholar
- News, 2023K.R.N. NewsChatGPT banned from New York City public schools’ devices and networks(2023)https://nbcnews.to/3iTE0t6, Accessed 22nd Jan 2023Google Scholar
- Pavlik, 2023J.V. PavlikCollaborating with ChatGPT: Considering the implications of generative artificial intelligence for journalism and media educationJournalism & Mass Communication Educator, 78 (1) (2023), Article 10776958221149577Google Scholar
- Polak et al., 2022S. Polak, G. Schiavo, M. ZancanaroTeachers’ perspective on artificial intelligence education: An initial investigationExtended abstracts of the 2022 CHI conference on human factors in computing systems, CHI EA ’22, New York, NY, USA, Association for Computing Machinery (2022)Google Scholar
- Qu et al., 2021F. Qu, X. Jia, Y. WuAsking questions like educational experts: automatically generating question-answer pairs on real-world examination dataProceedings of the 2021 conference on empirical methods in natural language processing (2021), pp. 2583-2593 View PDF CrossRefView in ScopusGoogle Scholar
- Radford et al., 2018A. Radford, K. Narasimhan, T. Salimans, I. Sutskever, et al.Improving language understanding by generative pre-training(2018)Accessed: 2023-01-22Google Scholar
- Raffel et al., 2020C. Raffel, N. Shazeer, A. Roberts, K. Lee, S. Narang, M. Matena, Y. Zhou, W. Li, P.J. Liu, et al.Exploring the limits of transfer learning with a unified text-to-text transformerJournal of Machine Learning Research, 21 (140) (2020), pp. 1-67View in ScopusGoogle Scholar
- Raina and Gales, 2022V. Raina, M. GalesMultiple-choice question generation: towards an automated assessment frameworkarXiv (2022)preprint arXiv:2209.11830Google Scholar
- Ramesh et al., 2021A. Ramesh, M. Pavlov, G. Goh, S. Gray, C. Voss, …, A.Sutskever RadfordZero-shot text-to-image generationProceedings of the 38th International Conference on Machine Learning, 139, PMLR (2021), pp. 8821-8831Google Scholar
- Redecker et al., 2017C. Redecker, et al.European framework for the digital competence of educators: DigCompEduTechnical report, Joint Research Centre, Seville site (2017)Google Scholar
- Rodriguez-Torrealba et al., 2022R. Rodriguez-Torrealba, E. Garcia-Lopez, A. Garcia-CabotEnd-to-end generation of multiple-choice questions using text-to-text transfer transformer modelsExpert Systems with Applications, 208 (2022), Article 118258View PDFView articleView in ScopusGoogle Scholar
- Rojas-Sánchez et al., 2022M.A. Rojas-Sánchez, P.R. Palos-Sánchez, J.A. Folgado-FernándezSystematic literature review and bibliometric analysis on virtual reality and educationEducation and Information Technologies (2022), pp. 1-38View in ScopusGoogle Scholar
- Roussou, 2001M. RoussouImmersive interactive virtual reality in the museumProc. of TiLE (Trends in Leisure Entertainment) (2001)Google Scholar
- Sailer et al., 2023M. Sailer, E. Bauer, R. Hofmann, J. Kiesewetter, J. Glas, I. Gurevych, F. FischerAdaptive feedback from artificial neural networks facilitates pre-service teachers’ diagnostic reasoning in simulation-based learningLearning and Instruction, 83 (2023), Article 101620View PDFView articleView in ScopusGoogle Scholar
- Salas-Pilco et al., 2022S.Z. Salas-Pilco, K. Xiao, X. HuArtificial intelligence and learning analytics in teacher education: A systematic reviewEducation Sciences, 12 (8) (2022)Google Scholar
- Salomon, 1993G. SalomonOn the nature of pedagogic computer tools: The case of the writing partnerComputers as Cognitive Tools, 179 (1993), p. 196Google Scholar
- Sarsa et al., 2022S. Sarsa, P. Denny, A. Hellas, J. LeinonenAutomatic generation of programming exercises and code explanations using large language modelsProceedings of the 2022 ACM conference on international computing education research, 1 (2022), pp. 27-43Accessed: 2023-01-22 View PDF CrossRefGoogle Scholar
- Scao et al., 2022T.L. Scao, A. Fan, C. Akiki, E. Pavlick, S. Ilić, D. Hesslow, R. Castagné, A.S. Luccioni, F. Yvon, M. Gallé, et al.BLOOM: A 176B-parameter open-access multilingual language modelarXiv (2022)preprint arXiv:2211.05100Google Scholar
- Shen et al., 2021J. Shen, Y. Yin, L. Li, L. Shang, X. Jiang, M. Zhang, Q. LiuGenerate & Rank: A multi-task framework for math word problemsFindings of the Association for Computational Linguistics: EMNLP, 2021 (2021), pp. 2269-2279 View PDF CrossRefView in ScopusGoogle Scholar
- Tack and Piech, 2022A. Tack, C. PiechThe AI teacher test: Measuring the pedagogical ability of blender and GPT-3 in educational dialoguesProceedings of the 15th international conference on educational data mining, International Educational Data Mining Society, Durham, United Kingdom (2022), pp. 522-529View in ScopusGoogle Scholar
- Tai and Chen, 2020T.-Y. Tai, H.H.-J. ChenThe impact of google assistant on adolescent efl learners’ willingness to communicateInteractive Learning Environments (2020), pp. 1-18View article CrossRefGoogle Scholar
- Tay et al., 2022Y. Tay, M. Dehghani, D. Bahri, D. MetzlerEfficient transformers: A surveyACM Computing Surveys, 55 (6) (2022), pp. 1-28View in ScopusGoogle Scholar
- Team, 2022O. TeamChatGPT: Optimizing language models for dialogue(2022)Accessed 19th Jan 2023Google Scholar
- Tian, 2023E. TianGPTZerohttps://gptzero.me/ (2023)Accessed: 22.01.2023Google Scholar
- UNESCO, 2023UNESCOEducation 2030 agenda(2023)https://www.unesco.org/en/digital-education/artificial-intelligence, Accessed 22nd Jan 2023Google Scholar
- Vaswani et al., 2017A. Vaswani, N. Shazeer, N. Parmar, J. Uszkoreit, L. Jones, A.N. Gomez, Kaiser, I. PolosukhinAttention is all you needAdvances in Neural Information Processing Systems, 30 (2017)preprint arXiv:2212.01020Google Scholar
- Wang et al., 2021Z. Wang, A. Lan, R. BaraniukMath word problem generation with mathematical consistency and problem context constraintsProceedings of the 2021 conference on empirical methods in natural language processing (2021), pp. 5986-5999 View PDF CrossRefView in ScopusGoogle Scholar
- Yang et al., 2019Z. Yang, Z. Dai, Y. Yang, J. Carbonell, R. Salakhutdinov, Q.V. LeXLNet: Generalized Autoregressive Pretraining for Language UnderstandingAdvances in neural information processing systems (2019), p. 32preprint arXiv:1810.04805Google Scholar
- Yu et al., 2021W. Yu, Y. Wen, F. Zheng, N. XiaoImproving math word problems with pre-trained knowledge and hierarchical reasoningProceedings of the 2021 conference on empirical methods in natural language processing (2021), pp. 3384-3394 View PDF CrossRefView in ScopusGoogle Scholar
Cited by (2)
- ChatGPT and the Future of Health Policy Analysis: Potential and Pitfalls of Using ChatGPT in Policymaking2023, Annals of Biomedical Engineering
- A SWOT analysis of ChatGPT: Implications for educational practice and research2023, Innovations in Education and Teaching International