人間とAIのライティングコラボレーションを評価する
AIツールの時代における学生のライティング評価の新しい方法。
― 1 分で読む
目次
書くことはみんなにとって大事なスキルだよ。毎日、メッセージやメール、メモを書いてるしね。研究みたいな専門分野では、書くことは特に重要。時間が経つにつれて、書くためのツールはシンプルなストレージデバイスから、より良いテキストを作成するための高度なソフトウェアに進化してきたんだ。最近では、生成的な人工知能(AI)を使ったツールが登場して、文章を自動生成してくれるようになった。
この技術の変化は、特に教育に大きな影響を与える。教育は、生徒が重要なスキルを学んだかどうかを判断するために、評価に依存してるからね。効果的に学びを評価するには、どのように学んだかを示す証拠を集める必要がある。評価はこの仕事にとって重要で、教育者が生徒の進捗を理解するのに役立つよ。生徒がAIツールを使っているときは、人間の努力とAIの入力が両方関わっているから、書いたものをどう評価するかが課題になるんだ。
こうした課題に対処するために、教育機関は今、AIを取り入れた書き方に関するポリシーを策定している。たとえば、オーストラリアの大手教育機関は、評価がAIとの協力を含むように適応すべきだとするガイドラインを最近発表した。生徒がAIを使うことを排除するのではなく、AIとの本物の関与、学習プロセス、生徒とAIの協力に焦点を当てた評価に再設計することを目指しているんだ。
新しい評価の必要性
人間とAIが一緒に働く方法を考慮した評価を開発することが大事。この記事では、証拠中心のデザインフレームワークを利用した評価方法を提案する。このフレームワークは、三つの主要な側面に焦点を当ててる:生徒の書くプロセス、書くタスク、そして書きセッション中に集めた証拠。
生徒の側面は、生徒がAIの助けを借りてどうやって書くかを理解することに重点を置いてるんだ。ただ最終的な作品を評価するだけではなくね。従来の評価は、エッセイや記事など最終的な成果物に焦点を当ててきたけど、最近の技術の進歩は、書くプロセスの分析を可能にして、生徒のスキルの発展がどうなっているかを知る手助けをしてくれるんだ。
書くプロセスに焦点を当てる
書くプロセスを理解することは教育において重要。生徒の能力をより明確に把握でき、教育者が効果的なフィードバックを提供できるようになる。成果物からプロセスに焦点を移すことで、行動を生徒またはAIに帰属させるのが簡単になるんだ。この明確さが生徒の学びを高めることができる。
現在、生徒とAIの書く協力に関する研究は限られているけど、さまざまなAIツールのインターフェースは特定のインタラクションパターンを示している。たとえば、人気のあるAIツールでは、ユーザーがテキストを提案したり、提案を修正したり、新しいレスポンスを生成したりすることができる。この機能は、ユーザーがAIを使って書くとき、異なるプロセスに関与するかもしれないことを示唆している。
知識伝達と知識変換
研究者たちは、人が書きながら知識を構築する方法を調べてきた。彼らは、書くことを二つのタイプに分類している:知識伝達と知識変換。知識伝達はあまり考えずに情報を繰り返すことを含み、知識変換はより深い関与が求められ、ライターが自分の作品を批判的に分析して再構築することを必要とする。
AIと一緒に書くとき、これらの概念は生徒が生成されたテキストとどのように相互作用するかを理解する手助けになる。知識伝達はAIの提案を変更せずに受け入れることが含まれ、知識変換はユーザーがそれらの提案を自分のニーズに合わせて修正するときに見られる。
認知的存在
認知的存在は、生徒が学習環境でコミュニケーションを通じて意味を創造し確認する能力を指す。これには、好奇心を引き起こす問題から始まり、情報を積極的に探し、統合して一貫した回答にし、最終的に問題を解決するといういくつかの段階が含まれる。
人間とAIによる執筆の文脈では、認知的存在は、ユーザーがAIツールにどのように関与するかに観察できる。たとえば、彼らの最初の質問がAI生成の提案の探索を引き起こし、それによって彼らの書き方が統合され、解決されることになる。
評価の要素
生徒モデル
生徒モデルは、評価が生徒の学習主張に関して何を測定しようとしているのかを特定する。この研究は、最終的な文書の質ではなく、AIを使って書くときの生徒のプロセスに焦点を当てている。最近の書き込み分析の進展は、書くプロセスの詳細な分析を可能にし、生徒がAIとどのように相互作用するかの洞察を提供する。
タスクモデル
タスクモデルは、生徒が執筆中に関与するタスクと環境を定義する。商業用のAI執筆ツールは多く存在するけど、評価の目的に必要な関連データをキャッチできていないことが多い。このデータアクセスの欠如は、教育者にとって評価を難しくする。解決策は、執筆タスク中にAIとのインタラクションを効果的に記録するために設計されたツールを作成すること。
その一例がCoAuthorツールで、ユーザーがAIと一緒に作業しながら、分析のために彼らのインタラクションを記録することができる。このツールは執筆のためのプロンプトを提供し、ユーザーの行動やAIの提案をログするので、協力的な執筆を評価するのに役立つ。
証拠モデル
証拠モデルは、生徒の反応が生徒モデルで行われた主張にどのように結びつくかを説明する。書き込み分析の分野は、キーストロークを追跡したり、ユーザーのインタラクションを分析したりすることで、書くプロセスを理解するためのさまざまな方法を提供している。
これらの行動を分析することで、教育者は生徒の書くプロセスについての洞察を得ることができ、より良い評価を行うことが可能になる。ただし、従来の方法は、個人やグループ間で書くプロセスを効果的に比較するのが難しいことがある。
研究質問
この研究は、人間とAIの共同執筆を評価する方法を提案することを目的としていた。このために、以下の研究質問が設定された:
- 書くプロセスに対する所有権のレベルが異なる著者は、AIとどのように関わるのか?
- 書きプロンプトのタイプ(創造的 vs. 論理的)に基づく書くプロセスの違いはあるか?
- AIの温度設定が書くプロセスにどのように影響を与えるか?
書く所有権
最初の質問は、生徒が書く際にどれだけのコントロールを持っているかとAIとの関係を調査する。AIにより頼る生徒は知識伝達が多く見られると思われ、一方で所有権を持つ生徒は知識変換に関与するだろう。
ジャンルの違い
二つ目の質問は、異なるタイプのプロンプトへの反応時の書くプロセスの違いを調べる。創造的なプロンプトは、AIの提案をより探求する結果になるだろうが、論理的なプロンプトはより批判的な思考や修正を必要とすることが予測される。
温度設定
三つ目の質問は、AIの温度設定が出力の変動性に影響し、それが書くプロセスにどう関わるかを調べる。低い温度設定は、AIの提案に対してより批判的な思考や修正を促すと予想される。
方法論の概要
これらの仮説を検証するために、研究は数段階で行われた。書きセッションからデータを収集し、そのデータを質的に分析し、自動分類システムを開発し、書くプロセスを理解するために認知ネットワーク分析を適用した。
データ収集
この研究のデータは、参加者が執筆プロンプトに応じてAIと相互作用しているデジタル書きセッションを通じて収集された。このデータセットには、彼らの行動とAIの出力に関する詳細な記録が含まれていた。
質的分析
自動分析を行う前に、研究者は書きセッションのサブセットを質的にレビューして、書くプロセスに関連する主要な行動を特定した。このステップで、後に収集したデータ全体に適用する関連するコードの開発を確実にした。
自動分類器
大量のデータを管理するために、自動分類器が開発されてデータセット内の書き行動をラベル付けした。このプロセスには、ユーザーがAIとの相互作用で特定の行動を特定することが含まれていた。
認知ネットワーク分析
コーディングされたデータセットは認知ネットワーク分析(ENA)を使用して分析され、参加者の書きセッションごとのネットワーク表現を作成した。この分析によって、さまざまな書き行動の間の関係を特定し、条件によってどのように変化するかを理解するのに役立った。
結果
研究は、所有権、書きプロンプトのジャンル、AIの温度設定に基づいて参加者の書きプロセスを比較することを含んでいた。
所有権と関与
結果として、より多くの所有権を持つ参加者はAIの提案に依存せず、自分のテキストを自立して作成・修正する傾向が示された。一方、所有権が少ない参加者はAIの提案をより頻繁に使用する傾向があった。
ジャンルの影響
創造的なプロンプトと論理的なプロンプトを比較したとき、創造的なプロンプトに反応する参加者はAIの提案をより積極的に探求していた。対照的に、論理的なプロンプトに対処した参加者は、自分のテキストの修正に焦点を当てて、内容に対して批判的に関与していることが示された。
温度設定の影響
AIの温度設定に基づく有意な違いは見られなかった。この結果は、AIの提案の変動性にかかわらず、参加者が似たようなプロセスに関与していることを示唆している。
議論
この研究の結果は、最終的な成果物だけを評価するのではなく、書くプロセスに焦点を当てる重要性を強調している。生徒がAIとどのように相互作用するかを調べることで、教育者は彼らの学びをより深く理解し、評価の実践を改善できる。
この研究はまた、共同執筆における人間とAIの動的関係を考慮した評価の必要性を浮き彫りにしている。AIツールが教育の場にますます統合される中で、生徒がこの現実に備えるための戦略を開発することが重要だ。
限界
この研究は貴重な洞察を提供するが、制限もある。収集されたデータは、AIツールに参加することを選んだ特定の参加者群を反映しているため、結果はすべての生徒に一般化できるものではない。
もう一つの制限は、CoAuthorツールの制約から生じており、より多様な相互作用を許可する他のAI執筆プラットフォームとは異なるかもしれない。今後の研究では、こうした要因を考慮して、人間とAIの協力に関する理解を広げるべきだ。
今後の方向性
今後の研究では、生徒が用いる内容やメタ認知戦略など、書くことの追加的な認知的側面を探ることができる。多様な書きシナリオに適応する評価を開発することで、人間とAIの共同執筆の評価が向上するだろう。
目的は、現代の執筆の共同的な性質を正確に反映する柔軟でスケーラブルな評価方法を作成すること。これは、教育が技術の進歩に応じて進化し続ける中で重要な課題だ。
結論
この研究は、人間とAIの共同執筆に焦点を当てた新しい評価方法の可能性を示している。書くプロセスを分析することで、教育者は生徒の学びについての洞察を得られ、AIとのパートナーシップが含まれる未来に向けて彼らをより良く準備させることができる。技術が進歩する中で、教育と評価へのアプローチも進化させ、生徒がAIとの共同作業において成功するために必要なスキルを身につけられるようにすることが必要だ。
タイトル: Evidence-centered Assessment for Writing with Generative AI
概要: We propose a learning analytics-based methodology for assessing the collaborative writing of humans and generative artificial intelligence. Framed by the evidence-centered design, we used elements of knowledge-telling, knowledge transformation, and cognitive presence to identify assessment claims; we used data collected from the CoAuthor writing tool as potential evidence for these claims; and we used epistemic network analysis to make inferences from the data about the claims. Our findings revealed significant differences in the writing processes of different groups of CoAuthor users, suggesting that our method is a plausible approach to assessing human-AI collaborative writing.
著者: Yixin Cheng, Kayley Lyons, Guanliang Chen, Dragan Gasevic, Zachari Swiecki
最終更新: 2024-01-16 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2401.08964
ソースPDF: https://arxiv.org/pdf/2401.08964
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。