イベントスキーマ作成の新しいシステム
このシステムは、人間の入力とAIを組み合わせて、より良いイベントスキーマを作るんだ。
― 1 分で読む
スキーマ生成は、特定の状況での出来事の進行を示すグラフを作成する方法だよ。従来の方法は主にテキストソースから情報を集めることに依存してるけど、慎重な人間の関与が欠けてることが多いんだ。このアプローチでは、スキーマの質を改善するために重要な段階で人間の入力を取り入れるシステムを提案してる。このシステムは、高度な言語モデルによって支えられ、有用な要素の生成を助けるんだ。
私たちのシステムは、完成したスキーマを作るために協力するいくつかのステップで構成されてる。このステップには、シナリオのためのステップ生成、ステップからのシンプルなノードの作成、ノードをつなぐグラフの構築、そしてそのノードを認識されたオントロジーに基づいて位置づけることが含まれてる。私たちのアプローチと古い方法を比較することで、新しい状況により適応できる一方で、各タスクに必要な人間の労力を最小限に抑えられることを示してる。
最近、自然言語での出来事の理解への関心が高まってる。この焦点が、質問への回答、テキストの要約、誤情報の特定など、出来事認識に関連するさまざまなタスクのパフォーマンス向上につながってる。こうした理解の核心には、複雑な出来事が通常どのように展開するかを要約するイベントスキーマがある。この概念は、単純なアクションの連続から、より複雑なグラフ表現へと進化してきたんだ。
例えば、「サイバー攻撃」を考えると、スキーマは「アクセスを得る」、「システムを制御する」、「ファイルを持ち出す」、「システムログを変更する」といった部分に分かれることができる。これらのアクション間のつながりを理解することが重要なんだ。例えば、ログを変更することは、アクセスを得る前に実行される必要があるから、アクセスがそのアクションの前提条件なんだ。
私たちのスキーマシステムは、ステップ生成、ノード抽出、グラフ構築、ノード位置づけの4つの主要なステージが含まれてる。それぞれのステージが協力して、対象のシナリオのための総合的なスキーマを作り上げるんだ。人間の関与が重要なのは、機械が生成したエラーを特定して修正する助けになるからだよ。
私たちのアプローチの目標は、正確で信頼性のあるスキーマを作成することだ。人間の入力は、機械が生成する可能性のある不正確または不完全な出力をフィルタリングするのに役立つ。この確認は、公衆衛生の緊急事態などの高リスクシナリオでは特に重要で、情報の質が大きな影響を持つからだ。
フローチャートでは、最初のステージはステップ生成だ。ここで、プロンプトを使ってシナリオを説明するステップを作成する。次のステージはノード抽出で、生成されたステップを主語-動詞-目的語のペアに簡略化して、ノードの基礎を形成する。その後、ノード間の関係に基づいてノードをつなぐグラフ構築が行われる。最後のステージはノード位置づけで、これらのノードをWikidataのような認識されたオントロジーにリンクする。
このプロセスを通じて、各ステージは大規模な言語モデルに提案を提供してもらうことに依存してる。ユーザーはシステムと対話し、モデルが生成した出力をレビューして修正することができる。この対話は、人間と機械のパートナーシップを生み出し、より良く、より正確なスキーマを導くんだ。
私たちのシステムの柔軟性により、ユーザーはゼロから始めることも、既存の出力を編集することもできるんだ。また、異なる事前学習バージョンの言語モデルを切り替えられるため、適応性が向上する。ユーザーフレンドリーなインターフェースは、各ステージでの簡単な修正を促進し、古い方法と比較してより効果的にしてる。
ステップ生成に焦点を当てるとき、プロンプトを使ってシナリオの詳細なステップを作成する。例えば、シナリオが病気の発生に関するものであれば、プロンプトはその状況で何が起こるかを説明する一連の出来事を開始できる。ノード抽出の段階では、主要なアクションとそれらの主語・目的語を選び出して、グラフ構築段階で接続されるノードを形成する。
グラフ構築の際には、ノード間の関係が特定され、確立され、出来事がどのように組み合わさるかを視覚化する。インターフェースのおかげで、ユーザーはこれらの構造を簡単に修正できる-必要に応じてノードを追加、削除、または変更できる。
最後に、ノード位置づけでは、ノードが構造化されたオントロジー内の既存の概念にリンクされるようにする。このステップは、各ノードが表している出来事の意味を正確にキャッチするために不可欠なんだ。こうすることで、将来のタスクで参照できるスキーマを作成し、一貫性と正確性を確保する。
ケーススタディを通じて、私たちのシステムが実際にどのように機能するかを示してきた。例えば、サイバー攻撃のスキーマを生成する際には、ステップを生成し、その後ノードを生成し、これらのノードに基づいてグラフを構築した。最終的には、ノードを認識されたオントロジーに位置づけて、関連する概念を正確に表現することを確保したんだ。
私たちのアプローチを評価するために、自然言語処理の経験があるユーザーからフィードバックを集めた。彼らは生成されたステップとノードの正確性、出力を編集・修正する際の容易さを評価できた。その結果、人間中心のアプローチが生成されたスキーマの質を大幅に向上させることが分かった。
私たちのシステムは素晴らしい結果を示しているけど、改善の余地もまだある。現在のプロンプトは限られた例に基づいており、より多くの人間がキュレーションしたデータでそれらのプロンプトを洗練させることで、より良い結果が得られるかもしれない。また、ユーザーからのフィードバックによると、さまざまなステージでスキーマのビジュアル表現を取り入れることが理解を助けるかもしれないとのことだ。
さらに、倫理的な考慮も必要だ。現在の言語モデルは、トレーニングデータに見られるバイアスを反映する可能性がある。これが、生成される出来事やシナリオに影響を及ぼすこともある。この作業は、こうしたバイアスを軽減し、将来のスキーマにおいて異なる文化や文脈を幅広く表現できるようにすることを目指してるんだ。
要するに、私たちのシステムは、高度な機械学習技術と人間の入力を活用したスキーマ作成のための協力モデルを提供する。各ステージでユーザーを巻き込むことで、さまざまなアプリケーションで使用できる高品質で信頼性のあるイベントスキーマを生成することを目指しているんだ。さらなる発展がこのアプローチを強化し、将来的にさらに効果的になることを期待しているよ。
タイトル: Human-in-the-Loop Schema Induction
概要: Schema induction builds a graph representation explaining how events unfold in a scenario. Existing approaches have been based on information retrieval (IR) and information extraction(IE), often with limited human curation. We demonstrate a human-in-the-loop schema induction system powered by GPT-3. We first describe the different modules of our system, including prompting to generate schematic elements, manual edit of those elements, and conversion of those into a schema graph. By qualitatively comparing our system to previous ones, we show that our system not only transfers to new domains more easily than previous approaches, but also reduces efforts of human curation thanks to our interactive interface.
著者: Tianyi Zhang, Isaac Tham, Zhaoyi Hou, Jiaxuan Ren, Liyang Zhou, Hainiu Xu, Li Zhang, Lara J. Martin, Rotem Dror, Sha Li, Heng Ji, Martha Palmer, Susan Brown, Reece Suchocki, Chris Callison-Burch
最終更新: 2023-02-25 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2302.13048
ソースPDF: https://arxiv.org/pdf/2302.13048
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://www.latex-project.org/help/documentation/encguide.pdf
- https://www.kairos.jiaxuan.me
- https://www.youtube.com/watch?v=myru-fozVWI
- https://www.darpa.mil/program/knowledge-directed-artificial-intelligence-reasoning-over-schemas
- https://aclanthology.org/2021.acl-demo.19.pdf
- https://www.wikidata.org/wiki/Wikidata:Main_Page
- https://www.npmjs.com/package/react-vis-network-graph
- https://platform.openai.com/docs/models/gpt-3
- https://joeyhou.notion.site/Human-in-the-Loop-Schema-Induction-Interface-Logs-1eb52403b05542919ccea214656f4211