小児医療におけるLLMの使い方を理解する
調査が、小児科でのLLMの使用と懸念についての洞察を明らかにした。
― 1 分で読む
大規模言語モデル(LLM)は、大量のテキストから学ぶコンピュータープログラムだよ。目標は、人間と同じように言語を理解すること。いろんなタイプの入力を受け取って、人間っぽい感じで返答できるんだ。2022年11月にChatGPTが登場してから、LLMは仕事や教育の分野で広く使われるようになったけど、責任ある倫理的な使用に関して、大事な問題があるんだ。これらの懸念は、LLMがどう働くのかを明確に説明しないことが多いからで、職場で適切なガイドラインなしで使われることもあるんだよ。
LLMは、医療や研究のタスクの効率を向上させるなど、いろんな分野でメリットがあるけど、医療プライバシーや情報の正確性、偏見、決定に対する説明責任の欠如などの課題もあるんだ。
我々の研究設定
メルボルン子どもキャンパスは、小児医療に特化した大きな学術病院と研究センターだよ。多くのスタッフや学生がいろんな仕事でLLMを使っているようだったけど、どれくらいの頻度で、どんなふうに使われているかの明確な証拠はなかったんだ。人々がLLMにどれだけ慣れているか、どのように使っているか、これらのツールについてどう思っているかを知りたかった。臨床ケア、研究、教育の分野でのLLMの使用に違いがあるかどうかも見たかったんだ。
キャンパスには6000人以上の従業員と350床の小児病院があって、1800人以上の研究者が子どもの健康問題に取り組む医学研究所もあるよ。大学の学部にも70人の教員がいて、研究やサポート役割に関わっている人もたくさんいる。全体で約7500人がキャンパスに関連しているんだ。
研究アプローチ
キャンパスコミュニティからのインサイトを集めるために、グラウンデッド・セオリーという方法を使ったよ。全スタッフと学生に調査を送って、LLMの使い方や将来の利用、機会、リスクについての情報を集めたんだ。ほとんどの質問は自由回答形式で、詳細な返答ができるようにしたよ。適切な結果報告のためのガイドラインに従ったんだ。
調査を設計して分析した研究者たちは、研究者、臨床医、データ専門家、子どもの医療における消費者の意見を代表するメンバーなど、多様な専門家のグループだった。キャンパスに関連する人は誰でも参加できるようにして、臨床スタッフ、研究者、サポートスタッフも含まれてる。
調査設計と配布
調査は、我々のワーキンググループ内での話し合いを通じて作成されたよ。皆が満足するまでテストと改善を重ねたんだ。オンラインプラットフォームを使って調査を配布し、約1000人の臨床スタッフ、1800人の研究者、100人の学生に届いた。調査は4週間オープンだったよ。
データ分析
調査データを処理する際には、識別情報を削除してプライバシーを確保する手順を踏んだよ。統計分析にはMicrosoft Excelを使い、自由回答には定性的分析技術を適用した。2人の研究者が回答をコーディングし、テーマを特定する作業に関わったんだ。
返答のまとめ
合計で281件の返答を受け取ったよ。多くの回答者は病院で働いていて、他は研究所や大学の学部に関連していた。参加者の半数以上が臨床の役割を持っていて、ほとんどが経験豊富な専門家だと自己申告してた。
調査結果から、90%以上の回答者がLLMツールを知っていて、最も多かったのがChatGPTだった。約64%が仕事でLLMを使っていると報告し、LLMの存在は知っているけど使ったことはないという人も多かったよ。
現在と潜在的なLLMの使用
回答者は、自分の仕事でLLMの幅広い利用法を挙げたよ。多くの人がテキストを生成したり編集したりするためにLLMを使っていると報告し、アイデアやプログラミングの助け、データ管理、情報取得にも役立てられているんだ。一部の回答者は、現在LLMを使っていないとも言ってた。
今後、多くの回答者は、テキスト作成や臨床判断支援、データ分析、教育資料の作成にLLMをもっと使うことを期待しているみたいだね。
LLMに関連する機会とリスク
主な機会として明らかになったのは、業務の効率向上で、時間やリソースの節約になることだ。いくつかの回答者は、LLMが仕事の質を向上させる可能性があると感じていたけど、プライバシーやセキュリティ、生成された情報の正確性に関する大きな懸念もあったんだ。
多くの人が特定したリスクには、プライバシー侵害の可能性や知的財産の問題、医療や研究に対する信頼の低下が含まれていた。低い正確性やLLMの出力の質に対する懸念も一般的だったよ。一部の教育者は、LLMが低品質な結果を提供するかもしれないと心配していた。
他にもあまり一般的ではないリスクには、LLMの出力を誤用する可能性や、その使用の透明性の欠如があった。LLMの可能性に関する意見の違いは、より多くのトレーニングと明確なガイドラインの必要性を示しているね。
主な発見
調査から、ほとんどの回答者がLLMツールについて知っていて、様々なタスクに使っていることがわかったよ。回答者は、LLMが効率を改善する可能性があると述べているけど、プライバシー侵害や正確性の問題など、潜在的なリスクを認識している人も多いんだ。
一部の回答者は、プライベート情報を共有したり、LLMの信頼性を確認せずに使ったりすることにリスクがあることに気づいていないかもしれない。この発見は、ユーザーに対するより明確なガイドラインと効果的なトレーニングの必要性を強調しているね。
また、回答者が挙げた課題は、さまざまな教育や研究環境におけるLLMに関する既存の文献に見られるものと同様だよ。
LLM使用の推奨事項
キャンパスでのLLMの広範な使用と、利点とリスクの両方の可能性を考慮すると、適切なガイドラインとトレーニングを確立することが重要だ。特定の分野でLLMを禁止することは実用的ではないと思うし、すでに多くのワークフローに組み込まれているからね。
スタッフにLLM技術を探求することを奨励しつつ、透明性とガバナンスを維持することが大切だよ。トレーニングは、LLMの効果的な使用方法、出力の質を評価する方法、倫理的かつ責任を持って使う方法に焦点を当てるべきだ。
我々の調査から得られたインサイトは、AI使用に関する政府の規制を inform するのにも役立つと思うし、ヘルスケアにおける技術の進化に関連するものにすることができるよ。
将来の考慮事項
我々の研究は、LLMの現在の意見や使用を反映しているけど、これらのツールは常に変わっていることを忘れないでほしいな。返答は意見のスナップショットを表していて、時間が経つにつれて変わる可能性があるから、定期的にこれらの発見を再訪する必要があるんだ。
他の機関も、この研究を再現して自分たちの環境でのLLMの使用を理解し、文脈に応じたガイドラインを開発することができるよ。この継続的な作業は、様々な学術的および臨床環境でLLMツールが効果的かつ倫理的に使われることを確保するのに役立つだろうね。
結論
まとめると、我々の調査は、LLMがキャンパス全体でさまざまな目的で広く使用されていることを強調しているよ。多くの人が、効率の向上や他の利点を期待している一方で、その使用に伴うリスクをナビゲートするためのより良いガバナンスとトレーニングの必要性があることは明確だ。この研究の結果は、LLMアプリケーションを責任を持って管理するための今後の戦略に役立つだろうね。
タイトル: A survey of Large Language Model use in a hospital, research, and teaching campus
概要: BackgroundThe use of Large Language Models (LLMs) has exploded since November 2022 but there is sparse evidence regarding LLM use in health, medical and research contexts. ObjectiveTo summarise the current uses of and attitudes towards LLMs across the clinical, research and teaching contexts in our campus. DesignWe administered a survey about LLM uses and attitudes. We conducted summary quantitative analysis and inductive qualitative analysis of free text responses. SettingIn August-September 2023, we circulated the survey amongst all staff and students across our campus (approximately n=7500), a fully integrated paediatric academic hospital and research institute. ParticipantsWe received 281 anonymous survey responses. Main outcome measuresWe asked about participants knowledge of LLMs, their current use of LLMs in professional or learning contexts, and perspectives on possible future uses, opportunities, and risks of LLM use. ResultsOver 90% of respondents have heard of LLM tools and about two-thirds have used them in their work on our campus. Respondents reported using LLMs for a range of uses, including for generating or editing text and exploring ideas. Many, but not necessarily all, respondents seem aware of the limitations and potential risks of LLMs, including privacy and security risks. Various respondents expressed enthusiasm about opportunities of LLM use, including increased efficiency. ConclusionsOur findings show LLM tools are already widely used on our campus. Guidelines and governance are needed to keep up with practice. We have developed recommendations for the use of LLMs on our campus using insights from this survey. What is knownThe known: The use of Large Language Models (LLMs) has increased rapidly since the introduction of ChatGPT in November 2022. The new: Most survey respondents are aware of, if not using, LLMs in their work across our hospital, research, and university campus. Diverse uses were reported, including generating or editing text and exploring ideas. There were varying attitudes towards LLMs. Perceived risks included privacy and security risks. A key perceived opportunity was increased efficiency. The implications: LLM tools are already widely used on our campus, highlighting the need for guidelines and governance to keep up with practice.
著者: Loretta Gasparini, N. Phillipson, D. Capurro, R. Rosenberg, J. Buttery, J. Howley, S. Ranganathan, C. Quinlan, N. Selvadurai, M. Wildenauer, M. South, G. L. Dimaguila
最終更新: Sep 12, 2024
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2024.09.11.24313512
ソースPDF: https://www.medrxiv.org/content/10.1101/2024.09.11.24313512.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。