社会の暴力に対処するためのデータ統合
研究が暴力データを効果的に分析する新しい方法を明らかにした。
― 1 分で読む
目次
暴力は社会の大きな問題で、公共の健康や安全の多くの面に影響を与えているんだ。研究によると、これは医療システムだけじゃなく、警察や法律サービスにも影響があるみたい。暴力を経験した人たちは、身体的・精神的健康の問題に悩まされ、生産性が失われることもある。暴力問題に対処するためには、いろんなシステムからのデータを分析することが、より深く理解し、効果的な対応を見つける手助けになるんだ。
より良いデータの必要性
研究者たちは、暴力をよりよく測るためにいろんなデータタイプと取り組んできたよ。たとえば、救急部門と警察の記録を組み合わせることで、暴力の統計に関する洞察が得られている。ただ、多くの研究はまだデータを別々に見ていて、情報へのアクセスの難しさや被害者を守る必要があるからそうなってるんだ。特に、暴力の被害者や加害者を支援する団体からのデータセットのつながりが不足している。これらの団体は、助けている個人を守るために情報をプライベートに保ちたいと思ってるんだ。
データを組み合わせる理由
いろんなソースからデータをリンクさせることで、暴力の理解が深まり、その影響を健康や社会についてより良く分析できるようになるんだ。時間が経つにつれて同じ人からのデータを使うことで、より完全な景色が得られる。ただ、安全面の懸念から、個人情報はしばしば変更されて、個人に追跡されないようになってるから、異なるデータセットの記録をリンクさせるのが難しいんだ。
新しいアプローチ:ルックアライクモデリング
ルックアライクモデリングは、ビジネス、特にマーケティングでよく使われる方法なんだ。これは、似たような特徴を持つ顧客を特定するのに役立つよ。この技術を暴力研究に応用して、個人のプライバシーを尊重しながらデータを組み合わせる新しい方法を提案できるんだ。この方法を使って、研究者たちは異なるソースからの情報を基に、個人の共通の特徴を持つ新しい合成データセットを作ることができるんだ。
この研究で使った方法
この研究では、具体的な2つのソースからデータを組み合わせたんだ:イングランドとウェールズの国家被害調査(CSEW)と、レイプクライシスイングランドとウェールズ(RCEW)の行政記録。成人の性的暴力の経験を理解することに焦点を当てたよ。
データ収集
CSEWは1980年代から何千人もの人から情報を収集してきた。参加者には、過去1年間の犯罪体験、特に性的暴力について質問してる。RCEWは、性的暴力に対する支援を求める個人から情報を集めていて、このデータには、人口統計情報、暴力の性質、被害者と加害者の関係が含まれているんだ。
データセットのリンク
これらのデータセットをリンクさせるために、被害者の経験に影響を与える重要な変数に注目したよ。それには、経験した性的暴力のタイプ、加害者との関係、健康への影響、年齢や性別のような社会人口統計情報が含まれている。両方のデータセットに比較可能な情報が含まれていることを確認することで、暴力の影響を受けた人たちの経験についてより深い洞察が得られるデータセットを作ることを目指したんだ。
データセットの分析
私たちの分析は、ルックアライクモデリングを通じてデータをリンクさせる方法が効果的かどうかを確かめることを目的としてたよ。両方のデータセットの変数を見て、結果が一貫しているかどうかを確認したんだ。
被害者の主な特徴
データを統合する前に、CSEWとRCEWのデータセットにおける被害者のプロフィールを比較したんだ。重要な違いがあったよ。たとえば、RCEWデータセットでは、レイプされたと報告する被害者の割合がCSEWよりも大きかった。また、加害者との関係も異なっていて、RCEWでは知っている人による事件が多かったんだ。
アプローチのテスト
統合方法をテストするために、1つのソースからの情報を別のソースに組み込んだ合成データセットを作った。まず年齢や性別のような変数を見てから、健康への影響のようなより複雑な問題に移ったんだ。私たちの発見は、元のデータセットで観察された関係が合成データセットにも反映されていて、私たちのアプローチに自信を持てる結果になったよ。
分析結果
分析の結果、合成データセットが元のデータに多くの点で似ていることがわかった。たとえば、年齢を見てみると、CSEWデータセットの結果と似たようなことがわかって、若い人たちが特定の種類の暴力を報告する可能性が高いことが示されてたんだ。
性別分析
性別に関する分析では、男性と女性で異なる種類の暴力を経験していることがわかって、異なる性別が直面する独自の経験を強調するのに役立ったんだ。合成データセットで見つかったパターンはCSEWのものと一致していて、使った方法の妥当性が確認されたよ。
健康への影響
暴力の健康への影響も重要な研究エリアだった。この分析では、暴力の影響を受けた人々がさまざまな健康結果を持つことがわかった。統合データセットを分析することで、性的暴力の被害者が直面する現実を反映したパターンが見えてきたんだ。
研究結果の意義
この研究は暴力研究にとって重要な意味を持ってるよ。異なるデータセットを統合しながら個人のプライバシーを守る手法を示すことで、より包括的な研究の扉を開いているんだ。このアプローチは、被害者の経験の理解を深めるだけでなく、ターゲットを絞った介入の開発にも役立つ。
統合データの利点
統合データを使うことで、被害者に対するリソース配分やサービス提供が改善されるよ。暴力の広がりや、それが個人や社会全体に与える影響のより正確なイメージを作るのに役立つんだ。最終的には、政策決定のガイドや支援サービスの改善につながるよ。
結論
さまざまなソースからのデータ統合は、暴力研究にとって価値のある機会を提供するよ。私たちの調査結果は、ルックアライクモデリングとデータインプテーション技術を使うことで、暴力の影響を受けた人々の経験についての洞察を提供する合成データセットを作成できることを示しているんだ。このアプローチは問題をよりよく理解できるようにし、社会における暴力の複雑さに対処する能力を高めるよ。今後の研究では、この方法を探求し続け、異なる文脈や集団への適用を広げて、発見をさらに強化していくべきだと思う。統合アプローチは、研究、政策、実践の間でのコラボレーションを促進する可能性があり、最終的には暴力の影響を受けた人たちに利益をもたらすんだ。
タイトル: Look-alike modelling in violence-related research: a missing data approach
概要: Violence as a phenomena has been analysed in silo due to difficulties in accessing data and concerns for the safety of those exposed. While there is some literature on violence and its associations using individual datasets, analyses using combined sources of data are very limited. Ideally data from the same individuals would enable linkage and a longitudinal understanding of experiences of violence and their (health) impacts and consequences. However, in the absence of directly linked data, look-alike modelling may provide an innovative and cost-effective approach to exploring patterns and associations in violence-related research in a multi-sectorial setting. We approached the problem of data integration as a missing data problem to create a synthetic combined dataset. We combined data from the Crime Survey of England and Wales with administrative data from Rape Crisis, focussing on victim-survivors of sexual violence in adulthood. Multiple imputation with chained equations were employed to collate/impute data from different sources. To test whether this procedure was effective, we compared regressions analyses for the individual and combined synthetic datasets on a binary, continuous and categorical variables. Our results show that the effect sizes for the combined dataset reflect those from the dataset used for imputation. The variance is higher, resulting in fewer statistically significant estimates. We extended our testing to an outcome measures and finally applied the technique to a variable fully missing in one data source. Our approach reinforces the possibility to combine administrative with survey datasets using look-alike methods to overcome existing barriers to data linkage.
著者: Estela Barbosa, N. Blom, A. Bunce
最終更新: 2024-03-15 00:00:00
言語: English
ソースURL: https://www.medrxiv.org/content/10.1101/2024.03.13.24304238
ソースPDF: https://www.medrxiv.org/content/10.1101/2024.03.13.24304238.full.pdf
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた medrxiv に感謝します。