標準カメラを使ったドライバー視線追跡システム

関連作業
ドライバーの視線ポイントデータセット
ドライバーの視線ポイント推定ネットワーク
結果
結論
オリジナルソース

新しい運転中のドライバーの視線を追跡する方法を紹介するよ。このシステムは車に取り付けた2つの普通のカメラを使っていて、一つは運転手を見つめるフロントウィンドウに、もう一つは道路を見つめるダッシュボードに設置されてるんだ。交通の速さや三次元環境での距離が分からないから、ドライバーの視線を追跡するのは難しいんだよね。それに、運転手が位置を調整することでカメラとの距離も変わるし。

この問題を解決するために、ドライバーの顔と運転シーンの両方を同時に分析する特別なネットワークを作ったんだ。このネットワークにはカメラのキャリブレーションモジュールが含まれていて、ドライバーとカメラの相対位置を計算するんだ。この機能が全体のシステムのパフォーマンスを向上させて、一貫したプロセスでトレーニングができるようになるんだ。

この分野での大きな課題は、これらのシステムをトレーニングしてテストするためのデータが不足していること。これを克服するために、都市部での運転セッションの大規模なデータセットを集めて、視線データも含めたんだ。このデータセットは、道路とドライバーの顔の同期した画像を含んでいて、我々の方法の正確なトレーニングと評価が可能になるんだ。テストの結果、新しいアプローチは既存の方法よりも正確で、ドライバーが見ている場所を推定するときの平均予測誤差は約29.69ピクセルだったよ。

この研究の目的は、運転手の頭や顔の動きをモニターできる手頃なデバイスを作って、交通環境でドライバーが何に集中しているかを特定すること。これを車で量産できれば、ドライバーの意識を高めて事故を減らすのに役立つんだ。たとえば、交通標識や歩行者などの重要な情報を見落としたときにドライバーに警告を出したりすることができるし、ドライバーの注意を引いたり、気を散らせたりするものについての洞察を提供して、より良い道路設計や安全対策に繋がるんだ。

いくつかのシステムは、この目的のために特別なメガネを使ってドライバーの視線を追跡しようとしたけど、これらのメガネは高価で、普段使うには不快かもしれない。それに、視線がどこを向いているかは分かっても、視界の外で見落としているものが分からないから、これは重要だよね。ドライバーは車内のものに簡単に気を取られるし。

この制限を考慮して、ダッシュボードに取り付けたカメラを使った新しいアプローチを提案するよ。このセットアップでは、運転手の顔を捉えるカメラと、前方の道路に焦点を合わせるカメラの2つの標準カメラだけで済むんだ。私たちの焦点は、両方のカメラからの画像を処理してドライバーの視線を特定するコンピュータービジョンアルゴリズムの開発にあるんだ。

このアルゴリズムを作るのは簡単じゃない。まず、トレーニングに必要な画像や視線の注釈が組み合わさったデータセットが存在しないから。これは、おそらく遠くのカメラから運転手がどこを見ているかを正確に特定するのが難しいからだよね。そこで、私たちは10万組以上の画像ペアを集めて、大きなデータセットを作ったんだ。

ダッシュボードに取り付けたシステムのもう一つの課題は、運転中にドライバーの位置がカメラとの関係で変わること。運転中にドライバーに停止させたり、システムを再キャリブレーションさせたりするのは非現実的だから、自動キャリブレーションによる視線推定方法を開発したんだ。これにはカメラとドライバーの関係を変数として扱うことで、キャリブレーションモジュールを使って推定する仕組みなんだ。

実験では、このキャリブレーションモジュールが視線予測の精度を大幅に改善することが分かったよ。私たちの方法は29.69ピクセルの予測誤差に達していて、シーンカメラの解像度に比べてかなり小さいんだ。

ドライバーの視線ポイントデータセット

私たちの方法をサポートするために、Drivers' Points-of-Gaze（DPoG）という新しいデータセットを作ったよ。このデータセットには、市街地を運転した11人のドライバーの視線データが含まれていて、リアルな運転条件をキャッチしているんだ。さまざまな交通状況で異なるドライバーの経験を記録した19セッションから成っている。

データ収集と注釈

データ収集にはGoProカメラを使ったよ。一つはフロントウィンドウに取り付けてドライバーの顔を追跡し、もう一つはダッシュボードに置いて道路を観察した。正確な視線ポイントを得るために、データ収集の際に特別な視線追跡メガネを使ったんだ、これはトレーニングデータの収集には重要だけど、最終的な製品には必要ない。

運転セッション

合計で13人のドライバーが参加して、2週間にわたってさまざまな条件で運転したよ。各ドライバーは計画したルートに従って2〜3セッションを行った。セッションの長さは異なったけど、一般的には15分から35分程度だった。収集したデータを分析した結果、いくつかのセッションは不完全または壊れた情報のために使用できないと判断された。最終的には、11人のドライバーから得られた19の有効なセッションを保持することになったんだ。

キャリブレーションと同期

各セッションの開始時に、視線追跡メガネをキャリブレーションした。GoProカメラはその位置が敏感だったのでキャリブレーションしなかった。異なるカメラの動画を同期させるために、ドライバーは各セッションの開始時に手を叩いて、映像を揃えることができたんだ。

でも、視線追跡メガネでキャッチした視線データとGoProの映像を同期させるのはもっと難しかった。いくつかの試みを重ねた結果、視線動画のフレームレートが変わることが分かって、他の映像と揃えるのがトリッキーだった。これを解決するために、視線データから短いクリップを抽出して、それを対応する顔とシーンのクリップに手動で合わせることにしたんだ。

視線ポイントの注釈

シーン、顔、視線データを含む同期されたトリプレットフレームを大量に抽出したよ。すべてのフレームに視線ポイントがあったわけじゃないから、RANSAC-Flowという手法を使って視線ポイントをシーンフレームに合わせたんだ。手動で確認することで視線ポイントが正確であることを確認し、最終的に143,675のフレームトリプレットが得られたんだ。

ドライバーの視線ポイント推定ネットワーク

私たちは、リアルタイムでドライバーがどこを見ているかを正確に特定するシステムを作ることを目指しているよ。既存の方法が固定画面に焦点を当てるのに対し、私たちの方法は動的で三次元の環境で視線を予測しなければならない。これを実現するために、ドライバーの顔画像と周囲の運転シーンを分析するDrivers' Points-of-Gaze Estimation Network（DPEN）を開発したんだ。

ネットワークアーキテクチャと処理パイプライン

ネットワークはカメラキャリブレーションモジュールと視線回帰モジュールの2つのメイン部分から成っている。ドライバーの顔の周りの小さなエリアをキャッチして、その画像とシーン画像を使って、ドライバーとの相対的なカメラの位置を反映するキャリブレーションパラメータのセットを計算する。最終的な出力は、シーン画像の中の視線の予測位置になるんだ。

最初の部分がカメラキャリブレーションモジュールで、シーンと顔の画像を処理して、二つのカメラの関係を示すパラメータを生成する。次の部分が視線回帰モジュールで、両方の画像とキャリブレーションパラメータを使って視線ポイントを予測するんだ。

トレーニング手順

ネットワークは一度でトレーニングが可能で、推定された視線ポイントと実際の視線ポイントとの違いを最小限に抑えるようにパラメータが最適化される。特定の損失関数を使用してトレーニングプロセスをガイドして、システムを微調整するんだ。

結果

評価では、私たちのアプローチのパフォーマンスをいくつかのベースライン方法と比較するよ。システムが視線ポイントをどれだけ正確に予測できるかを実際のポイントと比較して測るんだ。異なるベースライン方法には、シーンの中心を予測するものや、運転シーン内で検出された物体に基づくものが含まれている。

私たちの方法は、これらのベースラインを一貫して上回って、29.69ピクセルの注目すべき平均予測誤差を達成したよ。AUCスコアも、私たちの方法が良く予測するだけでなく、顕著な性能も持っていることを示してるんだ。

結論

運転中のドライバーの視線を追跡するためにダッシュボードに取り付けたシステムを紹介したよ。2つのカメラを使うことで、ドライバーの顔と車外のシーンの両方をキャッチできる。システムはドライバーとカメラのセットアップ間の距離の変化にも対応していて、正確な視線推定を可能にしてるんだ。新しいデータセットも提案して、運転手の注意や安全に関する将来の研究に貴重なリソースを提供する。全体として、この研究は運転の安全性を高めたり、全体的な運転体験を改善したりするデバイスの開発に貢献してるんだ。

標準カメラを使ったドライバー視線追跡システム

ダッシュボードカメラを使って運転手の注意力を監視するコスト効果の高い方法。

関連作業

視線推定データセット

ドライバー監視データセット

視線推定方法

ドライバーの視線ポイントデータセット

データ収集と注釈

運転セッション

キャリブレーションと同期

視線ポイントの注釈

ドライバーの視線ポイント推定ネットワーク

ネットワークアーキテクチャと処理パイプライン

トレーニング手順

結果

結論

参照トピック

標準カメラを使ったドライバー視線追跡システム

ダッシュボードカメラを使って運転手の注意力を監視するコスト効果の高い方法。

#関連作業

#視線推定データセット

#ドライバー監視データセット

#視線推定方法

#ドライバーの視線ポイントデータセット

#データ収集と注釈

#運転セッション

#キャリブレーションと同期

#視線ポイントの注釈

#ドライバーの視線ポイント推定ネットワーク

#ネットワークアーキテクチャと処理パイプライン

#トレーニング手順

#結果

#結論

参照トピック

関連作業

視線推定データセット

ドライバー監視データセット

視線推定方法

ドライバーの視線ポイントデータセット

データ収集と注釈

運転セッション

キャリブレーションと同期

視線ポイントの注釈

ドライバーの視線ポイント推定ネットワーク

ネットワークアーキテクチャと処理パイプライン

トレーニング手順

結果

結論