動画の動きを理解し、未来予測と運動視を持つセンサーやロボットの実現へ

コンピューターで動画の動きを推定して未来の様子を予測する技術などを研究している亀田裕介准教授。動画データ圧縮や太陽光発電予測などのさまざまな分野への応用や、視覚心理学などの分野を超えた複合知の面白さについて語ります。

放たれたボールの動きを見れば、それがどこに落ちそうかを私たちは予測できます。一方、カメラは人の視覚のように「先を読む」ことはできません。カメラによって撮られる動画は何枚もの写真をつなげたパラパラ漫画のようなものです。そこで私はコンピューターが人間の目のように動きをとらえられるようにする方法を研究しています。専門的にはコンピュータービジョンやロボットビジョンと呼ばれるもので、このうちの「動き推定」という、動画に映るあらゆる被写体の動きを計算する分野の研究に取り組んでいます。

動き推定の研究では、動画などの連続するパラパラ漫画のデータから、カメラと被写体がどのように動いているのか、一瞬先ではどこにあるのかを情報処理する理論とアルゴリズムを構築してプログラミングします。

さまざまな分野への応用　視覚心理学の運動錯視

動き推定の研究は、車の自動運転の技術などさまざまな分野で応用が期待されています。私自身の研究成果としては、動画データ圧縮技術への応用があります。動画データの圧縮では、パラパラ漫画を1枚1枚表現するのではなく、画面内で変わった部分（差分）をうまく表現することで動画全体のデータ量を節約しています。動き推定による未来予測によって、この差分を小さくできるので、データ量をさらに節約でき、圧縮効率がよくなることが確認できました。

動き推定を雲の動きの予測に使う研究も行っています。衛星画像列や地上から撮影した動画から、雲の3次元的な動き推定と予測が可能になりました。この研究は太陽光発電量の予測につながる可能性を秘めています。

学生の頃から興味を持っているのは運動錯視です。例としては理髪店の縞模様のポールが、上に昇っているように見える現象などがあります。現在、錯視を動き推定の理論で説明する研究にも取り組んでいます。また、画面内で変わった部分のみを超高速にとらえる新しいカメラ（写真）の情報処理についても研究しています。このカメラは「網膜カメラ」とも呼ばれ、ドローンや未来の空飛ぶ車などへの搭載が期待されています。

消えるように見える武道の動きにも注目

私は映像処理に関する理論を改良するための基礎研究を行う研究者ですが、動き推定は、工学系から文系まであらゆる分野の専門家と一緒に研究できるテーマだと思います。自分の研究が思わぬ形に展開するなど、その都度、新鮮ですし、得るものが多いです。動き推定の分野でも、AIを使ってコンピューターに学習させて動き情報を生成してもらうアプローチも多くなってきています。しかし、AIでは現象の背景にある理論を説明することは難しいため、基礎研究はやはりなくてはならないものだと考えています。

研究者として大事なのは、分からないことに興味を持ち、「なぜそうなるのか」を常に考え続けることだと思います。日常生活でもあらゆる動きが気になり、一瞬、消えるように見える武道の動きなどにも興味を持っています。学生のみなさんにも、ぜひ、考えることの面白さを知ってほしいと思います。

この一冊

『フラットランド　たくさんの次元のものがたり』
（エドウィン・アボット・アボット／著竹内　薫／訳　講談社）

平面世界に住む正方形が、3次元空間世界の来訪者の導きでさまざまな次元の世界をめぐるSF小説。ヴィクトリア朝の階級や男女の格差の風刺もあり、理工に限らず上智らしい題材だと思います。4次元空間とはどんな空間なのだろう、と共に考えてみましょう。

亀田　裕介 理工学部情報理工学科 准教授: 千葉大学工学部情報画像工学科情報工学コース卒、同大学院融合科学研究科情報科学専攻博士後期課程修了。博士（工学）。日本学術振興会特別研究員DC2、民間企業博士エンジニア、東京理科大学理工学部電気電子情報工学科助教、同大学工学部電気工学科講師、上智大学理工学部情報理工学科助教を経て、2025年より現職。; 情報理工学科