わからないことを数理モデルで理解する面白さ - 青山学院大学

理工学部
わからないことを数理モデルで理解する面白さ
市原直幸准教授（2020年10月掲載）

理工学部
わからないことを数理モデルで理解する面白さ
市原直幸准教授（2020年10月掲載）

人類の大きな一歩と最適制御理論の発展

私の専門である確率最適制御は最適制御理論と確率論の融合領域です。最適制御理論とは、時間とともに変化する系についての動的な最適化理論のことです。ここでいう「時間とともに変化する系」とは、物理法則に従って運動する物体の軌道であったり、何らかの経済状況を表す指標であったりします。前者の代表例として「月面着陸問題」が挙げられます。これは、月面に近づくロケットを最小限の燃料消費で月面に軟着陸させるという問題です。ロケットのエンジンをどのようなタイミングで、またどのくらいの出力で逆噴射させれば良いのかについて理論的に最適な方策を導き出すことが最適制御理論の目的です。

最適制御理論に関する先駆的な研究は、冷戦開始直後から米ソ両国により既に行われていましたが、数学理論としての最適制御理論が確立するのは、ソ連のステクロフ数学研究所のポントリャーギンらによる1950年代後半の研究においてでした。ほぼ時を同じくして、応用数学者ベルマンらの所属するアメリカのRAND研究所でも、最適制御理論の研究がソ連とはほぼ独立に進められていました。ちょうど1950〜60年代はいわゆる米ソ宇宙開発競争の時期にあたり、人工衛星やロケットに関する研究を通じて最適制御理論は大きく発展しました。なかでも、「月面着陸問題」はこの時代の最適制御理論を象徴する問題だったといえるでしょう。

純粋数学の視点から眺めると、最適制御理論の起源は変分法と呼ばれる数学の一分野に遡ることができます。変分法は、数学者ベルヌーイが1696年に提示した「最速降下曲線」の問題、すなわち重力以外の力を加えずに高低差のある離れた２地点の間を最も早くボールを転がすことができる曲線を見つけよ、という問題に端を発します。ベルヌーイの生きた時代に人工衛星やロケットはもちろんありませんでしたが、変分法の考え方は20世紀になって最適制御理論という形に進化したともいえます。物事の本質をついた数学的なアイデアは、時代や学問分野を超えて大きく発展するものだということを改めて認識させられます。

確率最適制御とは

次に、確率最適制御とは何かについてお話しします。一言でいうと、最適制御理論の確率版が確率最適制御理論です。ノイズを含んだ観測データや株価の推移のように、系の状態が不確実性を持つ場合には、数理モデルを構築する際に確率的な影響を初めから組み込んでおく必要があります。このような「ランダムネスを含んだ系」の状態に関する最適制御を扱うのが確率最適制御理論です。確率最適制御の典型例として、経済学における「最適投資・消費問題」というものがあります。これは、アメリカの経済学者マートンにより1970年頃に考察された確率最適制御問題の一種で、株式のようなリスクを伴う資産と預金等の安全な資産の投資比率を時間の経過に合わせて組み換えながら、資産そのものや消費行動による期待効用を最大化する戦略を見つけるという問題です。この問題では、危険資産と安全資産への投資比率や消費行動へ回す資金の比率などが制御すべきパラメータとなります。

このように、最適制御や確率最適制御の対象とする範囲は宇宙工学から経済学まで非常に幅広いのですが、私が取り組んでいる研究対象はもう少し抽象的な問題です。個別の具体的な問題に対して解決策を提示するというよりも、それらの問題群から本質的な部分を抜き出して理想化したモデルの数学的特性を研究しているといった方が正確かもしれません。以下では、私自身がこれまでに行った研究の一部をやや詳しく紹介したいと思います。

報酬と費用のせめぎ合いで起こる相転移

確率最適制御では時間とともに変化する確率的な系を扱いますが、そのような系を記述する数理モデルの中で最も基本的なものとしてランダムウォークがあります。私が現在研究対象としているのは、このランダムウォークが関係した確率最適制御です。

ランダムウォークとは、グラフの頂点上をランダムに移動する粒子の運動を数学的にモデル化したものです。もう少し正確にいうと、直線上に等間隔に並んだ点の上を、各時間ステップごとに左右いずれかの方向に等確率で1歩ずつ移動する粒子の運動を１次元ランダムウォークと呼びます。同様のランダムな運動を直線上ではなく平面上で考えたものが２次元ランダムウォーク、空間内で考えたものが３次元ランダムウォークです。つまり、2次元ランダムウォークでは平面上の４方向（上下左右）いずれかに等確率で移動します。また、3次元ランダムウォークでは空間内の６方向（上下左右前後）いずれかに等確率で移動します。数学的には、さらに４次元以上のランダムウォークを考えることも可能です。

1次元ランダムウォークと2次元ランダムウォーク

ランダムウォークにおける最も基本的な問題は、粒子が出発点に再び戻ってくるかどうかに関する「再帰性」について調べることです。具体的には、出発点に何度でも（無限回）戻ってくる場合を再帰的といい、有限回しか戻ってこない場合を過渡的あるいは非再帰的といいます。ランダムウォーク理論の基本的な結果であるポリアの定理によると、1次元と２次元のランダムウォークは再帰的で、3次元以上のランダムウォークは過渡的であることが知られています。直感的には、次元が高いほどランダムウォークが次のステップで移動できる場所が増えるので、一度離れた地点に再び戻ってくることが難しくなります。ポリアの定理は、その境目がちょうど２次元と３次元の間にあることを示しています。

このランダムウォークを「制御」することを考えます。もとのランダムウォークに従う粒子は隣接点に等確率で移動しますが、これを好きな確率に変更できるものとします。ただし、確率を変更する場合は、等確率から大きく離れるほど高い費用が発生するものとします。一方で、粒子が出発点に戻ってくるたびに一定量の報酬が得られるとします。目標は、粒子の運動を長時間観測するとき、確率変更による費用を最小限に抑えつつ粒子が出発点に戻ってくる回数をできる限り増やす戦略を見つけることです。数学的には、単位ステップあたりに獲得できる利潤（＝報酬から費用を差し引いた額）を最大化する確率最適制御問題として定式化できます。

問題のポイントは、ランダムウォークを制御する戦略がトレードオフの関係になっている点です。つまり、何の制御も加えない粒子は（たとえ１，２次元の場合であっても）あまり出発点には戻ってこないので、多くの報酬を得ることは期待できません。逆に、粒子を制御しすぎると費用がかさみ、報酬を上回ってしまい本末転倒です。この報酬と費用の微妙なせめぎ合いを詳しく解析し、最適に制御されたランダムウォークの挙動を調べることが私の研究内容です。結果だけ述べると、３次元以上のランダムウォークでは、報酬額を少しずつ増やしていくと、ある臨界値を境に粒子の動きが過渡的から再帰的へと大きく変化することが証明できます。この状況が変わるさまが物理学でいう相転移と似ていることから、この現象をランダムウォークの相転移と呼んでいます。

ここで紹介した「ランダムウォークの相転移」は、月面着陸問題や最適投資・消費問題のように実社会の問題解決に直結する研究ではありませんが、全くの机上の空論というわけでもありません。例えば、ランダムウォークに関する確率最適制御は、高分子鎖についての物理モデルや機械学習の一分野である強化学習とも関連しています。単に数学的に面白いというだけで研究されている数理モデルでも、それが物事の根本的な性質を捉えた「よい」モデルであれば、長いスパンで見ると当初は予想もしなかったような分野に応用されることが数学ではよくあります。私自身の研究でも、単純だが本質を突いた面白い数理モデルを構築することを目標にして、日々の研究に取り組んでいます。

ランダムの集積で違う世界が現れる不思議

大学生の頃、「測度論」と呼ばれる分野を勉強する機会がありました。これは「長さとは何か、面積とは何か」といったことを数学的に突き詰める少し抽象的な理論なのですが、この理論が実は確率論を基礎づける土台となっていることを知り、衝撃を受けました。それと同時に、それまで確率論に対して抱いていた「何となくスッキリしない感じ」が、測度論の枠組で語ることにより明瞭に理解できたことがとても印象に残っています。

確率論の面白さの一つは、いわゆる極限定理にあると思います。偏りのないサイコロを投げるとき、どの目が出るかは予測不可能です。しかし、何百回、何千回とサイコロを投げると、それぞれの目が出る相対頻度は６分の１に限りなく近づきます。これは誰がいつどこでやってもそうなります。一回一回のサイコロ投げは予測不可能であるにもかかわらず、それらが大量に集まるとランダムではない規則的な法則が現れることが面白いと思ったのが、この研究領域に踏み込んだきっかけの一つです。

研究は一人で行うこともあれば、共同研究の場合もあります。共同研究では、相方と交わすとりとめもない雑談から着想を得ることが多いです。一応は「こんな研究をやりたいな」と何となく思い描いてから話をするのですが、結局全く違う方向にまとまったりするところが共同研究の醍醐味です。私と共同研究者では研究のバックグラウンドが全く異なりますから、一人では到底思いつかなかった物の見方を発見できる点も、共同研究の面白さだと思います。

一人で研究する場合は、もう少しストイックに自分の研究課題を追求することが多いです。先行研究の論文を読んでいて「すごいアイデアだ！」と感動することもありますが、私の場合は論文の内容に釈然としない感じを抱いたり、違和感を覚えたりするときの方が結果として面白い研究になるような気がします。学生時代は全てを理解することが大事だと思っていましたが、最近は理解できない時間も結構重要なのではないかと思うようになりました。

本学を目指す受験生や在学生へのメッセージ

大学入学までは合格という目標に向かって受験勉強に励むと思いますが、大学に入ったらぜひ「目的のない」勉強もして下さい。決められたゴールを目指すのではなく、知的好奇心のおもむくままに勉強することはサイエンス本来の姿だと思います。世の中全体が余裕を失いつつある時代ですが、大学生の間だけでもあまり先のことを考えずに学んでほしいと思います。また、そのような余裕を時間的にも心理的にも提供できる場として、大学が残り続けてほしいと思っています。

本学科は学生と教員の距離が近いという特徴があります。さらに来春の学科改編により一層多彩な教員が揃います。何か疑問があれば気軽にぶつけてみてください。それに応えてくれる教員が必ずいるはずですから。（2020年10月掲載）

青山学院大学でこのテーマを学ぶ

理工学部

理工学部
市原直幸准教授（2020年10月掲載）
所属：青山学院大学理工学部物理・数理学科

研究者情報へリンク

理工学部
市原直幸准教授（2020年10月掲載）
所属：青山学院大学理工学部物理・数理学科
研究者情報へリンク

世界を解き明かすコラム
ー研究者に迫るー

人類の大きな一歩と最適制御理論の発展

確率最適制御とは

報酬と費用のせめぎ合いで起こる相転移

ランダムの集積で違う世界が現れる不思議

本学を目指す受験生や在学生へのメッセージ

あわせて読みたい

青山学院大学でこのテーマを学ぶ

関連キーワード

関連キーワード

関連コンテンツ

関連コンテンツ

世界を解き明かすコラムー 研究者に迫る ー

人類の大きな一歩と最適制御理論の発展

確率最適制御とは

報酬と費用のせめぎ合いで起こる相転移

ランダムの集積で違う世界が現れる不思議

本学を目指す受験生や在学生へのメッセージ

あわせて読みたい

青山学院大学でこのテーマを学ぶ

関連キーワード

関連キーワード

関連コンテンツ

関連コンテンツ

世界を解き明かすコラム
ー研究者に迫るー