AGU RESEARCH

世界を解き明かすコラム
ー 研究者に迫る ー

私たちが生きている世界には、
身近なことから人類全体に関わることまで、
さまざまな問題が溢れています。
意外に知られていない現状や真相を、
本学が誇る教員たちが興味深い視点から
解き明かします。

  • 経営学部 経営学科
  • 正確で客観的な資料を提示し、社会全体の適切な意思決定を促す
  • 荒木 万寿夫 教授
  • 経営学部 経営学科
  • 正確で客観的な資料を提示し、社会全体の適切な意思決定を促す
  • 荒木 万寿夫 教授

「意義のあるデータ」を収集し、社会の実態を正確に映し出す

国の行政機関や地方公共団体が作成する統計調査を公的統計と言います。官民問わず意思決定のための基礎資料として広く活用されており、社会の実態を正確に映し出すことが求められます。行政がマクロな観点で実施するものであるため、その規模も文字通りのビッグデータとなります。官公庁では委員会を設置して調査の設計や改善を行いますが、私は国の仕事をお手伝いする委員としてそこに参画してきました。調査対象となる世帯や企業に対して調査票でどのようなことを質問すべきか検討したり、時代情勢に即した情報を得るために新しい調査項目を考案したり、また実査後の調査データの分析も行ったりしてきました。

公的統計は5年に一度の国勢調査や経済センサスのように過去から調査を継続して行っているケースが多く、調査票を一から設計することは稀です。大半は、既存の調査票の改善について検討するところから始まります。例えば、近年の急速な電子決済の広がりがもたらす消費への影響をどう捉えるか。チョコレートを購入した事実一つをとっても、貯めたポイントと交換するのは消費なのか。そもそもポイントを貯めることは収入を得たと考えてよいのか。調査に先立って、調査項目に関する概念の整理をしておくことも大切になります。加えて質問の意図が正しく伝わるよう言葉や言い回しなど質問の精査にも注意を払う必要があり、どういう質問をするとどんな回答が返ってくるかあらかじめ調査をすることもあります。調査票は表面的にはわかりやすく見えますが、「意義のあるデータ」を集めるために、実は綿密に設計されているのです。

 

 

「家計調査の結果から、ポイントの取得や利用分は分かりますか?また、集計上どのように扱われるのですか?」

 

公的統計を利用したデータ分析の事例として近年では、企業統計において産業を分類する新しい指標「産業間距離」の開発に関心を持っています。一般的に自動車産業、航空機産業、農業があったら、自動車産業と航空機産業は人や物を運ぶという点で距離が近い、農業はそれらと比較して遠い、と直感的にイメージするのではないでしょうか。その「近い、遠い」という感覚はどこから来るのか。もしその感覚的な距離感を数値で表すことができたら、おもしろいと思いませんか。データサイエンスでは、それが可能です。当然ながら、実際の物理的空間に「産業間距離」は存在しません。そこでまず「産業間の距離」を定義します。それから総務省が作成している、各産業間で財・サービスがどのようにやり取りされたかをまとめた「産業連関表」という統計資料を用いて、ある産業が製品を1単位生産するために投入する原材料のリストに注目します。そして、それら産業ごとの原材料レシピのようなものを使って、産業間でこうしたレシピが相互にどの程度似ているかについて、ベクトルという数学の概念を用いて、「産業間距離」の定義を当てはめて計測します。

ベクトルは高校の数学で扱われますが、学んでいるときは抽象的で捉えどころがないように感じて、これはいったい何の役に立つのだろうと思っていた人もいるかもしれません。しかし、大学では、私が研究で用いているように、分析したいテーマがある時に使える便利なツールの一つです。ベクトルに限らず今学んでいる数学は、分析したいことが出てきた時に「あれが使えるかもしれない」と役立つケースが出てきます。データサイエンスの世界に触れるきっかけにもなるので、今は大変かもしれませんがぜひ勉強を続けてほしいと思います。

データサイエンスに数学は必要か

最近、学生を中心に「データサイエンスに数学は必須ですか」と質問される機会が増えてきました。私は研究領域によっても、また実務の分野によっても答え方が変わると思います。調査を企画・実施してデータを生み出す人と、調査で取得したデータを使う人とでは求められる知識や技術が違ってきます。データの分析手法に関しても、手法を開発する人と使う人とでは、やはり違いが生まれるでしょう。人数で言えば、相対的に多いのはデータや分析手法を「使う人」です。こうしたユーザー側の立場であれば、必ずしも数学の高度な知見を身に付けていなくても良い場合があります。文系と理系の垣根を越えてデータサイエンスを活用するユーザーが増えていくのは健全なことで、この分野全体の発展につながると思います。一方で、社会的に有用なデータを生み出したり、データの分析手法を開発したりといったことに携わる人は、一定以上の数学の力が必要です。とは言え、開発する人も使う人もデータサイエンティストです。詳しく見ていくと、それ以外にもデータサイエンスへの多様な関わり方があり、関心のある領域や達成したいタスクに応じて、数学の必要度は異なります。
また、必ずしも数学に長けていなくても、社会科学系の学問的バックグラウンドのある人がデータを扱うことには大きな意義があります。私は文系出身で、大学では経済学専攻でしたが研究活動では社会の動きに関する専門的知見が数学に代わるアドバンテージとなっています。近年は多様なバックグランドを持つ人々がそれぞれの専門的知見を持ち寄り、データサイエンスの発展に貢献していこうという流れも形成されつつあります。数学が重要であることは間違いありませんが、一概に数学が何よりも重要であるとまでは言えないでしょう。

 

AI(DALL·E)に描かせたデータサイエンスのイメージ

 

データサイエンスの分野では、同じデータを使ってどのチームが一番良い結果を出せるかを競うコンペティションがあります。高成績のチームには、データを取得した現場の事情に明るい人がいることがあります。私たちはそうした現場や分野に特有な知見を「ドメイン知識」と呼んでいます。例えばデータサイエンティストが、ある工場で一定以上の品質に達する製品をできるだけ多く製造するために製造工程をどう改善すればいいか、データを預かって分析するとします。しかし、データサイエンティストが初めに弾いた分析結果は、その製造工程に長く従事していて現場に詳しい人の経験則や勘には敵わない場合があるのです。逆に言えばデータ分析をする際、対象となる分野の「ドメイン知識」を持っている人にプロジェクトに参画してもらうと分析精度は上がります。ここでハードルとなるのが専門家同士のコミュニケーションです。専門分野が違うため、同じ課題に対して同じことを議論しているにもかかわらず、異なる分野の専門用語や概念で表現しているため話がうまくかみ合わないというケースが起こります。そのような時でもデータの分析結果、数値やグラフを共有することで、つまり、誰が見ても同じ客観情報を共通言語とすることで議論を進めることができるのです。

公的統計を正しく活用し、建設的な議論を進めてほしい

誰が見ても同じ客観的な数値を根拠として提示する考え方は、ポリシーメイキングと呼ばれる政府が政策をつくる過程で重視されてきました。ビジネスの現場で企業買収や事業投資などを検討する際も、やはりデータにもとづいて判断をします。経験を積んだ人が判断した結果とデータから導き出された結果とが一致することは往々にしてあるでしょう。それでも判断の理由を定量的に示しながら詳細を一つ一つ丁寧に議論していくプロセスは非常に重要です。その材料を世の中に提示できる人材は社会に不可欠な存在だと考えており、これが多くの学生にデータサイエンスを学んでもらいたい理由の1つでもあります。

根拠を示すことに実務現場における上下関係や国情の違いは関係ありません。データで客観的に評価できる根拠を見せると建設的な議論を展開することができ、多くの人の理解も得やすい。グローバルなキャリアを築きたい人にとっても、語学や交渉スキルなどと同等に学ぶ価値のある分野だと思います。

公的統計は分析するデータを収集するまでに膨大な作業が必要で、記入する人たちに対しても負担がかかります。しかし、健康診断が病気予防に大切なのと同様に、企業統計や人口統計、自然環境に関する統計データが揃っていないと、この国はどこに課題があり、何をすべきかを適切に把握できません。より多くの人に調査に協力しようと思ってもらうために、収集したデータを分析して政策提言を行い、政策の効果が実感できるようになることで有用性を示していきたいと考えています。私は、多くの人が公的統計のために力を尽くしてきたのを見てきました。ですから収集されたデータに対しては敬意を持っています。改ざんなどは許されないことですし、正しく活用することが調査に関わった多くの人への恩返しになると思っています。理想主義かもしれませんが、それが昔からの変わらぬ研究の原動力です。

 

政府統計の総合窓口(e-Stat)

あわせて読みたい

  • 「教養としてのデータサイエンス (データサイエンス入門シリーズ)」内田 誠一、川崎 能典、孝忠 大輔、佐久間 淳、椎名 洋、中川 裕志、樋口 知之、丸山 宏 著、北川 源四郎、竹村 彰通 編(講談社:2021年)
  • 「統計学が最強の学問である[数学編]――データ分析と機械学習のための新しい教科書」西内 啓著(ダイヤモンド社:2017年)
  • 「スタンダード 経済データの統計分析」美添 泰人、荒木 万寿夫、元山 斉 著、岩崎 学、西郷 浩、田栗 正章、中西 寛子 編(培風館:2020年)
  • 「産業連関表を用いた産業間距離の定量評価に関する一考察」後藤 智弘、保科 架風、荒木 万寿夫 著『青山経営論集 第56巻4号』241-266(青山学院大学経営学会:2022年)

青山学院大学でこのテーマを学ぶ

経営学部 経営学科

  • 経営学部 経営学科
  • 荒木 万寿夫 教授
研究者情報へリンク

関連キーワード

関連コンテンツ

  • 経営学部
  • TPPは我が国に何をもたらすか?
  • 岩田 伸人 教授
  • 2013年3月に参加意思表明がなされた「TPP」。新聞やニュース等でも頻繁に取り上げられ、「TPP」は私たちにとって身近な言葉となりましたが、そもそも「TPP」とは何なのか?なぜ日本はTPP交渉に参加しているのか?本コラムでは「TPP」とは何かを説くとともに、交渉参加の要因を政治・経済の両面から考察する。(2013年掲載)

  • 国際政治経済学部
  • 健康のための課税は、どれだけ効果があるのか
  • 内田 達也 教授
  • 「たばこ税」を始めとして「ポテトチップス税」、「脂肪税」、「ソーダ税」など、健康増進のための課税が国際的に話題になっている昨今。経済学的な見方で、こうした税がどこまで有効なのかを考える。(2012年掲載)

  • 経済学部
  • 経済を「空間的に」考えるとは—「地域経済学」のすすめ
  • 須田 昌弥 教授
  • 「地域経済学」と聞くと、“ある特定の地域の経済を考える学問”と思う人がいるかもしれない。ところがさにあらず。地域経済学とは、経済学の理論に「空間」という要素を取り入れることで、現実に生じている様々な経済問題の対策を具体的に検討する学問である。本コラムでは、幾つかの経済活動を取り上げ、それがどこで行われているのか、行われるべきなのかを考えながら、地域経済学の基本的な考え方を紹介する。(2018年掲載)

関連コンテンツ

  • 会計プロフェッション研究科
  • 経済活動あるところ「会計」あり
  • 八田 進二 教授

  • 法学部
  • 税金は私たちが決めよう!
  • 三木 義一 教授

  • 経済学部
  • 保険から見る原発問題
  • 本間 照光 名誉教授