AGU RESEARCH

世界を読み解くコラム

  • 経営学部 経営学科
  • 正確で客観的な資料を提示し、社会全体の適切な意思決定を促す
  • 荒木 万寿夫 教授
  • 経営学部 経営学科
  • 正確で客観的な資料を提示し、社会全体の適切な意思決定を促す
  • 荒木 万寿夫 教授

「意義のあるデータ」を収集し、社会の実態を正確に映し出す

国の行政機関や地方公共団体が作成する統計調査を公的統計と言います。官民問わず意思決定のための基礎資料として広く活用されており、社会の実態を正確に映し出すことが求められます。行政がマクロな観点で実施するものであるため、その規模も文字通りのビッグデータとなります。官公庁では委員会を設置して調査の設計や改善を行いますが、私は国の仕事をお手伝いする委員としてそこに参画してきました。調査対象となる世帯や企業に対して調査票でどのようなことを質問すべきか検討したり、時代情勢に即した情報を得るために新しい調査項目を考案したり、また実査後の調査データの分析も行ったりしてきました。

公的統計は5年に一度の国勢調査や経済センサスのように過去から調査を継続して行っているケースが多く、調査票を一から設計することは稀です。大半は、既存の調査票の改善について検討するところから始まります。例えば、近年の急速な電子決済の広がりがもたらす消費への影響をどう捉えるか。チョコレートを購入した事実一つをとっても、貯めたポイントと交換するのは消費なのか。そもそもポイントを貯めることは収入を得たと考えてよいのか。調査に先立って、調査項目に関する概念の整理をしておくことも大切になります。加えて質問の意図が正しく伝わるよう言葉や言い回しなど質問の精査にも注意を払う必要があり、どういう質問をするとどんな回答が返ってくるかあらかじめ調査をすることもあります。調査票は表面的にはわかりやすく見えますが、「意義のあるデータ」を集めるために、実は綿密に設計されているのです。

 

 

「家計調査の結果から、ポイントの取得や利用分は分かりますか?また、集計上どのように扱われるのですか?」

 

公的統計を利用したデータ分析の事例として近年では、企業統計において産業を分類する新しい指標「産業間距離」の開発に関心を持っています。一般的に自動車産業、航空機産業、農業があったら、自動車産業と航空機産業は人や物を運ぶという点で距離が近い、農業はそれらと比較して遠い、と直感的にイメージするのではないでしょうか。その「近い、遠い」という感覚はどこから来るのか。もしその感覚的な距離感を数値で表すことができたら、おもしろいと思いませんか。データサイエンスでは、それが可能です。当然ながら、実際の物理的空間に「産業間距離」は存在しません。そこでまず「産業間の距離」を定義します。それから総務省が作成している、各産業間で財・サービスがどのようにやり取りされたかをまとめた「産業連関表」という統計資料を用いて、ある産業が製品を1単位生産するために投入する原材料のリストに注目します。そして、それら産業ごとの原材料レシピのようなものを使って、産業間でこうしたレシピが相互にどの程度似ているかについて、ベクトルという数学の概念を用いて、「産業間距離」の定義を当てはめて計測します。

ベクトルは高校の数学で扱われますが、学んでいるときは抽象的で捉えどころがないように感じて、これはいったい何の役に立つのだろうと思っていた人もいるかもしれません。しかし、大学では、私が研究で用いているように、分析したいテーマがある時に使える便利なツールの一つです。ベクトルに限らず今学んでいる数学は、分析したいことが出てきた時に「あれが使えるかもしれない」と役立つケースが出てきます。データサイエンスの世界に触れるきっかけにもなるので、今は大変かもしれませんがぜひ勉強を続けてほしいと思います。

データサイエンスに数学は必要か

最近、学生を中心に「データサイエンスに数学は必須ですか」と質問される機会が増えてきました。私は研究領域によっても、また実務の分野によっても答え方が変わると思います。調査を企画・実施してデータを生み出す人と、調査で取得したデータを使う人とでは求められる知識や技術が違ってきます。データの分析手法に関しても、手法を開発する人と使う人とでは、やはり違いが生まれるでしょう。人数で言えば、相対的に多いのはデータや分析手法を「使う人」です。こうしたユーザー側の立場であれば、必ずしも数学の高度な知見を身に付けていなくても良い場合があります。文系と理系の垣根を越えてデータサイエンスを活用するユーザーが増えていくのは健全なことで、この分野全体の発展につながると思います。一方で、社会的に有用なデータを生み出したり、データの分析手法を開発したりといったことに携わる人は、一定以上の数学の力が必要です。とは言え、開発する人も使う人もデータサイエンティストです。詳しく見ていくと、それ以外にもデータサイエンスへの多様な関わり方があり、関心のある領域や達成したいタスクに応じて、数学の必要度は異なります。
また、必ずしも数学に長けていなくても、社会科学系の学問的バックグラウンドのある人がデータを扱うことには大きな意義があります。私は文系出身で、大学では経済学専攻でしたが研究活動では社会の動きに関する専門的知見が数学に代わるアドバンテージとなっています。近年は多様なバックグランドを持つ人々がそれぞれの専門的知見を持ち寄り、データサイエンスの発展に貢献していこうという流れも形成されつつあります。数学が重要であることは間違いありませんが、一概に数学が何よりも重要であるとまでは言えないでしょう。

 

AI(DALL·E)に描かせたデータサイエンスのイメージ

 

データサイエンスの分野では、同じデータを使ってどのチームが一番良い結果を出せるかを競うコンペティションがあります。高成績のチームには、データを取得した現場の事情に明るい人がいることがあります。私たちはそうした現場や分野に特有な知見を「ドメイン知識」と呼んでいます。例えばデータサイエンティストが、ある工場で一定以上の品質に達する製品をできるだけ多く製造するために製造工程をどう改善すればいいか、データを預かって分析するとします。しかし、データサイエンティストが初めに弾いた分析結果は、その製造工程に長く従事していて現場に詳しい人の経験則や勘には敵わない場合があるのです。逆に言えばデータ分析をする際、対象となる分野の「ドメイン知識」を持っている人にプロジェクトに参画してもらうと分析精度は上がります。ここでハードルとなるのが専門家同士のコミュニケーションです。専門分野が違うため、同じ課題に対して同じことを議論しているにもかかわらず、異なる分野の専門用語や概念で表現しているため話がうまくかみ合わないというケースが起こります。そのような時でもデータの分析結果、数値やグラフを共有することで、つまり、誰が見ても同じ客観情報を共通言語とすることで議論を進めることができるのです。

公的統計を正しく活用し、建設的な議論を進めてほしい

誰が見ても同じ客観的な数値を根拠として提示する考え方は、ポリシーメイキングと呼ばれる政府が政策をつくる過程で重視されてきました。ビジネスの現場で企業買収や事業投資などを検討する際も、やはりデータにもとづいて判断をします。経験を積んだ人が判断した結果とデータから導き出された結果とが一致することは往々にしてあるでしょう。それでも判断の理由を定量的に示しながら詳細を一つ一つ丁寧に議論していくプロセスは非常に重要です。その材料を世の中に提示できる人材は社会に不可欠な存在だと考えており、これが多くの学生にデータサイエンスを学んでもらいたい理由の1つでもあります。

根拠を示すことに実務現場における上下関係や国情の違いは関係ありません。データで客観的に評価できる根拠を見せると建設的な議論を展開することができ、多くの人の理解も得やすい。グローバルなキャリアを築きたい人にとっても、語学や交渉スキルなどと同等に学ぶ価値のある分野だと思います。

公的統計は分析するデータを収集するまでに膨大な作業が必要で、記入する人たちに対しても負担がかかります。しかし、健康診断が病気予防に大切なのと同様に、企業統計や人口統計、自然環境に関する統計データが揃っていないと、この国はどこに課題があり、何をすべきかを適切に把握できません。より多くの人に調査に協力しようと思ってもらうために、収集したデータを分析して政策提言を行い、政策の効果が実感できるようになることで有用性を示していきたいと考えています。私は、多くの人が公的統計のために力を尽くしてきたのを見てきました。ですから収集されたデータに対しては敬意を持っています。改ざんなどは許されないことですし、正しく活用することが調査に関わった多くの人への恩返しになると思っています。理想主義かもしれませんが、それが昔からの変わらぬ研究の原動力です。

 

政府統計の総合窓口(e-Stat)

あわせて読みたい

  • 「教養としてのデータサイエンス (データサイエンス入門シリーズ)」内田 誠一、川崎 能典、孝忠 大輔、佐久間 淳、椎名 洋、中川 裕志、樋口 知之、丸山 宏 著、北川 源四郎、竹村 彰通 編(講談社:2021年)
  • 「統計学が最強の学問である[数学編]――データ分析と機械学習のための新しい教科書」西内 啓著(ダイヤモンド社:2017年)
  • 「スタンダード 経済データの統計分析」美添 泰人、荒木 万寿夫、元山 斉 著、岩崎 学、西郷 浩、田栗 正章、中西 寛子 編(培風館:2020年)
  • 「産業連関表を用いた産業間距離の定量評価に関する一考察」後藤 智弘、保科 架風、荒木 万寿夫 著『青山経営論集 第56巻4号』241-266(青山学院大学経営学会:2022年)

青山学院大学でこのテーマを学ぶ

経営学部 経営学科

  • 経営学部 経営学科
  • 荒木 万寿夫 教授
研究者情報へリンク

関連コンテンツ

  • 経営学部 経営学科
  • 専門知見を社会の利益へ。
    より価値を生み出せるデータサイエンスの探究
  • 保科 架風 准教授
  • 統計的モデリングは、データの背後にある構造を表す数式=数理モデルをデータから求める手法で、これを利用することでさまざまな現象の予測や解釈を行うことができる。保科准教授は、より予測の精度が高く、汎用性のあるモデルをめざし、既存の理論を応用した新しい手法の開発に取り組む。理論研究の強みを生かし、専門知識がなくても間違えずにデータ分析ができる手法を社会に送り出すことで、誰もがデータサイエンスのもたらすメリットを最大限に活用できる未来を見据える。 (2023年公開)
  • 詳細はこちら

  • 国際マネジメント研究科
  • ソーシャル・ネットワークから経営、組織、そして社会を考える
  • 中野 勉 教授
  • ソーシャル・ネットワークというとSNSやオンラインコミュニケーションを思い浮かべる人が多いだろう。しかし、本来、ソーシャル・ネットワークは、組織の人間関係やコミュニケーションの中に存在する競争や協力などの関係を研究することから始まった。現代社会を生きていくために、ソーシャル・ネットワークについて学び、その理解を深め、大いに活用してほしい。(2013年掲載)
  • 詳細はこちら

  • 経済学部
  • アベノミクスは日本経済の救世主なのか
  • 中村 まづる 教授
  • 最近毎日のようにきかれる言葉「アベノミクス」。これは、第2次安倍内閣の経済政策を示す「通称」であるが、「アベノミクス」とは何かを説くとともに、日本経済が再生するためには何が必要なのか、救世主となりうるものは何かを明らかにする。(2013年掲載)
  • 詳細はこちら