見出し画像

データ戦略の成果(Progress report of National Data Strategy)

(The English article is in the second half.)

社会の活動は交通データ、人流データ、電力、ガスのエネルギーデータ、物流データ、取引データ、気象データ等、様々なデータによって支えられています。
今やデータのない社会は考えられません。このようなデータを安心してきちんと活用できる環境を作るのが私たちの使命です。
この1年間で「デジタル時代に誰もが必要とするインフラや考え方を整備」整理しました。データは目に見えないので気が付きませんが、サービスを提供するのための環境が抜本的に改善してきています。

以下がデータチームの成果のサマリーです。データモデルを整備し、ベースレジストリを作り、各分野に展開するという一連の流れで着実に成果を上げています。

データ戦略の成果のオーバービュー

教育分野は標準化の取り組みが先行しており、以下のように自分らしく学べるようにデータを自在に活用できる環境整備を進めています。

教育分野での進展

また、2022年8月31日に公表された地方公共団体情報システムデータ要件・連携要件標準仕様書のデータ設計もGIFの成果が反映されています。これにより、国、地方公共団体で日付の形式が違うなどの問題も徐々に解消されていきます。
さらに現在、検討を進めているのが防災データの標準化です。状況報告、支援内容等、災害時には様々な情報が飛び交いますが、これらを効率的に行うためデータの標準化を進めているところです。

データ戦略の目指すもの

さて、こうした取り組みを通じて私たちはどのような社会を目指しているのかを解説していきましょう。

誰もがデータの消費者であり、データ生成・発信者である

データ戦略というと、作る立場、使う立場で見ることが多いですが、誰もがデータの消費者であり生産者、発信者であるという視点も重要です。

データの流れのイメージ

皆さんもスマートフォンを使っていると思います。そのスマートフォンで使っているアプリでは多くのデータを使っています。つまり消費者としての立場です。
一方、アプリケーションから位置情報や検索情報、健康情報、購買情報など、様々なデータが生成され発信されています。今度は皆さんデータの生産者であり発信者の立場です。

このデータは匿名化された上でビッグデータ化されることにより、他の方々の生活を支えています。このようなデータのサイクルが世の中では当たり前になってきています。

社会の土台を支えるのがデータ戦略です

こうしたデジタル社会の土台をなすものとして私たちはデータ戦略を推進しています。

データ戦略のスコープ

時間軸では、150年前から250年後の400年を見ています。
日本の基本制度である戸籍や登記等の制度の骨格ができたのは、明治政府が近代国家を作った150年前のことです。また、今日生まれた子供が100歳まで生きたとすると、まずは戸籍で管理され、亡くなった後150年は除籍簿に移行してデータが管理されます。つまり、今後250年、今記録したデータがきちんと活用できる形で管理されなければいけません。

このような長いスパンで我々データを考えています。

変化の激しい世界ですので、よく、2030年なんてわからないといわれます。しかしデータ戦略を考える場合には2050年、2100年を考えることが当たり前になります。

また、現時点を面で見てみると、サイズでは、ナノレベルつまりはIoTレベルのセンサーデータからグローバルなレベルまで、さらに、垂直にみると衛星データから地下データまで、さまざまなデータを扱う必要があります。

このように非常にスケールの大きなデータ空間をマネージしてデータ駆動社会をつくっていくことが我々に求められています。

信号から知識、それを活用したアクションまで

ただ単に我々はデータだけを見ているわけではありません。信号から知識それを活用したアクションまで、データのサイクル全体を見ています。

データのサイクル

何かの「事象(イベント)」が起こったとき、事象によって生じた「信号(シグナル)」を観測し記録します。その信号の記録を収集することによって「データ」になります。データを処理して意味付けすることにより「情報(インフォメーション)」になります。情報といっても、もしかしたら違った解釈をしているかもしれないので、情報を分析して、さらに確認をすることによって「確認された情報(インテリジェンス)」になります。この確認された情報を関連付けたり融合していくこと、それと位置づけたり理解することにより「知識」として蓄積されていきます。

今度は利用の局面です。知識に、個人の「経験」とか「知恵」が頭の中でスパークし、評価や創造が行われたりし、その結果、「アイディアや計画」が生まれます。
そして、その計画をもとに意思決定をして アクションに繋げていきます。

このように信号から知識へと大きなサイクルを、データ戦略では考えていく必要があります。

これまでのデータ関連基盤整備の成果

データの基本の文字を整備

データの基本は文字にあります。皆さんが扱うデータは、多くの場合、数字や文字で表されます。特に、文字で書いてある基本的なデータとして、氏名、法人名、地名があります。

文字の主な対象と最近の取り組み(黄色がデジタル庁になってからの成果)

それぞれに、漢字、読み仮名、英字がありますが、これまで十分に整理がされてこず、2015年ぐらいから漢字、読み仮名、英字の整備が急速に進んできています。
これらは、漢字を整備する文字情報基盤等、内閣官房IT室のころから進めていた取り組みの延長ですが、今年4月にアドレスのベースストーリーができたことによって 地名の読み仮名や英字が整理されました。

このように社会の文字環境がほぼ完成しました。これ日本のデジタル化にとって非常に大切な一歩です。

デジタルデータの基本ルールを整備

他にも重要な基礎データがあります。日付、住所、電話番号です。これらをデジタルデータで扱うためには、記法の標準化を行うことが重要となるので政府相互運用性フレームワーク(GIF)で書き方などのルールを作っています。(印字や表示は自由に表記できます。)

基本情報の表記例

例えば、日付は、何年何月何日で書いたりスラッシュ区切りで書いたりハイフンでつないだり、様々な形で記載されます。

住所等の記載は、5丁目を漢数字で書くこともありデータとして統一した表記がされていません。郵便番号を書くと住所が自動表示され丁目以下を記入するなどの様々なサイトがありますが、サイトによって自動記入される範囲等が様々です。また、建物名を別のデータ項目として管理するのが一般的ですが、住所と一体のデータ項目で記録しているものも多いです。そもそも、住所等と書いてあるように、人の住んでいるところは住所と呼ぶけれど、法人等の位置は所在地と呼んだり、住所表記のほかに地番がある等、一言で表せないので住所等と書いています。ベース・レジストリではアドレスと呼んでいます。

電話番号も様々な書き方があります。カッコ「()」をどこにつけるか、ハイフン「-」でつなぐのかなどをルール化することが重要です。国際標準は複数あり、ここでは省略可能な市外局番に()を付ける形式を指定しています。

日付や住所を申込書などで1ヵ所だけ書く場合には問題に感じないかもしれませんが、名簿や一覧にするときには、この表な表記の揺れは気になります。また、同じデータかどうかを確認するときにも不便です。
国内各地で、このような名簿上の表記を統一するデータのクレンジングが行われて時間やコストを費やしています。

コンピューターの世界では、こうしたバラバラな定義を減らすことで、大幅に社会コストを減らすことができます。
そのため、このようなデータの基盤を作っています。

今までのデータ設計と、データ戦略が進める参照モデルを使ったデータ設計手法

データ表記の基本ルールを整えるとともに、データ戦略ではデータの設計手法から根本的に見直しています。

これまでの課題

これまでのデータ設計というのは、お客様のところに行って個別に要望を聞き、それを積み重ねてデータ設計をしてきました。そのため拡張性や柔軟性が欠けることがありました。データ項目が不要になってもデータベースの改造が困難で、いつまでも残り続けるデータ項目があったりもします。

データ戦略は、グローバルに使われているが設計手法を活用しています。

構造化したひな型を使ったデータ設計

データのひな型群を用意して、サービスを作る人が、そこからサービスの必要性に応じてデータ項目を取捨選択し、さらにデータ項目を追加することでデータの設計をしていきます。
こうすることで、コア部分の相互運用性の確保を図りつつ、柔軟性、拡張性が高いデータを設計することができます。

社会のデータを体系化

このように設計するにはデータのひな型群が重要で、社会全体のデータ体系化として今年の3月31日に政府相互運用性フレームワークを公表しました。今まで内閣官房のIT室で扱ってきた各種標準類を一つの体系としてまとめてます。

政府総合性フレームワークの全体像

下から、文字データや数値データ、データの辞書であるコア語彙(IMI共通語彙基盤として推進している部分)、それから様々なサービスで共通的に使われる日付やアドレスのコアパーツがあります。
その上に、建物、施設等の分野を横断してもデータの骨格が共通なものであるコアデータモデルを定義しています。
その上が実装データモデルです。分野毎の特徴を生かしたデータモデルをひな型であるコアデータモデルから項目を取捨選択したり拡張して使います。

レゴブロックの模型を作るように部品を組み立てていきます。

また、サービスを作っていくためのガイドブックも用意しています。
このGIFを一年間のデジタル庁の動きの中で整理して来ましたが、自治体や企業から高い評価を受けています。

気が付かない間に基盤の整備は進んでいます

分かりにくいところもあるので具体的な説明をします。

GIFの展開イメージ

文字データや日付の書き方をルール化する等、教育分野では文部科学省が整備を進めている教育データ標準にGIFのデータ設計のノウハウが採用されてます。
さらに、防災分野で設計中のデータモデルもGIFのデータ設計のノウハウが生かされています。
スマートシティの一環であるデジタル田園都市プロジェクトでは、データ連携基盤の活用、GIFの活用、オープンデータの推進が採択の基準に反映されており、データモデルを使ったデータの流通や公開が体系的に推進されています。
行政サービスのデータモデルも作っています。政府システムは、政府相互運用性フレームワークの活用が推奨されていますし、さらに、各システムを作る時にチェックリストでデータ標準を検討したか確認をしています。地方自治体へは、地方公共団体情報システムデータ要件・連携要件標準仕様書でGIFの内容が反映されています。

一番左にベース・レジストリがありますが、この設計にもGIFのデータモデルが使われています。

このように、利用している方の目には見えにくいのですが社会のデータ流通の基盤中の基盤の整備をしており、この一年で「デジタル時代に誰もが必要とするインフラや考え方を整備」しました。

都市でいえば、道路、電気、水道、ガス、下水道という、皆さん気になさらないで使えるようなインフラがあります。データ戦略は、デジタル社会の見えないけど最重要な基本インフラを整備してきました。

この基盤で何ができるようになるのでしょうか

この基盤で何ができるようになるかということを説明しましょう。
基盤が整備されデータが自由自在に使えるようになると、まず分野横断のサービスができるようになります。

同じ都市や地域を対象とするスマートシティと防災でデータを共通化したり、文化史跡の情報を観光でも教育でも使うような分野を超えたサービスができるようになってきます。
また、都市型のスマートシティのモデルとデジタル田園都市それと山間部等の地域でデータ基盤を統一化することによってアプリケーションを共通化、横展開することが容易になります。データモデルが揃っていれば、サービスを他都市に展開したり、他都市の優れたサービスを簡単に導入することができます。これは地域にとっても有益なことですし、スマートシティ関連サービスを作っている事業者にとっても大きなチャンスです。これまでは優良事例を作っても、他都市に展開するのにはカスタマイズが必要で、効率的にビジネス展開できませんでしたが、データや基盤が標準化されることにより、他地域への展開が容易にできるようにできるようになります。もちろんグローバル展開も容易になります。

データという切り口で、「社会」「制度」を見直しています。

データ戦略の推進を「見えないし、遅い」という人もいるかもしれません。しかし、データというのは社会を横串しており、社会全体の改革を考え、今までの紙を前提とした制度を見直していく必要があります。さらに100年以上先にも使える仕組みを考えていく必要があります。

このような基盤整備と改革を並行して進めていること、社会の基本ルールに近いところを改革しているということで時間がかかっています。しかし、アナログ社会からデジタル社会への大きな変革であり、明治維新並みの気概を持って推進をしているところです。

データ戦略全体を説明しましょう。

データ戦略はSociety5.0の実現を目標にしていますが、具体的に我々目指している姿を説明します。

目指している姿

Society5.0では、リアルとバーチャルの世界が融合したデジタルツインが実現されます。
行政の保有するデータ、統計データ、センサーデータも含め基本的なデータをそろえるとともに、データを交換しやすくする仕組みをつくります。その結果として「誰でも必要なデータが手に入り、新サービスをスタートしやすい。またサービス向上をしやすい社会。それにより生活も豊かになる社会」を目指しています。

データ駆動社会

エストニアが先進的と良く取り上げられます。エストニアでは、様々なデータがすぐに手に入るのですぐにスタートアップすることができます。IT産業が栄えるのはもちろんですが、サービス全体が向上するので、そこに最先端サービスを使いたい住民が集まってきて、社会全体が活性化しています。このような、データを基にした経済循環を目指しています。

データ戦略はアーキテクチャを活用し推進

AIやデータサイエンスが注目されますが、実際にサービスを実現するためにはアーキテクチャで考えることが重要です。

戦略からサービス、ルール、利活用基盤、データやセキュリティ等の取り組みがバランスよく推進される必要があります。

GIFのアーキテクチャ

例えばデータが整備されていても、データを交換するためのルールやプラットフォームがないと、そのサービス実現できません。
逆に、ルールがあったとしてもデータがなければルールだけでは社会が動きません。

アーキテクチャで考え、バランスよく整備していくことが持続的サービスを作るために必須の条件です。

使えるデータ環境を目指す

具体的には、使えるデータ環境を作っていくことが重要です。利用者視点で優先順位をつけて取り組んでいます。

使えるデータ環境

共通的なデータの利用ルールは、内閣官房IT室のころから推進してきた政府標準利用規約があります。さらに、政府相互運用性フレームワークの中でAPIの利用規約の雛形も提供しました。また、個人情報保護法やモビリティのルールなど、各府省でも分野別のルールをそれぞれ整備しています。
このように政府で共通的なルールが整備されると、地域をまたがったサービスが提供しやすくなります。トラスト確保の方法の検討も進んでいますし、今後もデジタル社会に必要なルール整備を進めていきます。

中段の層ですが、データはまず見つけられることが重要です。そこがスタートラインになります。そのため、データカタログを整備したり検索用データや、分類体系であるコード一覧などを整理しています。また、データ定義を明確にするためのデータの辞書を作ることを検討しています。

データは複数データを掛け合わせることで価値が増大することが多いです。そのため、データが見つかったらデータをつなぐことになります。そのためのコネクタとかブローカと言われる連携の仕組み、全体プラットフォームとしてのDATA-EXの整備と活用を進めているところです。また、データへのアクセス管理や、使ってよいサービスを管理するための認証、認可の仕組みも検討しています。

いよいよデータを活用しようとしたときに、自組織で持っているデータを使うこともあればオープンデータを使うこともあります。さらに有料のデータを購入することがあるかもしれません。データが取引される社会を想定しデータ取引市場のルールの在り方などの検討も推進しています。

そして、何よりも重要なのが多様で質が高くて充分な量のデータ供給です。サービスをやろうとした時に必要なデータが手に入れられるようにすることが求められています。そのため、行政機関が持っているデータを公開し利用可能にするオープンデータの推進を強化しています。また、社会の基本のデータについてはベース・レジストリの整備を進めています。
これらの、オープンデータやベース・レジストリのデータを高品質かつ簡単に整備、運用できるようにに政府相互運用性フレームワークを活用しています。

データ戦略が実現するサービスのイメージ

データ戦略により一年で様々な環境整備しましたが、これらを通して実現するサービスや効率化のイメージを如何に3つ示します。

申請ワンスオンリーサービスとは、民間のサービスでよくある、ユーザーIDを入れると自分の住所とか決算情報とか配送先の既存の登録情報が呼び出されるサービスです。
行政機関への不満として、何度も同じ項目を書かせるというものがあげられますが、それを防ぐために、一か所で申請すれば他機関とデータ連携してくれるワンストップサービスとともにデジタル手続法により推進されています。
行政内でも、ベース・レジストリの利用で、審査時間の短縮など業務の効率化を大幅に進めることができます。

データをオープンデータ化することによって、最新で正確なデータを使った様々なサービスが作れるメリットもあります。行政業務の透明化や改善などにも活用することができます。

さらに、ベース・レジストリで大きく期待されるのが、社会全体での重複コストの削減です。日本中の組織が顧客情報などのメンテナンスをしていますが最新で正確な情報が参照可能になれば大きな効率化を図ることができます。
本社移転などの情報が共有できれば、各組織で管理しているデータメンテナンスのコストが下がるのはもちろんのこと、配送間違いの防止、それによるCO2削減など社会的にも大きな効果があると考えられています。

社会全体の不効率や無駄をなくしていくためには、データ視点の改革は非常にインパクトがあります。

既に一部のサービスが始まっています

既にサービスの実現が始まっているものもあります
法人情報や制度情報のペースレジストリですが、両方とも総合政府相互運用性フレームワークに基づいてデータを設計し、それに基づいてデータを蓄積しています。

法人の検索サービスであるgBizInfoは、商業登記にも続く法人の存在確認ができるとともその法人が保有する資格情報や政府との契約案件等が検索できます。また、制度ベース・レジストリでは、国や自治体が提供する給付金とか相談等の支援制度を簡単に探せるようにしています。また、両サービスともにAPIで情報取得することができます。
このように我々データの基盤を作るというところから実際のサービスまで、関係府省と連携して非常に幅広い取り組みを進めています。

グローバル視点での推進

データ戦略は、グローバル視点ということが非常に大きなポイントになります。今は、海外のさまざまなサイトに簡単にアクセスすることができますし、企業間の取引もグローバルな取引が増えてきています。グローバルを考えないとデータ戦略は進められません。

データを取り巻く国内環境

グローバルを見る前に国内の環境も見てみましょう。データを取り巻く国内環境も大きく変わってきています。

データに関する注目度が増加してきており、人材不足が顕在化しています。人材の量も不足していますが量も不足しています。また、各組織のデータ戦略を担うCDO(Chief Data Officer)も増加してきていますが、ここでも人材不足といわれています。

そもそも、基礎データの不足もさまざまなところで言われています。データを探したりクレンジングするのに非常に時間がとられ、それが人材不足を加速しています。そうした面からも、ベース・レジストリとかオープンデータをはじめデータ戦略の推進に期待が高まっています。

環境変化としては、企業内やスマートシティ等でデータの活用する機会が増えてきて来ていますが、多くの制度がデータ活用を前提に作られていないのでグレーゾーン的な領域が増えてきています。個人情報は大丈夫だろうか、知的財産は大丈夫だろうかという心配の声をよく聞きます。それは新規事業を行うときのリスクにもなっておりデータ社会に移行するときの大きな課題になっています。
サービス開発という側面からは、最近、ノーコード開発が注目されています。プログラミングの知識がなくても業務の流れ図等があればシステムが作れるという仕組みですが、このようなな手法を使うときにも、データのひな型を参照して作れれば効率的です。政府相互運用性フレームワークで提供しているデータモデルを活用することで、開発環境も高度化できると考えています。

世界で進むデータ駆動社会への戦略的取り組み

一方、海外を見ると世界中でデータ駆動社会への戦略的取り組みを進めています。世界各国は2018年から2020年までの間に戦略を公表していますが、どの国も基本的な考え方として、データの価値に注目し、原則のポイントとしては安心して安定的に使えることサステイナビリティを重視しています。そのための仕組みの整備、人材の投資も頑張っており、データが国の競争力を左右するものとして、2030年頃をターゲットにデータ社会に向け積極的に取り組んでいます。

世界のデータ戦略

欧州委員会では、データに関連した法整備に力を入れ、英国とか米国は、CDOをはじめとした体制整備に力を入れています。全体的には、戦略、法律、人材、体制、運用がバランスよく推進されています。

ベンチマークは常にグローバル

データ戦略を進めていく中で重要なベンチマークがグローバルです。データ戦略にしたがってデータやサービスの推進をすることで、他地域への展開とか他地域のアプリケーションを持ってこれるということができると考えています。他地域にはもちろん海外も含まれます。そのためには、グローバルに使われる仕組みを積極的に使っていくことが重要です。

推進に関する考え方

設計手法としては、データ設計はUMLクラス図、アーキテクチャ記述はArchimate、プロセスモデルにはBPMNを使っています。このような手法を使うことで、効率的に設計することが可能になり、国際的な対話をする場合もお互いの理解を深めることが容易になります。
データモデルは、スマートシティ等使われるスマート・データ・モデルや、ウェブ検索で使われるschema.orgもあります。それに加え、検索用のデータ標準であるDCATも参照しています。
人材は、英国のSFIAや米国のO’net等の様々な世界の優れた仕組みがあるので、それらを参照しています。
こうしてグローバルな手法を導入することで、interoperabilityが高く、国際展開も可能なサービス群を構築することを目指しています。
また、行政自らこれらの先進技術を使うことで、国内技術の底上げにつながります。企業の人が打ち合わせに来てデータチームの技術レベルの高さに驚くことも多いです。また、ノウハウ展開や人材育成も並行して実施しています。

国際的な交流も推進

グローバルに推進するには人的交流も必要で、DFFTのような理念をG7やG20で議論するとともに、インターオペラビリティなどの個別テーマの議論にも参加しています。

OECDや国連の会議

データチームのnoteは日英で情報発信するなど、国際的な情報発信にも取り組んでいます。

2030年に社会と並ぶデータ駆動社会を推進する

世界の目標は2030年であり、日本も世界と並ぶデータ駆動社会を2030年ぐらいに実現するため、2025年までに仕組みをつくって、その後2030年に向けて再申請やシステム更改に合わせデータを整備していきます。

全体スケジュール

そのため2021年度中に相互運用性フレームワークを整備しており、順調に戦略を進めているところです。

まとめ

デジタル庁ができる前と後を比較すると、基盤の状況が全く違います。
これまで、AI等の様々な実証が行われてきましたが、実証がそのままサービスに展開できるケースは少なく、他地域や他分野への展開もできない場合が多くありました。

デジタル庁前後の比較

それは、これまでデータの世界にアーキテクチャやきちんとした設計手法が使われてこなかったためです。
デジタル庁は、これまで内閣官房IT室で地道に取り組んできたデータプロジェクトを体系化して強力に推進をしています。
アーキテクチャを導入し、グローバルに普及する最新の設計手法を導入することで、サービス構築を迅速にでき、持続可能なサービスを提供することができるようになっています。

要するに、都市開発で言えば、方法論が整備され、土地造成や電力などの基礎インフラの整備が終わった状況になっています。

基盤が整理されたことにより、今後はAIを使ったサービスなど、様々なサービスが出てくることを期待しています。

デジタル庁データチームは、この1年間でデータの基盤をこれまでにないスピードで整備、展開してきました。足場はできたので、現場での活用を期待しています。

詳細プロジェクト資料が公表されましたので、こちらの会議資料もご覧ください。(日本語)[2022-09-08追記]

(データ戦略統括 平本 健二)

English

In order to increase the international communication of information, we will post an English translation in the second half of our note. We use automatic translation from the perspective of promoting our data strategy. This is based on the translation by National Institute of Information and Communications Technology (NICT) "Minna no Jido Hon' yaku @ TexTra ®". And we sometimes modify the translation to make it easier to read.

Our policy for articles in English

Progress report of National Data Strategy

Social activities are supported by a wide range of data, traffic, people's flow, energy for electricity and gas, distribution, transactions, weather, etc. it is impossible to imagine a society without data at present. Our mission is to create an environment where such data can be used safely and correctly. Over the past year, we have organised the infrastructure and ways of thinking everyone needs in the digital age. Data is invisible, so we don't become aware of them, but the environment for providing data-related services is improving drastically.
 
Below is a summary of the results of the data team. We are making steady progress in putting the data models in place, creating base registries, and deploying them in each area.

The result of the data strategy

In education, standardisation efforts are taking precedence. We are developing an environment in which data can be used freely so that students can learn in their way, as described below.

Result of Education domain

In addition, the results of GIF are reflected in the data design of the Standard Specifications for Data Requirements of Local Government Information Systems published on August 31, 2022. This will gradually solve differences in data formats between national and local governments. Furthermore, we currently make the standard of disaster-related data. Various information, such as status reports and support details, will be exchanged during a disaster, and standardisation of data is being promoted to carry out these efficiently.

Data Strategy Goals

Now, let me explain what kind of society we aim for through these efforts.
Everyone is a consumer of data and a producer and publisher of data.

Data cycle

Data strategy is often seen from the standpoint of creating and using data, but it is also essential to consider that everyone is a consumer, producer and publisher of data.

I think all of you are also using smartphones. The application that you are using on that smartphone uses many data. In other words, it is your position as a consumer.
On the other hand, various data, such as location information, search information, health information, purchase information, etc., are generated and transmitted from the application. This time, you are the producer and publisher of the data.

This data is anonymised and converted into big data to support other people's lives. This kind of data cycle is becoming a matter of course worldwide.
 

The foundation of society is a data strategy.

We are promoting our data strategy as the foundation of this digital society.

Overview of the scope of the strategy

On the time axis, we look at 400, which is from 150 years ago to 250 years later. The family registration and registration system framework, which is Japan's primary system, was created 150 years ago when the Meiji Government established the modern state.
If a child born today to the age of 100, it is managed by the family register for 100 years. After the person dies, the data is transferred to the record of the removed family register. the data will stored for 150 years. In other words, it must be managed in a form that can be appropriately used for 250 years.

We are considering our data over such a long span.

People say we don't know the year 2030 because it is a rapidly changing, but when thinking about data strategy, it is natural to think about the year 2050 or 2100.

In terms of size, we need to handle a wide range of data, from sensor data at the nano-level or IoT level to global data and satellite data to underground data when viewed vertically.

We are required to create a data-driven society by managing these extremely large-scale data spaces.

From signals to knowledge and actions utilising it

We're not just looking at data but the entire data cycle, from signals to knowledge to actions that leverage it.

Data life cycle

When an event occurs, it observes and records the signal generated by the event. By collecting the records of the signal, it becomes "data". It becomes "information" by processing the data meaning to the data. Information may be interpreted differently, so it becomes "intelligence" by analysing and confirming the information. It accumulates as "knowledge" by relating and integrating this confirmed information, positioning it with it, and understanding it.

In the use phase, knowledge, individual experience and wisdom spark in mind, and evaluation and creation are carried out. As a result, "ideas and plans" are born, and decisions are made based on those plans and are linked to actions.

Data strategies need to consider such a large cycle from signals to knowledge.

Results of data-related infrastructure development

Maintain Basic Data Characters

The essential data is written in letters. The data you deal with is often represented by numbers or letters. The primary data in letters include names, corporate names, and geographical names.

There are kanji (Chinese characters), yomigana (Japanese syllabaries), and alphabet (English letters), but they have not been sufficiently organised so far. Since around 2015, kanji (Chinese characters), yomigana (Japanese syllabaries), and alphabet (English letters) have been organised rapidly. These efforts have been promoted since the time of the Information Technology Office of the Cabinet Secretariat. In April of this year, when the base story of address was created, the yomigana (Japanese syllabaries) and alphabet (English letters) were organised.

In this way, the character environment of society has almost been completed. This is a crucial step for digitisation in Japan.

Development of basic rules for digital data

Other critical primary data include the date, address, and phone number. Standardisation of notation is essential for handling these in digital data, so we have created rules such as how to write them in the Government Interoperability Framework (GIF). (Printing and display can be described freely.)

For example, dates are written in various forms, such as in what year, what month and what day, with slash delimiters or hyphens.

5-chome is sometimes written in Chinese numerals, so there is no unified address description. There are various sites where the address is automatically displayed when the postal code is written and the following address is entered. However, the range that is automatically entered varies depending on the site. In addition, the building name is generally managed as a separate data item, but many records it as a data item integrated with the address.

There are many ways to write phone numbers. It is important to make rules on where to put the parentheses "()" and whether to connect it with the hyphen "-". Several international standards specify the form of adding () to an optional area code.

It may not be a problem if you write the date or address in only one part of the application form, but when you make a list or list of names, the fluctuation of the notation in the table is a concern. It is also inconvenient to check whether the data is the same. It takes time and cost to cleanse the data so that the notation on the list is unified in all parts of Japan.

In the computer world, we can significantly reduce social costs by reducing these disparate definitions, thus creating a foundation for such data.

Data design techniques using conventional data design and reference models promoted by the data strategy

In addition to arranging the basic rules for data presentation, the data strategy radically reexamines data design methods.

In the past, data design was done by going to the customer, listening to individual requests, and accumulating them. Therefore, there was a lack of expandability and flexibility. Even when a data item becomes unnecessary, it isn’t easy to modify the database, and some data items remain forever.

The data strategy takes advantage of design techniques used globally.

Reference models

By providing a set of data templates from which a service designer can design data by selecting data items according to the needs of the service and adding additional data items, you can create flexible and scalable data while ensuring core interoperability.

The systematisation of social data

On March 31, the Government Interoperability Framework was announced as a systematisation of data for society. It combines various standards handled by the Information Technology Office of the Cabinet Secretariat into one framework.

Government Interoperability Framework (GIF)

From the bottom are character and numeric data, core vocabulary, a dictionary of data, and core parts of date and address, which are commonly used in various services. On top of that, a core data model is defined, with a standard data skeleton across fields such as buildings and facilities. On top of that, there is an implementation data model. A data model that uses the characteristics of each area is used by selecting or expanding items from the core data model.

We assemble the parts like making a model of Lego blocks.

We have also prepared guidebooks for creating services. We have organised this GIF and received high praise from local governments and private sectors.

We provide infrastructure without citizens becoming aware of them.


We will explain in detail.

Usage of GIF

In education, the know-how of GIF data design has been adopted in the educational data standards being developed by the Ministry of Education, Culture, Sports, Science and Technology. In addition, the know-how of GIF data design has been utilised in the data model for disaster prevention. In the Digital Garden City Project, which is part of the Smart City, the utilisation of data-linkage infrastructure, GIF, and the promotion of open data are reflected in the adoption criteria. The distribution and disclosure of data using the data model are systematically promoted. The data model for administrative services is also being developed. For government systems, the utilisation of the Government Interoperability Framework is recommended. In addition, we check whether the data standard was considered in the checklist when each system was developed. For local governments, the content of GIF is reflected in the Standard Specifications for Data-Requirements for Local Government Information Systems. The base registry on the far left uses the GIF data model for this design.

In this way, although it is difficult for users to see, we are developing the infrastructure of social data distribution. In the past year, we have "developed the infrastructure and the way of thinking everyone needs in the digital age."

In cities, people can use roads, electricity, water, gas and sewage systems without worrying about them. The data strategy has put in place the digital society's invisible but essential basic infrastructure.

What can we do with this foundation?

Let me explain what we can do with this infrastructure. Once the infrastructure is in place and data is freely available, cross-sectoral services will be available first.

Smart City and Digital Garden City

Data can be shared between smart cities and disaster prevention that target the same city or region. In addition, it will become possible to provide services beyond fields, such as using the information on cultural and historic sites for tourism and education. In addition, by unifying the data infrastructure in urban smart cities, digital rural cities, and mountainous areas, it will become easier to share applications and deploy them horizontally. With a complete data model, services can be deployed to other cities and superior services from other cities can be quickly introduced. This is beneficial for the region and an excellent opportunity for businesses that produce smart city-related services. In the past, even if excellent examples were created, deployment to other cities required customisation and could not be done efficiently. However, standardising the data makes it easier and more deployable in other areas. Of course, global deployment becomes more effortless.

We are reviewing "society" and "systems and regulations" from the data perspective.

Some may say that the promotion of a data strategy is "invisible and slow." However, data is an integral part of society. It is necessary to consider the reform of society as a whole and review the existing system and regulations based on paper. It is also essential to consider a system that can be used more than 100 years in the future.

It takes time because we are advancing such infrastructure development and reform in parallel and reforming areas close to society’s basic rules. However, it is a significant transformation from an analogue society to a digital society, and we are promoting it with the same spirit as the Meiji Restoration.

Let's talk about the overall data strategy.

Our goal is to make Society5.0 a reality, but I will explain how we aim at it.

What we are aiming for

In Society5.0, Digital Twin is realised by fusing real and virtual worlds. Primary data, including administrative, statistical, and sensor data, will be collected, and a system will be created to facilitate data exchange. As a result, we aim to create a society in which everyone can obtain the necessary data and start new services easily. In addition, it is easy to improve services. By doing so, we will be able to enrich people's lives.

Vision

Estonia is often mentioned as being advanced. In Estonia, various data is readily available to start immediately. Of course, the IT industry will flourish, but as the service improves, people who want to use cutting-edge services will gather there, and society as a whole will be revitalised. We are aiming for economic circulation based on such data.

Data strategy and architecture.

While AI and data science are attracting attention, it is essential to consider architecture based services.architecture-based

Architecture

Promoting a well-balanced approach from strategies to services, rules, and infrastructure for utilization, data, and utilisation is necessary. We aim to create a society in which people can enjoy their lives.

For example, even if data is well organised, if there are no rules or platforms for exchanging data, that service cannot be realised. On the other hand, even if there are rules and no data, society cannot move with only regulations.

To create a sustainable service, it is essential to consider it in terms of architecture and maintain its balance.

Aim for a usable data environment

In concrete terms, creating a data environment that can be used is essential, and we are working to prioritise it from the user's perspective.

Priority actions

As for common data usage rules, there are the Government Standard Terms of Use, which have been promoted since the time of the Information Technology Office of the Cabinet Secretariat. In addition, we provided a model of the API Terms of Use within the Government Interoperability Framework. In addition, each Cabinet Office and each Ministry have established rules for each field, such as the Personal Information Protection Law and mobility rules. When the government sets standard practices, it becomes easier to provide services across regions. Studies on ways to secure trust are progressing, and we will continue to develop regulations necessary for the digital society.

In the middle layer, it is essential to find the data first. That is the starting line. For this reason, we have prepared a data catalogue, organised search data, and classified a code list as a classification. We are also considering creating a data dictionary to clarify the definition of data.

In many cases, the value of data increases by multiplying multiple data. Therefore, when data is found, the data will be connected. For that purpose, we are developing and utilising a linkage mechanism called a connector or broker and DATA-EX as a whole platform. We are also considering an authentication and authorisation mechanism to control data access and manage services that can be used.

When we finally try to use data, we sometimes use data owned by our organisation and sometimes use open data. We may also purchase paid data. We are also examining the rules of the data trading market, assuming a society in which data is traded.

The most important thing is providing diverse, high-quality, and sufficient data. It is necessary to be able to obtain the required data when starting to provide services. Therefore, we are strengthening the promotion of open data to make available the data held by government agencies. We are also developing the Base Registry for primary social data. We utilise the Government Interoperability Framework so that the open data and the Base Registry can be maintained and operated with high quality and ease.

Image of Services Realized by Data Strategy

We have prepared various environments throughout the year based on our data strategy. This section presents three images of services and the efficiency achieved through these efforts.

Image of benefit

The Once Only Service is a service that, when you enter your user ID, the current registration information of your address, account settlement information, and delivery address is called up, which is common among private services. Complaints about administrative agencies include requiring them to write the same item many times. To prevent this, the Once Only Service is promoted under the Digital Procedure Law and is a one-stop service that links data with other organisations if you apply in one place. Even within administrative agencies, using the Base Registry can significantly improve operational efficiency by reducing examination time.

By converting data into open data, there is an advantage that various services using the latest and most accurate data can be created. It can also be utilised for transparency and improvement of administrative work.
 
In addition, the primary expectation of a base registry is to reduce duplication costs for the entire society. Organisations throughout Japan maintain customer and other information, but if the latest and accurate information can be referenced, significant efficiency can be achieved. If information such as the head office relocation can be shared, not only can the cost of maintaining data managed by each organisation be reduced, but it is also thought to have a significant social effect, such as preventing delivery errors and thus reducing CO2 emissions.

To eliminate inefficiency and waste in society as a whole, reform of the viewpoint of data has an enormous impact.

Some services have already started.

Some services have already begun to be available. Corporate and Public services information generates data based on the Government Interoperability Framework and accumulates it.

GBizInfo, a search service for corporations, allows you to confirm the existence of a corporation following commercial registration and also allows you to search for credentials held by the corporation and contracts with the government. In addition, the Public service-Based Registry makes it easy to find public services such as benefits and consultations provided by the national and local governments. In addition, both services can obtain information using APIs. This way, we promote various initiatives cooperating with the relevant ministries and agencies, from creating our data infrastructure to providing essential services.

Promotion from a global perspective

Global is critical one of the most important aspects of the data strategy. Nowadays, it is easy to access various overseas sites, and the number of transactions between companies is increasing globally. Without a global perspective, data strategy cannot proceed.

The domestic environment surrounding data

Before looking at the global market, let's look at the domestic environment. The domestic climate surrounding data is also changing significantly.

Data is getting more attention. There is a shortage of human resources but also a shortage of quality.
In addition, the number of Chief Data Officers (CDOs) responsible for each organisation's data strategy is increasing. Still, it is also said that there is a shortage of human resources.

In the first place, it is said that there is a shortage of primary data in many areas. Finding and cleaning it takes so much time, accelerating the lack of human resources. In this aspect, there is a high expectation that the base registry and the open data will be promoted.

As for environmental changes, opportunities to utilise data in companies and smart cities are increasing. However, grey areas are growing since many regulations are not built on data utilisation. I often hear whether personal information is safe or intellectual property is safe. This is also a risk when starting new businesses and a significant issue when transitioning to a data-based society. From the aspect of service development, no-code development has recently attracted attention. Even if you don't know to program, you can create a system if you have a business flow diagram, etc. However, when using the method, it is efficient if you can make a system by referring to a data model. I believe the development environment can be advanced by utilising the data model provided by the Government Interoperability Framework.

Strategic Approach to the Global Data-Driven Society

On the other hand, looking overseas, we are advancing strategic initiatives for a data-driven society worldwide. Countries around the world announced their strategies between 2018 and 2020. All countries place importance on the value of data as a basic concept and on the point of principle, sustainability, which means that data can be used safely and stably. We are trying to develop mechanisms and invest human resources for that purpose. As data determines national competitiveness, we are actively working toward a data-driven society with a target of around 2030.

The European Commission focuses on data-related legislation, while the United Kingdom and the United States concentrate on CDO and the governance team. Overall, strategies, laws, human resources, rules and operations are being promoted in a well-balanced manner.

Benchmarks are always global.

A global benchmark is an essential benchmark in advancing our data strategy. By promoting data and services through our data strategy, we can expand to other regions and bring applications from other areas. Not only other parts but also overseas countries are included. To this end, it is essential to use mechanisms used globally actively.

We use UML class diagrams for data design, Archimate for architecture description, and BPMN for the process model. Using these techniques, we can design efficiently and deepen mutual understanding when we engage in international dialogue. As for data models, there are smart data models used for smart cities and schema. org used for web search. In addition, we refer to DCAT, which is a data standard for search. As for human resources, we refer to SFIA in the United Kingdom and O' net in the United States, which have various excellent global mechanisms. By introducing international techniques, we aim to build a group of services with high interoperability that can be deployed internationally. In addition, the government itself uses these advanced technologies to raise the level of domestic technologies. Many people from companies come to meetings and are surprised at the technical level of our data team. We also develop know-how and develop human resources in parallel.

Promoting International Exchange

Promoting it on a global scale requires people-to-people exchange. Ideas such as DFFT are discussed at the G7 and G20. We also participate in discussions on individual themes such as interoperability.

We are also working to disseminate information internationally, such as sharing information in Japanese and English through the data team's notes.

Promote a data-driven society in line with the organisation in 2030

The global target is 2030. To achieve a data-driven society comparable to that of the rest of the world by around 2030, Japan will establish a system by 2025. After that, data will be compiled with reapplications and system upgrades by 2030.

Schedule

For this reason, we have established an interoperability framework in fiscal 2021 and are making steady progress in our strategy.

Conclusion

Comparing before and after Digital Agency, the foundation’s situation is entirely different. Various demonstrations, such as AI, have been conducted, but there were few cases where demonstrations could be directly applied to services. There were many cases where they could not be applied to other regions or fields.

The Digital Agency has systematically and powerfully promoted data-related projects that the Information Technology Office of the Cabinet Secretariat has steadily implemented. By introducing architectures and introducing the latest design methods that are spreading globally, services can be built quickly, and sustainable services can be provided.

Compared to urban development, it is a situation in which the methodology has been improved, and land development and basic infrastructure such as electric power have been completed.

As the infrastructure has been organised, I expect various services to emerge in the future, such as AI services.

Over the past year, the Digital Agency Data Team has developed and deployed its data infrastructure at an unprecedented speed. Now that we have a foothold, we expect it to be used in the field.

We published additional resources about the progress. [Japanease](2022-09-08 postscript)

(Kenji Hiramoto, Head of Data strategy)


みんなにも読んでほしいですか?

オススメした記事はフォロワーのタイムラインに表示されます!