No.484,July3, 2020, GISシリーズ No.6-2,「都道府県別新型コロナウイルス感染者数マップ」 開発秘話 with Ai-san

U-C、独立記念日のイベントは中止、ホタルの季節

アメリカでは、7月4日が独立記念日、Independence Dayですが、COVID-19の影響で、Champaign Countyでは、すべてのChampaign County Freedom Celebrationのイベントは中止となっています。U-Cは今、どんな季節なのかなと思い、Tomさんに尋ねたら、「ローカルなトマトの味が濃くて美味しい」と言っていました。M. Wataruさんからは、こんな写真が届きました。「ホタル、たくさんいました。でも撮影するのは難しい」

GISシリーズNo.6 with Ai-san

「都道府県別新型コロナウイルス感染者数マップ」(2)

GISシリーズNo.6の2回めです(第1回はNo.483へ)。今回のトークは、M. Wataruさんが「都道府県別新型コロナウイルス感染者数マップ」(ジャッグジャパン株式会社)の開発秘話や公開後の反響について、制作者のAiさんに詳しくお話を聞いています。収録は、2020年6月21日、Aiさん(Tokyo)、Wataruさん(U-C, US)、Ryutaさん(Shizuoka)、Mugiko(Kyoto)がオンラインで参加しました。以下のPodcastの文章は、Wataruさんが編集し、Aiさんが加筆。GISとその活用について、2人のスペシャリストによるわかりやすい解説にもなっています。

No.6-2, Part2,マップ開発秘話、公開の葛藤21m34s,

No.6-2, Part, マップ仕様、手入力、「可変地区単位問題」19m26s

都道府県別新型コロナウイルス感染者数マップ」(ジャッグジャパン株式会社)は、COVID-19の国内症例に関する各自治体等の公開情報を電子地図上等に一元化したダッシュボード(関係するデータを集約し、主要な情報を視覚的に表示するプラットフォーム)です。コロナウィルス感染拡大の全体像と、各情報のソースも記されており個別情報も確認できるWebページとなっています。

「マップ」開発の経緯:「いま」を知る公共的なダッシュボードの必要性

今年1月ごろ、中国で新型コロナウイルス感染者が相次いでいるという情報が耳に入ってきました。当時の日本国内は、中国からの帰国者に感染者が出たかどうかといった状態でした。とはいえ既に、彼らと接触した観光業の方などに伝播していましたし、中国は地理的にも近い国として交流は多く、今後国内で流行することがあるのか不安な中、「いま」の状況はどうなのか、どんな関連情報がどういった粒度(細かさ)で公開・提供されているのかを知りたいという思いから、公共的なダッシュボードの必要性を感じていました。

生活にプラスにはたらく「正しい情報」をわかりやすく伝える

当時、日本国内向けのWebGISやダッシュボードは存在しませんでした。そこで、すでに公開されていた米国ジョンズ・ホプキンズ大学システム科学工学センター開発の「COVID-19 Dashboard」に着想を得て開発に取りかかりました。公開されている情報であっても、場合により個人を特定しうる可能性もあり、集約し「わかりやすく」公開することによる批判も起こると考えていました。公開後の取り下げる事態も想定され、マップを公表するべきか悩みましたが、社内での議論の末、「正しい情報を伝えることで皆さんの生活にプラスに働けば」との思いから、2月16日に公開となりました。

マップの基本仕様:概要(左)→詳細(右)、利用者がさらに調べやすく

見やすさ、使いやすさを意識して、左から右に向けて概要→詳細になるようにしました。左から感染者数・検査数等の累計、日次累計・都道府県別のグラフ、トレンドを示すグラフ、地図、個別の症例表となっています。また、直観的に理解できて、誤解はさせないような工夫しました。例えば、地図の縮尺は可変とし拡大すると(一部)市区町村ごとの集計に切り替わったり、個別表からソースにアクセスできたりするなど、必要に応じて利用者がさらに調べやすい環境を整えました。

「あえての情報の粗さ」と「誤解を与えない表現」

中身が繊細なことから公開にあたっては、「自分が感染したとして公開されても構わない程度の情報の粗さ」と「誤解を与えない表現」を意識しました。

都道府県別マップにした理由、不安をあおらない色づかい

開発当初、都道府県ごとの集計としたのは、公開されているデータの粒度に合わせた結果でもあります。サービス開始時点の2月頃は、COVID-19の国内症例は厚生労働省や内閣官房の会議資料として、文書でひっそり公開されているのみでした。そこで公開されていた感染者の地理的属性が都道府県名までだったので、Web地図上には、各県庁所在地にポイントデータとして集約。感染者数が多いほど色が濃く範囲が大きくなるようなヒートマップという手法で表現しました。これは県全体を塗りつぶしてしまうと、印象が面積に大きく依存してしまうためです。また、赤や黄色といった警告色は不安を煽るため使用を控えました。

ボランティアとしての活動、手入力でマップ更新、情報一元管理の難しさ、

Webサイトがオープンしてからしばらくして、都道府県や各自治体でも情報が提供されるようになると、スケールや記述される属性の内容も様々となり、一元管理するのに苦労しましたが、情報の取捨選択、様式変更等を繰り返しながら柔軟に対応しています。あくまでボランティア活動なので、マップ更新は昼間の通常業務を終えてから夜に作業しているのですが、多い時は1日に700件ほどの更新が必要だったことも。先述の通り、当時は特に、機械判読に適していない形式のソースも多かったので、1件ごとの手入力を要し、とても苦労しました。

Bi-Bo-6:記憶を記録feat.宇田川藍 *COVID-19 国内症例マップ(ダッシュボード)を作成して考えたこと」 2020-02-23  *「メディアの外側から COVID-19 国内症例マップ を発信する意味、オープンデータとシビックテック」 2020-03-01

公開後の反響

このマップは、公開後、国会や報道機関他、各所からの問い合わせを多数いただき、情報を公開し活用する機運を高めるのに一役買う結果となりました。詳しいメディア掲載履歴等は、会社のWebページ  内の「新型コロナウイルス感染者数マップ」についてを参照ください。さらに、保健所の方からは「我々が苦労して収集したデータが、有益な情報として市民に提供されて嬉しい。今後も頑張って欲しい」と直接励ましの声が届き、医療従事者からも「地域の状況把握に役立っている」等の感謝のメッセージが寄せられるなど、多くの反響を呼びました。さらに、可視化に用いた整形データをCSV形式やGeoJSON形式のオープンデータとして合わせて公開提供したところ、大学ほか教育研究機関にてデータ分析や情報公開のあり方の議論に使われています。

マップ更新、5ヶ月をへて見えてきた課題、今後どう展開するか

2月にマップを制作、公開してからまもなく5か月が経ちます。更新を続けるなかで、感染が拡大し始めた状況と、一定期間経過した今とでは、求められる情報が変わってきているように思います。また、長期にわたり運営していると、過去の情報はいつまで掲載するのか、フォローアップの情報はどう提供すべきか、連続・時系列データの扱い方、伝え方など、様々な課題も見えてきました。公表情報に誤りがあった、個人情報保護のため一部取り下げた、など情報源が訂正されれば、こちらも対応しなくてはいけません。一度アップロードしたら終わりではないのです。開始した当初は、とりあえず手探りでという感じでしたが、今後どう展開していくか、第2波が懸念される中いつまで提供するのか等、社内でも議論しているところです。(Aiさんのトークのまとめby M. Wataru)

Wataruさんに、コメントと専門用語などについても解説していただきました。

プライバシー、個人情報保護と情報の粒度(細かさ)

情報の粒度は、正確さを追うなら細かいほうがより良いわけですが、個人情報保護の観点からみるとぼかした方が良いとも言えて、各国対応が分かれるところです。例えば、香港では、感染者の空間情報は、建物レベルというとても細かいスケールで公開されています(Latest Situation of Coronavirus Disease[COVID-19] in Hong Kong)。 SARSの教訓から、できるだけ詳細な情報を提供し、コントロールや対策ができていることを示しながら、正しく注意喚起し、不要な混乱を防ごうというのが狙いのようです。一方で、日本はハンセン病の歴史等から患者の地理的分布を詳細に公表することは、差別や偏見を助長する恐れがあるとして、細かくても市区町村単位が最小単位のようです。アメリカも詳細データの公表には悲観的で、County(群)レベルか細かくても郵便番号程度が最小単位です。

「可変地区単位問題」地図にだまされる?

個人情報保護の観点から集計データが好まれるようですが、感染者数を居住地の都道府県や州といった地域ごとに集計してしまうと、そのスケール(単位)やゾーニング(分割の仕方)次第で、見た目や統計分析の結果が異なるという問題が起きます。これは、地理学では、可変地区単位問題(Modifiable Areal Unit Problem)と呼ばれ、古くから指摘されている問題です。下図を例に説明しましょう。

を無免疫者(Susceptible:未感染者)を感染者とした場合、(A)の空間単位で(全体を1つの地域として)集計した場合、感染率は40%です。ところが、より詳細な空間単位の(全体を3つの地域に分割した)場合、その中の分布は異なります。(B)のケースでは右側に集中している印象を与え、(C)では中央、(D)は上側に偏っているように見えます。このように集計の仕方で、偏りが生まれる可能性があるということです。

この他、人は通勤等で地域をまたいでの移動も伴うため、近隣に比べて良い悪いと過度に反応したり、政治問題化したりするのはナンセンスです。研究や正しい検証のためには、積極的な検査をしながら、非集計等なるべく粒度の細かい形で記録した上で、適切なコンテキスト及び空間単位での分析が望まれます。

接触履歴の追跡

話は少し異なりますが、先日、日本では厚生労働省が、COVID-19の感染拡大防止用に、接触履歴を記録するアプリ(COCOA)をリリースしました。これは、アプリを起動しているスマホ同士が一定期間、同じ空間にいた際に、匿名のIDを交換。PCR検査で陽性と判明した時点でその人がアプリ上で報告することで、陽性者のIDを保持している者に通知が行くという仕組みです。いつ、どこで、誰と会ったという情報は介さず、接触追跡しようというプライバシーに配慮した出口戦略と言えます。はたしてこれが機能するかは、アプリの利用人数、報告数、通知受取後の検査受診数に依存するため、これからの行政の丁寧な説明や国民の理解次第と言えそうです。

位置情報の利活用と信頼性構築に向けて

今回の件で、GIS、位置情報や技術を“正しく”活用すれば、感染症の感染拡大防止や人々の理解に役立てられるということが、立証されたように思います。SARSでは影響を受けなかった日本ですが、今回のCOVID-19で公衆衛生、保健福祉政策の岐路に立っています。政策の検証や今後のため、さらには公平で透明性の高い運営能力を示す意味でも、まずは、行政には(位置に関するオープンデータを含めた)積極的な情報公開を推進してもらいたいです。by Wataru

情報の受け手、一市民としての感覚

AiさんがGISスペシャリストとしての信念とともに、「一市民として、今私たちの生活で必要な情報とは何だろう」と問い続ける感覚があって、このマップが生まれ、表現され、データベースとしても多くに人が利用しやすい形に作られたのだろうと思います。「公共性、公益性というものを真面目に考えて、倫理観、ポリシーをもって事業をすすめることが必要」というAiさんの言葉が、印象的でした。(Mugi)

「都道府県別新型コロナウイルス感染者数マップ」の制作と更新をとおしてAiさんたちが直面しているたくさんの問題は、私たちに、様々な媒体をとおして伝えられている情報それ自体が、どのように作られ、選ばれ、伝えられているのか、考えさせられます。来週のGISシリーズNo.6の最終回は、Aiさん、Ryutaさん、Wataruさん、Mugikoが「情報との付き合い方」についてのトークをしていきます。(Mugi)

■Katy Perry「Firework」■羽毛田丈史「蛍のプレゼント」■HE BEATES 「PENNY LANE

カテゴリー: Harukana Show-Podcast パーマリンク

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です