工人智慧之協同合作

無國界醫生組織 (Doctors Without Borders/Médecins Sans Frontières) 在七月份發表了一個新的手機軟體 MapSwipe，這個軟體的功能是讓志工可以透過手機協助預分析衛星圖 (pre-screen satellite imagery)，協助醫療團隊判斷哪些偏遠地區的群聚部落，以便派人前往提供疫苗接種等醫療服務。

MapSwipe 是一個開放原始碼軟體，使用方式非常簡單，透過後端系統將衛星圖切好豆腐，透過手機介面讓志工選出地圖上可能的道路或建築物。這個計畫可以與 OpenStreetMap 的 Humanitarian Team 的 Missing Maps Project 合作，在大型災害發生時，透過最新的衛星圖資料，讓志工可以快速的區分出尚存的建築物。然後再發布於 HOT Task Manager 上，由後續的圖客 (Mapper) 接手進行細部的地圖繪製工作。可以爭取時效由全球的志工，為地面隊伍提供更新過得地圖情報。

機械學習用於社經發展判讀

然而，這是使用工人智慧進行衛星圖，利用大量的人力來做地圖判讀。

大型的科技公司如 Facebook ，為了達成他們的連結全世界的遠景，也必須找出人口分布，這是傳統的人口統計無法提供的資訊。於是他們與衛星影像公司 Digital Global 合作，利用 machine learning 的影像處理技術找出人造建築，來推算人口分布度。Facebook Connectivity Lab 的技術文章說明了技術的概念。

至於非營利組織與學術界，只好利用開放的資料。類似的工作有 Arnhold Institute for Global Health 的 Senior Data Analyst, Patrick Doupe 使用 LANDSAT7 的衛星圖，計算預測特定區域的社經狀態。初期的程式碼已經發布在 github 上。

Standford 大學的研究學者 Marshall Burke 與 Stefano Ermon 的團隊，則是更進一步的藉由分析白天和夜間的衛星影像來建立模型，因為電力的基礎設施可以反應出當地的經濟水平，然後再以地面的基礎設施作為 filters，將模型轉移成預測貧困地區 (中文)。透過這套技術，可以以衛星影像取代過往利用大量人力普查的成本，長期的觀察偏遠區域的發展現況。然而，衛星資料仍有其侷限性，研究團隊也在考慮如何蒐集行動電話的 metadata作為原始數據. 論文中以 R 3.2.4 與 Python 2.7. 實做的程式碼與配置教學已經放到 github　上。

深度學習的特徵搜尋

這些技術使用的都是 convolutional neural network，有別傳統的 Geographic Object-Based Image Analysis 技術，有更多應用場景。

像是快速搜索衛星圖中的特定影像特徵。

Terrapattern 提供了一個普羅大眾都可以輕易使用的反向搜尋引擎。透過 OSM 標籤分類衛星圖像，以 Deep Convolutional Neural Network 訓練，但他的目的不是自動區分出建築物的類型。而是讓使用者可以快速透過 Cover Tree 的依據影像特徵快速搜尋地景，最好用來搜尋哪些不容易出現在地圖上的設施，像是廢氣泳池、冷氣機組等等。同樣的技術也可以用在受災區域的空照圖，可以很快的辨識出毀損的建築與橋樑道路等。程式碼是以 MIT 授權發布，網站上的資料也很有參考價值。

人工智慧實踐自動與偵錯

本文開始提到的以工人智慧方式檢測衛星影像，以便加速急難救助時候的繪圖速度，其實也可以透過人工智慧的技術加速處理。Stanford 的同學 Lars Roemheld 在他的學習課程 CS231n: Convolutional Neural Networks for Visual Recognition 的報告，詳細的描述了他嘗試的方法，以及碰到的問題。

Development Seed 的 Anand Thakker 在 2016 的 SoTM US 的演講 Skynet 則成功的展示如何利用 Machine Learning 找出道路。他提到、雖然 OSM 圖資中已經有許多的道路可以作為訓練資料，但是由於道路的寬度並未正確得標注，所以仍需要一些調整後才能正確的訓練出模型。細節請參考投影片、測試資料與程式碼。

光是標注出路線只完成了一小份工作，人工智慧與衛星影像並無法提供路名。

Facebook 在某些區域，已經開始使用 OSM 當作地圖基本資料，作為打卡的基礎地圖，Sadi Khan, Yin Wang, Luke Walsh 等幾位 Facebook 工程師在 SoTM US 上分享了他們針對埃及所進行的一些實驗，預測可以增加 20%-30% 道路網絡，並開始測試從 POI 取出路名，然後讓使用者回報選擇正確的路名，進一步提高資訊的完整度。雖然已經匯入部份部份路網，但是由於程序問題且品質不佳，已經回退修改。

其他的社群實驗還有 Geometalab 的 Samuel Kurath 做的 Crosswalk-Detection，用於偵測馬路上的斑馬線，據說目前已經有了 98% 的準確率。

在開放街圖社群已經有社群將技術用於改善圖資品質。專門做專業登山地圖軟體 Gaia GPS 的 TrailBehind, Inc，利用 TensorFlow 開發自動偵錯工具 DeepOSM，利用衛星影像識別道路，並與現有的圖資對照是否正確。這是最早將類神經網路技術利用於 OSM 的計畫之一。

未來發展

深度學習/機械學習的進入門檻越來越低，主要的線上雲端服務供應商包含 Amazon, Microsoft Azure, Google 都陸續推出適合類神經網路計算使用的 GPU 伺服器。可以很方便的取得計算資源，進行一些實驗開發。
除此之外，DigitalGlobe, CosmiQ Works 與 Amazon 合作推出了 SpaceNet 資料集。這些圖資來自 DigitalGlobe 的 WorldView-2 商業衛星，50 cm 的高畫質圖資，包含八個波段多光譜影像 (8-band multispectral data)。以及 220,594 組建築物圖像可以作為人工智慧訓練資料。

從 Development Seed 的分享，社群已經開始將技術用在完善 Dar es Salaam 路網或是與 World Bank 合作。但是這些新技術在 OSM 社群中引起一些政治衝突，OSM 社群一直都是由志工徒步踏查從無到有畫出來的，這些志工很珍惜透過聚會所建立的社群，只須要宅在家裡的鍵盤畫圖活動一直都不太受到歡迎。

而現在到達了一個機械化編輯 (Robot mapping) vs 人力編輯 (Craft mapping) 的十字路口。

作為一個實用主義者，我個人相信機械化編輯可以大幅降低成本的維持高品質的圖資資料，而人力編輯可以相輔相成的專注於提供本地知識。

Rex's blah blah blah

Tag: deep learning

用於開放街圖的人工智慧技術

工人智慧之協同合作

機械學習用於社經發展判讀

深度學習的特徵搜尋

人工智慧實踐自動與偵錯

未來發展