编者按:本文作者Silver Keskkula是Skype核心团队的首席研究员,Teleportinc创始人之一。他从自身搬家经验出发,从五个方面深入讲述何种因素会影响人们搬迁,AI技术将如何实现让人们足不出户就能发现到一个适合自己居住的地方
编者按:本文作者Silver Keskkula是Skype核心团队的首席研究员,Teleportinc创始人之一。他从自身搬家经验出发,从五个方面深入讲述何种因素会影响人们搬迁,AI技术将如何实现让人们足不出户就能发现到一个适合自己居住的地方。
我曾经在《AI将如何重组人口》一文中打趣过我的读者们。就像在线约会网站决定谁跟谁将制造一个婴儿一样,我们将让AI技术决定谁将搬去哪儿。所以,我们如何知道如今那些城市才能被称为好城市?
我们读新闻,听到朋友的好消息,看到照片和视频,从那里得到最好的工作机会,而非常平常的是,我们经常只是走马观花地去看城市。
我不会去深入剖析AI是如何参与决定哪些新闻、朋友的帖子、视频或城市的照片将被我们看到,但我将要阐述我们如何使用在Teleport中的AI技术去帮助你更客观地看待城市。自从我被《每个孩子都开始编程》一文深深吸引后,接下来,我将通过简单的代码示例来演示这个文中的过程,以说明使用所有工具玩转AI已经是一件很容易的事情。
通过AI的眼睛探访城市
让我们从Teleport Developers API中抓取爱沙尼亚Tartu区域,并生成10,000个随机地理坐标。你可能会问,为什么是一万个?因为科学!
这样在地理上的均匀分布当然会使我们对城市的看法有一定意见,因为大多数时候我们在树林里或者屋顶上都几乎看不到任何东西。但幸运的是,在Google Maps API的帮助下,我们可以任意移动坐标,并得到更像这样的东西:
正如你所看到的,我们计划访问的位置(红点)或多或少在热闹的道路和街道上,而不是一些长满了树的地方。
现在我们已经拥有我们的位置,现在是时候进入观看位了,并熟悉Google街景视图图像API。基本上我用我的坐标调用他们的API,并在本地保存生成的图像。
经过一些反向地理编码和一些常规遵循后,Google的API让我得到了每个坐标返回的照片(而均匀分布则会显示的“对不起,我们没有图像”)。
然后通过我的代码,我就可以窥视成千上万的Tartu的图像,而不需要离开房间(或我的电脑?)。
图像HAL层上有什么?
为了简化事情,我通过公共可用的机器视觉API运行我们的图像集。我们有很多这种类似的选择,比如Microsoft Computer Vision API / Google Cloud Vision API / IBM Vision Recognition API / Cloud / Sight API / Clarifai,等等。
但为了这个例子,我去了微软的牛津项目。微软研究组织使我印象深刻,老实说,他们的API免费使用条款是最吸引我的。他们甚至慷慨到提供Python的快速开始代码。
实质上,您只需将图片上传到其API,并返回一行描述场景的文本。这里有一个来自Tartu的图像示例,以及来自MS Vision API的输出文本。
建筑物前的摩托车停车场
智能压缩
通过他们的API,我将来自Tartu的8.5GB原始图像像素数据压缩成255KB的文本数据。如果研究过压缩和智能的关系,那么这个减小了35,294倍的尺寸或许能说明一些问题。
无论如何,现在我们终于有了描述场景的自然语言,我们可以开始研究统计数据,看看我们能否找到一些说服某人搬家的理由。
27 of 1528 most frequent terms of machine vision based analysis of 10K images of Tartu, Estonia
看着那长长的列表,我几乎睡着了,直到我看到“摩托车”这个词。摩托车的数量或者人口中拥有摩托车的比例很好的说明了一座城市的潜力。我个人对此非常有共鸣(因为我拥有两辆摩托车)。当然,在各个城市寻找关于摩托车的统计数据还是会有很多来源,但是要记住,这些来自不同国家的不同来源的数据需要我们花费大量的工作去抓取以及进行规范化。Google街景的美妙之处就在于它将大城市作为了单个数据源,并且能在捕获图像中可见的任何信息。
AI的进步,更具体来说,深度神经网络的进步每周都让我们感到惊讶,如果你依然怀疑AI技术在图像中提取信息的能力不如人类的话,那么请参考一下下列AI击败人类的成果列表:
• Google的AlphaGo击败李世石
• 卡内基梅隆人工智能击败顶级职业扑克选手
• 微软AI在语音识别方面击败人类
当然了,摩托车只是我个人关心的用于打趣的所举的一个例子,但不难想象,在人类可见(或者也许是不可见的)的图像中提取任何知识。潜藏在Google捕捉来的数百万张图片背后,却有很多线索来描述着这些城市的生活质量。
这里有一个快速健全的检查方法,去检验我们知道的某些事情到底是否真实。我们为阿姆斯特丹拍摄另外了一万张图片,并在图片中标记计算自行车的出现情况:
不考虑人口密度(或实际计算每个图像上有多少自行车),至少,直觉似乎被验证了。从计算自行车的数量和在地图上追溯儿童在建筑物及社区涂鸦的情况,这个巨大的图像数据印证了我们的移动动作是丰富众多的。
远离街道
我们当然不可能对街上看到的一切都关心。有时你必须离开热闹的街道,来个越野。举个例子,Tanel Pärnamaa在Teleport实习时做了一些工作,他从Flickr那里拿到了一组公开地理标记的照片,并使用机器视觉标记来识别海滩。有趣的是,当机器视觉数据信号受限时,他发现了很多沙地高尔夫球场。
Beaches as identified by AI in Flickr photos by Tanel Pärnamaa
更甚者,随着Planet再次发射的那88颗卫星进入轨道,我们又有了另一个惊人的可以让AI技术进入的图像源。这样一来,数据量将呈指数增长,而我们对城市生活质量的理解也随之增长。
选择你的工作,选择你的城市,选择你的生活!
我们的一个投资者说道:“电脑和互联网的传播将把工作分为两类:告诉电脑做什么的人,以及被电脑告知要做什么的人。”
我看到我们站内一些在任者花了大价钱以捕获那些可以用代码完成的事情。而我却相信,通过机器学习和众包获得的效率将为我们提供了巨大的竞争优势,长远来说,我渴望看到它将如何发挥作用。
同时,我要对那些更倾向于告诉电脑怎么做的人们一些具挑战性的事实:
如何在各地理区域分布您的代理/探测器,同时使各种偏差实现最小化(由城市面积大小,人口密度等引起的)
为了促进公平的比较,应该如何规范化的捕捉城市地区的数据?
如何避免在近景中出现的重复计数?
如何在统计中减少天气,季节,白天等的影响?
如何优化观看角度,在每个坐标中采样或组合图像以被运用到360度视图中?
从图像提取生活质量数据后,要如何构建/训练这些特定目标的模型?
最后,那些从公共图片捕捉来的数据也许与生活质量相互对应,并且也有可能影响你决定接下来要搬去哪儿?
声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!