点击访问西红柿 
» 游客:  注册 | 登录 | 会员 | 搜索 | 帮助

RSS 订阅当前论坛  

上一主题 下一主题
     
标题: 理科生进入!matrix世界  
 
thenew
超级版主
Rank: 8Rank: 8
西红柿二长老


UID 6
精华 0
积分 1777
帖子 1325
番茄股票 0
阅读权限 150
注册 2006-1-9
状态 离线
理科生进入!matrix世界

via:http://inside.edimsum.net/bbs1/d ... ID=25824&skin=1
作者goodfella
本文由goodfella的《欢迎来到矩阵世界》整理

我们先从现在网络上随处可见的验证码说起。
qq的注册认证代码

donews的认证代码


据说这一套验证码系统的始祖是由现卡耐基-梅隆大学的计算机博士后Luis von Ahn与加州伯克利大学的教授共同创造的。

Luis von Ahn,瓜地马拉人(中美洲),我们管他叫小陆好了。小陆在杜克大学本科念完数学之后,发现自己对密码学(cryptography)以及人工智能(AI)有着浓厚兴趣,于是前往全美计算机第一大牛校卡内基-梅隆(Carnegie-Mellon)进修计算机硕士与博士,直至如今的博士后。

期间,小陆和伯克利的教授一起研究出了一套系统,名叫CAPTCHA。即我们所说的验证码的始祖。这套系统随机生成的字符形状被弄得歪七扭八,人类可以识别,但现有的计算机识别技术很难完整识别。
小陆继续从中得到启发:计算机难以识别,人类可以识别?

小陆于是研发出一种叫ESP的寓教于乐游戏(http://www.espgame.org ),希望将人类每年用在玩空当接龙游戏上的数十亿(!!)小时用在对人工智能技术更有用的方面。

这个游戏的玩法是:给出一幅图片,随机抽出另一位匿名玩家与你配对,要求你们同时用任意你认为与图片相关的词汇来描述这张图片,如果两人用于描述的词汇一样,则得分。两分半内,以二人的描述词汇一致的图片数量,决定分数高低。

这个游戏创意的天才之处就是直接利用人类的识别能力,帮助人工智能的研究。
迄今为止,用电脑自动判断图片内容在技术上依然是一个难题,因为我们所有能让电脑用到的信息,无非来自基本像素构成的小方块,电脑只能根据像素的数值本身去作各种数学上的分析与判断,而对画面内容本身一无所知。在这种情况下,若是目标物体被局部遮挡,甚至是少许缩小,就很有可能判断不出来。

如果我们有一张大象的全身完整图,我们告诉电脑这是大象。接着我们给电脑一张大象站在树后,身体被挡住,但仍然能看到头部与尾巴;或者是我们给一张只有象头在画面里的图片,人类可以迅速准确的判断这是大象,而电脑就不行。

作计算机识别,除了程序和分析工具复杂,还有一个重要局限在于,我们用于教电脑识别的图片总是不够多,因为我们需要提前给每张图片赋值:这是大象,那是汽车……这一步往往很耗时间。如果我们拥有海量的,已经被非常准确识别过的图片库,这对电脑视觉今后的研究,也是很宝贵的财富。

ESPGAME利用了几乎免费的网民资源,由人类通过游戏的方式,对已知的图片进行描述、分类、标记,这些知识不断的汇总、整理,进入了数据库,计算机再对数据库进行分析。只要保持ESPGAME的人气,数据库就能不断完善。在ESP游戏网站建立的几个月间,就已经有一千万张图片被准确的分类。小陆估计,要是把这个游戏放到MSN的游戏网站上,不出几个礼拜,我们就能非常准确的分类互联网上的所有图片!!这样人工智能识别图像的在技术分析上的难度大大降低,效率却极大提高。

计算机从ESPGAME了解了一张图片中有什么、是什么、在干什么之后,还面临一个问题:什么是什么。仍以大象在树后的图为例,ESPGMAE的游戏数据库中描述了这个图的意义,甚至可能连象的种属、树的名称、当地的故事传闻都包含其中,但是计算机只知道这个图当中有人类定义为象和树的东西,但是不知道象在哪里,树又是哪个。

所以小陆又用与ESPGAME相似的方式,试图解决另一个图像处理问题,那就是图像中的目标物体定位。比如,人类可以在一张图片里很容易的找到树在哪里,房子在哪里,人在哪里,而电脑自动判别则非常之难。于是http://www.peekaboom.org诞生了,这个游戏类似于ESP,也是两个互不知名的人配对。游戏进程及范例如下:

A面前一张荒漠照片–>指令告诉A要指出绿洲–>A点击绿洲部分
B面前一片漆黑——>B图片上出现对应部分–>B猜测指令究竟给出的什么

这个数据库,可以给做电脑视觉的人一大批关于目标物体定位的training image。

小陆在台上演讲时,我坐在台下心里狂叫:这不就是Matrix的雏形么!!运用自然界最大的计算资源–人脑,来实现真正意义上的Human Computation, 恍惚之间,我似乎看到小陆的身后如Matrix的Architect一般散发万道光芒。

据小道消息,全美三大天王级工程院–麻省理工(MIT),斯坦福(Stanford),伯克利(Berkeley)目前正对于小陆不断进行糖衣炮弹的攻势,欲将其招入麾下。而ESP所产生的巨大数据库,早已被google image买下(又是google!!!)。

而小陆的下一步是一个新的游戏,叫Verbosity,目的是要建立一个新的“常识”数据库。所谓“常识”,指的是对于人类显而易见的事实,比如“牛奶是白的”,“摸烫的东西会痛”等等。这些“常识”会在以后的人工智能领域发挥重要的作用。

而另外一个正在筹划当中的,便是语言翻译。如果我们避开机器翻译这座大山,用游戏参与的方式,用海量的游戏时间,“人多力量大”的实现互联网所有网页的全面翻译又如何?

此外,小陆还透露他的另一个构想,那就是利用ESP和Peekaboom的两人配合游戏方式,可以找到两人的契合程度,说不定会因此找到最适合你的那位另一半哦~~

p.s. CMU计算机本科有一门传奇课程叫“电脑科学中的伟大构想”,(Great Theoretical Ideas in Computer Science),专门介绍各种听起来匪夷所思的古怪咚咚,颇为有趣。小陆今年教这堂课,翻了翻笔记,发现这个通过计算机对男女组合配对,如何让各自满意程度最优化的算法很有意思:
http://www.cs.cmu.edu/~15251/Mat ... ure16/lecture16.ppt




原来玄奘大师西行取经并非官派,乃是非法偷渡出关滴牙~

2006-5-31 03:48 PM#1
查看资料  Blog  发短消息  顶部
     


  可打印版本 | 推荐给朋友 | 订阅主题 | 收藏主题  


 


Powered by Discuz! 4.1.0  © 2001-2006 Comsenz Inc.

所有时间为 GMT+8, 现在时间是 2024-5-3 07:02 AM 清除 Cookies - 联系我们 - 西红柿CHong4 - Archiver