• [织梦吧]唯一域名:www.dedecms8.com,织梦DedeCMS学习平台.

当前位置: > 站长学院 > 站长百科 >

扎克伯格开发笔记:打造Jarvis的日子,我庆幸自己从未停止过编程(2)

来源: www.dedecms8.com 编辑:织梦吧 时间:2016-12-25点击:

当我写完能够让我的电脑控制我家的代码之后,下一步就是让我和电脑之间的沟通变得像日常对话那样自然。这里的过程分为两步:首先实现通过文本信息来对话,然后增加将语音转录成文本的功能。

从寻找关键词开始,比如通过“卧室”、“灯”、“开”这几个关键字,它可以知道我是在告诉它把卧室的灯打开。很快,我就发现它需要理解同义词,“family room”和“living room”在我们家里指的是同一个房间,这就需要建立一种能教它学习新的词汇和概念的方法。

理解语境对任何AI来说都非常重要。例如,当我告诉它打开我办公室里的空调时,这和Priscilla说同样的话的意思完全不同。这造成了一些混乱。比如,当你在没有指定房间的情况下让它把灯调暗一点或者播放一首歌的时候,如果它不知道你在哪个房间,那么很可能打开Max房间里的播放器,然后在我们希望她能打个小盹的时候把她吵醒。

音乐是一个更有趣也更复杂的自然语言领域。对于一个识别关键字的系统来说,有太多的艺术家、歌曲、专辑,因此你可以问的东西也非常宽泛。电灯只能关闭或打开,然而当你说“play XX(播放XX歌曲)”时,即使细微的差别也可能意味很多不同的意思。比如,“play someone like you(播放歌曲someone like you)”,“play someone like Adele(播放和Adele风格相似的歌手的歌曲)”,“play some Adele(播放Adele的歌)”,这些听起来很相似,但其实是完全不同的指令。第一个指令是播放一首特定的歌曲,第二个是推荐一位歌手,第三个则是创建一个Adele最好听的歌曲播放列表。不过,通过一个有反馈的系统,AI可以学习到这些差异。

一个AI系统对语境的了解越多,就能越好地处理开放式问题。我经常只对Jarvis说“play me some music(播放音乐)”,它会查看我过去的听歌习惯,大部分情况下它播放的都是我想听的歌。如果它播的歌不符合当时的气氛,我可以直接告诉它,比如,“这不是舒缓的,播放一些舒缓的音乐”,它就会学习到那首歌的分类,并立即做出调整。而且它也知道是我在跟它说话,还是Priscilla(扎克伯格的妻子)在跟它说话,这样它就可以根据我们的口味推荐不同的歌曲。相比非常具体的指令,我发现我们更常使用开放式的命令。就我所知,目前还没有哪个商业化的产品在做这个,这应该是一个巨大的机会。

视觉和面部识别

扎克伯格开发笔记:打造Jarvis的日子,我庆幸自己从未停止过编程

人类三分之一的大脑都负责视觉,而AI在理解图像和视频方面也有很多难题。这些难题包括追踪(比如Max在婴儿床中移动是不是说明她醒了?),对象识别(例如房间里的是Beast还是一块毯子(注:Beast是一条长得很像地毯的宠物狗)),以及面部识别(例如谁在门口?)。

面部识别是对象识别中一个特别难的问题,因为大部分人的长相是很相似的,相比之下,区分任意两个不同的物体,比如一个三明治和一座房子,就简单得多。但是Facebook在面部识别方面的技术能力很强,它能够很轻易地识别你照片库中的朋友。当你的朋友站在你的门前的时候,通过面部识别,AI系统就能决定是否让他进来。

为了做到这一点,我在门口装了好几个摄像头,确保各个角度都能够捕获图像。AI系统目前还不能识别后脑勺,因此多装几个摄像头可以确保我们可以看到那个人的脸。我设置了一个简单的服务器,可以持续检查摄像头的传回的图像,并执行以下两个程序:

  • 首先,通过面部检测,来查看是否有人出现在摄像头的视野之中,如果它发现人脸出现在画面之中,就会执行面部识别程序来确定这个人是谁。

  • 标签:

About D8

  • ©2014 织梦吧(d8) DedeCMS学习交流平台
  • 唯一网址 www.DedeCMS8.com 网站地图
  • 联系我们 1978130638@qq.com ,  QQ