笔下文学

字:
关灯 护眼
笔下文学 / 科幻灵异 / 大国AI / 10. 架构

10. 架构

章节出错了,点此刷新,刷新后小编会在两分钟内校正章节内容,请稍后再试。

  这个小叶,不但有自己这一辈科研人的精气神,
  专业技能和对人工智能的理解,大大超出了一个本科生的水平,比这一届这个最优秀的学生徐晓瑞还强;
  甚至演讲的能力都是杠杠的,
  看看这节奏把握和吊胃口的时机。
  连自己见多识广,不知道参加过多少学术会议,都被他几句话就搞得心里痒痒的。
  年轻真好啊……
  看着小伙子挺直的腰杆,不由出了神,
  回想起了当年自己年轻时和志同道合的同学,同事,同志们一起建设脚下这座教学楼的激情岁月。
  祝闲云越看叶伟航越是觉得顺眼,
  都忘了催促他继续说下去。
  小会议室里一时陷入诡异的沉默。
  还好,
  叶伟航自己先反应过来,把系统面板先放到了一边。
  他用记号笔点了点徐晓瑞,继续说道:
  “当然了,和徐晓瑞的方案一样,这些免费获取的数据也需要进行清洗和整理。请问一下,徐晓瑞你打算怎么清洗文本数据呢?”
  徐晓瑞被冷落了好一会,突然被叶伟航发问,下意识答到:
  “我们是打算用一个星期时间,小组三个人一起写一个Python程序,调用Python自己的工具库,到网上爬取数据。”
  “当然,我们小组现在都还是学生,清洗数据,工作量太大,我们又没有经验,可能需要外包,我想学校应该能支持一些经费……”
  他觉得自己的想法非常合理,
  可叶伟航却连连摇头:
  “怎么能这么浪费资源呢?”
  “刚才吴云霞师姐的话你是不是没有认真听?人家不是介绍了吗,实验室因为做【小昭机器人】项目,已经完成了现成的NLP文本处理器,师姐你愿意借给我们用一用吗?”
  吴云霞微微一愣,马上笑得眼睛眯成了一条缝:
  “当然可以啦。”
  【源点+0.005】
  叶伟航一直注意着祝闲云的表情,
  刚才说完话,随着对方连连点头,
  系统马上就跳出了获得源点的提示,
  他心里顿时有数了。
  看来,
  祝闲云就是系统认定的刷资源点了。
  现在叶伟航只不过是个普通学生,
  在这位计算机学院的院长面前表现露脸的机会难得的很,可得好好抓住——
  这也和他本来,在国内人工智能学术界一鸣惊人的计划不谋而合。
  叶伟航面向吴云霞,注意力却全在旁边的祝闲云身上。
  “这样,第一步数据处理应该在一天之内就能完成。”
  一边说着在第一个方框下面画了同样大小的第二个方框,
  “第二步,建立多层多神经节点的神经网络,直接把经过预处理的海量数据喂给神经网络,进行穷举式训练。也就是我们人工智能术语中的无监督学习。”
  “无监督学习?好像Alphago在训练神经网络的任何阶段都没有使用这么简单粗暴的方法吧?”
  仔细研读过Alphago论文的吴云霞忍不住插话问道。
  “是的,这一步和Deepmind让Alphago通过海量的人类对弈棋谱学习围棋规则的步骤有较大不同。主要原因是AlphaGo和聊天机器人的应用场景和任务目标不同。”
  “Alphago研究的是棋手的对弈棋谱。可是,围棋和聊天毕竟是两个很不一样的领域。棋谱和网上得到的聊天,评论,文本数据有一个很大的不同之处。”
  “什么不同之处?”
  这次急着追问的人,
  竟然是一向眼高于顶的徐晓瑞。
  叶伟航看他一眼,继续说:
  “大多数棋谱数据基本都有最重要的标注——棋谱的对弈双方,最后谁输谁赢。这样,Deepmind对任何一个棋谱数据中,哪一方的操作更好就天然拥有一个基本判断。”
  “以这个判断作为基础,自然就可以对模型进行有监督训练,告诉他应该更倾向于向下棋两边的那一边学习。”
  “而聊天机器人的研究对象是我们预处理后得到的海量文本数据,则完全没有这种标注,除非耗费大量的人工来一一识别打分,否则我们不可能知道哪一段文本更好,哪一段聊天质量更差。”
  “在这种情况下,使用无监督学习进行深度神经网络训练,是明显更合理的。”
  小会议室里沉默了好一会,所有人花了几秒钟理解叶伟航的这段解说。
  很快。
  【源点+0.005】
  ……
  这种对深度学习和人工智能超越时代的认识,
  让祝闲云眼睛放出光来,
  他根本顾不得其他人能不能听懂:
  “好!这个理解,太棒了。继续,你接着说。”
  叶伟航环视一圈,发现吴云霞托着腮,一副似懂非懂的样子,
  徐晓瑞皱着眉头,眼神都没聚焦;
  李大路和徐晓瑞的另外一个室友则都张大了嘴,一副懵逼的表情,
  看起来完全没听明白。
  不过这两个货又提供不了源点。
  倒不用着急这时候就向他们解释。
  他在白板上画下第三个并列的方框,顺势拍起祝闲云的马屁来:
  “接下来的步骤,以教授您对人工智能的理解,肯定已经想到了。没错,就是监督学习。”
  “在海量的无标注文本数据之后,现在我们的机器人,差不多是一个背下了海量知识,却不能分辨好坏的小孩。”
  “如果我们问他一个答不上来的问题,他会怎么样呢?”
  李大路抢答:
  “告诉我们他不能回答?”
  他这话顿时让其他几个人全都笑了。
  吴云霞向他解释:
  “直接通过深度学习训练出来的人工智能绝对不可能这样回答问题的。人类甚至很难通过一些规则来限制他,把某些问题定义成他“不懂”的问题,一旦碰到就输出“我不懂”这样的回答。因为,深度神经网络模型对人类来说完全是个黑箱子,纠正了人类想让他回答“不懂”的问题,会让其他你根本想不到的地方出现更大的偏差。。”
  叶伟航补充:
  “而且,没有任何专家是全知全能的,这样做还会锁死人工智能的上限,最多就是达到请来的专家的水平。试想,如果Alphago是用这种方法训练的,那么它怎么可能吊打围棋世界冠军呢?”
  “事实是,在面对不懂的问题,完成了第二步训练的机器人可能编造各种答案来糊弄我们,也可能爆出几句CTMD之类的经典国骂。”
  “各位,想象一下,在NeurlPS大会上,面对各国的专家和领导,我们的机器人在被刁难的时候来一堆“Fxxk”“Shxx”“问你玛,我是你爸爸。”之类的回复。那场面,该有多酸爽。”
  
热门推荐
这个大佬画风不对我在帝国当劳模诸天从让子弹飞开始快穿:反派女配,你有毒黑化男主总想套路我玩家凶猛快穿花招:扑倒专属男神!轮盘世界快穿之陪你看星辰大海神级快穿:病娇宿主,求轻宠影视世界从小舍得开始桃源俏美妇穿成黑化男主的白月光美漫:名场面全被我曝光了透视仙王在都市快穿之宿主横行霸道女主她是个bug从四合院开始的天道轮回大佬今天又凶残了吗穿书之每天醒来师尊都在崩人设