极速快3官方_3分快3登入新加坡国立大学霍华德:NLP都有哪些有意思的事儿? | 雷锋网

  • 时间:
  • 浏览:9
  • 来源:大发1分快3—1分快3官方

雷锋网 AI 研习社按:人工智能的发展不仅是给社会带来了巨大的变化与进步,同样也给我们我们每一一一3个多莘莘学子的人生带来了重大的机遇与挑战。本文的分享嘉宾但是一位紧跟随时代浪潮,投身 AI 革命的践行者。

在近期雷锋网 AI 研习社举办的线上公开课上,来自新加坡国立大学电子及计算机工程系的霍华德博士分享了他的在 NLP 学术研究上的一点体验与心得。他一点人的求学经历非常传奇,在本科,硕士,博士阶段分别读了一一3个多不同的专业,现在腾讯就职。

霍华德,新加坡国立大学电子及计算机工程博士,现为腾讯自然语言处理 算法工程师。学过材料,打过铁,下过车间,烧过炉子,后转行人工智能,有着充沛的转行经验。

以下是嘉宾的分享内容:

自然语言处理(NLP)都在那先 用处?

简单来说,NLP 结合大数据、机器学习、淬硬极速快3官方_3分快3登入层 学习进行词法分析,句法分析,语义分析等功能,主要用于搜索引擎和推荐系统,像包括用户画像,计算智能推荐广告完会用到。现在计算机视觉技术也在和 NLP 有着更多的结合,比如最近很火的自动驾驶。另外语音识别某种都在一点一点的 NLP 大问题,不仅仅是简单的识别,还包括单词的边界界定,词义的消歧,句法的模糊性等大问题。

对于 NLP 技术,目前市场需求非常稳固,但是会随着 AI 的进展不断增张。目前 NLP 技术发展面临的挑战之一是语言的歧义性,比如下面这张图片上的例子。

接下来给我们我们分享一点 NLP 中比较有意思的大问题。不能非要说是 AI 领域的比较有趣的大问题。

高中数学有一一一3个多著名的概率大问题,「一枚硬币连续投了五次都在正面,没人第六次投还是正面的概率是几次?」机智的高中生会想,这骗得了我?这是独立重复实验,概率还是 0.5!

可但是一枚硬币连续投了一百次都在正面呢?一亿次都在正面呢?否有都要坚信冒出正面的概率是 0.5?你这种 硬币会不必被人动了手脚,就非要正面呢?

当几瓶的事实摆在我们我们转过身,随着数据很多,人应该没人相信你这种 硬币有大问题,没人不相信硬币的概率是 0.5,这才是最自然而然的感觉,这才是动态的看待大问题,而都在机械简化的看待大问题,而这转过身但是极速快3官方_3分快3登入贝叶斯思想。

高中老师我不知道们概率但是频率;而贝叶斯我不知道们,概率实在不为社 像人对事物的信心。随着证据很多,我们我们对事物的信心没人强,不能非要称极速快3官方_3分快3登入作概率。

直观理解贝叶斯公式

极速快3官方_3分快3登入好多同学都说不理解贝叶斯公式,接下来举个例子帮助我们我们直观的理解贝叶斯公式。

先来一一一3个多大问题:一机器在良好具体情况生产合格产品几率是 90%,在故障具体情况生产合格产品几率是 60 %,机器良好的概率是 75%,若一日第一件产品是合格品,没人此日机器良好的概率是几次?

这里都要用到贝叶斯公式,贝叶斯公式一点但是神秘,首先我们我们但是实在一一3个多东西之间有关联,没人我们我们都在联合概率 ,联合概率能非要用链式法则表示 ,你这种 是我们我们都学过的条件概率,A和B一并地处的概率是B地处的概率乘以B地处下A的条件概率,反过来一样成立,一点一点有:

两边一并除以 ,得:

这但是贝叶斯公式。贝叶斯公式的范围非常广泛,倘若一一3个多东西有关联,能写出联合概率,就能非要用贝叶斯公式。

机器有良好和故障某种具体情况,用A表示。产品有合格和不合格某种具体情况,用B表示。直接套用公式算:

的概率等于:

一点一点:

从投硬币到高斯分布(正态分布)

我们我们都知道人的身高是遵从高斯分布的。假设有 340 个因素影响你的身高,每个因素都在 0.5 的概率我能 长高1cm,如:

  • 你打不打篮球

  • 妈妈的身高

  • 爸爸的身高

  • 爱不爱吃肉

  • 喝不喝牛奶

那先 因素里有的对身高产生不产生影响,就如投硬币投到了0,有的我能 身高长高1cm,如投硬币投到了正面。而你最终的身高但是这 340 投硬币累加的结果。但是你做10万次没人 的实验,我能 得到下面没人 图,是都在发现身高分布变成了正态分布。一点人运气好,多投了几次正面,就多长了几厘米,长到了 160 cm;有的人运气差些,少投了几次正面,就非要 160 。但大多数人,运气都差很多一点一点都在 170 左右~这也是投硬币实验的期望 (170=340*0.5)。一并,但是投硬币概率的影响,运气超级好和运气超级差的都在多,一点一点高于 60 cm 和低于 140cm 的男生都在多。

这转过身是中心极限定律:「几瓶相互独立随机变量的均值都讲收敛于正态分布」,其涵盖三主次:独立,随机,相加。

幸运的是,人生不都在独立重复实验,一点因素是我们我们能非要控制的,能非要努力的,如多喝牛奶,多打篮球,多蹦多跳,没人 就大概提高了某几次投硬币得到正面的概率,让一点人多长高一点。

从投硬币到泊松分布

日常生活中,几瓶事件是有固定频率的,如:某个医院平均每小时出生4个小婴儿;某个王者荣耀服务器平均每秒钟接到 60 0 次访问请求;某个汽车站台的候客人数等等... 想象你在妇产科工作,你的职责但是记录婴儿的出生具体情况,你知道平均每小时我能 有4个婴儿出生 。

泊松分布的产生

每十分钟记录一次

把一小半时为6段,每十分钟记录一次,这10分钟里有婴儿出生,就记录1,没人就记录0。没人 每个10分钟里有婴儿出生的概率但是P=4/6  ,你每小完会记录6次,有  k 个婴儿出生的概率能非要写成:

如图所示:

每一分钟记录一次

每一秒钟记录一次

从中间三张图能非要看出,每次的记录都差很多。以前能非要每毫秒记录一次,每微秒记录一次,每纳秒记录一次,但是你这种 概率分布的价值形式都在会为社 会 变了,这以前就得到了泊松分布。

用贝叶斯措施挑香蕉苹果苹果

公式左边是香蕉苹果苹果「是好瓜」的逻辑地处比,又称作 logit,逻辑地处比大于 0 但是明是好瓜的概率较大。

最后发现等式右边变成了各个价值形式的求和。价值形式值越大,说明你这种 价值形式对香蕉苹果苹果「是好瓜」的影响越大,相应的说明你这种 价值形式是一一一3个多显著价值形式。而值比较小的价值形式说明影响较小,都在一一一3个多很有效的价值形式,剔除掉但是会有很大的影响。

朴素贝叶斯分类

以上但是本次分享的完整篇 内容,视频回放链接:http://www.mooc.ai/open/course/447

雷锋网(公众号:雷锋网)温馨提示:关注公众号「AI 研习社」,每周都在免费公开课直播。

雷锋网原创文章,未经授权禁止转载。详情见转载须知。