一文看懂自然语言处理

您所在的位置:网站首页 需要帮助的例子有哪些呢 一文看懂自然语言处理

一文看懂自然语言处理

2024-07-16 04:06:42| 来源: 网络整理| 查看: 265

一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)

网络上有海量的文本信息,想要处理这些非结构化的数据就需要利用 NLP 技术。

本文将介绍 NLP 的基本概念,2大任务,4个典型应用和6个实践步骤。

NLP 为什么重要?

“语言理解是人工智能领域皇冠上的明珠”

比尔·盖茨

在人工智能出现之前,机器智能处理结构化的数据(例如 Excel 里的数据)。但是网络中大部分的数据都是非结构化的,例如:文章、图片、音频、视频…

一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)

在非结构数据中,文本的数量是最多的,他虽然没有图片和视频占用的空间大,但是他的信息量是最大的。

为了能够分析和利用这些文本信息,我们就需要利用 NLP 技术,让机器理解这些文本信息,并加以利用。

什么是自然语言处理 – NLP

每种动物都有自己的语言,机器也是!

自然语言处理(NLP)就是在机器语言和人类语言之间沟通的桥梁,以实现人机交流的目的。

人类通过语言来交流,狗通过汪汪叫来交流。机器也有自己的交流方式,那就是数字信息。

一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)

不同的语言之间是无法沟通的,比如说人类就无法听懂狗叫,甚至不同语言的人类之间都无法直接交流,需要翻译才能交流。

而计算机更是如此,为了让计算机之间互相交流,人们让所有计算机都遵守一些规则,计算机的这些规则就是计算机之间的语言。

既然不同人类语言之间可以有翻译,那么人类和机器之间是否可以通过“翻译”的方式来直接交流呢?

NLP 就是人类和机器之间沟通的桥梁!

一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)

为什么是“自然语言”处理?

自然语言就是大家平时在生活中常用的表达方式,大家平时说的「讲人话」就是这个意思。

自然语言:我背有点驼(非自然语言:我的背部呈弯曲状)

自然语言:宝宝的经纪人睡了宝宝的宝宝(微博上这种段子一大把)

NLP 的2大核心任务

一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)

NLP 有2个核心的任务:

自然语言理解 – NLU | NLI自然语言生成 – NLG

自然语言理解 – NLU|NLI

自然语言理解就是希望机器像人一样,具备正常人的语言理解能力,由于自然语言在理解上有很多难点(下面详细说明),所以 NLU 是至今还远不如人类的表现。

一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)

自然语言理解的5个难点:

语言的多样性语言的歧义性语言的鲁棒性语言的知识依赖语言的上下文

想要深入了解NLU,可以看看这篇文章《一文看懂自然语言理解-NLU(基本概念+实际应用+3种实现方式)》

自然语言生成 – NLG

一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)

NLG 是为了跨越人类和机器之间的沟通鸿沟,将非语言格式的数据转换成人类可以理解的语言格式,如文章、报告等。

NLG 的6个步骤:

内容确定 – Content Determination文本结构 – Text Structuring句子聚合 – Sentence Aggregation语法化 – Lexicalisation参考表达式生成 – Referring Expression Generation|REG语言实现 – Linguistic Realisation

想要深入了解NLG,可以看看这篇文章《一文看懂自然语言生成 - NLG(6个实现步骤+3个典型应用)》

NLP 的5个难点

一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)

语言是没有规律的,或者说规律是错综复杂的。语言是可以自由组合的,可以组合复杂的语言表达。语言是一个开放集合,我们可以任意的发明创造一些新的表达方式。语言需要联系到实践知识,有一定的知识依赖。语言的使用要基于环境和上下文。 NLP 的4个典型应用

一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)

情感分析

互联网上有大量的文本信息,这些信息想要表达的内容是五花八门的,但是他们抒发的情感是一致的:正面/积极的 – 负面/消极的。

通过情感分析,可以快速了解用户的舆情情况。

聊天机器人

过去只有 Siri、小冰这些机器人,大家使用的动力并不强,只是当做一个娱乐的方式。但是最近几年智能音箱的快速发展让大家感受到了聊天机器人的价值。

而且未来随着智能家居,智能汽车的发展,聊天机器人会有更大的使用价值。

语音识别

语音识别已经成为了全民级的引用,微信里可以语音转文字,汽车中使用导航可以直接说目的地,老年人使用输入法也可以直接语音而不用学习拼音…

机器翻译

目前的机器翻译准确率已经很高了,大家使用 Google 翻译完全可以看懂文章的大意。传统的人肉翻译未来很可能会失业。

NLP 的 2 种途径、3 个核心步骤

NLP 可以使用传统的机器学习方法来处理,也可以使用深度学习的方法来处理。2 种不同的途径也对应着不同的处理步骤。详情如下:

方式 1:传统机器学习的 NLP 流程

一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)

语料预处理中文语料预处理 4 个步骤(下文详解)英文语料预处理的 6 个步骤(下文详解)特征工程特征提取特征选择选择分类器

方式 2:深度学习的 NLP 流程

一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)

语料预处理中文语料预处理 4 个步骤(下文详解)英文语料预处理的 6 个步骤(下文详解)设计模型模型训练 英文 NLP 语料预处理的 6 个步骤

一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)

分词 – Tokenization词干提取 – Stemming词形还原 – Lemmatization词性标注 – Parts of Speech命名实体识别 – NER分块 – Chunking 中文 NLP 语料预处理的 4 个步骤

一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)

中文分词 – Chinese Word Segmentation词性标注 – Parts of Speech命名实体识别 – NER去除停用词 总结

自然语言处理(NLP)就是在机器语言和人类语言之间沟通的桥梁,以实现人机交流的目的。

NLP的2个核心任务:

自然语言理解 – NLU自然语言生成 – NLG

NLP 的5个难点:

语言是没有规律的,或者说规律是错综复杂的。语言是可以自由组合的,可以组合复杂的语言表达。语言是一个开放集合,我们可以任意的发明创造一些新的表达方式。语言需要联系到实践知识,有一定的知识依赖。语言的使用要基于环境和上下文。

NLP 的4个典型应用:

情感分析聊天机器人语音识别机器翻译

NLP 的6个实现步骤:

分词-tokenization次干提取-stemming词形还原-lemmatization词性标注-pos tags命名实体识别-ner分块-chunking

往期精彩文章回顾:

PyTorch 手把手搭建神经网络 (MNIST)

神经网络的自我修养——神经网络结构搜索NAS简述

(Python教程)什么是机器学习、人工智能、深度学习,三者又是什么关系?

总结:

我整理了一份关于pytorch、python基础,图像处理opencv\自然语言处理、机器学习、数学基础等资源库,想学习人工智能或者转行到高薪资行业的,大学生都非常实用,无任何套路免费提供,,加我Q群【856833272 】也可以领取的内部资源,人工智能题库,大厂面试题 学习大纲 自学课程大纲还有200G人工智能资料大礼包免费送哦~扫码加V免费领取资料.



【本文地址】

公司简介

联系我们

今日新闻


点击排行

实验室常用的仪器、试剂和
说到实验室常用到的东西,主要就分为仪器、试剂和耗
不用再找了,全球10大实验
01、赛默飞世尔科技(热电)Thermo Fisher Scientif
三代水柜的量产巅峰T-72坦
作者:寞寒最近,西边闹腾挺大,本来小寞以为忙完这
通风柜跟实验室通风系统有
说到通风柜跟实验室通风,不少人都纠结二者到底是不
集消毒杀菌、烘干收纳为一
厨房是家里细菌较多的地方,潮湿的环境、没有完全密
实验室设备之全钢实验台如
全钢实验台是实验室家具中较为重要的家具之一,很多

推荐新闻


图片新闻

实验室药品柜的特性有哪些
实验室药品柜是实验室家具的重要组成部分之一,主要
小学科学实验中有哪些教学
计算机 计算器 一般 打孔器 打气筒 仪器车 显微镜
实验室各种仪器原理动图讲
1.紫外分光光谱UV分析原理:吸收紫外光能量,引起分
高中化学常见仪器及实验装
1、可加热仪器:2、计量仪器:(1)仪器A的名称:量
微生物操作主要设备和器具
今天盘点一下微生物操作主要设备和器具,别嫌我啰嗦
浅谈通风柜使用基本常识
 众所周知,通风柜功能中最主要的就是排气功能。在

专题文章

    CopyRight 2018-2019 实验室设备网 版权所有 win10的实时保护怎么永久关闭