导读
- 快速了解自然语言处理
什么是自然语言处理
自然语言处理发展背景和历程
自然语言处理技术体系
自然语言处理工作原理 - 自然语言处理开发环境介绍
Sublime Text和Anaconda介绍
开发环境安装与配置 - 案例:NLP技术实现预测天气冷暖感知度
算法模型选择及原理讲解
案例需求
加载数据集代码与实现
数据分析与可视化
算法模型构建与实现
算法优化与应用 - 结尾讨论
什么是自然语言处理
自然语言处理(英语:Natural Language Processing,简称NLP)是人工智能和语言学领域的分支科学。主要包括自然语言理解和生成,自然语言理解系统把自然语言转化为计算机程序更易于处理的形式即让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。
自然语言处理应用前景
自然语言处理发展背景和历程
- 1948年,香农把“熵”的概念引用导语言处理中。
- 1956年,乔姆斯基提出了上下文无关语法。[基于规则和概率]
- 70年代初,NLP的研究进入了低谷期。一些学者依旧研究着。
- 80年代,有限状态模型和经验主义的研究方法开始复苏。
- 90年代以后,计算机速度和存储量大幅增加,NLP商品化的出现。
- 90年代末导21世纪初,各种处理技术开始融合(统计、规则、知识库等),自然语言处理的研究又开始兴旺起来。
自然语言处理涉及的学科领域
- 语言学
- 计算机科学(提供模型表示、算法设计、计算机实现)
- 数学(数学模型)
- 统计学(提供样本数据的预测统计技术)
- 心理学(人类语言心理模型和理论)
- 哲学(提供人类思维和语言的更深层次理论)
- 电子工程(信息论基础和语言信号处理技术)
- 生物学(人类语言行为机制理论)
自然语言处理技术体系
自然语言处理工作原理
过程:**形式化描述-数学模型算法化-程序化-实用化。**具体步骤如下:
- 形式化:研究的问题在语言上建立形式化模型,使其可以数学形式表示出来。
- 数学化:把数学模型表示为算法的过程称之为算法化。
- 程序化:更具算法计算机进行实现,建立各种自然语言处理系统,这个过程呢个叫程序化。
- 实用化:对系统进行评测和改进最终满足现实需求,这个过程是实用化。