什么是自然语言处理(NLP)? 世界微资讯
2023-05-05 19:30:43 来源: 清一色财经
自然语言处理(NLP)是人工智能的一个分支,它使计算机能够像人类一样理解、处理和生成语言。搜索引擎、机器翻译以及语音助理均由该技术提供支持。
[[399636]]
【清一色.com快译】自然语言处理(NLP)的定义
自然语言处理(NLP)是人工智能的一个分支,它使计算机能够像人类一样理解、处理和生成语言。搜索引擎、机器翻译以及语音助理均由该技术提供支持。
(相关资料图)
虽然这一术语最初指的是人工智能系统的阅读能力,但现在已经成为所有计算语言学的一种通俗说法。其子类别包括自然语言生成(NLG)——计算机自行创建通信的能力和自然语言理解(NLU)(理解俚语、发音错误、拼写错误和语言其他变体的能力)。
自然语言处理(NLP)的工作原理
自然语言处理(NLP)通过机器学习进行工作。机器学习系统像其他任何形式的数据一样存储单词及其组合方式。短语、句子、有时甚至整本书的内容都被输入机器学习引擎,并在其中使用语法规则或人们的现实语言习惯,或两者兼而有之进行处理。然后,计算机使用这些数据来查找模式并推断出接下来的结果。以翻译软件为例:在法语中,“我要去公园”是“Je vais au parc”,因此机器学习预测“我要去商店”也将以“Je vais au”开头。
自然语言处理(NLP)的应用
机器翻译是一种功能强大的自然语言处理(NLP)应用程序,但是搜索是最常用的一种用法。每次人们在谷歌或Bing搜索引擎中查找内容时,都人为将数据输入到系统中。当单击搜索结果时,搜索引擎会将其解释为确认其找到的结果是正确的,并在以后使用这一信息更好地进行搜索。
聊天机器人的工作方式与其相同:它们与Slack、Microsoft Messenger和其他聊天程序集成在一起,可以读取人们使用的语言,然后在键入触发短语时将其打开。当Siri和Alexa等语音助理听到诸如“嘿,Alexa”之类的短语时,它们就会有回应,而这就是为什么批评人士指责这些人工智能程序一直在进行监听的原因:如果不这样做,它们永远不知道人们什么时候需要它们。除非人们自己打开应用程序,否则自然语言处理(NLP)程序必须在后台运行,并等待这一短语的出现。
自然语言处理(NLP)的示例
数据有多种形式,但是最大的未使用数据池由文本组成。专利、产品规格、学术出版物、市场研究、新闻以及社交媒体的文章,所有这些都以文本作为主要组成部分,并且文本的数量正在不断增长。将技术应用到语音,数据池将会变得更大。以下是组织如何使用自然语言处理(NLP)技术的三个示例:
(1)全球管理咨询服务商埃森哲公司使用自然语言处理(NLP)技术分析合同:“埃森哲法律智能合同探索(ALICE)”工具已经帮助该公司的2,800名专业人士处理上百万份合同,通过执行文本搜索,来搜索合同条款。ALICE工具使用“嵌入单词”逐段浏览合同文件,寻找关键字来确定每段是否与特定合同条款类型相关。
(2)美国电信商Verizon公司采用自然语言处理(NLP)技术处理客户请求:Verizon公司业务服务保证团队使用自然语言处理(NLP)技术和深度学习来自动处理客户请求注释。该团队每月收到10万个以上的入站请求。其人工智能支持服务可以读取维修票证,并自动响应最常见的请求,例如报告当前票证状态或维修进度更新。而更为复杂的问题将交给工程师解决。
(3)美国公共电力和天然气公司((PSE&G)通过虚拟助理帮助客户:新泽西州州公用事业公司使用虚拟助理技术和其他数字服务,以使其客户能够通过语音命令来管理其电费或天然气账户,这是使用亚马逊公司提供的Alexa 技能工具包构建的。
自然语言处理(NLP)的软件
无论组织是要构建聊天机器人、语音助理、预测文本应用程序,还是以自然语言处理(NLP)为核心的其他应用程序,都将需要工具来帮助做到这一点。以下是一些受到开发人员欢迎的软件工,其中包括:
自然语言工具包(NLTK)。自然语言工具包(NLTK)是一个开放源代码框架,用于构建Python程序以使用人类语言数据。它是在宾夕法尼亚大学计算机和信息科学系开发的,提供了与50多种语料库和词汇资源库、一个文本处理库、一个用于自然语言处理库的包装器以及论坛的接口。自然语言工具包(NLTK)是在Apache2.0许可证下提供的。SpaCy。SpaCy是一个用于高级自然语言处理的开放源代码库,是专门为生产目的而非研究目的而设计的。SpaCy的设计充分考虑了高级数据科学,并允许进行深度数据挖掘。SpaCy是由麻省理工学院开发并许可的。Gensim。Gensim是一个开源Python库。独立于平台的库支持可扩展的统计语义,对纯文本文档进行语义结构分析以及检索语义相似文档的功能。它旨在在无需人工监督的情况下处理大量文本。Amazon Comprehend。这个Amazon服务不需要机器学习的经验。它旨在帮助组织从电子邮件、客户评论、社交媒体、其他文本中找到见解。它使用情感分析、词性提取和标记化来分析单词背后的意图。IBM Watson音频分析器。这个基于云计算的解决方案旨在用于社交监听、聊天机器人集成和客户服务监控。它可以分析客户帖子中的情绪和语气,并监控客户服务电话和聊天对话。谷歌云翻译。这个API使用自然语言处理(NLP)来检查源文本以确定语言,然后使用神经机器翻译将文本动态翻译为另一种语言。该API允许用户将功能集成到他们自己的程序中。自然语言处理(NLP)的课程
有许多资源可用于学习创建和维护自然语言处理(NLP)应用程序,其中许多是免费的。其中包括:
DataCamp中的Python自然语言处理简介。这门免费课程提供15个视频和51个练习文件,涵盖了使用Python进行自然语言处理(NLP)的基础知识,其中包括如何识别和分隔单词,如何在文本中提取主题以及如何构建自己的虚假新闻分类器。Udemy的自然语言处理(NLP)简介。这一入门课程提供使用Python和Natural Language Toolkit处理和分析文本的经验。它包括三个小时的点播视频、三篇文章以及16个可下载资源。该课程费用为19.99美元,并提供结业证书。使用Udemy的Python进行自然语言处理(NLP)。这一课程面向具有任何语言基础编程经验,对面向对象编程概念的理解,具有基础到中级数学知识以及矩阵运算知识的个人。它完全基于项目,并且涉及构建文本分类器以实时预测推文的情绪,以及构建文章摘要器,该文章摘要器可以获取文章并提取摘要。该课程包括10.5小时的点播视频和8篇文章。该课程费用为19.99美元,并提供结业证书。edX的自然语言处理(NLP)。这门由微软公司通过edX提供的为期六周的课程,概述了自然语言处理和经典机器学习方法的使用。它涵盖了统计机器翻译和深度语义相似性模型(DSSM)及其应用。它还涵盖了在自然语言处理(NLP)和视觉语言多模式智能中应用的深度强化学习技术。这是一门高级课程,完成该课程的人员只需支付99美元就可以获得认证证书。Coursera提供的自然语言处理。该课程是Coursera公司的高级机器学习专业化的一部分,涵盖自然语言处理任务,其中包括情感分析、摘要、对话状态跟踪等。Coursera公司表示,这是一门高级课程,估计需要五个星期的学习时间,每周需要学习四到五个小时才能完成。Coursera在TensorFlow中进行自然语言处理。该课程是Coursera公司的实践专业化TensorFlow的一部分,它涵盖了使用TensorFlow构建自然语言处理系统,该系统可以处理文本和输入语句到神经网络中。Coursera公司表示,这是一门中级课程,估计需要四个星期的学习时间,每周需要四到五个小时才能完成。原文标题:What is NLP? Natural language processing explained,作者:Terena Bell,Thor Olavsrud
【清一色译稿,合作站点转载请注明原文译者和出处为清一色.com】
标签:
为您推荐
精彩放送
热门文章
-
金禾实业:拟斥1亿元-2亿元回购公司股份
-
实时:4连板长江传媒:控股股东减持公司股份686.82万股
-
工信部就《汽车整车信息安全技术要求》等四项强制性国家标准公开征求意见
-
报道:鄱阳投资发展:免去孔剑公司董事长职务
-
【聚看点】4月全球手游收入排行榜发布:米哈游重回国内厂商第二
-
*ST奇信:公司股票可能被终止上市
-
监管调研摸底存量专项债项目收益情况 今日关注
-
汉缆股份:中标约5.7亿元的国家电网相关采购项目
-
上海电力:控股子公司拟增持中信建投国家电投新能源REIT不超过4%的份额
-
止盈止损比例多少合适?止损点和止盈点怎么算?
-
业绩亏损严重的股票可以上涨吗?业绩亏损的股票为什么有分红?
-
股票资金流入好还是流出好?主力净流入为负为什么还涨?
精彩图片
-
成本大减!新一轮的旗舰大战也将在即将到来的9月正式拉开帷幕
-
博览会开幕 中国首款具有自主知识产权的国产通用型科学计算软件正式发布
-
技术下降!Intel独立显卡驱动一次评测就发现43个Bug
-
高性能的台式机彻底告别“光污染” 雷克沙推出简洁纯白外观设计
-
韩国媒体率先报道:三星电子236层NAND闪存预计年内开始生产 市场竞争更激烈
-
新科技!苹果正在积极研发某种形式的AR/VR头显或智能眼镜
-
谷歌测试开展新功能 向用户展示哪些云流媒体服务拥有特定的视频游戏
-
支付宝积极响应国家为小微降费的政策号召 一年降费让利近80亿
-
京东汽车就与浦林成山旗下新能源车轮胎品牌浦林达成战略合作 助力轮胎“电动化转型”
-
苹果新专利公布:暗示未来 iPhone手机或许有陶瓷材质版
-
盖茨和韩国能源供应商SK共同牵头 其中SK投资2.5亿美元
-
海底捞早已经捞不动了 据统计上半年最高亏损达2.97亿
热文
-
国家发改委:调查显示5月份钢材市场预期偏弱 全球热门
-
今日热议:工行受托管理年金突破5000亿元 助力老有所养
-
两江新区招商集团第二党支部举办五四青年节主题党日活动
-
焦点热文:中金:消费复苏第一步基本完成
-
天天动态:日本部分路段受地震影响限速,北陆新干线部分列车停运
-
新乳业:在淄博烧烤节以及淄博市场有产品提供
-
北证50指数午后涨超2% 世界热议
-
国家发改委会同有关部门研究启动年内第二批中央冻猪肉储备收储工作 全球独家
-
永鼎股份:预中标2022年中国电信光模块集采向项目
-
数字湖南十大应用场景建设重点项目出炉 总投资超15亿元
-
党组织在纪律审查中发现党员严重违纪涉 党组织在纪律审查中发现党员有贪污贿
-
全球观焦点:违规发出收购要约、减持广汇物流 广汇实业投资及法定代表人被监管罚款400万元
-
四川:力争“十四五”末成都都市圈经济总量突破3.3万亿元
-
伯克希尔-哈撒韦资深董事:不认为92岁的巴菲特会向格雷格·阿贝尔急迫交棒
-
深圳:港澳青年在深创业个人最高可贷60万元
-
商务部:拓展中国与中东欧国家在绿色、低碳、数字、健康等新领域新业态的合作
-
君亭酒店:五一期间直营店RevPAR同比去年增长超250% 世界热资讯
-
V观财报|*ST泛海连抛两份增持计划,深交所:可行?“忽悠式”增持?
-
中药、新冠药概念股震荡下挫 众生药业跌超8%
-
半导体板块震荡走低 寒武纪跌超10%
-
新宙邦:波兰锂离子电池电解液等项目将于二季度投产 当前热闻
-
全球观热点:山西素合菜的做法?
-
全球今亮点!《表白吧!在毕业前》主创亮相大影节
-
港股午评:恒生科技指数涨1.58% 券商、手游等概念股活跃
-
【世界新要闻】商务部:截至去年底 中欧双向投资存量已超2300亿美元
-
天天视点!长江河道采砂管理合作机制领导小组会议:推动实现非法采砂船舶存量动态清零
-
天空之眼瞰古都西安 全球播资讯
-
世界热讯:京北方:对今年行业整体中性偏乐观
-
山东:加快布局人形机器人等前沿领域 推进6G技术研发和应用 |天天时快讯
-
医疗美容行业监管工作指导意见出台 伊美尔遭聘用“黑医生”质疑
-
最“热”五一|重点聚焦
-
每日观察!小白投资要懂!天线股票龙头有哪些?(2023年5月)
-
世界热讯:商务部:截至去年底中欧双向投资存量已超2300亿美元
-
SHIBOR短线品种全线下跌 当前速看
-
视点!浙江稠州时隔14年首次打进了总决赛
-
美国3月贸易逆差额创新高 当前资讯
-
ETF观察丨银行板块获主力资金净流入超8亿元,招商银行涨超2%,央企创新驱动ETF(515900)盘中溢价 世界即时
-
国产半导体CIM企业赛美特完成超5亿元C轮融资 全球新资讯
-
周大生:已使用公司终端pos系统加盟商五一节5天时间店均销售增长40.6%
-
2023年春季踏青活动方案策划 春季踏青活动策划(5篇)
-
查快递物流单号追踪_查快递物流单号
-
5月4日中国汽、柴油平均批发价格分别为8880、7822元/吨
-
今日热搜:最“热”五一
-
世界今日讯!铁路五一假期发送旅客1.33亿人次 日均较2019年同期增超26%
-
多地发文支持,“地摊经济”该如何带动城市烟火气?_全球新视野
-
商务部:一季度中国对中东欧国家全行业直接投资同比大幅增长148%
-
光伏等赛道股持续调整 阳光电源跌超6% |世界即时看
-
中电联:非化石能源发电装机容量占比升至50.5% 首次过半 |全球时快讯
-
商务部:将采取多种方式、多种措施,积极推动自中东欧国家的进口
-
松江各大景点花式解锁“露营+” 露营经济成为“五一”旅游新增长点