-1.更新
发现现在brat直接Python3就可以使用,只是brat官网上和Github上最新release版本还停留在2012年,然而brat近几年有所更新,所以我们可以直接clone Github上的brat的最新源码进行使用hhh。
0.前言
0.1 背景
近日简单调研一下NLP标注工具brat的使用,其官网示例中可以标注的任务包括命名实体识别、事件抽取、指代消解、依存句法、成分句法等等。
发现现在brat直接Python3就可以使用,只是brat官网上和Github上最新release版本还停留在2012年,然而brat近几年有所更新,所以我们可以直接clone Github上的brat的最新源码进行使用hhh。
近日简单调研一下NLP标注工具brat的使用,其官网示例中可以标注的任务包括命名实体识别、事件抽取、指代消解、依存句法、成分句法等等。
最近出于兴趣和需要,重新回顾中文分词技术,期间有些心得,以及一些关于自然语言处理的浅薄之见,这里简单分享一下。
之前自己也是懵懵懂懂的不太理解,经过一段时间的学习和思考,感觉自己有了新的认识,所以在这里分享一下,也算自己的总结了。
不谈数学原理,我认为理解Word Embedding可以从以下3个角度来理解。
使用如下命令安装torchtext
pip install https://github.com/pytorch/text/archive/master.zip
自然语言处理(Natural Language Processing,NLP):自然语言处理是人工智能和语言学领域的分支学科,主要研究如何让计算机处理和运用自然语言。
自然语言处理广义上分为两大部分,第一部分是自然语言理解,是指让电脑“懂”人类的语言;第二部分为自然语言生成,是指把计算机数据转化为自然语言。
经过我的探索,发现现在商用也好,学习也罢,目前提供NLP技术服务的大致分三种:
1 / 2