腾讯云-云智自然语言处理API小试

 

前述

(妈耶!这是昨天的文章了,昨天晚上写着写着突然断电,而我的电脑是台式机。。。)

今天在忙毕设的事情,毕设项目是做一个微计划日程管理的小程序,目前已经完成了大部分的功能。

其中包括图表统计、时间轴、四象限、小卡片、数据备份和数据还原等功能。不过今天刚通知了说审核失败,理由是身份为个人的开发者不能做备忘录相关的微信小程序。

昨天想着能不能把自己的兴趣(自然语言处理+知识图谱)和毕设结合起来,打算通过调用一些开放的自然语言处理的Restful API接口来处理一些todo、plan、target相关分析统计工作。

哈工大的ltp之前尝试过,不过现在调用的结果还是说未授权的用户,虽然网页上显示我的可使用流量还有18G之多。

复旦的话有知识工场有提供知识图谱的相关Restful API,尝试了一下感觉还可以,蛮不错的,有时间也做个记录。

以上的都是使用的是http,而小程序的request请求只能是https,所以许多方法也就都不实用了。除非自己搭设一个https的服务器,然后转接请求http请求,就和代理差不多。

一些其他公司的服务经过探索后也都是有的,比如说百度、阿里、腾讯、华为等。估计差不多都大同小异,用起来也都差不多。基本上都是提供相关平台语言SDK来服务的,如果是要自己动手去写出http请求的话,还要自己对签名进行处理等等,比较麻烦,目前并不想尝试实践。

由于先搜到的腾讯云,同时由于小程序的缘故刚注册的腾讯云的微信公共平台的账号,所以就在腾讯云上学习探索了。

发现调用的方式其实挺简单的,相关的文章网上也早已经有了。

比如说:腾讯文智自然语言处理-分词API Python小实验开发者实验室体验之文智自然语言处理SDK by python等。

腾讯云文智自然语言处理API链接:https://cloud.tencent.com/document/api/271

下面简单的贴一下相关的代码。

虽然从逻辑上讲这些重复性的代码可以通过运用相关设计模式经验封装成模块和函数更为合理,但是这里仅是简单的测试,所以也就没继续搞了。

情感分析

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
from QcloudApi.qcloudapi import QcloudApi

from settings import secretId,secretKey

import json


from pprint import pprint
module = 'wenzhi'


config = {
'secretId': secretId,
'secretKey': secretKey,
'Region': 'gz',
'method': 'POST'
}

action = 'TextSentiment' #情感分析

params = {
'content': "李亚鹏挺王菲:加油!孩他娘。"
}

try:
service = QcloudApi(module,config)

print(service.generateUrl(action,params))

pprint(json.loads(service.call(action,params)))

except Exception as e:
print('Exception',e)

运行结果:

1
2
3
4
5
6
https://wenzhi.api.qcloud.com/v2/index.php
{'code': 0,
'codeDesc': 'Success',
'message': '',
'negative': 0.0051898001693189,
'positive': 0.99481022357941}

其中的settings模块里面装有自己的secretId和secretKey,就两行代码而已:

1
2
secretId = '自己的secretId'
secretKey = '自己的secretKey'

很明显无法打印出有效的URL~因为使用的方法为POST,相关的数据在请求体中而非GET方法中的请求头中。

后面的所有代码只需要修改action和params的值即可

文本抓取

1
2
3
4
5
action = 'ContentGrab'# 文本抓取

params = {
'url': 'http://www.iamlightsmile.com'
}

运行结果:
靠,之前还好好的,现在报错了!

1
2
3
4
https://wenzhi.api.qcloud.com/v2/index.php
{'code': 4000,
'codeDesc': 'InvalidParameter',
'message': '(-100) service timeout.'}

不知为啥,有时会出现如上的错误,尽管代码没有问题,多尝试几次可能就出现正常的结果了,尽管这种不确定性还是挺烦人的。。。
正确结果如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
https://wenzhi.api.qcloud.com/v2/index.php
{'code': 0,
'codeDesc': 'Success',
'content': 'lightsmile\n'
'1459679436@qq.com\n'
"lightsmile's Blog\n"
"lightsmile's Blog\n"
' lightsmile \n'
'2018-04-18\n'
'GithubPages新尝试\n'
' 由于某些不便明说的原因,我要再申请一个域名,再申请一个GitHub账号,再搞一个GitHub '
'Pages。打算用来记录一些不便明说的东西。 '
'这次域名的申请不同于之前的在万网的iamlightsmile.com,这次是在腾讯云上申请的,不过都大同小异了。接着等待大概3天左右的实名认证,通过后域名就可以解析可用了。由于只是使用GitHub '
'Pages 作为静态网页,不需要另外购置服务器,所以也不... 阅读全文… \n'
'GitHub\n'
'2018-04-17\n'
'学习Python设计模式\n'
' 本书主要参阅的书籍是《精通Python设计模式》 '
'本书分为创建型模式、结构型模式、行为型模式三大类,同时又细分为16种模式。具体到每个模式,则通过简单介绍、现实生活中例子、软件应用实例、应用场景、具体代码实现、小结几部分,多个角度加深对某个设计模式的理解。案例贴近生活,代码简单易懂,描述清晰明白,翻译水平上佳,确实算是我认为的好书,同时翻译还将代码上传到GitHub上方便读者下载学习,这里真... '
'阅读全文… \n'
'2018-04-14\n'
'推荐阅读书籍\n'
' 此博文作为书籍阅读及相关的记录哲学篇 《和谐辩证法》 《智慧之根》 计算机篇 《统计学习理论基础》 《大数据智能》 '
'《统计自然语言处理》(第二版) 《Python自然语言处理》(第2版,没有纸质) 基础篇 《线性代数及其应用》 历史篇小说篇 '
'《天行健》 《英雄志》 《国士无双》 思维篇 《如何系统思考》 阅读全文… \n'
'2018-04-07\n'
'哈工大ltp小试\n'
' 今天开始探索学习使用哈工大的LTP(Language Technology Platform)。 这里是官网地址 '
'这里是GitHub地址 这里是pyltp的使用文档 '
'平台采用的语言是C++,但是也提供了Python和Java的封装。由于本人目前使用Python作为自然语言处理的工具语言,所以以下的探索流程都是使用本人电脑中的Window8.1操作系统的PyCharm集成开发环境,使用的Pyt... '
'阅读全文… \n'
'Python\n'
'ltp\n'
'自然语言处理\n'
'2018-04-06\n'
'Scrapy爬取知乎数据小试\n'
' 啊啊啊,没时间写啦,以后有时间再写吧! 。。。发现今天是周五,不熄灯。。。 '
'前两周一直在忙毕设的事情,由于某些原因毕设选择了相对简单的微信小程序,经过奋战之后一些主要的基本功能已经实现多半。 '
'自然语言处理的一些最基本的概念已经有所了解,下面想要找点实战项目练练手。由于处理的第一步便是要获取语料,想着以后爬虫这东西肯定是要学的,于是从昨天开始学习相关视频、配置相关环境,今天看了部分,照着Dem... '
'阅读全文… \n'
'Scrapy\n'
'爬虫\n'
'2018-04-03\n'
'随想\n'
' 其实这世上哪有什么善恶,有的只是不同环境下不同的选择。 我发现人和人相识的过程基本上都是从他的经历中提取特质然后贴上标签的过程。 '
'普天之下又有多少人敢把自己的灵魂放在阳光下炙烤呢?草他妈的! 阅读全文… \n'
'2018-03-28\n'
'计算机\n'
'微信小程序的component\n'
' '
'我发现无法直接在样式即wxss里通过color属性设置icon组件的颜色,是无效的,只能通过在wxml里设置它的color属性为js传入的变量值或者是通过变量值来控制具体的颜色值。 '
'我们可以将微信小程序中的components组件视为一个对象,没错,它本来就是一个对象,只是相对而言,它的初始化方法和设置方式不同于在一般的js语言中,它的data属性里是这个对象建立时初始化时的数据,作用域... '
'阅读全文… \n'
'微信小程序\n'
'2018-03-19\n'
'计算机\n'
'learnNLTKbyWatchVideo\n'
' The following is learning from the video:NLTK with Python 3 for '
'Natural Language Processing.You can watch the videos in '
'YouTube,iliibili and the author’s website: pythonprogramming.net '
'I use jupyte... 阅读全文… \n'
'NLTK\n'
'Python\n'
'自然语言处理\n'
'2018-03-13\n'
'线性代数与微积分浅解\n'
' '
'以前在大一大二时曾学过高等数学(微积分)与线性代数,不过在当时都是被动的学一学,考个分数而已,同时教授一般也都是照本宣科的围绕理论展开,平淡无味的 '
'阅读全文… \n'
'2018-03-13\n'
'《自然语言处理综论》学习笔记\n'
' Bill Manaris 关于自然语言处理的定义 阅读全文… \n'
'博客内容遵循 知识共享 署名 - 非商业性 - 相同方式共享 4.0 国际协议\n'
'扫一扫,分享到微信\n'
'{title}\n'
' {tags} \n'
'{date}\n',
'message': '',
'title': "lightsmile's Blog | lightsmile"}

内容转码

1
2
3
4
5
6
action = 'ContentTranscode'# 内容转码

params = {
'url': 'www.iamlightsmile.com',
'to_html': 1
}

运行结果:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
https://wenzhi.api.qcloud.com/v2/index.php
{'code': 0,
'codeDesc': 'Success',
'content': '<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE html PUBLIC '
'"-//WAPFORUM//DTD XHTML Mobile 1.0//EN" '
'"http://www.wapforum.org/DTD/xhtml-mobile10.dtd"><html '
'xmlns="http://www.w3.org/1999/xhtml"><head><meta '
'http-equiv="Content-Type" content="application/xhtml+xml; '
'charset=UTF-8"/><title>lightsmile\'s Blog | '
'lightsmile</title><style type="text/css">* '
'{margin:0;padding:0;}body {font-family: '
'Arial,Helvetica,sans-serif;}a {cursor: pointer;text-decoration: '
'underline;}body, div, p, a, table, textarea, form, img, ol, ul, '
'li, h1, h2, h3, h4, h5, h6 {border:0 none;}#tc_content '
'{font-size: 16px;line-height: 25px;word-wrap: break-word;padding: '
'5px 6px;overflow: hidden;}</style></head><body><div '
'id="tc_content"><div class="fold_div"><a class="fold_a" '
'href="http://www.iamlightsmile.com##bk=1&pg=1">[展开]&#160;1459679436@qq.com&#160;</a></div>lightsmile\'s&#160;Blog&#160;<br '
"/>lightsmile's&#160;Blog&#160;&#160;lightsmile&#160;<br "
'/>2018-04-18&#160;<a '
'href="http://www.iamlightsmile.com/2018/04/18/GithubPages%E6%96%B0%E5%B0%9D%E8%AF%95/" '
'position="6">GithubPages新尝试</a>&#160;由于某些不便明说的原因,我要再申请一个域名,再申请一个GitHub账号,再搞一个GitHub&#160;Pages。打算用来记录一些不便明说的东西。\n'
'这次域名的申请不同于之前的在万网的iamlightsmile.com,这次是在腾讯云上申请的,不过都大同小异了。接着等待大概3天左右的实名认证,通过后域名就可以解析可用了。由于只是使用GitHub&#160;Pages&#160;作为静态网页,不需要另外购置服务器,所以也不...\n'
'<a '
'href="http://www.iamlightsmile.com/2018/04/18/GithubPages%E6%96%B0%E5%B0%9D%E8%AF%95/" '
'position="6">阅读全文…</a> <a '
'href="http://www.iamlightsmile.com/tags/GitHub/" '
'position="6">GitHub</a> <br />2018-04-17&#160;<a '
'href="http://www.iamlightsmile.com/2018/04/17/%E5%AD%A6%E4%B9%A0Python%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F/" '
'position="6">学习Python设计模式</a> <br '
'/>&#160;本书主要参阅的书籍是《精通Python设计模式》\n'
'本书分为创建型模式、结构型模式、行为型模式三大类,同时又细分为16种模式。具体到每个模式,则通过简单介绍、现实生活中例子、软件应用实例、应用场景、具体代码实现、小结几部分,多个角度加深对某个设计模式的理解。案例贴近生活,代码简单易懂,描述清晰明白,翻译水平上佳,确实算是我认为的好书,同时翻译还将代码上传到GitHub上方便读者下载学习,这里真...\n'
'<a '
'href="http://www.iamlightsmile.com/2018/04/17/%E5%AD%A6%E4%B9%A0Python%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F/" '
'position="6">阅读全文…</a> <br />2018-04-14&#160;<a '
'href="http://www.iamlightsmile.com/2018/04/14/%E6%8E%A8%E8%8D%90%E9%98%85%E8%AF%BB%E4%B9%A6%E7%B1%8D/" '
'position="6">推荐阅读书籍</a> <br />&#160;此博文作为书籍阅读及相关的记录哲学篇\n'
'《和谐辩证法》\n'
'《智慧之根》\n'
'计算机篇\n'
'《统计学习理论基础》\n'
'《大数据智能》\n'
'《统计自然语言处理》(第二版)\n'
'《Python自然语言处理》(第2版,没有纸质)\n'
'基础篇\n'
'《线性代数及其应用》\n'
'历史篇小说篇\n'
'《天行健》\n'
'《英雄志》\n'
'《国士无双》\n'
'思维篇\n'
'《如何系统思考》\n'
'<a '
'href="http://www.iamlightsmile.com/2018/04/14/%E6%8E%A8%E8%8D%90%E9%98%85%E8%AF%BB%E4%B9%A6%E7%B1%8D/" '
'position="6">阅读全文…</a> <br />2018-04-07&#160;<a '
'href="http://www.iamlightsmile.com/2018/04/07/%E5%93%88%E5%B7%A5%E5%A4%A7ltp%E5%B0%8F%E8%AF%95/" '
'position="6">哈工大ltp小试</a> <br '
'/>&#160;今天开始探索学习使用哈工大的LTP(Language&#160;Technology&#160;Platform)。\n'
'这里是官网地址\n'
'这里是GitHub地址\n'
'这里是pyltp的使用文档\n'
'平台采用的语言是C++,但是也提供了Python和Java的封装。由于本人目前使用Python作为自然语言处理的工具语言,所以以下的探索流程都是使用本人电脑中的Window8.1操作系统的PyCharm集成开发环境,使用的Pyt...\n'
'<a '
'href="http://www.iamlightsmile.com/2018/04/07/%E5%93%88%E5%B7%A5%E5%A4%A7ltp%E5%B0%8F%E8%AF%95/" '
'position="6">阅读全文…</a> <br /><a '
'href="http://www.iamlightsmile.com/tags/Python/" '
'position="6">Python</a> <a '
'href="http://www.iamlightsmile.com/tags/ltp/" '
'position="6">ltp</a> <a '
'href="http://www.iamlightsmile.com/tags/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86/" '
'position="6">自然语言处理</a> <br />2018-04-06&#160;<a '
'href="http://www.iamlightsmile.com/2018/04/06/Scrapy%E7%88%AC%E5%8F%96%E7%9F%A5%E4%B9%8E%E6%95%B0%E6%8D%AE%E5%B0%8F%E8%AF%95/" '
'position="6">Scrapy爬取知乎数据小试</a> <br />&#160;啊啊啊,没时间写啦,以后有时间再写吧!\n'
'。。。发现今天是周五,不熄灯。。。\n'
'前两周一直在忙毕设的事情,由于某些原因毕设选择了相对简单的微信小程序,经过奋战之后一些主要的基本功能已经实现多半。\n'
'自然语言处理的一些最基本的概念已经有所了解,下面想要找点实战项目练练手。由于处理的第一步便是要获取语料,想着以后爬虫这东西肯定是要学的,于是从昨天开始学习相关视频、配置相关环境,今天看了部分,照着Dem...\n'
'<a '
'href="http://www.iamlightsmile.com/2018/04/06/Scrapy%E7%88%AC%E5%8F%96%E7%9F%A5%E4%B9%8E%E6%95%B0%E6%8D%AE%E5%B0%8F%E8%AF%95/" '
'position="6">阅读全文…</a> <br /><a '
'href="http://www.iamlightsmile.com/tags/Scrapy/" '
'position="6">Scrapy</a> <a '
'href="http://www.iamlightsmile.com/tags/%E7%88%AC%E8%99%AB/" '
'position="6">爬虫</a> <br />2018-04-03&#160;<a '
'href="http://www.iamlightsmile.com/2018/04/03/%E9%9A%8F%E6%83%B3/" '
'position="6">随想</a> <br />&#160;其实这世上哪有什么善恶,有的只是不同环境下不同的选择。\n'
'我发现人和人相识的过程基本上都是从他的经历中提取特质然后贴上标签的过程。\n'
'普天之下又有多少人敢把自己的灵魂放在阳光下炙烤呢?草他妈的!\n'
'<a '
'href="http://www.iamlightsmile.com/2018/04/03/%E9%9A%8F%E6%83%B3/" '
'position="6">阅读全文…</a> <br />2018-03-28&#160;<a '
'href="http://www.iamlightsmile.com/categories/%E8%AE%A1%E7%AE%97%E6%9C%BA/" '
'position="6">计算机</a> <br /><a '
'href="http://www.iamlightsmile.com/2018/03/28/%E5%BE%AE%E4%BF%A1%E5%B0%8F%E7%A8%8B%E5%BA%8F%E6%8E%A2%E7%B4%A2%E9%9A%8F%E7%AC%94/" '
'position="6">微信小程序的component</a> <br '
'/>&#160;我发现无法直接在样式即wxss里通过color属性设置icon组件的颜色,是无效的,只能通过在wxml里设置它的color属性为js传入的变量值或者是通过变量值来控制具体的颜色值。\n'
'我们可以将微信小程序中的components组件视为一个对象,没错,它本来就是一个对象,只是相对而言,它的初始化方法和设置方式不同于在一般的js语言中,它的data属性里是这个对象建立时初始化时的数据,作用域...\n'
'<a '
'href="http://www.iamlightsmile.com/2018/03/28/%E5%BE%AE%E4%BF%A1%E5%B0%8F%E7%A8%8B%E5%BA%8F%E6%8E%A2%E7%B4%A2%E9%9A%8F%E7%AC%94/" '
'position="6">阅读全文…</a> <br /><a '
'href="http://www.iamlightsmile.com/tags/%E5%BE%AE%E4%BF%A1%E5%B0%8F%E7%A8%8B%E5%BA%8F/" '
'position="6">微信小程序</a> <br />2018-03-19&#160;<a '
'href="http://www.iamlightsmile.com/categories/%E8%AE%A1%E7%AE%97%E6%9C%BA/" '
'position="6">计算机</a> <br /><a '
'href="http://www.iamlightsmile.com/2018/03/19/learnNLTKbyWatchVideo/" '
'position="6">learnNLTKbyWatchVideo</a> <br '
'/>&#160;The&#160;following&#160;is&#160;learning&#160;from&#160;the&#160;video:NLTK&#160;with&#160;Python&#160;3&#160;for&#160;Natural&#160;Language&#160;Processing.You&#160;can&#160;watch&#160;the&#160;videos&#160;in&#160;YouTube,iliibili&#160;and&#160;the&#160;author’s&#160;website:&#160;pythonprogramming.net\n'
'I&#160;use&#160;jupyte...\n'
'<a '
'href="http://www.iamlightsmile.com/2018/03/19/learnNLTKbyWatchVideo/" '
'position="6">阅读全文…</a> <br /><a '
'href="http://www.iamlightsmile.com/tags/NLTK/" '
'position="6">NLTK</a> <a '
'href="http://www.iamlightsmile.com/tags/Python/" '
'position="6">Python</a> <a '
'href="http://www.iamlightsmile.com/tags/%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86/" '
'position="6">自然语言处理</a> <br />2018-03-13&#160;<a '
'href="http://www.iamlightsmile.com/2018/03/13/%E7%BA%BF%E6%80%A7%E4%BB%A3%E6%95%B0%E4%B8%8E%E5%BE%AE%E7%A7%AF%E5%88%86%E6%B5%85%E8%A7%A3/" '
'position="6">线性代数与微积分浅解</a> <br '
'/>&#160;以前在大一大二时曾学过高等数学(微积分)与线性代数,不过在当时都是被动的学一学,考个分数而已,同时教授一般也都是照本宣科的围绕理论展开,平淡无味的\n'
'<a '
'href="http://www.iamlightsmile.com/2018/03/13/%E7%BA%BF%E6%80%A7%E4%BB%A3%E6%95%B0%E4%B8%8E%E5%BE%AE%E7%A7%AF%E5%88%86%E6%B5%85%E8%A7%A3/" '
'position="6">阅读全文…</a> <br />2018-03-13&#160;<a '
'href="http://www.iamlightsmile.com/2018/03/13/%E3%80%8A%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86%E7%BB%BC%E8%AE%BA%E3%80%8B%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0/" '
'position="6">《自然语言处理综论》学习笔记</a> <br '
'/>&#160;Bill&#160;Manaris&#160;关于自然语言处理的定义\n'
'<a '
'href="http://www.iamlightsmile.com/2018/03/13/%E3%80%8A%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86%E7%BB%BC%E8%AE%BA%E3%80%8B%E5%AD%A6%E4%B9%A0%E7%AC%94%E8%AE%B0/" '
'position="6">阅读全文…</a> <br />1&#160;<a '
'href="http://www.iamlightsmile.com/page/2/" '
'position="786432">2</a> <a '
'href="http://www.iamlightsmile.com/page/3/" '
'position="786432">3</a> <a '
'href="http://www.iamlightsmile.com/page/4/" '
'position="786432">4</a> <a '
'href="http://www.iamlightsmile.com/page/2/" '
'position="786432">下一页</a> <br />博客内容遵循&#160;<a '
'href="https://creativecommons.org/licenses/by-nc-sa/4.0/deed.zh" '
'position="6">知识共享&#160;署名&#160;-&#160;非商业性&#160;-&#160;相同方式共享&#160;4.0&#160;国际协议</a> '
'<br />lightsmile&#160;&amp;copy;&#160;2015&#160;-&#160;2018\n'
'Power&#160;by&#160;<a href="http://hexo.io/" '
'position="6">Hexo</a>&#160;Theme&#160;<a '
'href="https://github.com/yscoder/hexo-theme-indigo" '
'position="6">indigo</a> <br />扫一扫,分享到微信&#160;<br /><a '
'href="http://www.iamlightsmile.com/%7Bpath%7D" '
'position="6">{title}{tags}{date}</a> <br /></div></body></html>',
'message': ''}

分词、词性标注、命名实体识别

1
2
3
4
5
6
7
action = 'LexicalAnalysis'# 分词、词性标注、命名实体识别

params = {
'text': "我爱洗澡",
'code': 0x00200000, #0x00200000表示utf-8
'type': 0 #取值 0 或 1,默认为 0。 0 为基础粒度版分词,倾向于将句子切分的更细,在搜索场景使用为佳。 1 为混合粒度版分词,倾向于保留更多基本短语不被切分开。
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
https://wenzhi.api.qcloud.com/v2/index.php
{'code': 0,
'codeDesc': 'Success',
'combtokens': [{'cls': '短语', 'pos': 0, 'wlen': '8', 'word': '我爱洗澡'}],
'message': '',
'tokens': [{'pos': 0,
'wlen': '2',
'word': '我',
'wtype': '代词',
'wtype_pos': 27},
{'pos': 2,
'wlen': '2',
'word': '爱',
'wtype': '动词',
'wtype_pos': 31},
{'pos': 4,
'wlen': '4',
'word': '洗澡',
'wtype': '动词',
'wtype_pos': 31}]}

文本纠错

1
2
3
4
5
action = 'LexicalCheck' #文本纠错

params = {
'text': '人生苦短,我用Python!哼哼哈嘿!巴啦巴啦小魔仙!'
}
1
2
3
4
5
6
7
https://wenzhi.api.qcloud.com/v2/index.php
{'code': 0,
'codeDesc': 'Success',
'conf': 1,
'message': '',
'text': '人生苦短,我用Python!哼哼哈嘿!巴啦巴啦小魔仙!',
'text_annotate': '人生苦短,我用Python!哼哼哈嘿!巴啦巴啦小魔仙!'}

同义词

1
2
3
4
5
action = 'LexicalSynonym'# 同义词

params = {
'text': '人生苦短,我用Python。我爱自然语言处理和知识图谱!'
}
1
2
3
4
5
6
7
8
9
10
11
12
13
https://wenzhi.api.qcloud.com/v2/index.php
{'code': 0,
'codeDesc': 'Success',
'message': '',
'query': None,
'syns': [{'word_ori': {'idx_beg': 7, 'idx_end': 8, 'text': '爱'},
'word_syns': [{'conf': 0.32546776533127, 'text': '最爱'}]},
{'word_ori': {'idx_beg': 8, 'idx_end': 9, 'text': '自然'},
'word_syns': [{'conf': 0.36934259533882, 'text': '大自然'}]},
{'word_ori': {'idx_beg': 11, 'idx_end': 12, 'text': '和'},
'word_syns': [{'conf': 0.60000002384186, 'text': '与'}]},
{'word_ori': {'idx_beg': 13, 'idx_end': 14, 'text': '图谱'},
'word_syns': [{'conf': 0.37899446487427, 'text': '图片'}]}]}

文本分类

1
2
3
4
5
action = 'TextClassify' #文本分类

params = {
'content':'人生苦短,please Python。太祖、刘邦、朱元璋哪个更厉害?!'
}
1
2
3
4
5
6
7
https://wenzhi.api.qcloud.com/v2/index.php
{'classes': [{'class': '文化', 'class_num': 61, 'conf': 0.713},
{'class': '历史', 'class_num': 95, 'conf': 0.221},
{'class': '未分类', 'class_num': 0, 'conf': 0.066}],
'code': 0,
'codeDesc': 'Success',
'message': ''}

句法分析

1
2
3
4
5
action = 'TextDependency'# 句法分析

params = {
'content': '我爱自然语言处理'
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
https://wenzhi.api.qcloud.com/v2/index.php
{'code': 0,
'codeDesc': 'Success',
'keywords': [[{'dep_rel': 'SBV',
'father_id': 2,
'id': 1,
'postag': 'r',
'word': '我'},
{'dep_rel': 'HED',
'father_id': 0,
'id': 2,
'postag': 'v',
'word': '爱'},
{'dep_rel': 'VOB',
'father_id': 2,
'id': 3,
'postag': 'n',
'word': '自然语言'},
{'dep_rel': 'COO',
'father_id': 2,
'id': 4,
'postag': 'v',
'word': '处理'}]],
'message': ''}

关键词提取

1
2
3
4
5
6
7
8
action = 'TextKeywords' #关键词提取

params = {
'title': '自然语言处理',
'content': '''自然语言处理(英语:natural language processing,缩写作 NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。

自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。'''
}
1
2
3
4
5
6
7
https://wenzhi.api.qcloud.com/v2/index.php
{'code': 0,
'codeDesc': 'Success',
'keywords': [{'keyword': '自然语言',
'score': 0.57486760616302,
'type': 'keyword'}],
'message': ''}

敏感信息识别

1
2
3
4
5
6
action = 'TextSensitivity' #敏感信息识别

params = {
'content': "中共统治!压迫,人民!续一秒!",
'type': 2
}
1
2
3
4
5
6
https://wenzhi.api.qcloud.com/v2/index.php
{'code': 0,
'codeDesc': 'Success',
'message': '',
'nonsensitive': 0.37754066879815,
'sensitive': 0.62245933120185}