lightsmile's blog

about NLP,KG,ML and so on

0.概览

目前自己在深度学习这方面有一定的积累,一些代码流程都有一定的套路和相应的标准,这里自己简单梳理一下。

我们这里假设输入为已标注数据,输出为训练的模型,不考虑标注前数据处理部分已经代码上线部署环节。

大致的流程包括:

  • 数据预处理
  • 编写神经网络模型
  • 编写数据加载部分代码
  • 编写模型训练预测代码

本文章转自完整机器学习项目的工作流程 - 知乎

1.抽象成数学问题

明确问题是进行机器学习的第一步。机器学习的训练过程通常都是一件非常耗时的事情,胡乱尝试时间成本是非常高的。

这里的抽象成数学问题,指的我们明确我们可以获得什么样的数据,目标是一个分类还是回归或者是聚类的问题。即明确输入和输出以及任务类型。

-1.更新

发现现在brat直接Python3就可以使用,只是brat官网上和Github上最新release版本还停留在2012年,然而brat近几年有所更新,所以我们可以直接clone Github上的brat的最新源码进行使用hhh。

0.前言

0.1 背景

近日简单调研一下NLP标注工具brat的使用,其官网示例中可以标注的任务包括命名实体识别、事件抽取、指代消解、依存句法、成分句法等等。





博客内容遵循 署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0) 协议

本站使用 Volantis 作为主题,总访问量为
载入天数...载入时分秒...
冀ICP备20001334号