奇趣闻 > 数码科技 > \

Facebook开源新NLP框架:简化部署流程,大规模应用也OK

原标题:Facebook开源新NLP框架:简化部署流程,大规模应用也OK

铜灵 编译整理

今天,Facebook开源了一个基于PyTorch的深度学习库PyText,想容易地构建和部署NLP系统。

Facebook在博客中介绍说,新框架具有多个特性,不仅能简化流程更快部署,还能调取众多预构建模型和程序方便大规模部署

Facebook开源新NLP框架:简化部署流程,大规模应用也OK

PyText开源的消息经Yann LeCun转推后,短时间引发了高额的点赞转发,一些网友称这是个“鹅妹子嘤”的项目。在Github今日热榜上,PyText排名第四。

Facebook开源新NLP框架:简化部署流程,大规模应用也OK

核心功能

构建PyText的初衷,是想解决当前NLP任务中时间紧且需要大规模部署之间的矛盾。研究人员的大致思路分两步。

一是通过为模型组件提供简单可扩展的接口,二是导出模型用于推理。目前,PyText的核心功能有以下几点:

  • 内含各种为NLP/NLU任务准备的模型

(如文本分类、序列标注、连接意图-槽位模型和上下文意图-槽位模型等。)

  • 支持基于PyTorch 1.0中新的C10d后端构建的分布式训练
  • 可以轻松创建新模型和任务的可扩展组件
  • 支持整体训练

为了适应研究和生产的需要,Facebook还强调了框架的稳健性和低延迟性,目前,PyText已经应用于Facebook网站上,你和朋友视频/音频中的字幕生成功能就是它的功劳。每天可执行超过10亿次预测。

Facebook开源新NLP框架:简化部署流程,大规模应用也OK

可以看出,模块化也是PyText的一大亮点,不仅支持从头创建新的pipeline,还可以修改现有的工作流程。除了分布式训练外,还支持一次训练多个模型。

传送门

官方博客地址:

https://code.fb.com/ai-research/pytext-open-source-nlp-framework/

GitHub代码:

https://github.com/facebookresearch/pytext

在论文PyText: A seamless path from NLP research to production中,研究人员详细介绍了PyText的原理:

Facebook开源新NLP框架:简化部署流程,大规模应用也OK

https://research.fb.com/wp-content/uploads/2018/12/PyText-A-seamless-path-from-NLP-research-to-production-using-PyTorch3.pdf?

不花一分钱,你也能拥有Facebook同款框架了~