首页
学习
活动
专区
圈层
工具
发布

#spacy

信息抽取流水线构建实用技巧

用户11764306

本演示将介绍如何创建信息抽取流水线,重点使用 spaCy NLP 库和 Prodigy 标注工具,但所讨论的原则也适用于其他框架。

3210

将spaCy模型推送至Hugging Face Hub

用户11764306

Hugging Face Hub 托管基于 Git 的仓库,这些仓库是存储空间,可以包含所有文件。这些仓库具有多种优势:版本控制(提交历史和差异)、分支、有关其...

7510

伪排练解决NLP灾难性遗忘

用户11764306

有时你需要微调一个预训练模型,以添加新的标签或修正某些特定错误。这可能会引入“灾难性遗忘”问题。伪排练是一个很好的解决方案:使用原始模型对示例进行标注,并将它们...

6910

临床NLP工具库medspaCy架构

用户11764306

截至 2024 年 5 月,medspacy 已重构,支持分发英语之外语言的规则和资源。下表总结了各语言可用内容(按规则成熟度排序):

10010

spaCy v1.0:自定义管道与Keras深度学习集成

用户11764306

我很高兴宣布spaCy 1.0发布,这是世界上最快的NLP库。1.0版本最出色的部分是一个用于将自定义模型集成到spaPy中的新系统。本文将介绍这些变化,并展示...

9810

spaCy配置文件的代码智能提示工具

用户11764306

该扩展提供了用于处理 spaCy 配置文件的额外工具和功能。版本 1.0.0 包含作为可安装扩展的配置文件中注册表函数、变量和节名称的悬停描述。

8610

spaCy开发者谈NLP与Python工具

用户11764306

本周欢迎 Ines Montani(@_inesmontani)成为我们的“本周 PyDev”!Ines 是某机构(原 Explosion AI)的创始人,也是...

14810

Spancat:解决重叠实体的NLP技术

用户11764306

命名实体识别模型可能无法处理多种多样的文本跨度,但Spancat绝对可以!在开源的NLP库spaCy中,创建了一个NER模型来处理重叠和任意的文本跨度。通过这场...

14010
领券