侵权投诉

深度学习:四种利用少量标注数据进行命名实体识别的方法

深度学习自然语言处理 ? 2021-01-03 09:35 ? 次阅读

导读

近年来,深度学习方法在特征抽取深度和模型精度上表现优异,已经超过了传统方法,但无论是传统机器学习还是深度学习方法都依赖大量标注数据来训练模型,而现有的研究对少量标注数据学习问题探讨较少。本文将整理介绍四种利用少量标注数据进行命名实体识别的方法。

面向少量标注数据的NER方法分类

基于规则、统计机器学习和深度学习的方法在通用语料上能取得良好的效果,但在特定领域、小语种等缺乏标注资源的情况下,NER 任务往往得不到有效解决。然而迁移学习利用领域相似性,在领域之间进行数据共享和模型共建,为少量标注数据相关任务提供理论基础。本文从迁移的方法出发,按照知识的表示形式不同,将少量标注数据NER 方法分为基于数据增强、基于模型迁移、基于特征变换、基于知识链接的方法。如图1所示,在这 20 多年间,四种方法的发文数量基本呈上升趋势,整体而言,当前的研究以数据增强、模型迁移为主,而其他的方法通常配合前两种方法使用,在研究中也值得关注。

211ccf60-4691-11eb-8b86-12bb97331649.png

图1 1995年-2019年四种方法的使用情况

基于数据增强的NER方法

数据增强的方法即:在少量数据集训练模型导致过拟合时,通过样本选择、权重调整等策略以创建高质量样本集,再返回分类器中迭代学习,使之能够较好地完成学习任务的方法。

(1)样本选择。在面向少量标注数据时,最直接的策略是挑选出高质量样本以扩大训练数据。其中,样本选择是数据增强式 NER 的核心模块,它通过一定的度量准则挑选出置信度高、信息量大的样本参与训练,一种典型的思路为主动学习采样,例如 Shen 等利用基于“不确定性”标准,通过挖掘实体内蕴信息来提高数据质量。在实践中,对于给定的序列 X=(x1, x2,…xi) 和标记序列Y=(y1, y2,…yi),x 被预测为 Y 的不确定性可以用公式(1)来度量,其中 P(y) 为预测标签的条件分布概率,M 为标签的个数,n 为序列的长度:

21598ebe-4691-11eb-8b86-12bb97331649.png

为了验证主动学习采样的性能,在人民日报(1998 年)语料中进行实验,共迭代十次,其中 Random 为迭代中随机采样,ALL 为一次训练完所有数据的结果,Active-U 为利用数据增强的结果。实验结果(如图 2)表明,利用数据增强方法在第 7 次迭代中就能达到拟合,节省了 30% 的标注成本。

218b1f1a-4691-11eb-8b86-12bb97331649.png

图2基于数据增强方法的实例

也有不同学者利用其他的度量准则,例如高冰涛等人通过评估源域样本在目标领域中的贡献度,并使用单词相似性和编辑距离,在源域样本集和目标样本集上计算权值来实现迭代学习。Zhang 等人充分考虑领域相似性,分别进行域区分、域依赖和域相关性计算来度量。这些方法利用无监督模式通过降低统计学习的期望误差来对未标记样本进行优化选择,能够有效减少标注数据的工作量。此外,半监督采样也是一种新的思路。例如在主动学习的基础上加入自学习(Self-Training)、自步学习(Self-Paced Learning,SPL)过程,这些方式通过对噪声样本增大学习难度,由易到难地控制选择过程,让样本选择更为精准。

(2)分类器集成。在数据增强中,训练多个弱分类器来获得一个强分类器的学习方式也是一种可行的思路。其中典型的为 Dai 等人提出集成式 TrAdaBoost 方法,它扩展了 AdaBoost 方法,在每次迭代的过程中,通过提高目标分类样本的采样权重、降低误分类实例样本的权重来提高弱分类器的学习能力。TrAdaBoost 利用少量的标签数据来构建对源域标签数据的样本增强,最后通过整合基准弱分类器为一个强分类器来进行训练,实现了少样本数据的学习。之后的研究针对 TrAdaBoost 进行了相应的改进也取得了不错的效果。例如,王红斌等人在分类器集成中增加迁移能力参数,让模型充分表征语义信息,在 NER 中提高精度也能显著减少标注成本。

基于模型迁移的NER方法

基于模型迁移的基本框架如图 3 所示,其核心思想是利用分布式词表示构建词共享语义空间,然后再迁移神经网络的参数至目标领域,这是一种固定现有模型特征再进行微调(Fine-Tuning) 的方法,在研究中共享词嵌入和模型参数的迁移对 NER 性能产生较大影响。

21ac572a-4691-11eb-8b86-12bb97331649.png

图3模型迁移基本结构

(1)共享词嵌入。在 NLP 中,前期工作通常会借助语言预训练模型学习文本的词义信息,这种方式构建了公共的词嵌入表示空间,词嵌入在 NER 中通常作为输入。词向量是共享词嵌入的初步形式,此后,ELMo模型利用上下文信息的方式能解决传统词向量不擅长的一词多义问题,还能在一定程度上对词义进行预测逐渐受到人们关注。而 2018 年谷歌提出的 BERT预训练模型更是充分利用了词义和语义特性,BERT 是以双向 Transformer为编码器栈的语言模型,它能强有力地捕捉潜在语义和句子关系,基于 BERT 的 NER 在多个任务上也取得 state-of-the-art,其基本网络结构如图4所示。

21f45c82-4691-11eb-8b86-12bb97331649.png

图4模型迁移的基础方法-BERT-BiLSTM-CRF

其中 BERT 作为语义表示输入,BiLSTM抽取特征,CRF 获取概率最大标签。与传统的NER 模型相比,该模型最关键的是 BERT 语言模型的引入,BERT 通过无监督建模的方式学习海量互联网语义信息,能充分表征实体的语义信息。在人民日报(1998年)语料中进行实验,实验结果(如表 1)表明,基于 BERT 的预训练迁移学习模型能有效提高分类的准确率。

表1BERT-BiLSTM-CRF与其他方法的比较

22439b6c-4691-11eb-8b86-12bb97331649.png

(2)共享参数。共享词嵌入侧重于词义的表示,而共享参数则侧重于模型参数的迁移。例如,Jason 等人从神经网络迁移机制以及迁移哪些层进行大量实验,实验结论显示浅层网络学习知识的通用特征,具有很好的泛化能力,当迁移到第 3 层时性能达到饱和,继续迁移会导致“负迁移”的产生。Giorgi 等人基 于 LSTM 进行网络权重的迁移,首先将源领域模型参数迁移至目标领域初始化,之后进行微调使适应任务需要。而 Yang 等人从跨领域、跨应用、跨语言迁移出发测试模型迁移的可行性, 在 一 些 benchmarks 上实现了 state-of-the-art。整体而言,在处理 NER 任务时良好的语义空间结合深度模型将起到不错的效果,在迁移过程中模型层次的选择和适应是难点。

基于特征变换的NER方法

在面向少量标注数据 NER 任务时,我们希望迁移领域知识以实现数据的共享和模型的共建,在上文中我们从模型迁移的角度出发,它们在解决领域相近的任务时表现良好,但当领域之间存在较大差异时,模型无法捕获丰富、复杂的跨域信息。因此,在跨领域任务中,一种新的思路是在特征变换上改进,从而解决领域数据适配性差的问题。基于特征变换的方法是通过特征互相转移或者将源域和目标域的数据特征映射到统一特征空间,来减少领域之间差异的学习过程,下面主要从特征选择和特征映射的角度进行探讨。

(1)特征选择。即通过一定的度量方法选取相似特征并转换,在源域和目标域之间构建有效的桥梁的策略。例如 Daume 等人通过特征空间预处理实现目标域和源域特征组合,在只有两个域的任务中,扩展特征空间 R^F 至 R^3F,对应于域问题,扩展特征空间至 R^(K+1)F。然而当 Yi 与 YJ 标签空间差异较大时,这种线性组合效果可能不理想,Kim 等人从不同的角度出发,进行标签特征的变换,第一种是将细粒度标签泛化为粗粒度标签。例如源域标签中 泛化为

(2)特征映射。即为了减少跨领域数据的偏置,在不同领域之间构建资源共享的特征空间,并将各领域的初始特征映射到该共享空间上。利用预测的源标签嵌入至目标领域是一种常见策略。例如,Qu 等人从领域和标签差异出发,首先训练大规模源域数据,再度量源域和目标域实体类型相关性,最后通过模型迁移的方式微调。其基本步骤为:

1、通过 CRF学习大规模数据的知识;

2、使用双层神经网络学习源域与目标域的命名实体的相关性;

3、利用 CRF 训练目标域的命名实体。

实验结果显示相较于 Baseline 方法 Deep-CRF,TransInit 方法能提高 160% 的性能。

标签嵌入的方式在领域之间有较多共享标签特征时迁移效果不错,但是这种假设在现实世界中并不普遍。一种新的思路是在编解码中进行嵌入适配(如图 5),这种方式利用来自预训练源模型的参数初始化 Bi-LSTM-CRF 基础模型,并嵌入词语、句子和输入级适配。具体而言,在词级适配中,嵌入核心领域词组以解决输入特征空间的领域漂移现象。在句子级适配中,根据来自目标域的标记数据,映射学习过程中捕获的上下文信息。在输出级适配中将来自 LSTM 层输出的隐藏状态作为其输入,为重构的 CRF 层生成一系列新的隐藏状态,进而减少了知识迁移中的损失。

2288b800-4691-11eb-8b86-12bb97331649.png

图5特征变换方法TransInit实验结果

基于知识链接的NER方法

基于知识链接的 NER,即使用本体、知识库等结构化资源来启发式地标记数据,将数据的结构关系作为共享对象,从而帮助解决目标 NER 任务,其本质上是一种基于远程监督的学习方式,利用外部知识库和本体库来补充标注实体。例如 Lee 等人的框架(如图 6),在 Distant supervision 模块,将文本序列与 NE词典中的条目进行匹配,自动为带有 NE 类别的大量原始语料添加标签,然后利用 bagging和主动学习完善弱标签语料,从而实现语料的精炼。一般而言,利用知识库和本体库中的链接信息和词典能实现较大规模的信息抽取任务,这种方法有利于快速实现任务需求。

22c42214-4691-11eb-8b86-12bb97331649.png

图6知识链接与数据增强结合模型

(1)基于知识库。这种方式通常借用外部的知识库来处理 NER、关系抽取、属性抽取等任务,在现实世界中如 Dbpedia、YAGO、百度百科等知识库存在海量结构化信息,利用这些知识库的结构化信息框、日志信息可以抽取出海量知识。例如,Richman 等人利用维基百科知识设计了一种 NER 的系统,这种方法利用维基百科类别链接将短语与类别集相关联,然后确定短语的类型。类似地,Pan 等人利用一系列知识库挖掘方法为 200 多种语言开发了一种跨语言的名称标签和链接结构。在实践中,较为普遍的是联合抽取实体和实体关系。例如Ren 等的做法,该方法重点解决领域上下文

无关和远程监督中的噪声问题,其基本步骤为:

1、利用 POS 对文本语料进行切割以获得提及的实体;

2、生成实体关系对;

3、捕获实体与实体关系的浅层语法及语义特征;

4、训练模型并抽取正确的实体及关系。

在 NYT 等语料上进行实验(如表 2),基于知识库的方法相较于基线方法有显著提高。

表2不同语料下实体的F1值

22ff9e3e-4691-11eb-8b86-12bb97331649.png

(2)基于本体系统。该方式通过一定的规则,将本体库中的概念映射为实体。例如史树敏等人通过构建的 MPO 本体,首先利用CRF 获得高召回率的实体,再融合规则过滤噪声,最终获得较为精确的匹配模式。相似地,Lima 等人通过开发出 OntoLPER 本体系统,并利用较高的表达关系假设空间来表示与实体—实体关系结构,在这个过程中利用归纳式逻辑编程产生抽取规则,这些抽取规则从基

于图表示的句子模型中抽取特定的实体和实体关系实例。同样地,李贯峰等人首先从 Web网页提取知识构建农业领域本体,之后将本体解析的结果应用在 NER 任务中,使得 NER 的结果更为准确。这些方法利用本体中的语义结构和解析器完成实体的标准化,在面向少量标注的 NER 中也能发挥出重要作用。

四种方法比较

上述所介绍的 4 种面向少量标注的 NER 方法各有特点,本文从领域泛化能力、模型训练速度、对标注数据的需求和各方法的优缺点进行了细致地比较,整理分析的内容如表 3 所示。

2423db72-4691-11eb-8b86-12bb97331649.png

面向少量标注数据 NER,最直接的方法是数据增强,通过优先挑选高质量样本参与训练,这种方法在窄域中能实现较高的准确率。但是针对不同领域所需的策略也不同,领域的泛化能力一般。模型迁移从海量无结构化文本中获取知识,这种方式对目标领域的数据需求较少,只需“微调”模型避免了重新训练的巨大开销,但是它依赖领域的强相关性,当领域差异性太大时,容易产生域适应问题。

相较于模型迁移,特征变换更加注重细粒度知识表示,这种方法利用特征重组和映射,丰富特征表示,减少知识迁移中的损失,在一定程度上能实现“零样本”学习,但是这种方法往往难以求出优化解,过适配现象也会造成消极影响。知识链接能利用任何结构化信息,通过知识库、本体库中的语义关系来辅助抽取目标实体,但是这种方法易产生噪声,实体的映射匹配依赖强假设条件,所需的知识库通常难以满足领域实体的抽取。

方法评测比较

如表4所示四类面向少量标注数据的典型方法与评测信息如下:

24b6c9f0-4691-11eb-8b86-12bb97331649.png

结语

当有大量标注数据可供模型训练时,NER任务往往能够得到很好的结果。但是在一些专业领域比如生物医药领域,标注数据往往非常稀缺,又由于其领域的专业性,需要依赖领域专家进行数据标注,这将大大增加数据的标注成本。而如果只用少量的标注数据就能得到同等效果甚至更好的效果,这将有利于降低数据标注成本。

参考资料

[1]石教祥,朱礼军,望俊成,王政,魏超.面向少量标注数据的命名实体识别研究[J].情报工程,2020,6(04):37-50.

责任编辑:xj

原文标题:综述 | 少量标注数据下的命名实体识别研究

文章出处:【微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

原文标题:综述 | 少量标注数据下的命名实体识别研究

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
分享:

评论

相关推荐

华为创新性地推出“5G新通话”解决方案
在北京国家会议中心举行的2021年中国国际信息通信展览会上,由中国通信企业协会发起的“ICT中国(2....
的头像 华为云核心网 发表于 10-15 17:27 ? 275次 阅读
华为发布SD-WAN逐包负载分担方案 提升带宽利用率
华为SD-WAN逐包负载分担方案,提升带宽利用率至90%,让您的广域网络更加高效。
的头像 华为产品资料 发表于 10-15 16:44 ? 207次 阅读
教大家如何减小微量水分策略的结果中的误差
微量水分测定仪采用卡尔——菲休库仑法,对不同物质进行微量水分测定,是一种可靠的方法,微量水分测定仪成....
发表于 10-15 16:39 ? 19次 阅读
详解工业液体密度测试步骤
业液体通常需要进行液体密度的测试来加以控制品质。行业内的测试仪就是搏仕的液体密度测试仪了。下面将演示....
发表于 10-15 16:27 ? 14次 阅读
音频电路原理(双音频解码电子电路/TDA2822双声道功放电路/音频放大处理电路)
双音多频信号解码电路是目前在按键电话(固定电话、移动电话)、程控交换机及无线通信设备中广泛应用的集成....
发表于 10-15 16:08 ? 474次 阅读
音频电路原理(双音频解码电子电路/TDA2822双声道功放电路/音频放大处理电路)
浅析压敏(热敏)陶瓷粉末水分测试实验报告
厦门搏仕检测设备有限公司 ?www.lboshi.cn 18959266236 陶瓷粉末水分含量介绍....
发表于 10-15 15:57 ? 13次 阅读
电子行业B2B数字化升级, 腾采通先行
以往,在数以亿计的电子元器件中快速找到想要的型号,如同大海捞针一般。直到一款B2B交易型SaaS(S....
发表于 10-15 15:49 ? 12次 阅读
电子行业B2B数字化升级, 腾采通先行
探究塑料颗粒密度测试仪实验报告
密度计品牌:搏仕 型号:BOS-300系列 测试品:塑料颗粒 塑料种类纷多,密度值各不相同,如PP料....
发表于 10-15 15:47 ? 13次 阅读
塑料水分测定仪测试经验总结
厦门搏仕检测设备有限公司 ?www.lboshi.cn 18959266236 塑料水分测定仪针对不....
发表于 10-15 15:38 ? 15次 阅读
剖析汽车塑料零配件水分测试仪实验
水分仪品牌:搏仕 ????型号:BOS-180A系列 ????测试品:汽车塑料片 塑料的含水量是影响....
发表于 10-15 15:23 ? 10次 阅读
四维图新构建现实世界三维还原的能力赋能智能网联应用
实时构建现实世界三维还原,将物理世界数字化,是四维图新近20年来一直努力的方向,通过对物理世界的人、....
的头像 四维图新NavInfo 发表于 10-15 14:40 ? 809次 阅读
完整关注跨模态转换器网络
舞蹈是几乎所有文化中的一种通用语言,也是如今许多人在当代媒体平台上表达自己的一种方式。跳舞的能力(组....
的头像 TensorFlow 发表于 10-15 10:25 ? 112次 阅读
MySQL缓冲区设计介绍
1. Buffer 与 cache 的区别? Bbuffer 与 Cache 非常类似,因为它们都用....
的头像 数据分析与开发 发表于 10-15 09:50 ? 95次 阅读
pandasgui安装与简单使用
pandasgui安装与简单使用 根据作者的介绍,pandasgui是用于分析 Pandas Dat....
的头像 数据分析与开发 发表于 10-15 09:46 ? 96次 阅读
交换模式与路由模式有哪些异同点
交换模式是什么?路由模式又是什么? 交换模式与路由模式有哪些异同点? ...
发表于 10-15 09:35 ? 0次 阅读
采集与分析用户行为数据的意义
本文属于用户行为数据领域入门级别文章,适合对用户行为数据略知一二但是对这个主题非常感兴趣的同学。 1....
的头像 数据分析与开发 发表于 10-15 09:32 ? 126次 阅读
JD-BQX7 七参数便携式气象站功能有哪些
七参数便携式气象站功能有哪些?在清凉谷旅游风景区的监测使用,满足风景区气象监测服务的需求,使得清凉谷....
发表于 10-14 16:29 ? 34次 阅读
智慧电梯的运用能解决行业哪些需求
电梯作为与百姓生活最为密切相关的特种设备,直接关系人民群众生命和财产安全,关系经济发展大局和社会和谐....
发表于 10-14 16:28 ? 23次 阅读
IBM利用AI 驱动帮助气候和数据科学家分析海量环境数据集
IBM (纽交所证券代码:IBM) 发布了一套环境智能应用软件,利用 AI 帮助企业做好准备并应对可....
的头像 IBM中国 发表于 10-14 16:01 ? 711次 阅读
食品检测设备有哪些,其用途是什么
食品检测设备【恒美】有哪些,随着国家经济的大幅提高以及居民消费水平的普遍提高,休闲食品的食品种类与数....
发表于 10-14 10:43 ? 24次 阅读
食品检测仪的工作原理及使用方法
食品检测仪【恒美 HM-G1200】的操作原理及方法。食品检测仪【恒美 HM-G1200】因其体积小....
发表于 10-14 10:29 ? 17次 阅读
TableSQL API和Pyhton上相关的性能优化
一、简介 1.14 新版本原本规划有 35 个比较重要的新特性以及优化工作,目前已经有 26 个工作....
的头像 数据分析与开发 发表于 10-13 17:25 ? 138次 阅读
胶水固含量测试注意事项
厦门搏仕检测设备有限公司 ?www.lboshi.cn 18959266236 1、无论是高粘性胶水....
发表于 10-13 16:16 ? 32次 阅读
神经网络复杂性的基本下界
最近,人们对深度神经网络产生了极大的兴趣,因为它们在计算机视觉等领域取得了突破性的成果。 尽管如此,....
的头像 人工智能与大数据技术 发表于 10-13 15:40 ? 162次 阅读
神经网络复杂性的基本下界
将FSoE部署到安全系统时面临的挑战
今年,瑞萨将高度关注Functional Safety over EtherCAT (FSoE) 解....
的头像 瑞萨电子 发表于 10-13 14:23 ? 122次 阅读
浅谈商业智能BI给企业带来的价值
整体分析问题BI可以将企业信息化的数据孤岛整合起来,提供一个全局的视图,让决策者可以更加全面地看待问....
发表于 10-13 13:57 ? 25次 阅读
IP知识百科之带你全面了解VPN技术
VPN是什么 VPN(Virtual Private Network)是依靠Internet服务提供....
的头像 华为产品资料 发表于 10-13 11:11 ? 173次 阅读
红外遥控这么简单让我看看还有谁不会
平时我们经常会用到遥控器,那么现在遥控器也分很多种类,有使用红外通信的,也有使用蓝牙,无线的等,今天....
的头像 单片机匠人 发表于 10-13 11:06 ? 247次 阅读
eBPF技术应用云原生网络实践系列之基于socket的service
背景介绍 Kubernetes 中的网络功能,主要包括 POD 网络,service 网络和网络策略....
的头像 Linux阅码场 发表于 10-13 10:54 ? 204次 阅读
eBPF技术应用云原生网络实践系列之基于socket的service
汽车以太网数据通道的研究和发现
大家好!之前小编给大家做了两期汽车以太网的介绍,反响特别好,今天我们继续进行汽车以太网的探讨吧~ 由....
的头像 罗森伯格汽车电子 发表于 10-13 10:32 ? 174次 阅读
汽车以太网数据通道的研究和发现
大联大世平集团推出基于Intel与Orbit产品的车牌识别解决方案
大联大控股宣布,其旗下世平推出基于英特尔(Intel)Movidius与律碁(Orbit)AiCam....
发表于 10-13 09:55 ? 855次 阅读
大联大世平集团推出基于Intel与Orbit产品的车牌识别解决方案
受控文本生成模型的一般架构及故事生成任务等方面的具体应用
来自:哈工大讯飞联合实验室 本期导读:本文是对受控文本生成任务的一个简单的介绍。首先,本文介绍了受控....
的头像 深度学习自然语言处理 发表于 10-13 09:46 ? 107次 阅读
受控文本生成模型的一般架构及故事生成任务等方面的具体应用
LiDAR测量物料体积能为行业带来哪些变化
在商业化竞争日益激烈的环境下,任何提高运营效率的机会对公司来说都是宝贵的。包括对原材料的精准测量和追....
的头像 广州虹科电子科技有限公司 发表于 10-13 09:11 ? 158次 阅读
Deep Edge AI使得算法的规模正不断缩小
机器学习和深度学习网络有可能通过提供更强大的全新方法来分析现场数据,从而极大地提高产品价值。Deep....
的头像 STM32单片机 发表于 10-12 17:36 ? 149次 阅读
禹山便携式溶氧传感器的使用方法
禹山便携式溶氧传感器采用了国际领先的荧光寿命技术,其基于物理学中特定物质对活性荧光的猝熄原理。这种荧....
发表于 10-12 16:43 ? 22次 阅读
美政府索要芯片数据原因之一被公开 剑指中国大陆车用芯片产业链
前不久,美政府组织召开了第三轮半导体峰会,依然是为了解决目前严重的缺芯问题。在这一轮峰会上,美政府要....
的头像 电子发烧友网 发表于 10-12 14:31 ? 297次 阅读
SATA连接器:低成本下的高连接性
电子发烧友网报道(文/李宁远)SATA连接器,作为连接器细分种类之一,广泛应用于PC、SSD、服务器....
的头像 电子发烧友网 发表于 10-12 10:49 ? 250次 阅读
全项目食品安全检测仪的检测项目
全项目食品安全检测仪检测项目,全项目食品安全检测仪【恒美HM-G1200】可以在餐饮行业、学校工厂食....
发表于 10-12 09:48 ? 33次 阅读
C++中的背包问题说明和源码示例
? 问题说明 有N件物品和一个容量为V的背包。 第i件物品的重量是w[i],价值是v[i]。 求解将....
的头像 C语言编程学习基地 发表于 10-12 09:27 ? 122次 阅读
探究Redis 性能测试与监控
很多人在安装部署好Redis后,就没有对Rredis的配置和部署等有效性和高可用性进行性能测试,最终....
的头像 马哥Linux运维 发表于 10-12 09:19 ? 188次 阅读
探究Redis 性能测试与监控
IPv6+ 引领下一代互联网技术创新之路
今日,由推进IPv6规模部署专家委员会主办的“2021中国IPv6创新发展大会”在北京召开。本次大会....
的头像 华为数据通信 发表于 10-12 09:09 ? 238次 阅读
IPv6+ 引领下一代互联网技术创新之路
超大Transformer语言模型的分布式训练框架
NVIDIA Megatron 是一个基于 PyTorch 的框架,用于训练基于 Transform....
的头像 NVIDIA英伟达企业解决方案 发表于 10-11 16:46 ? 122次 阅读
超大Transformer语言模型的分布式训练框架
深度剖析Linux socket
socket fd 长什么样子? 什么是 socket fd ?粗糙的来讲,就是网络 fd,比如我们....
的头像 Linux爱好者 发表于 10-11 15:55 ? 1911次 阅读
深度剖析Linux socket
NEC发布人工智能辅助内镜检查质控系统
 爱美科互联医疗正式发布提供呼吸监测穿戴式平台,对患有慢性阻塞性肺病或者影响呼吸道的病毒或细菌传染疾....
的头像 lhl545545 发表于 10-11 15:40 ? 1154次 阅读
全方位剖析三边测距定位算法
“定位”这个概念想必大家并不陌生,可以说定位技术的迅猛发展,给我们的日常生活带来了极大的便利。 比如....
的头像 FPGA技术江湖 发表于 10-11 15:19 ? 216次 阅读
全方位剖析三边测距定位算法
非洲猪瘟检测设备的特点有哪些
JD-CW32非洲猪瘟检测设备有哪些特点?哪个厂家生产?先进的温度控制技术,是其优良的产品特性的最基....
发表于 10-11 14:14 ? 13次 阅读
曙光基于ParaStor对象数据平台提供优质软硬一体解决方案
IDC研究表明,金融行业未来80%的数据主要呈现为影像、照片、音频、视频等非结构化数据。从2010年....
的头像 中科曙光 发表于 10-11 11:50 ? 240次 阅读
缺失值处理你确定你真的会了吗
缺失值处理是一个数据分析工作者永远避不开的话题,如何认识与理解缺失值,运用合适的方式处理缺失值,对模....
的头像 数据分析与开发 发表于 10-11 11:21 ? 426次 阅读
缺失值处理你确定你真的会了吗
剖析Spark的两种核心Shuffle
在 MapReduce 框架中, Shuffle 阶段是连接 Map 与 Reduce 之间的桥梁,....
的头像 数据分析与开发 发表于 10-11 11:15 ? 264次 阅读
剖析Spark的两种核心Shuffle
高精度土壤重金属检测仪的功能特点
高精度土壤重金属检测仪【恒美HM-ZSE】可对土壤、肥料、作物、蔬菜、水果、水质、食品等样品中的砷、....
发表于 10-11 10:06 ? 16次 阅读
浅谈LoRa自组网的三大安全问题
Lora自组网络是lora无线技术与计算机技术的结合,以终端为单位节点,可以在节点之间实现双向通信。....
发表于 10-11 10:04 ? 181次 阅读
ARM架构的数据类型定义是什么
ARM架构的数据类型定义是什么? 局部变量和全局变量是什么意思? ...
发表于 10-09 06:32 ? 0次 阅读
常量和变量有哪些区别
引用和拷贝有什么区别? 常量和变量有哪些区别? ...
发表于 10-08 08:42 ? 0次 阅读
VS2017是如何实现串口发送及接收数据的
VS2017是如何实现串口发送及接收数据的?有哪些操作步骤? ...
发表于 09-30 07:04 ? 0次 阅读
怎样使用代码来访问PLC数据
如何配置网络参数?怎样使用代码来访问PLC数据? 如何使用gitHub开源的组件技术来读写西门子plc数据? ...
发表于 09-29 07:42 ? 0次 阅读
怎样使用gitHub开源的组件技术来读写三菱的plc数据
如何配置网络参数?怎样使用代码来访问PLC数据? 怎样使用gitHub开源的组件技术来读写三菱的plc数据? ...
发表于 09-29 06:03 ? 0次 阅读
模型量化会带来哪些好处?
量化算法具有什么特点? 模型量化会带来哪些好处? ...
发表于 09-28 06:32 ? 0次 阅读
工业4.0如何保证在各地收集到的数据的完整性
工业4.0如何保证在各地收集到的数据的完整性? 如何选择一个低成本的数据处理方案? ...
发表于 09-27 07:47 ? 0次 阅读
求一种工业自动化数据采集方案
工业数据网关是什么? 工业数据采集类型有哪几种? ...
发表于 09-27 06:42 ? 0次 阅读
怎样去设置数值元件的格式呢
怎样去设置数值元件呢? 怎样去设置数值元件的格式呢? ...
发表于 09-26 09:16 ? 0次 阅读
综合在线 日韩欧美 中文字幕_综合在线 日韩欧美 中文字幕精品视频 <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>