预训练语言模型|研报情绪API发布

0
0
1. 介绍 预训练大模型:BBT 10亿参数, 微调:3000条标注数据,人工交叉标注三分类标签(正,负,中性) 准确度:93%(评判标准:0-0.4为负面,0.4-0.6为中性,0.6-1为正面) 继上一篇我们分析了不同场景下情绪分析的用处和意义,我们开放了基于BBT大模型的研报情绪分析能力,以API形式调用: ![tu 11.JPEG](https://dev-media.amazoncloud.cn/e7c648539690426a94e4ff0056fc7099_tu%2011.JPEG "tu 11.JPEG") 截止3月31日,我们提供每个客户每日1万次内的免费调用! 调用代码如图,将文本作为content输入即可。 输出字段释义: “code:200”:请求成功 “msg”:情绪值,值域0-1连续值,0为极负,1为极正,数值大小代表情绪强度 2. 推荐使用方法 API输入可以是一整篇文章,可以是一个段落,也可以是一句话,长度限制为1024个字节。但根据对模型的微调过程,我们建议以一句话为单位作为模型输入,原因如下: - 一篇研报往往涉及多个行业及公司,整篇分析易混淆多个主体及其情绪,我们更推荐每句话进行“主体识别+情绪分析”的组合使用方式。 - 大篇幅语料其中的中性语句(在研报中“免责声明”类尤其多)会中和整篇的情绪,使得以整体作为的输出失去选股能力,且看不到行文间情绪的变化。 3. 研报文本特征 - 根据情绪值标色,红色为正面情绪,绿色为负面情绪,颜色深度为情绪强度,我们发现研报普遍更愿意输出正向观点。 ![tu 12.PNG](https://dev-media.amazoncloud.cn/dcf1738b9d244cf1a7ea1c208160f024_tu%2012.PNG "tu 12.PNG") - 将研报拆分为句子进行情绪分析,可以看到行文的观点变化,往往以段落为转折,且能看到情绪强度的增减趋势,以对文本进行更细致的量化处理。 ![tu 13.JPEG](https://dev-media.amazoncloud.cn/07d06a0103954e02a183d3a07262e477_tu%2013.JPEG "tu 13.JPEG") - 同时可以过滤掉“免责声明”类的中性情绪噪声数据,使信号更有价值。 ![tu 15.png](https://dev-media.amazoncloud.cn/649ba8358182481698f5c2246dd89c23_tu%2015.png "tu 15.png")
目录
亚马逊云科技解决方案 基于行业客户应用场景及技术领域的解决方案
联系亚马逊云科技专家
亚马逊云科技解决方案
基于行业客户应用场景及技术领域的解决方案
联系专家
0
目录
关闭