预训练语言模型｜研报情绪API发布

1. 介绍预训练大模型：BBT 10亿参数，微调：3000条标注数据，人工交叉标注三分类标签（正，负，中性）准确度：93%（评判标准：0-0.4为负面，0.4-0.6为中性，0.6-1为正面）继上一篇我们分析了不同场景下情绪分析的用处和意义，我们开放了基于BBT大模型的研报情绪分析能力，以API形式调用： ![tu 11.JPEG](https://dev-media.amazoncloud.cn/e7c648539690426a94e4ff0056fc7099_tu%2011.JPEG "tu 11.JPEG") 截止3月31日，我们提供每个客户每日1万次内的免费调用！调用代码如图，将文本作为content输入即可。输出字段释义： “code：200”：请求成功 “msg”：情绪值，值域0-1连续值，0为极负，1为极正，数值大小代表情绪强度 2. 推荐使用方法 API输入可以是一整篇文章，可以是一个段落，也可以是一句话，长度限制为1024个字节。但根据对模型的微调过程，我们建议以一句话为单位作为模型输入，原因如下： - 一篇研报往往涉及多个行业及公司，整篇分析易混淆多个主体及其情绪，我们更推荐每句话进行“主体识别+情绪分析”的组合使用方式。 - 大篇幅语料其中的中性语句（在研报中“免责声明”类尤其多）会中和整篇的情绪，使得以整体作为的输出失去选股能力，且看不到行文间情绪的变化。 3. 研报文本特征 - 根据情绪值标色，红色为正面情绪，绿色为负面情绪，颜色深度为情绪强度，我们发现研报普遍更愿意输出正向观点。 ![tu 12.PNG](https://dev-media.amazoncloud.cn/dcf1738b9d244cf1a7ea1c208160f024_tu%2012.PNG "tu 12.PNG") - 将研报拆分为句子进行情绪分析，可以看到行文的观点变化，往往以段落为转折，且能看到情绪强度的增减趋势，以对文本进行更细致的量化处理。 ![tu 13.JPEG](https://dev-media.amazoncloud.cn/07d06a0103954e02a183d3a07262e477_tu%2013.JPEG "tu 13.JPEG") - 同时可以过滤掉“免责声明”类的中性情绪噪声数据，使信号更有价值。 ![tu 15.png](https://dev-media.amazoncloud.cn/649ba8358182481698f5c2246dd89c23_tu%2015.png "tu 15.png")

亚马逊云科技解决方案基于行业客户应用场景及技术领域的解决方案

联系亚马逊云科技专家