1. 介绍
预训练大模型:BBT 10亿参数,
微调:3000条标注数据,人工交叉标注三分类标签(正,负,中性)
准确度:93%(评判标准:0-0.4为负面,0.4-0.6为中性,0.6-1为正面)
继上一篇我们分析了不同场景下情绪分析的用处和意义,我们开放了基于BBT大模型的研报情绪分析能力,以API形式调用:

截止3月31日,我们提供每个客户每日1万次内的免费调用!
调用代码如图,将文本作为content输入即可。
输出字段释义:
“code:200”:请求成功
“msg”:情绪值,值域0-1连续值,0为极负,1为极正,数值大小代表情绪强度
2. 推荐使用方法
API输入可以是一整篇文章,可以是一个段落,也可以是一句话,长度限制为1024个字节。但根据对模型的微调过程,我们建议以一句话为单位作为模型输入,原因如下:
- 一篇研报往往涉及多个行业及公司,整篇分析易混淆多个主体及其情绪,我们更推荐每句话进行“主体识别+情绪分析”的组合使用方式。
- 大篇幅语料其中的中性语句(在研报中“免责声明”类尤其多)会中和整篇的情绪,使得以整体作为的输出失去选股能力,且看不到行文间情绪的变化。
3. 研报文本特征
- 根据情绪值标色,红色为正面情绪,绿色为负面情绪,颜色深度为情绪强度,我们发现研报普遍更愿意输出正向观点。

- 将研报拆分为句子进行情绪分析,可以看到行文的观点变化,往往以段落为转折,且能看到情绪强度的增减趋势,以对文本进行更细致的量化处理。

- 同时可以过滤掉“免责声明”类的中性情绪噪声数据,使信号更有价值。
