新浪微博情感分析标记语料库

2024-07-01

新浪微博情感分析标记语料库

简介

本仓库提供了一个由人工标记的新浪微博情感分析语料库,共计12万条数据。该语料库分为两个文件:消极情感语料(pos.txt)和积极情感语料(neg.txt),每类各60000条。这些数据适用于机器学习情感分析模型的训练和验证。

数据描述

  • 消极情感语料(pos.txt):包含60000条标记为消极情感的微博文本。
  • 积极情感语料(neg.txt):包含60000条标记为积极情感的微博文本。

适用场景

该语料库适用于以下场景:

  • 机器学习模型的训练和测试
  • 情感分析算法的开发和评估
  • 自然语言处理研究

使用说明

  1. 下载数据:您可以直接从本仓库下载pos.txt和neg.txt文件。
  2. 数据格式:每个文件中的数据按行存储,每行代表一条微博文本。
  3. 数据处理:根据您的需求,您可以对数据进行预处理、特征提取等操作。

贡献

如果您有新的标记数据或改进建议,欢迎提交Pull Request或Issue。

许可证

本项目采用MIT许可证。您可以自由使用、修改和分发本项目中的数据和代码,但请遵守相应的许可证条款。

联系我们

如果您有任何问题或建议,请通过GitHub Issue或电子邮件与我们联系。


感谢您使用本语料库,希望它能为您的研究和开发工作带来帮助!

下载链接

新浪微博情感分析标记语料库