深度学习常用图数据集资源

2022-07-26

深度学习常用图数据集资源

简介

本仓库提供了深度学习中常用的11个图数据集资源,这些数据集在图神经网络(Graph Neural Networks, GNNs)的研究和应用中扮演着重要角色。近年来,深度学习领域越来越关注图方向的任务,通过利用图神经网络来挖掘现实世界中各种可以用图表示的事物(如社交网络、论文引用网络、分子结构等),从而学习更好的表示,以实现下游任务。

数据集描述

图数据是由一些点和一些线构成的,能够表示一些实体之间的关系。图中的点就是实体,线就是实体间的关系。如下图所示,v表示顶点,e表示边,u表示整张图。每个点、每条边、每张图都可能包含信息(attributes 或 features)。

图数据集对于图任务的科研是必不可少的。本仓库提供的图数据集包括:

  1. Cora
  2. Citeseer (Cite)
  3. Pubmed
  4. DBLP
  5. ACM
  6. AMAP
  7. AMAC
  8. Corafull
  9. WIKI
  10. BAT
  11. EAT
  12. UAT

这些数据集涵盖了不同领域的图结构数据,适用于各种图神经网络的研究和实验。

使用方法

  1. 下载数据集:您可以通过本仓库提供的链接下载所需的图数据集。
  2. 数据集格式:每个数据集通常包含节点信息、边信息以及可能的节点特征和标签。具体格式请参考每个数据集的说明文档。
  3. 实验与研究:您可以将这些数据集用于图神经网络的训练、验证和测试,以探索图结构数据的表示学习和下游任务的性能。

贡献

如果您有其他常用的图数据集资源,欢迎提交PR或Issue,帮助丰富本仓库的内容。

许可证

本仓库中的数据集资源遵循相应的开源许可证。具体许可证信息请参考每个数据集的说明文档。


希望这些资源能够帮助您在图神经网络和深度学习领域的研究中取得更好的成果!

下载链接

深度学习常用图数据集资源