LIDC-IDRI 数据集资源文件
描述
本仓库提供了一个经过处理的 LIDC-IDRI 数据集资源文件,包含 13218 张 64x64 像素的 PNG 格式图片,这些图片仅包含肺结节区域及其对应的 mask。原始的 LIDC-IDRI 数据集处理过程较为复杂,下载和处理都相对费时费力。虽然 GitHub 上有代码可以处理并获得较为精确的 mask,但由于原始数据集本身较大,下载和处理过程较为繁琐,因此本仓库直接提供了处理后的结果。
在尝试使用 LUNA16 数据集进行训练时,根据网上的 DSB tutorial 以及参考其他处理方法,最终得到的 dice 系数仅为 0.3 左右。LUNA16 数据集的 mask 多为圆形,这在语义分割任务中可能不够准确,因为语义分割需要进行像素级分类。经过长时间的搜索,最终找到了这个数据集,并使用 U-net 进行训练,得到的 dice 系数为 0.8816。
如果有大佬能够分享 512x512 像素的图片,将不胜感激。如有侵犯版权的情况,请及时联系,我们将立即删除相关内容。
使用说明
- 下载数据集:直接从本仓库下载资源文件。
- 数据格式:所有图片均为 64x64 像素的 PNG 格式,包含肺结节区域及其对应的 mask。
- 训练建议:建议使用 U-net 等语义分割模型进行训练,以获得较高的 dice 系数。
致谢
感谢所有为数据集处理和分享做出贡献的开发者。如有任何问题或建议,欢迎提交 Issue 或 Pull Request。
免责声明
本仓库提供的资源文件仅供学习和研究使用,请勿用于商业用途。如有版权问题,请联系我们,我们将立即删除相关内容。