泰坦尼克号数据集下载
简介
本仓库提供泰坦尼克号数据集的下载链接,该数据集包含泰坦尼克号沉船事件中的乘客信息,包括他们的生还情况、船票等级、性别、年龄等详细数据。这个数据集常用于数据分析和机器学习任务。
数据集内容
- 训练集:包含12列特征,用于训练模型。
- 测试集:用于验证模型的性能。
数据集字段说明
- PassengerId: 乘客ID
- Survived: 是否生还(1-生还,0-未生还)
- Pclass: 乘客等级(1-一等舱,2-二等舱,3-三等舱)
- Name: 乘客姓名
- Sex: 性别
- Age: 年龄
- SibSp: 兄弟姐妹/配偶的数量
- Parch: 父母与小孩的数量
- Ticket: 船票信息
- Fare: 票价
- Cabin: 客舱
- Embarked: 登船港口(C-瑟堡,Q-皇后镇,S-南安普顿)
使用场景
该数据集适用于以下场景:
- 数据分析
- 机器学习模型训练
- 数据预处理练习
- 特征工程实践
下载方式
请访问本仓库提供的下载链接获取数据集。
注意事项
- 数据集仅供学习和研究使用,请勿用于商业用途。
- 数据集中可能存在缺失值,请在分析前进行数据清洗。
贡献
欢迎提交问题和改进建议,帮助我们完善数据集和文档。
许可证
本数据集遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。