零基础入门心电图心跳信号多分类预测挑战赛-赛题理解

零基础入门心电图心跳信号多分类预测挑战赛-赛题理解 1,比赛地址:https://tianchi.aliyun.com/competition/entranc

零基础入门心电图心跳信号多分类预测挑战赛-赛题理解

1,比赛地址:https://tianchi.aliyun.com/competition/entrance/531883/introduction

2,比赛任务
以预测心电图心跳信号类别为任务,是一个多分类的预测。

3,查看数据

train_data = pd.read_csv(r"C:\Users\tian\Desktop\杂货店\datawhale\train.csv") 
test_data = pd.read_csv(r"C:\Users\tian\Desktop\杂货店\datawhale\testA.csv") 
print('Train data shape:',train_data.shape)
print('TestA data shape:',test_data.shape)
#Train data shape: (100000, 3)
#TestA data shape: (20000, 2)
train_data.head()

在这里插入图片描述

train_data.info()
test_data.info()

在这里插入图片描述

#查看label情况
train_data['label'].value_counts()

在这里插入图片描述

#总体分布概况(无界约翰逊分布等)
import scipy.stats as st
y = train_data['label']
plt.figure(1); plt.title('Default')
sns.distplot(y, rug=True, bins=20)
plt.figure(2); plt.title('Normal')
sns.distplot(y, kde=False, fit=st.norm)
plt.figure(3); plt.title('Log Normal')
sns.distplot(y, kde=False, fit=st.lognorm)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
关于这三个图,比较有疑惑,这仨图有啥意思,能看出啥????