概述

YData 提供

数据集统计信息

变量数量12
观测数量891
缺失单元格866
缺失单元格 (%)8.1%
重复行0
重复行 (%)0.0%
内存总大小315.0 KiB
平均记录内存大小362.1 B

变量类型

数值型5
类别型4
文本型3

警报

SexSurvived 高度相关高度相关
SurvivedSex 高度相关高度相关
Age 有 177 (19.9%) 个缺失值缺失
Cabin 有 687 (77.1%) 个缺失值缺失
PassengerId 均匀分布均匀
PassengerId 包含唯一值唯一
Name 包含唯一值唯一
SibSp 有 608 (68.2%) 个零值零值
Parch 有 678 (76.1%) 个零值零值
Fare 有 15 (1.7%) 个零值零值

重现

分析开始2025-03-26 00:52:25.708863
分析完成2025-03-26 00:52:27.995819
持续时间2.29 秒
软件版本ydata-profiling v0.0.dev0
下载配置config.json

变量

PassengerId
实数 (ℝ)

均匀  唯一 

唯一值数量891
唯一值 (%)100.0%
缺失0
缺失值 (%)0.0%
无穷值0
无穷值 (%)0.0%
均值446
最小值1
最大值891
零值0
零值 (%)0.0%
负值数量0
负值 (%)0.0%
内存大小7.1 KiB
2025-03-26T00:52:28.050325image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

分位数统计

最小值1
第5百分位数45.5
Q1223.5
中位数446
Q3668.5
第95百分位数846.5
最大值891
范围890
四分位距 (IQR)445

描述性统计

标准差257.35384
变异系数 (CV)0.57702655
峰度-1.2
均值446
中位数绝对离差 (MAD)223
偏度0
总和397386
方差66231
单调性严格递增
2025-03-26T00:52:28.144728image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
固定分箱大小的直方图 (bins=50)
计数频率 (%)
891 1
 
0.1%
1 1
 
0.1%
2 1
 
0.1%
3 1
 
0.1%
4 1
 
0.1%
5 1
 
0.1%
6 1
 
0.1%
7 1
 
0.1%
8 1
 
0.1%
9 1
 
0.1%
其他值 (881)881
98.9%
计数频率 (%)
1 1
0.1%
2 1
0.1%
3 1
0.1%
4 1
0.1%
5 1
0.1%
6 1
0.1%
7 1
0.1%
8 1
0.1%
9 1
0.1%
10 1
0.1%
计数频率 (%)
891 1
0.1%
890 1
0.1%
889 1
0.1%
888 1
0.1%
887 1
0.1%
886 1
0.1%
885 1
0.1%
884 1
0.1%
883 1
0.1%
882 1
0.1%

Survived
类别型

高度相关 

唯一值数量2
唯一值 (%)0.2%
缺失0
缺失值 (%)0.0%
内存大小50.6 KiB
0
549 
1
342 

长度

最大长度1
中位数长度1
平均长度1
最小长度1

字符和Unicode

总字符数891
不同字符数2
不同类别数1 ?
不同书写系统数1 ?
不同Unicode块数1 ?
Unicode标准为每个码位分配字符属性,这可用于分析文本变量。

唯一

唯一0 ?
唯一值 (%)0.0%

样本

第1行0
第2行1
第3行1
第4行1
第5行0

常见值

计数频率 (%)
0 549
61.6%
1 342
38.4%

长度

2025-03-26T00:52:28.226610image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
类别长度直方图

常见值 (图)

2025-03-26T00:52:28.269436image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
计数频率 (%)
0 549
61.6%
1 342
38.4%

最常出现的字符

计数频率 (%)
0 549
61.6%
1 342
38.4%

最常出现的类别

计数频率 (%)
(未知)891
100.0%

每个类别中最常见的字符

(未知)
计数频率 (%)
0 549
61.6%
1 342
38.4%

最常出现的书写系统

计数频率 (%)
(未知)891
100.0%

每个书写系统中最常见的字符

(未知)
计数频率 (%)
0 549
61.6%
1 342
38.4%

最常出现的Unicode块

计数频率 (%)
(未知)891
100.0%

每个Unicode块中最常见的字符

(未知)
计数频率 (%)
0 549
61.6%
1 342
38.4%

Pclass
类别型

唯一值数量3
唯一值 (%)0.3%
缺失0
缺失值 (%)0.0%
内存大小50.6 KiB
3
491 
1
216 
2
184 

长度

最大长度1
中位数长度1
平均长度1
最小长度1

字符和Unicode

总字符数891
不同字符数3
不同类别数1 ?
不同书写系统数1 ?
不同Unicode块数1 ?
Unicode标准为每个码位分配字符属性,这可用于分析文本变量。

唯一

唯一0 ?
唯一值 (%)0.0%

样本

第1行3
第2行1
第3行3
第4行1
第5行3

常见值

计数频率 (%)
3 491
55.1%
1 216
24.2%
2 184
 
20.7%

长度

2025-03-26T00:52:28.323390image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
类别长度直方图

常见值 (图)

2025-03-26T00:52:28.368097image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
计数频率 (%)
3 491
55.1%
1 216
24.2%
2 184
 
20.7%

最常出现的字符

计数频率 (%)
3 491
55.1%
1 216
24.2%
2 184
 
20.7%

最常出现的类别

计数频率 (%)
(未知)891
100.0%

每个类别中最常见的字符

(未知)
计数频率 (%)
3 491
55.1%
1 216
24.2%
2 184
 
20.7%

最常出现的书写系统

计数频率 (%)
(未知)891
100.0%

每个书写系统中最常见的字符

(未知)
计数频率 (%)
3 491
55.1%
1 216
24.2%
2 184
 
20.7%

最常出现的Unicode块

计数频率 (%)
(未知)891
100.0%

每个Unicode块中最常见的字符

(未知)
计数频率 (%)
3 491
55.1%
1 216
24.2%
2 184
 
20.7%

Name
文本型

唯一 

唯一值数量891
唯一值 (%)100.0%
缺失0
缺失值 (%)0.0%
内存大小73.2 KiB
2025-03-26T00:52:28.572466image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

长度

最大长度82
中位数长度52
平均长度26.965208
最小长度12

字符和Unicode

总字符数24026
不同字符数60
不同类别数1 ?
不同书写系统数1 ?
不同Unicode块数1 ?
Unicode标准为每个码位分配字符属性,这可用于分析文本变量。

唯一

唯一891 ?
唯一值 (%)100.0%

样本

第1行Braund, Mr. Owen Harris
第2行Cumings, Mrs. John Bradley (Florence Briggs Thayer)
第3行Heikkinen, Miss. Laina
第4行Futrelle, Mrs. Jacques Heath (Lily May Peel)
第5行Allen, Mr. William Henry
计数频率 (%)
mr521
 
14.4%
miss182
 
5.0%
mrs129
 
3.6%
william64
 
1.8%
john44
 
1.2%
master40
 
1.1%
henry35
 
1.0%
james24
 
0.7%
george24
 
0.7%
charles23
 
0.6%
其他值 (1515)2538
70.0%
2025-03-26T00:52:28.901104image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

最常出现的字符

计数频率 (%)
2735
 
11.4%
r1958
 
8.1%
e1703
 
7.1%
a1657
 
6.9%
i1325
 
5.5%
n1304
 
5.4%
s1297
 
5.4%
M1128
 
4.7%
l1067
 
4.4%
o1008
 
4.2%
其他值 (50)8844
36.8%

最常出现的类别

计数频率 (%)
(未知)24026
100.0%

每个类别中最常见的字符

(未知)
计数频率 (%)
2735
 
11.4%
r1958
 
8.1%
e1703
 
7.1%
a1657
 
6.9%
i1325
 
5.5%
n1304
 
5.4%
s1297
 
5.4%
M1128
 
4.7%
l1067
 
4.4%
o1008
 
4.2%
其他值 (50)8844
36.8%

最常出现的书写系统

计数频率 (%)
(未知)24026
100.0%

每个书写系统中最常见的字符

(未知)
计数频率 (%)
2735
 
11.4%
r1958
 
8.1%
e1703
 
7.1%
a1657
 
6.9%
i1325
 
5.5%
n1304
 
5.4%
s1297
 
5.4%
M1128
 
4.7%
l1067
 
4.4%
o1008
 
4.2%
其他值 (50)8844
36.8%

最常出现的Unicode块

计数频率 (%)
(未知)24026
100.0%

每个Unicode块中最常见的字符

(未知)
计数频率 (%)
2735
 
11.4%
r1958
 
8.1%
e1703
 
7.1%
a1657
 
6.9%
i1325
 
5.5%
n1304
 
5.4%
s1297
 
5.4%
M1128
 
4.7%
l1067
 
4.4%
o1008
 
4.2%
其他值 (50)8844
36.8%

Sex
类别型

高度相关 

唯一值数量2
唯一值 (%)0.2%
缺失0
缺失值 (%)0.0%
内存大小53.8 KiB
男性
577 
女性
314 

长度

最大长度6
中位数长度4
平均长度4.704826
最小长度4

字符和Unicode

总字符数4192
不同字符数5
不同类别数1 ?
不同书写系统数1 ?
不同Unicode块数1 ?
Unicode标准为每个码位分配字符属性,这可用于分析文本变量。

唯一

唯一0 ?
唯一值 (%)0.0%

样本

第1行男性
第2行女性
第3行女性
第4行女性
第5行男性

常见值

计数频率 (%)
男性577
64.8%
女性314
35.2%

长度

2025-03-26T00:52:28.985741image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
类别长度直方图

常见值 (图)

2025-03-26T00:52:29.035376image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
计数频率 (%)
男性577
64.8%
女性314
35.2%

最常出现的字符

计数频率 (%)
e1205
28.7%
m891
21.3%
a891
21.3%
l891
21.3%
f314
 
7.5%

最常出现的类别

计数频率 (%)
(未知)4192
100.0%

每个类别中最常见的字符

(未知)
计数频率 (%)
e1205
28.7%
m891
21.3%
a891
21.3%
l891
21.3%
f314
 
7.5%

最常出现的书写系统

计数频率 (%)
(未知)4192
100.0%

每个书写系统中最常见的字符

(未知)
计数频率 (%)
e1205
28.7%
m891
21.3%
a891
21.3%
l891
21.3%
f314
 
7.5%

最常出现的Unicode块

计数频率 (%)
(未知)4192
100.0%

每个Unicode块中最常见的字符

(未知)
计数频率 (%)
e1205
28.7%
m891
21.3%
a891
21.3%
l891
21.3%
f314
 
7.5%

Age
实数 (ℝ)

缺失 

唯一值数量88
唯一值 (%)12.3%
缺失177
缺失值 (%)19.9%
无穷值0
无穷值 (%)0.0%
均值29.699118
最小值0.42
最大值80
零值0
零值 (%)0.0%
负值数量0
负值 (%)0.0%
内存大小7.1 KiB
2025-03-26T00:52:29.101473image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

分位数统计

最小值0.42
第5百分位数4
Q120.125
中位数28
Q338
第95百分位数56
最大值80
范围79.58
四分位距 (IQR)17.875

描述性统计

标准差14.526497
变异系数 (CV)0.48912219
峰度0.17827415
均值29.699118
中位数绝对离差 (MAD)9
偏度0.38910778
总和21205.17
方差211.01912
单调性非单调
2025-03-26T00:52:29.196191image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
固定分箱大小的直方图 (bins=50)
计数频率 (%)
24 30
 
3.4%
22 27
 
3.0%
18 26
 
2.9%
28 25
 
2.8%
30 25
 
2.8%
19 25
 
2.8%
21 24
 
2.7%
25 23
 
2.6%
36 22
 
2.5%
29 20
 
2.2%
其他值 (78)467
52.4%
(缺失)177
 
19.9%
计数频率 (%)
0.42 1
 
0.1%
0.67 1
 
0.1%
0.75 2
 
0.2%
0.83 2
 
0.2%
0.92 1
 
0.1%
1 7
0.8%
2 10
1.1%
3 6
0.7%
4 10
1.1%
5 4
 
0.4%
计数频率 (%)
80 1
 
0.1%
74 1
 
0.1%
71 2
0.2%
70.5 1
 
0.1%
70 2
0.2%
66 1
 
0.1%
65 3
0.3%
64 2
0.2%
63 2
0.2%
62 4
0.4%

SibSp
实数 (ℝ)

零值 

唯一值数量7
唯一值 (%)0.8%
缺失0
缺失值 (%)0.0%
无穷值0
无穷值 (%)0.0%
均值0.52300786
最小值0
最大值8
零值608
零值 (%)68.2%
负值数量0
负值 (%)0.0%
内存大小7.1 KiB
2025-03-26T00:52:29.388788image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

分位数统计

最小值0
第5百分位数0
Q10
中位数0
Q31
第95百分位数3
最大值8
范围8
四分位距 (IQR)1

描述性统计

标准差1.1027434
变异系数 (CV)2.1084644
峰度17.88042
均值0.52300786
中位数绝对离差 (MAD)0
偏度3.6953517
总和466
方差1.2160431
单调性非单调
2025-03-26T00:52:29.445496image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
固定分箱大小的直方图 (bins=7)
计数频率 (%)
0 608
68.2%
1 209
 
23.5%
2 28
 
3.1%
4 18
 
2.0%
3 16
 
1.8%
8 7
 
0.8%
5 5
 
0.6%
计数频率 (%)
0 608
68.2%
1 209
 
23.5%
2 28
 
3.1%
3 16
 
1.8%
4 18
 
2.0%
5 5
 
0.6%
8 7
 
0.8%
计数频率 (%)
8 7
 
0.8%
5 5
 
0.6%
4 18
 
2.0%
3 16
 
1.8%
2 28
 
3.1%
1 209
 
23.5%
0 608
68.2%

Parch
实数 (ℝ)

零值 

唯一值数量7
唯一值 (%)0.8%
缺失0
缺失值 (%)0.0%
无穷值0
无穷值 (%)0.0%
均值0.38159371
最小值0
最大值6
零值678
零值 (%)76.1%
负值数量0
负值 (%)0.0%
内存大小7.1 KiB
2025-03-26T00:52:29.501211image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

分位数统计

最小值0
第5百分位数0
Q10
中位数0
Q30
第95百分位数2
最大值6
范围6
四分位距 (IQR)0

描述性统计

标准差0.80605722
变异系数 (CV)2.1123441
峰度9.7781252
均值0.38159371
中位数绝对离差 (MAD)0
偏度2.749117
总和340
方差0.64972824
单调性非单调
2025-03-26T00:52:29.558272image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
固定分箱大小的直方图 (bins=7)
计数频率 (%)
0 678
76.1%
1 118
 
13.2%
2 80
 
9.0%
5 5
 
0.6%
3 5
 
0.6%
4 4
 
0.4%
6 1
 
0.1%
计数频率 (%)
0 678
76.1%
1 118
 
13.2%
2 80
 
9.0%
3 5
 
0.6%
4 4
 
0.4%
5 5
 
0.6%
6 1
 
0.1%
计数频率 (%)
6 1
 
0.1%
5 5
 
0.6%
4 4
 
0.4%
3 5
 
0.6%
2 80
 
9.0%
1 118
 
13.2%
0 678
76.1%

Ticket
文本型

唯一值数量681
唯一值 (%)76.4%
缺失0
缺失值 (%)0.0%
内存大小55.6 KiB
2025-03-26T00:52:29.768916image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

长度

最大长度18
中位数长度17
平均长度6.7508418
最小长度3

字符和Unicode

总字符数6015
不同字符数35
不同类别数1 ?
不同书写系统数1 ?
不同Unicode块数1 ?
Unicode标准为每个码位分配字符属性,这可用于分析文本变量。

唯一

唯一547 ?
唯一值 (%)61.4%

样本

第1行A/5 21171
第2行PC 17599
第3行STON/O2. 3101282
第4行113803
第5行373450
计数频率 (%)
pc60
 
5.3%
c.a27
 
2.4%
a/517
 
1.5%
ca14
 
1.2%
2 12
 
1.1%
ston/o12
 
1.1%
sc/paris9
 
0.8%
w./c9
 
0.8%
soton/o.q8
 
0.7%
soton/oq7
 
0.6%
其他值 (709)955
84.5%
2025-03-26T00:52:30.067536image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

最常出现的字符

计数频率 (%)
3 746
12.4%
1 689
11.5%
2 594
9.9%
7 490
8.1%
4 464
 
7.7%
6 422
 
7.0%
0 406
 
6.7%
5 387
 
6.4%
9 328
 
5.5%
8 282
 
4.7%
其他值 (25)1207
20.1%

最常出现的类别

计数频率 (%)
(未知)6015
100.0%

每个类别中最常见的字符

(未知)
计数频率 (%)
3 746
12.4%
1 689
11.5%
2 594
9.9%
7 490
8.1%
4 464
 
7.7%
6 422
 
7.0%
0 406
 
6.7%
5 387
 
6.4%
9 328
 
5.5%
8 282
 
4.7%
其他值 (25)1207
20.1%

最常出现的书写系统

计数频率 (%)
(未知)6015
100.0%

每个书写系统中最常见的字符

(未知)
计数频率 (%)
3 746
12.4%
1 689
11.5%
2 594
9.9%
7 490
8.1%
4 464
 
7.7%
6 422
 
7.0%
0 406
 
6.7%
5 387
 
6.4%
9 328
 
5.5%
8 282
 
4.7%
其他值 (25)1207
20.1%

最常出现的Unicode块

计数频率 (%)
(未知)6015
100.0%

每个Unicode块中最常见的字符

(未知)
计数频率 (%)
3 746
12.4%
1 689
11.5%
2 594
9.9%
7 490
8.1%
4 464
 
7.7%
6 422
 
7.0%
0 406
 
6.7%
5 387
 
6.4%
9 328
 
5.5%
8 282
 
4.7%
其他值 (25)1207
20.1%

Fare
实数 (ℝ)

零值 

唯一值数量248
唯一值 (%)27.8%
缺失0
缺失值 (%)0.0%
无穷值0
无穷值 (%)0.0%
均值32.204208
最小值0
最大值512.3292
零值15
零值 (%)1.7%
负值数量0
负值 (%)0.0%
内存大小7.1 KiB
2025-03-26T00:52:30.155904image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

分位数统计

最小值0
第5百分位数7.225
Q17.9104
中位数14.4542
Q331
第95百分位数112.07915
最大值512.3292
范围512.3292
四分位距 (IQR)23.0896

描述性统计

标准差49.693429
变异系数 (CV)1.5430725
峰度33.398141
均值32.204208
中位数绝对离差 (MAD)6.9042
偏度4.7873165
总和28693.949
方差2469.4368
单调性非单调
2025-03-26T00:52:30.251954image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
固定分箱大小的直方图 (bins=50)
计数频率 (%)
8.05 43
 
4.8%
13 42
 
4.7%
7.8958 38
 
4.3%
7.75 34
 
3.8%
26 31
 
3.5%
10.5 24
 
2.7%
7.925 18
 
2.0%
7.775 16
 
1.8%
7.2292 15
 
1.7%
26.55 15
 
1.7%
其他值 (238)615
69.0%
计数频率 (%)
0 15
1.7%
4.0125 1
 
0.1%
5 1
 
0.1%
6.2375 1
 
0.1%
6.4375 1
 
0.1%
6.45 1
 
0.1%
6.4958 2
 
0.2%
6.75 2
 
0.2%
6.8583 1
 
0.1%
6.95 1
 
0.1%
计数频率 (%)
512.3292 3
0.3%
263 4
0.4%
262.375 2
0.2%
247.5208 2
0.2%
227.525 4
0.4%
221.7792 1
 
0.1%
211.5 1
 
0.1%
211.3375 3
0.3%
164.8667 2
0.2%
153.4625 3
0.3%

Cabin
文本型

缺失 

唯一值数量147
唯一值 (%)72.1%
缺失687
缺失值 (%)77.1%
内存大小33.7 KiB
2025-03-26T00:52:30.517608image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

长度

最大长度15
中位数长度3
平均长度3.5882353
最小长度1

字符和Unicode

总字符数732
不同字符数19
不同类别数1 ?
不同书写系统数1 ?
不同Unicode块数1 ?
Unicode标准为每个码位分配字符属性,这可用于分析文本变量。

唯一

唯一101 ?
唯一值 (%)49.5%

样本

第1行C85
第2行C123
第3行E46
第4行G6
第5行C103
计数频率 (%)
g64
 
1.7%
c234
 
1.7%
c254
 
1.7%
c274
 
1.7%
b964
 
1.7%
b984
 
1.7%
f4
 
1.7%
d3
 
1.3%
f23
 
1.3%
c223
 
1.3%
其他值 (151)201
84.5%
2025-03-26T00:52:30.858880image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

最常出现的字符

计数频率 (%)
2 72
 
9.8%
C71
 
9.7%
B64
 
8.7%
1 61
 
8.3%
3 59
 
8.1%
6 51
 
7.0%
5 45
 
6.1%
4 37
 
5.1%
8 37
 
5.1%
D34
 
4.6%
其他值 (9)201
27.5%

最常出现的类别

计数频率 (%)
(未知)732
100.0%

每个类别中最常见的字符

(未知)
计数频率 (%)
2 72
 
9.8%
C71
 
9.7%
B64
 
8.7%
1 61
 
8.3%
3 59
 
8.1%
6 51
 
7.0%
5 45
 
6.1%
4 37
 
5.1%
8 37
 
5.1%
D34
 
4.6%
其他值 (9)201
27.5%

最常出现的书写系统

计数频率 (%)
(未知)732
100.0%

每个书写系统中最常见的字符

(未知)
计数频率 (%)
2 72
 
9.8%
C71
 
9.7%
B64
 
8.7%
1 61
 
8.3%
3 59
 
8.1%
6 51
 
7.0%
5 45
 
6.1%
4 37
 
5.1%
8 37
 
5.1%
D34
 
4.6%
其他值 (9)201
27.5%

最常出现的Unicode块

计数频率 (%)
(未知)732
100.0%

每个Unicode块中最常见的字符

(未知)
计数频率 (%)
2 72
 
9.8%
C71
 
9.7%
B64
 
8.7%
1 61
 
8.3%
3 59
 
8.1%
6 51
 
7.0%
5 45
 
6.1%
4 37
 
5.1%
8 37
 
5.1%
D34
 
4.6%
其他值 (9)201
27.5%

Embarked
类别型

唯一值数量3
唯一值 (%)0.3%
缺失2
缺失值 (%)0.2%
内存大小50.6 KiB
S
644 
C
168 
Q
77 

长度

最大长度1
中位数长度1
平均长度1
最小长度1

字符和Unicode

总字符数889
不同字符数3
不同类别数1 ?
不同书写系统数1 ?
不同Unicode块数1 ?
Unicode标准为每个码位分配字符属性,这可用于分析文本变量。

唯一

唯一0 ?
唯一值 (%)0.0%

样本

第1行S
第2行C
第3行S
第4行S
第5行S

常见值

计数频率 (%)
S644
72.3%
C168
 
18.9%
Q77
 
8.6%
(缺失)2
 
0.2%

长度

2025-03-26T00:52:30.936188image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
类别长度直方图

常见值 (图)

2025-03-26T00:52:30.982669image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
计数频率 (%)
s644
72.4%
c168
 
18.9%
q77
 
8.7%

最常出现的字符

计数频率 (%)
S644
72.4%
C168
 
18.9%
Q77
 
8.7%

最常出现的类别

计数频率 (%)
(未知)889
100.0%

每个类别中最常见的字符

(未知)
计数频率 (%)
S644
72.4%
C168
 
18.9%
Q77
 
8.7%

最常出现的书写系统

计数频率 (%)
(未知)889
100.0%

每个书写系统中最常见的字符

(未知)
计数频率 (%)
S644
72.4%
C168
 
18.9%
Q77
 
8.7%

最常出现的Unicode块

计数频率 (%)
(未知)889
100.0%

每个Unicode块中最常见的字符

(未知)
计数频率 (%)
S644
72.4%
C168
 
18.9%
Q77
 
8.7%

交互

2025-03-26T00:52:27.422010image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:25.967857image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:26.297266image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:26.640154image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:27.088687image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:27.486540image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:26.035066image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:26.363625image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:26.709367image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:27.153062image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:27.553052image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:26.100727image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:26.436206image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:26.775120image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:27.222401image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:27.623608image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:26.170294image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:26.502726image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:26.849699image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:27.291568image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:27.688580image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:26.233875image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:26.573674image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:26.918100image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:27.357359image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

相关性

2025-03-26T00:52:31.029501image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
AgeEmbarkedFareParchPassengerIdPclassSexSibSpSurvived
Age1.0000.0650.135-0.2540.0410.2690.099-0.1820.155
Embarked0.0651.0000.1960.0520.0000.2600.1130.0920.166
Fare0.1350.1961.0000.410-0.0140.4790.1890.4470.283
Parch-0.2540.0520.4101.0000.0010.0220.2470.4500.157
PassengerId0.0410.000-0.0140.0011.0000.0320.066-0.0610.104
Pclass0.2690.2600.4790.0220.0321.0000.1300.1480.337
Sex0.0990.1130.1890.2470.0660.1301.0000.2060.540
SibSp-0.1820.0920.4470.450-0.0610.1480.2061.0000.187
Survived0.1550.1660.2830.1570.1040.3370.5400.1871.000

缺失值

2025-03-26T00:52:27.788839image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
按列显示缺失值的简单可视化。
2025-03-26T00:52:27.868838image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
缺失矩阵是一种数据密集型显示,可让您快速直观地找出数据完成情况中的模式。
2025-03-26T00:52:27.954390image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
相关性热力图衡量缺失值相关性:一个变量的存在或缺失在多大程度上影响另一个变量的存在。

样本

PassengerIdSurvivedPclassNameSexAgeSibSpParchTicketFareCabinEmbarked
0103Braund, Mr. Owen Harris男性22.010A/5 211717.2500NaNS
1211Cumings, Mrs. John Bradley (Florence Briggs Thayer)女性38.010PC 1759971.2833C85C
2313Heikkinen, Miss. Laina女性26.000STON/O2. 31012827.9250NaNS
3411Futrelle, Mrs. Jacques Heath (Lily May Peel)女性35.01011380353.1000C123S
4503Allen, Mr. William Henry男性35.0003734508.0500NaNS
5603Moran, Mr. James男性NaN003308778.4583NaNQ
6701McCarthy, Mr. Timothy J男性54.0001746351.8625E46S
7803Palsson, Master. Gosta Leonard男性2.03134990921.0750NaNS
8913Johnson, Mrs. Oscar W (Elisabeth Vilhelmina Berg)女性27.00234774211.1333NaNS
91012Nasser, Mrs. Nicholas (Adele Achem)女性14.01023773630.0708NaNC
PassengerIdSurvivedPclassNameSexAgeSibSpParchTicketFareCabinEmbarked
88188203Markun, Mr. Johann男性33.0003492577.8958NaNS
88288303Dahlberg, Miss. Gerda Ulrika女性22.000755210.5167NaNS
88388402Banfield, Mr. Frederick James男性28.000C.A./SOTON 3406810.5000NaNS
88488503Sutehall, Mr. Henry Jr男性25.000SOTON/OQ 3920767.0500NaNS
88588603Rice, Mrs. William (Margaret Norton)女性39.00538265229.1250NaNQ
88688702Montvila, Rev. Juozas男性27.00021153613.0000NaNS
88788811Graham, Miss. Margaret Edith女性19.00011205330.0000B42S
88888903Johnston, Miss. Catherine Helen "Carrie"女性NaN12W./C. 660723.4500NaNS
88989011Behr, Mr. Karl Howell男性26.00011136930.0000C148C
89089103Dooley, Mr. Patrick男性32.0003703767.7500NaNQ