概览
由 YData 提供
数据集统计信息
变量数量 | 17 |
---|---|
样本数量 | 45211 |
缺失单元格数量 | 0 |
缺失单元格 (%) | 0.0% |
重复行数量 | 0 |
重复行 (%) | 0.0% |
总内存占用大小 | 29.2 MiB |
平均记录内存占用大小 | 677.2 B |
变量类型
数值型 | 7 |
---|---|
类别型 | 6 |
布尔型 | 4 |
警告
contact 与 month 整体高度相关 | 高相关性 |
housing 与 month 整体高度相关 | 高相关性 |
month 与 contact 和 1个其他字段 整体高度相关 | 高相关性 |
pdays 与 poutcome 和 1个其他字段 整体高度相关 | 高相关性 |
poutcome 与 pdays 整体高度相关 | 高相关性 |
previous 与 pdays 整体高度相关 | 高相关性 |
default 高度不平衡 (87.0%) | 不平衡 |
poutcome 高度不平衡 (53.1%) | 不平衡 |
previous 高度偏斜 (γ1 = 41.84645447) | 偏斜 |
balance 包含 3514 (7.8%) 个零值 | 零值 |
previous 包含 36954 (81.7%) 个零值 | 零值 |
复现
分析开始于 | 2025-03-26 00:44:51.321612 |
---|---|
分析完成于 | 2025-03-26 00:44:56.840576 |
持续时间 | 5.52 秒 |
软件版本 | ydata-profiling v0.0.dev0 |
下载配置 | config.json |
变量
age
实数 (ℝ)
唯一值数量 | 77 |
---|---|
唯一值 (%) | 0.2% |
缺失数量 | 0 |
缺失 (%) | 0.0% |
无穷值数量 | 0 |
无穷值 (%) | 0.0% |
均值 | 40.93621 |
最小值 | 18 |
---|---|
最大值 | 95 |
零值 | 0 |
零值 (%) | 0.0% |
负值数量 | 0 |
负值 (%) | 0.0% |
内存占用大小 | 353.3 KiB |
分位数统计信息
最小值 | 18 |
---|---|
第5百分位数 | 27 |
Q1 | 33 |
中位数 | 39 |
Q3 | 48 |
第95百分位数 | 59 |
最大值 | 95 |
范围 | 77 |
四分位距 (IQR) | 15 |
描述性统计信息
标准差 | 10.618762 |
---|---|
变异系数 (CV) | 0.25939778 |
峰度 | 0.31957038 |
均值 | 40.93621 |
中位数绝对离差 (MAD) | 7 |
偏度 | 0.68481793 |
总和 | 1850767 |
方差 | 112.75811 |
单调性 | 非单调 |
固定分箱大小的直方图 (bins=50)
值 | 计数 | 频率 (%) |
32 | 2085 | 4.6% |
31 | 1996 | 4.4% |
33 | 1972 | 4.4% |
34 | 1930 | 4.3% |
35 | 1894 | 4.2% |
36 | 1806 | 4.0% |
30 | 1757 | 3.9% |
37 | 1696 | 3.8% |
39 | 1487 | 3.3% |
38 | 1466 | 3.2% |
其他值 (67) | 27122 |
值 | 计数 | 频率 (%) |
18 | 12 | < 0.1% |
19 | 35 | 0.1% |
20 | 50 | 0.1% |
21 | 79 | 0.2% |
22 | 129 | 0.3% |
23 | 202 | 0.4% |
24 | 302 | 0.7% |
25 | 527 | |
26 | 805 | |
27 | 909 |
值 | 计数 | 频率 (%) |
95 | 2 | < 0.1% |
94 | 1 | < 0.1% |
93 | 2 | < 0.1% |
92 | 2 | < 0.1% |
90 | 2 | < 0.1% |
89 | 3 | < 0.1% |
88 | 2 | < 0.1% |
87 | 4 | |
86 | 9 | |
85 | 5 |
job
类别型
唯一值数量 | 12 |
---|---|
唯一值 (%) | < 0.1% |
缺失数量 | 0 |
缺失 (%) | 0.0% |
内存占用大小 | 2.9 MiB |
blue-collar | |
---|---|
management | |
technician | |
admin. | |
services | |
其他值 (7) |
常见值
值 | 计数 | 频率 (%) |
blue-collar | 9732 | |
management | 9458 | |
technician | 7597 | |
admin. | 5171 | |
services | 4154 | |
retired | 2264 | 5.0% |
self-employed | 1579 | 3.5% |
entrepreneur | 1487 | 3.3% |
unemployed | 1303 | 2.9% |
housemaid | 1240 | 2.7% |
其他值 (2) | 1226 | 2.7% |
长度
类别长度直方图
值 | 计数 | 频率 (%) |
blue-collar | 9732 | |
management | 9458 | |
technician | 7597 | |
admin | 5171 | |
services | 4154 | |
retired | 2264 | 5.0% |
self-employed | 1579 | 3.5% |
entrepreneur | 1487 | 3.3% |
unemployed | 1303 | 2.9% |
housemaid | 1240 | 2.7% |
其他值 (2) | 1226 | 2.7% |
最常见的字符
值 | 计数 | 频率 (%) |
e | 64550 | |
n | 45360 | |
a | 42656 | |
l | 33657 | 7.8% |
c | 29080 | 6.8% |
m | 28209 | 6.6% |
i | 28023 | 6.5% |
r | 22875 | 5.3% |
t | 22682 | 5.3% |
u | 14988 | 3.5% |
其他值 (14) | 96771 |
最常见的类别
值 | 计数 | 频率 (%) |
(unknown) | 428851 |
每个类别中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
e | 64550 | |
n | 45360 | |
a | 42656 | |
l | 33657 | 7.8% |
c | 29080 | 6.8% |
m | 28209 | 6.6% |
i | 28023 | 6.5% |
r | 22875 | 5.3% |
t | 22682 | 5.3% |
u | 14988 | 3.5% |
其他值 (14) | 96771 |
最常见的书写系统
值 | 计数 | 频率 (%) |
(unknown) | 428851 |
每个书写系统中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
e | 64550 | |
n | 45360 | |
a | 42656 | |
l | 33657 | 7.8% |
c | 29080 | 6.8% |
m | 28209 | 6.6% |
i | 28023 | 6.5% |
r | 22875 | 5.3% |
t | 22682 | 5.3% |
u | 14988 | 3.5% |
其他值 (14) | 96771 |
最常见的Unicode块
值 | 计数 | 频率 (%) |
(unknown) | 428851 |
每个Unicode块中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
e | 64550 | |
n | 45360 | |
a | 42656 | |
l | 33657 | 7.8% |
c | 29080 | 6.8% |
m | 28209 | 6.6% |
i | 28023 | 6.5% |
r | 22875 | 5.3% |
t | 22682 | 5.3% |
u | 14988 | 3.5% |
其他值 (14) | 96771 |
常见值
值 | 计数 | 频率 (%) |
married | 27214 | |
single | 12790 | |
divorced | 5207 | 11.5% |
长度
类别长度直方图
常见值 (Plot)
值 | 计数 | 频率 (%) |
married | 27214 | |
single | 12790 | |
divorced | 5207 | 11.5% |
最常见的字符
值 | 计数 | 频率 (%) |
r | 59635 | |
e | 45211 | |
i | 45211 | |
d | 37628 | |
m | 27214 | |
a | 27214 | |
s | 12790 | 4.1% |
n | 12790 | 4.1% |
g | 12790 | 4.1% |
l | 12790 | 4.1% |
其他值 (3) | 15621 | 5.1% |
最常见的类别
值 | 计数 | 频率 (%) |
(unknown) | 308894 |
每个类别中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
r | 59635 | |
e | 45211 | |
i | 45211 | |
d | 37628 | |
m | 27214 | |
a | 27214 | |
s | 12790 | 4.1% |
n | 12790 | 4.1% |
g | 12790 | 4.1% |
l | 12790 | 4.1% |
其他值 (3) | 15621 | 5.1% |
最常见的书写系统
值 | 计数 | 频率 (%) |
(unknown) | 308894 |
每个书写系统中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
r | 59635 | |
e | 45211 | |
i | 45211 | |
d | 37628 | |
m | 27214 | |
a | 27214 | |
s | 12790 | 4.1% |
n | 12790 | 4.1% |
g | 12790 | 4.1% |
l | 12790 | 4.1% |
其他值 (3) | 15621 | 5.1% |
最常见的Unicode块
值 | 计数 | 频率 (%) |
(unknown) | 308894 |
每个Unicode块中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
r | 59635 | |
e | 45211 | |
i | 45211 | |
d | 37628 | |
m | 27214 | |
a | 27214 | |
s | 12790 | 4.1% |
n | 12790 | 4.1% |
g | 12790 | 4.1% |
l | 12790 | 4.1% |
其他值 (3) | 15621 | 5.1% |
常见值
值 | 计数 | 频率 (%) |
secondary | 23202 | |
tertiary | 13301 | |
primary | 6851 | 15.2% |
unknown | 1857 | 4.1% |
长度
类别长度直方图
常见值 (Plot)
值 | 计数 | 频率 (%) |
secondary | 23202 | |
tertiary | 13301 | |
primary | 6851 | 15.2% |
unknown | 1857 | 4.1% |
最常见的字符
值 | 计数 | 频率 (%) |
r | 63506 | |
a | 43354 | |
y | 43354 | |
e | 36503 | |
n | 28773 | |
t | 26602 | |
o | 25059 | 6.7% |
s | 23202 | 6.2% |
d | 23202 | 6.2% |
c | 23202 | 6.2% |
其他值 (6) | 39425 |
最常见的类别
值 | 计数 | 频率 (%) |
(unknown) | 376182 |
每个类别中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
r | 63506 | |
a | 43354 | |
y | 43354 | |
e | 36503 | |
n | 28773 | |
t | 26602 | |
o | 25059 | 6.7% |
s | 23202 | 6.2% |
d | 23202 | 6.2% |
c | 23202 | 6.2% |
其他值 (6) | 39425 |
最常见的书写系统
值 | 计数 | 频率 (%) |
(unknown) | 376182 |
每个书写系统中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
r | 63506 | |
a | 43354 | |
y | 43354 | |
e | 36503 | |
n | 28773 | |
t | 26602 | |
o | 25059 | 6.7% |
s | 23202 | 6.2% |
d | 23202 | 6.2% |
c | 23202 | 6.2% |
其他值 (6) | 39425 |
最常见的Unicode块
值 | 计数 | 频率 (%) |
(unknown) | 376182 |
每个Unicode块中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
r | 63506 | |
a | 43354 | |
y | 43354 | |
e | 36503 | |
n | 28773 | |
t | 26602 | |
o | 25059 | 6.7% |
s | 23202 | 6.2% |
d | 23202 | 6.2% |
c | 23202 | 6.2% |
其他值 (6) | 39425 |
值 | 计数 | 频率 (%) |
False | 44396 | |
True | 815 | 1.8% |
balance
实数 (ℝ)
零值
唯一值数量 | 7168 |
---|---|
唯一值 (%) | 15.9% |
缺失数量 | 0 |
缺失 (%) | 0.0% |
无穷值数量 | 0 |
无穷值 (%) | 0.0% |
均值 | 1362.2721 |
最小值 | -8019 |
---|---|
最大值 | 102127 |
零值 | 3514 |
零值 (%) | 7.8% |
负值数量 | 3766 |
负值 (%) | 8.3% |
内存占用大小 | 353.3 KiB |
分位数统计信息
最小值 | -8019 |
---|---|
第5百分位数 | -172 |
Q1 | 72 |
中位数 | 448 |
Q3 | 1428 |
第95百分位数 | 5768 |
最大值 | 102127 |
范围 | 110146 |
四分位距 (IQR) | 1356 |
描述性统计信息
标准差 | 3044.7658 |
---|---|
变异系数 (CV) | 2.2350644 |
峰度 | 140.75155 |
均值 | 1362.2721 |
中位数绝对离差 (MAD) | 448 |
偏度 | 8.3603083 |
总和 | 61589682 |
方差 | 9270599 |
单调性 | 非单调 |
固定分箱大小的直方图 (bins=50)
值 | 计数 | 频率 (%) |
0 | 3514 | 7.8% |
1 | 195 | 0.4% |
2 | 156 | 0.3% |
4 | 139 | 0.3% |
3 | 134 | 0.3% |
5 | 113 | 0.2% |
6 | 88 | 0.2% |
8 | 81 | 0.2% |
23 | 75 | 0.2% |
10 | 69 | 0.2% |
其他值 (7158) | 40647 |
值 | 计数 | 频率 (%) |
-8019 | 1 | |
-6847 | 1 | |
-4057 | 1 | |
-3372 | 1 | |
-3313 | 1 | |
-3058 | 1 | |
-2827 | 1 | |
-2712 | 1 | |
-2604 | 1 | |
-2282 | 1 |
值 | 计数 | 频率 (%) |
102127 | 1 | |
98417 | 1 | |
81204 | 2 | |
71188 | 1 | |
66721 | 1 | |
66653 | 1 | |
64343 | 1 | |
59649 | 1 | |
58932 | 1 | |
58544 | 1 |
值 | 计数 | 频率 (%) |
True | 25130 | |
False | 20081 |
值 | 计数 | 频率 (%) |
False | 37967 | |
True | 7244 | 16.0% |
常见值
值 | 计数 | 频率 (%) |
cellular | 29285 | |
unknown | 13020 | |
telephone | 2906 | 6.4% |
长度
类别长度直方图
常见值 (Plot)
值 | 计数 | 频率 (%) |
cellular | 29285 | |
unknown | 13020 | |
telephone | 2906 | 6.4% |
最常见的字符
值 | 计数 | 频率 (%) |
l | 90761 | |
u | 42305 | |
n | 41966 | |
e | 38003 | |
c | 29285 | 8.3% |
a | 29285 | 8.3% |
r | 29285 | 8.3% |
o | 15926 | 4.5% |
k | 13020 | 3.7% |
w | 13020 | 3.7% |
其他值 (3) | 8718 | 2.5% |
最常见的类别
值 | 计数 | 频率 (%) |
(unknown) | 351574 |
每个类别中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
l | 90761 | |
u | 42305 | |
n | 41966 | |
e | 38003 | |
c | 29285 | 8.3% |
a | 29285 | 8.3% |
r | 29285 | 8.3% |
o | 15926 | 4.5% |
k | 13020 | 3.7% |
w | 13020 | 3.7% |
其他值 (3) | 8718 | 2.5% |
最常见的书写系统
值 | 计数 | 频率 (%) |
(unknown) | 351574 |
每个书写系统中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
l | 90761 | |
u | 42305 | |
n | 41966 | |
e | 38003 | |
c | 29285 | 8.3% |
a | 29285 | 8.3% |
r | 29285 | 8.3% |
o | 15926 | 4.5% |
k | 13020 | 3.7% |
w | 13020 | 3.7% |
其他值 (3) | 8718 | 2.5% |
最常见的Unicode块
值 | 计数 | 频率 (%) |
(unknown) | 351574 |
每个Unicode块中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
l | 90761 | |
u | 42305 | |
n | 41966 | |
e | 38003 | |
c | 29285 | 8.3% |
a | 29285 | 8.3% |
r | 29285 | 8.3% |
o | 15926 | 4.5% |
k | 13020 | 3.7% |
w | 13020 | 3.7% |
其他值 (3) | 8718 | 2.5% |
day
实数 (ℝ)
唯一值数量 | 31 |
---|---|
唯一值 (%) | 0.1% |
缺失数量 | 0 |
缺失 (%) | 0.0% |
无穷值数量 | 0 |
无穷值 (%) | 0.0% |
均值 | 15.806419 |
最小值 | 1 |
---|---|
最大值 | 31 |
零值 | 0 |
零值 (%) | 0.0% |
负值数量 | 0 |
负值 (%) | 0.0% |
内存占用大小 | 353.3 KiB |
分位数统计信息
最小值 | 1 |
---|---|
第5百分位数 | 3 |
Q1 | 8 |
中位数 | 16 |
Q3 | 21 |
第95百分位数 | 29 |
最大值 | 31 |
范围 | 30 |
四分位距 (IQR) | 13 |
描述性统计信息
标准差 | 8.3224762 |
---|---|
变异系数 (CV) | 0.52652509 |
峰度 | -1.0598974 |
均值 | 15.806419 |
中位数绝对离差 (MAD) | 7 |
偏度 | 0.093079014 |
总和 | 714624 |
方差 | 69.263609 |
单调性 | 非单调 |
固定分箱大小的直方图 (bins=31)
值 | 计数 | 频率 (%) |
20 | 2752 | 6.1% |
18 | 2308 | 5.1% |
21 | 2026 | 4.5% |
17 | 1939 | 4.3% |
6 | 1932 | 4.3% |
5 | 1910 | 4.2% |
14 | 1848 | 4.1% |
8 | 1842 | 4.1% |
28 | 1830 | 4.0% |
7 | 1817 | 4.0% |
其他值 (21) | 25007 |
值 | 计数 | 频率 (%) |
1 | 322 | 0.7% |
2 | 1293 | |
3 | 1079 | |
4 | 1445 | |
5 | 1910 | |
6 | 1932 | |
7 | 1817 | |
8 | 1842 | |
9 | 1561 | |
10 | 524 | 1.2% |
值 | 计数 | 频率 (%) |
31 | 643 | 1.4% |
30 | 1566 | |
29 | 1745 | |
28 | 1830 | |
27 | 1121 | |
26 | 1035 | |
25 | 840 | |
24 | 447 | 1.0% |
23 | 939 | |
22 | 905 |
常见值
值 | 计数 | 频率 (%) |
may | 13766 | |
jul | 6895 | |
aug | 6247 | |
jun | 5341 | 11.8% |
nov | 3970 | 8.8% |
apr | 2932 | 6.5% |
feb | 2649 | 5.9% |
jan | 1403 | 3.1% |
oct | 738 | 1.6% |
sep | 579 | 1.3% |
其他值 (2) | 691 | 1.5% |
长度
类别长度直方图
值 | 计数 | 频率 (%) |
may | 13766 | |
jul | 6895 | |
aug | 6247 | |
jun | 5341 | 11.8% |
nov | 3970 | 8.8% |
apr | 2932 | 6.5% |
feb | 2649 | 5.9% |
jan | 1403 | 3.1% |
oct | 738 | 1.6% |
sep | 579 | 1.3% |
其他值 (2) | 691 | 1.5% |
最常见的字符
值 | 计数 | 频率 (%) |
a | 24825 | |
u | 18483 | |
m | 14243 | |
y | 13766 | |
j | 13639 | |
n | 10714 | |
l | 6895 | 5.1% |
g | 6247 | 4.6% |
o | 4708 | 3.5% |
v | 3970 | 2.9% |
其他值 (9) | 18143 |
最常见的类别
值 | 计数 | 频率 (%) |
(unknown) | 135633 |
每个类别中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
a | 24825 | |
u | 18483 | |
m | 14243 | |
y | 13766 | |
j | 13639 | |
n | 10714 | |
l | 6895 | 5.1% |
g | 6247 | 4.6% |
o | 4708 | 3.5% |
v | 3970 | 2.9% |
其他值 (9) | 18143 |
最常见的书写系统
值 | 计数 | 频率 (%) |
(unknown) | 135633 |
每个书写系统中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
a | 24825 | |
u | 18483 | |
m | 14243 | |
y | 13766 | |
j | 13639 | |
n | 10714 | |
l | 6895 | 5.1% |
g | 6247 | 4.6% |
o | 4708 | 3.5% |
v | 3970 | 2.9% |
其他值 (9) | 18143 |
最常见的Unicode块
值 | 计数 | 频率 (%) |
(unknown) | 135633 |
每个Unicode块中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
a | 24825 | |
u | 18483 | |
m | 14243 | |
y | 13766 | |
j | 13639 | |
n | 10714 | |
l | 6895 | 5.1% |
g | 6247 | 4.6% |
o | 4708 | 3.5% |
v | 3970 | 2.9% |
其他值 (9) | 18143 |
duration
实数 (ℝ)
唯一值数量 | 1573 |
---|---|
唯一值 (%) | 3.5% |
缺失数量 | 0 |
缺失 (%) | 0.0% |
无穷值数量 | 0 |
无穷值 (%) | 0.0% |
均值 | 258.16308 |
最小值 | 0 |
---|---|
最大值 | 4918 |
零值 | 3 |
零值 (%) | < 0.1% |
负值数量 | 0 |
负值 (%) | 0.0% |
内存占用大小 | 353.3 KiB |
分位数统计信息
最小值 | 0 |
---|---|
第5百分位数 | 35 |
Q1 | 103 |
中位数 | 180 |
Q3 | 319 |
第95百分位数 | 751 |
最大值 | 4918 |
范围 | 4918 |
四分位距 (IQR) | 216 |
描述性统计信息
标准差 | 257.52781 |
---|---|
变异系数 (CV) | 0.99753928 |
峰度 | 18.153915 |
均值 | 258.16308 |
中位数绝对离差 (MAD) | 93 |
偏度 | 3.1443181 |
总和 | 11671811 |
方差 | 66320.574 |
单调性 | 非单调 |
固定分箱大小的直方图 (bins=50)
值 | 计数 | 频率 (%) |
124 | 188 | 0.4% |
90 | 184 | 0.4% |
89 | 177 | 0.4% |
104 | 175 | 0.4% |
114 | 175 | 0.4% |
122 | 175 | 0.4% |
136 | 174 | 0.4% |
112 | 174 | 0.4% |
139 | 174 | 0.4% |
121 | 173 | 0.4% |
其他值 (1563) | 43442 |
值 | 计数 | 频率 (%) |
0 | 3 | < 0.1% |
1 | 2 | < 0.1% |
2 | 3 | < 0.1% |
3 | 4 | < 0.1% |
4 | 15 | < 0.1% |
5 | 35 | |
6 | 45 | |
7 | 73 | |
8 | 85 | |
9 | 77 |
值 | 计数 | 频率 (%) |
4918 | 1 | |
3881 | 1 | |
3785 | 1 | |
3422 | 1 | |
3366 | 1 | |
3322 | 1 | |
3284 | 1 | |
3253 | 1 | |
3183 | 1 | |
3102 | 1 |
campaign
实数 (ℝ)
唯一值数量 | 48 |
---|---|
唯一值 (%) | 0.1% |
缺失数量 | 0 |
缺失 (%) | 0.0% |
无穷值数量 | 0 |
无穷值 (%) | 0.0% |
均值 | 2.7638407 |
最小值 | 1 |
---|---|
最大值 | 63 |
零值 | 0 |
零值 (%) | 0.0% |
负值数量 | 0 |
负值 (%) | 0.0% |
内存占用大小 | 353.3 KiB |
分位数统计信息
最小值 | 1 |
---|---|
第5百分位数 | 1 |
Q1 | 1 |
中位数 | 2 |
Q3 | 3 |
第95百分位数 | 8 |
最大值 | 63 |
范围 | 62 |
四分位距 (IQR) | 2 |
描述性统计信息
标准差 | 3.0980209 |
---|---|
变异系数 (CV) | 1.1209115 |
峰度 | 39.249651 |
均值 | 2.7638407 |
中位数绝对离差 (MAD) | 1 |
偏度 | 4.8986502 |
总和 | 124956 |
方差 | 9.5977334 |
单调性 | 非单调 |
固定分箱大小的直方图 (bins=48)
值 | 计数 | 频率 (%) |
1 | 17544 | |
2 | 12505 | |
3 | 5521 | 12.2% |
4 | 3522 | 7.8% |
5 | 1764 | 3.9% |
6 | 1291 | 2.9% |
7 | 735 | 1.6% |
8 | 540 | 1.2% |
9 | 327 | 0.7% |
10 | 266 | 0.6% |
其他值 (38) | 1196 | 2.6% |
值 | 计数 | 频率 (%) |
1 | 17544 | |
2 | 12505 | |
3 | 5521 | 12.2% |
4 | 3522 | 7.8% |
5 | 1764 | 3.9% |
6 | 1291 | 2.9% |
7 | 735 | 1.6% |
8 | 540 | 1.2% |
9 | 327 | 0.7% |
10 | 266 | 0.6% |
值 | 计数 | 频率 (%) |
63 | 1 | < 0.1% |
58 | 1 | < 0.1% |
55 | 1 | < 0.1% |
51 | 1 | < 0.1% |
50 | 2 | |
46 | 1 | < 0.1% |
44 | 1 | < 0.1% |
43 | 3 | |
41 | 2 | |
39 | 1 | < 0.1% |
pdays
实数 (ℝ)
高相关性
唯一值数量 | 559 |
---|---|
唯一值 (%) | 1.2% |
缺失数量 | 0 |
缺失 (%) | 0.0% |
无穷值数量 | 0 |
无穷值 (%) | 0.0% |
均值 | 40.197828 |
最小值 | -1 |
---|---|
最大值 | 871 |
零值 | 0 |
零值 (%) | 0.0% |
负值数量 | 36954 |
负值 (%) | 81.7% |
内存占用大小 | 353.3 KiB |
分位数统计信息
最小值 | -1 |
---|---|
第5百分位数 | -1 |
Q1 | -1 |
中位数 | -1 |
Q3 | -1 |
第95百分位数 | 317 |
最大值 | 871 |
范围 | 872 |
四分位距 (IQR) | 0 |
描述性统计信息
标准差 | 100.12875 |
---|---|
变异系数 (CV) | 2.4908994 |
峰度 | 6.9351952 |
均值 | 40.197828 |
中位数绝对离差 (MAD) | 0 |
偏度 | 2.6157155 |
总和 | 1817384 |
方差 | 10025.766 |
单调性 | 非单调 |
固定分箱大小的直方图 (bins=50)
值 | 计数 | 频率 (%) |
-1 | 36954 | |
182 | 167 | 0.4% |
92 | 147 | 0.3% |
183 | 126 | 0.3% |
91 | 126 | 0.3% |
181 | 117 | 0.3% |
370 | 99 | 0.2% |
184 | 85 | 0.2% |
364 | 77 | 0.2% |
95 | 74 | 0.2% |
其他值 (549) | 7239 | 16.0% |
值 | 计数 | 频率 (%) |
-1 | 36954 | |
1 | 15 | < 0.1% |
2 | 37 | 0.1% |
3 | 1 | < 0.1% |
4 | 2 | < 0.1% |
5 | 11 | < 0.1% |
6 | 10 | < 0.1% |
7 | 7 | < 0.1% |
8 | 25 | 0.1% |
9 | 12 | < 0.1% |
值 | 计数 | 频率 (%) |
871 | 1 | |
854 | 1 | |
850 | 1 | |
842 | 1 | |
838 | 1 | |
831 | 1 | |
828 | 1 | |
826 | 1 | |
808 | 1 | |
805 | 1 |
previous
实数 (ℝ)
高相关性 偏斜 零值
唯一值数量 | 41 |
---|---|
唯一值 (%) | 0.1% |
缺失数量 | 0 |
缺失 (%) | 0.0% |
无穷值数量 | 0 |
无穷值 (%) | 0.0% |
均值 | 0.58032337 |
最小值 | 0 |
---|---|
最大值 | 275 |
零值 | 36954 |
零值 (%) | 81.7% |
负值数量 | 0 |
负值 (%) | 0.0% |
内存占用大小 | 353.3 KiB |
分位数统计信息
最小值 | 0 |
---|---|
第5百分位数 | 0 |
Q1 | 0 |
中位数 | 0 |
Q3 | 0 |
第95百分位数 | 3 |
最大值 | 275 |
范围 | 275 |
四分位距 (IQR) | 0 |
描述性统计信息
标准差 | 2.303441 |
---|---|
变异系数 (CV) | 3.9692371 |
峰度 | 4506.8607 |
均值 | 0.58032337 |
中位数绝对离差 (MAD) | 0 |
偏度 | 41.846454 |
总和 | 26237 |
方差 | 5.3058406 |
单调性 | 非单调 |
固定分箱大小的直方图 (bins=41)
值 | 计数 | 频率 (%) |
0 | 36954 | |
1 | 2772 | 6.1% |
2 | 2106 | 4.7% |
3 | 1142 | 2.5% |
4 | 714 | 1.6% |
5 | 459 | 1.0% |
6 | 277 | 0.6% |
7 | 205 | 0.5% |
8 | 129 | 0.3% |
9 | 92 | 0.2% |
其他值 (31) | 361 | 0.8% |
值 | 计数 | 频率 (%) |
0 | 36954 | |
1 | 2772 | 6.1% |
2 | 2106 | 4.7% |
3 | 1142 | 2.5% |
4 | 714 | 1.6% |
5 | 459 | 1.0% |
6 | 277 | 0.6% |
7 | 205 | 0.5% |
8 | 129 | 0.3% |
9 | 92 | 0.2% |
值 | 计数 | 频率 (%) |
275 | 1 | |
58 | 1 | |
55 | 1 | |
51 | 1 | |
41 | 1 | |
40 | 1 | |
38 | 2 | |
37 | 2 | |
35 | 1 | |
32 | 1 |
poutcome
类别型
高相关性 不平衡
唯一值数量 | 4 |
---|---|
唯一值 (%) | < 0.1% |
缺失数量 | 0 |
缺失 (%) | 0.0% |
内存占用大小 | 2.8 MiB |
unknown | |
---|---|
failure | |
other | 1840 |
success | 1511 |
常见值
值 | 计数 | 频率 (%) |
unknown | 36959 | |
failure | 4901 | 10.8% |
other | 1840 | 4.1% |
success | 1511 | 3.3% |
长度
类别长度直方图
常见值 (Plot)
值 | 计数 | 频率 (%) |
unknown | 36959 | |
failure | 4901 | 10.8% |
other | 1840 | 4.1% |
success | 1511 | 3.3% |
最常见的字符
值 | 计数 | 频率 (%) |
n | 110877 | |
u | 43371 | 13.9% |
o | 38799 | 12.4% |
k | 36959 | 11.8% |
w | 36959 | 11.8% |
e | 8252 | 2.6% |
r | 6741 | 2.2% |
a | 4901 | 1.6% |
f | 4901 | 1.6% |
l | 4901 | 1.6% |
其他值 (5) | 16136 | 5.2% |
最常见的类别
值 | 计数 | 频率 (%) |
(unknown) | 312797 |
每个类别中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
n | 110877 | |
u | 43371 | 13.9% |
o | 38799 | 12.4% |
k | 36959 | 11.8% |
w | 36959 | 11.8% |
e | 8252 | 2.6% |
r | 6741 | 2.2% |
a | 4901 | 1.6% |
f | 4901 | 1.6% |
l | 4901 | 1.6% |
其他值 (5) | 16136 | 5.2% |
最常见的书写系统
值 | 计数 | 频率 (%) |
(unknown) | 312797 |
每个书写系统中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
n | 110877 | |
u | 43371 | 13.9% |
o | 38799 | 12.4% |
k | 36959 | 11.8% |
w | 36959 | 11.8% |
e | 8252 | 2.6% |
r | 6741 | 2.2% |
a | 4901 | 1.6% |
f | 4901 | 1.6% |
l | 4901 | 1.6% |
其他值 (5) | 16136 | 5.2% |
最常见的Unicode块
值 | 计数 | 频率 (%) |
(unknown) | 312797 |
每个Unicode块中最常见的字符
(unknown)
值 | 计数 | 频率 (%) |
n | 110877 | |
u | 43371 | 13.9% |
o | 38799 | 12.4% |
k | 36959 | 11.8% |
w | 36959 | 11.8% |
e | 8252 | 2.6% |
r | 6741 | 2.2% |
a | 4901 | 1.6% |
f | 4901 | 1.6% |
l | 4901 | 1.6% |
其他值 (5) | 16136 | 5.2% |
值 | 计数 | 频率 (%) |
False | 39922 | |
True | 5289 | 11.7% |
交互
相关性
age | balance | campaign | contact | day | default | duration | education | housing | job | loan | marital | month | pdays | poutcome | previous | y | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
age | 1.000 | 0.096 | 0.037 | 0.164 | -0.009 | 0.021 | -0.033 | 0.135 | 0.225 | 0.242 | 0.064 | 0.329 | 0.095 | -0.017 | 0.068 | -0.012 | 0.155 |
balance | 0.096 | 1.000 | -0.031 | 0.034 | 0.001 | 0.048 | 0.043 | 0.046 | 0.060 | 0.033 | 0.075 | 0.017 | 0.057 | 0.070 | 0.022 | 0.080 | 0.058 |
campaign | 0.037 | -0.031 | 1.000 | 0.032 | 0.140 | 0.015 | -0.108 | 0.011 | 0.027 | 0.012 | 0.010 | 0.006 | 0.058 | -0.112 | 0.047 | -0.108 | 0.048 |
contact | 0.164 | 0.034 | 0.032 | 1.000 | 0.091 | 0.023 | 0.025 | 0.123 | 0.213 | 0.150 | 0.015 | 0.045 | 0.512 | 0.200 | 0.207 | 0.008 | 0.151 |
day | -0.009 | 0.001 | 0.140 | 0.091 | 1.000 | 0.013 | -0.058 | 0.039 | 0.107 | 0.041 | 0.048 | 0.032 | 0.284 | -0.092 | 0.079 | -0.088 | 0.073 |
default | 0.021 | 0.048 | 0.015 | 0.023 | 0.013 | 1.000 | 0.000 | 0.014 | 0.003 | 0.033 | 0.077 | 0.018 | 0.057 | 0.035 | 0.040 | 0.000 | 0.022 |
duration | -0.033 | 0.043 | -0.108 | 0.025 | -0.058 | 0.000 | 1.000 | 0.000 | 0.000 | 0.012 | 0.016 | 0.011 | 0.019 | 0.029 | 0.014 | 0.031 | 0.364 |
education | 0.135 | 0.046 | 0.011 | 0.123 | 0.039 | 0.014 | 0.000 | 1.000 | 0.119 | 0.458 | 0.080 | 0.121 | 0.109 | 0.046 | 0.035 | 0.006 | 0.072 |
housing | 0.225 | 0.060 | 0.027 | 0.213 | 0.107 | 0.003 | 0.000 | 0.119 | 1.000 | 0.281 | 0.041 | 0.020 | 0.504 | 0.168 | 0.143 | 0.000 | 0.139 |
job | 0.242 | 0.033 | 0.012 | 0.150 | 0.041 | 0.033 | 0.012 | 0.458 | 0.281 | 1.000 | 0.105 | 0.205 | 0.109 | 0.043 | 0.062 | 0.000 | 0.135 |
loan | 0.064 | 0.075 | 0.010 | 0.015 | 0.048 | 0.077 | 0.016 | 0.080 | 0.041 | 0.105 | 1.000 | 0.052 | 0.182 | 0.030 | 0.055 | 0.008 | 0.068 |
marital | 0.329 | 0.017 | 0.006 | 0.045 | 0.032 | 0.018 | 0.011 | 0.121 | 0.020 | 0.205 | 0.052 | 1.000 | 0.071 | 0.026 | 0.028 | 0.000 | 0.066 |
month | 0.095 | 0.057 | 0.058 | 0.512 | 0.284 | 0.057 | 0.019 | 0.109 | 0.504 | 0.109 | 0.182 | 0.071 | 1.000 | 0.177 | 0.214 | 0.014 | 0.260 |
pdays | -0.017 | 0.070 | -0.112 | 0.200 | -0.092 | 0.035 | 0.029 | 0.046 | 0.168 | 0.043 | 0.030 | 0.026 | 0.177 | 1.000 | 0.571 | 0.986 | 0.192 |
poutcome | 0.068 | 0.022 | 0.047 | 0.207 | 0.079 | 0.040 | 0.014 | 0.035 | 0.143 | 0.062 | 0.055 | 0.028 | 0.214 | 0.571 | 1.000 | 0.032 | 0.312 |
previous | -0.012 | 0.080 | -0.108 | 0.008 | -0.088 | 0.000 | 0.031 | 0.006 | 0.000 | 0.000 | 0.008 | 0.000 | 0.014 | 0.986 | 0.032 | 1.000 | 0.011 |
y | 0.155 | 0.058 | 0.048 | 0.151 | 0.073 | 0.022 | 0.364 | 0.072 | 0.139 | 0.135 | 0.068 | 0.066 | 0.260 | 0.192 | 0.312 | 0.011 | 1.000 |
缺失值
按列显示的简单空值可视化。
空值矩阵是一种数据密集型显示,它可以让你快速直观地找出数据完整性中的模式。
样本
age | job | marital | education | default | balance | housing | loan | contact | day | month | duration | campaign | pdays | previous | poutcome | y | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | 58 | management | married | tertiary | no | 2143 | yes | no | unknown | 5 | may | 261 | 1 | -1 | 0 | unknown | no |
1 | 44 | technician | single | secondary | no | 29 | yes | no | unknown | 5 | may | 151 | 1 | -1 | 0 | unknown | no |
2 | 33 | entrepreneur | married | secondary | no | 2 | yes | yes | unknown | 5 | may | 76 | 1 | -1 | 0 | unknown | no |
3 | 47 | blue-collar | married | unknown | no | 1506 | yes | no | unknown | 5 | may | 92 | 1 | -1 | 0 | unknown | no |
4 | 33 | unknown | single | unknown | no | 1 | no | no | unknown | 5 | may | 198 | 1 | -1 | 0 | unknown | no |
5 | 35 | management | married | tertiary | no | 231 | yes | no | unknown | 5 | may | 139 | 1 | -1 | 0 | unknown | no |
6 | 28 | management | single | tertiary | no | 447 | yes | yes | unknown | 5 | may | 217 | 1 | -1 | 0 | unknown | no |
7 | 42 | entrepreneur | divorced | tertiary | yes | 2 | yes | no | unknown | 5 | may | 380 | 1 | -1 | 0 | unknown | no |
8 | 58 | retired | married | primary | no | 121 | yes | no | unknown | 5 | may | 50 | 1 | -1 | 0 | unknown | no |
9 | 43 | technician | single | secondary | no | 593 | yes | no | unknown | 5 | may | 55 | 1 | -1 | 0 | unknown | no |
age | job | marital | education | default | balance | housing | loan | contact | day | month | duration | campaign | pdays | previous | poutcome | y | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
45201 | 53 | management | married | tertiary | no | 583 | no | no | cellular | 17 | nov | 226 | 1 | 184 | 4 | success | yes |
45202 | 34 | admin. | single | secondary | no | 557 | no | no | cellular | 17 | nov | 224 | 1 | -1 | 0 | unknown | yes |
45203 | 23 | student | single | tertiary | no | 113 | no | no | cellular | 17 | nov | 266 | 1 | -1 | 0 | unknown | yes |
45204 | 73 | retired | married | secondary | no | 2850 | no | no | cellular | 17 | nov | 300 | 1 | 40 | 8 | failure | yes |
45205 | 25 | technician | single | secondary | no | 505 | no | yes | cellular | 17 | nov | 386 | 2 | -1 | 0 | unknown | yes |
45206 | 51 | technician | married | tertiary | no | 825 | no | no | cellular | 17 | nov | 977 | 3 | -1 | 0 | unknown | yes |
45207 | 71 | retired | divorced | primary | no | 1729 | no | no | cellular | 17 | nov | 456 | 2 | -1 | 0 | unknown | yes |
45208 | 72 | retired | married | secondary | no | 5715 | no | no | cellular | 17 | nov | 1127 | 5 | 184 | 3 | success | yes |
45209 | 57 | blue-collar | married | secondary | no | 668 | no | no | telephone | 17 | nov | 508 | 4 | -1 | 0 | unknown | no |
45210 | 37 | entrepreneur | married | secondary | no | 2971 | no | no | cellular | 17 | nov | 361 | 2 | 188 | 11 | other | no |