概览
由 YData 提供
数据集统计
变量数量 | 12 |
---|---|
观测数量 | 74 |
缺失单元格 | 5 |
缺失单元格 (%) | 0.6% |
重复行 | 0 |
重复行 (%) | 0.0% |
内存总大小 | 7.5 KiB |
内存平均记录大小 | 104.3 B |
变量类型
文本 | 1 |
---|---|
数值 | 9 |
分类 | 2 |
警报
displacement 与 foreign 和 其他 6 个字段 总体高度相关 | 高度相关 |
foreign 与 displacement 和 其他 5 个字段 总体高度相关 | 高度相关 |
gear_ratio 与 displacement 和 其他 6 个字段 总体高度相关 | 高度相关 |
headroom 与 length 和 其他 2 个字段 总体高度相关 | 高度相关 |
length 与 displacement 和 其他 7 个字段 总体高度相关 | 高度相关 |
mpg 与 displacement 和 其他 6 个字段 总体高度相关 | 高度相关 |
price 与 mpg 总体高度相关 | 高度相关 |
rep78 与 foreign 总体高度相关 | 高度相关 |
trunk 与 displacement 和 其他 6 个字段 总体高度相关 | 高度相关 |
turn 与 displacement 和 其他 6 个字段 总体高度相关 | 高度相关 |
weight 与 displacement 和 其他 7 个字段 总体高度相关 | 高度相关 |
rep78 有 5 个 (6.8%) 缺失值 | 缺失 |
make 有唯一值 | 唯一 |
price 有唯一值 | 唯一 |
复现
分析开始 | 2025-03-26 00:46:10.695470 |
---|---|
分析完成 | 2025-03-26 00:46:15.984247 |
耗时 | 5.29 seconds |
软件版本 | ydata-profiling v0.0.dev0 |
下载配置 | config.json |
变量
make
文本
唯一
非重复值 | 74 |
---|---|
非重复值 (%) | 100.0% |
缺失 | 0 |
缺失值 (%) | 0.0% |
内存大小 | 5.1 KiB |
值 | 计数 | 频率 (%) |
buick | 7 | 4.5% |
olds | 7 | 4.5% |
merc | 6 | 3.9% |
pont | 6 | 3.9% |
chev | 6 | 3.9% |
plym | 5 | 3.2% |
dodge | 4 | 2.6% |
datsun | 4 | 2.6% |
vw | 4 | 2.6% |
toyota | 3 | 1.9% |
其他值 (93) | 103 |
最常出现的字符
值 | 计数 | 频率 (%) |
81 | 9.3% | |
a | 62 | 7.1% |
o | 55 | 6.3% |
e | 53 | 6.1% |
r | 46 | 5.3% |
i | 41 | 4.7% |
l | 40 | 4.6% |
t | 37 | 4.2% |
n | 34 | 3.9% |
d | 30 | 3.4% |
其他值 (49) | 392 |
最常出现的类别
值 | 计数 | 频率 (%) |
(未知) | 871 |
每类别最常出现的字符
(未知)
值 | 计数 | 频率 (%) |
81 | 9.3% | |
a | 62 | 7.1% |
o | 55 | 6.3% |
e | 53 | 6.1% |
r | 46 | 5.3% |
i | 41 | 4.7% |
l | 40 | 4.6% |
t | 37 | 4.2% |
n | 34 | 3.9% |
d | 30 | 3.4% |
其他值 (49) | 392 |
最常出现的脚本
值 | 计数 | 频率 (%) |
(未知) | 871 |
每脚本最常出现的字符
(未知)
值 | 计数 | 频率 (%) |
81 | 9.3% | |
a | 62 | 7.1% |
o | 55 | 6.3% |
e | 53 | 6.1% |
r | 46 | 5.3% |
i | 41 | 4.7% |
l | 40 | 4.6% |
t | 37 | 4.2% |
n | 34 | 3.9% |
d | 30 | 3.4% |
其他值 (49) | 392 |
最常出现的块
值 | 计数 | 频率 (%) |
(未知) | 871 |
每块最常出现的字符
(未知)
值 | 计数 | 频率 (%) |
81 | 9.3% | |
a | 62 | 7.1% |
o | 55 | 6.3% |
e | 53 | 6.1% |
r | 46 | 5.3% |
i | 41 | 4.7% |
l | 40 | 4.6% |
t | 37 | 4.2% |
n | 34 | 3.9% |
d | 30 | 3.4% |
其他值 (49) | 392 |
price
实数 (ℝ)
高度相关 唯一
非重复值 | 74 |
---|---|
非重复值 (%) | 100.0% |
缺失 | 0 |
缺失值 (%) | 0.0% |
无穷大 | 0 |
无穷大 (%) | 0.0% |
均值 | 6165.2568 |
最小值 | 3291 |
---|---|
最大值 | 15906 |
零值 | 0 |
零值 (%) | 0.0% |
负值 | 0 |
负值 (%) | 0.0% |
内存大小 | 280.0 B |
分位数统计
最小值 | 3291 |
---|---|
第 5 百分位数 | 3780.5 |
Q1 | 4220.25 |
中位数 | 5006.5 |
Q3 | 6332.25 |
第 95 百分位数 | 13156.6 |
最大值 | 15906 |
范围 | 12615 |
四分位距 (IQR) | 2112 |
描述性统计
标准差 | 2949.4959 |
---|---|
变异系数 (CV) | 0.47840601 |
峰度 | 2.0340477 |
均值 | 6165.2568 |
中位数绝对偏差 (MAD) | 916 |
偏度 | 1.687841 |
总和 | 456229 |
方差 | 8699526 |
单调性 | 非单调 |
固定大小分箱直方图 (bins=50)
值 | 计数 | 频率 (%) |
4099 | 1 | 1.4% |
4749 | 1 | 1.4% |
3799 | 1 | 1.4% |
4816 | 1 | 1.4% |
7827 | 1 | 1.4% |
5788 | 1 | 1.4% |
4453 | 1 | 1.4% |
5189 | 1 | 1.4% |
10372 | 1 | 1.4% |
4082 | 1 | 1.4% |
其他值 (64) | 64 |
值 | 计数 | 频率 (%) |
3291 | 1 | |
3299 | 1 | |
3667 | 1 | |
3748 | 1 | |
3798 | 1 | |
3799 | 1 | |
3829 | 1 | |
3895 | 1 | |
3955 | 1 | |
3984 | 1 |
值 | 计数 | 频率 (%) |
15906 | 1 | |
14500 | 1 | |
13594 | 1 | |
13466 | 1 | |
12990 | 1 | |
11995 | 1 | |
11497 | 1 | |
11385 | 1 | |
10372 | 1 | |
10371 | 1 |
mpg
实数 (ℝ)
高度相关
非重复值 | 21 |
---|---|
非重复值 (%) | 28.4% |
缺失 | 0 |
缺失值 (%) | 0.0% |
无穷大 | 0 |
无穷大 (%) | 0.0% |
均值 | 21.297297 |
最小值 | 12 |
---|---|
最大值 | 41 |
零值 | 0 |
零值 (%) | 0.0% |
负值 | 0 |
负值 (%) | 0.0% |
内存大小 | 280.0 B |
分位数统计
最小值 | 12 |
---|---|
第 5 百分位数 | 14 |
Q1 | 18 |
中位数 | 20 |
Q3 | 24.75 |
第 95 百分位数 | 32.05 |
最大值 | 41 |
范围 | 29 |
四分位距 (IQR) | 6.75 |
描述性统计
标准差 | 5.7855032 |
---|---|
变异系数 (CV) | 0.27165434 |
峰度 | 1.1299198 |
均值 | 21.297297 |
中位数绝对偏差 (MAD) | 3.5 |
偏度 | 0.96846014 |
总和 | 1576 |
方差 | 33.472047 |
单调性 | 非单调 |
固定大小分箱直方图 (bins=21)
值 | 计数 | 频率 (%) |
18 | 9 | |
19 | 8 | 10.8% |
14 | 6 | 8.1% |
22 | 5 | 6.8% |
21 | 5 | 6.8% |
25 | 5 | 6.8% |
24 | 4 | 5.4% |
17 | 4 | 5.4% |
16 | 4 | 5.4% |
23 | 3 | 4.1% |
其他值 (11) | 21 |
值 | 计数 | 频率 (%) |
12 | 2 | 2.7% |
14 | 6 | |
15 | 2 | 2.7% |
16 | 4 | |
17 | 4 | |
18 | 9 | |
19 | 8 | |
20 | 3 | 4.1% |
21 | 5 | |
22 | 5 |
值 | 计数 | 频率 (%) |
41 | 1 | 1.4% |
35 | 2 | 2.7% |
34 | 1 | 1.4% |
31 | 1 | 1.4% |
30 | 2 | 2.7% |
29 | 1 | 1.4% |
28 | 3 | |
26 | 3 | |
25 | 5 | |
24 | 4 |
常见值
值 | 计数 | 频率 (%) |
平均 | 30 | |
好 | 18 | |
优秀 | 11 | 14.9% |
尚可 | 8 | 10.8% |
差 | 2 | 2.7% |
(缺失) | 5 | 6.8% |
长度
类别长度直方图
常见值 (图示)
值 | 计数 | 频率 (%) |
average | 30 | |
good | 18 | |
excellent | 11 | 15.9% |
fair | 8 | 11.6% |
poor | 2 | 2.9% |
最常出现的字符
值 | 计数 | 频率 (%) |
e | 82 | |
r | 40 | |
o | 40 | |
a | 38 | |
v | 30 | 7.1% |
A | 30 | 7.1% |
g | 30 | 7.1% |
l | 22 | 5.2% |
d | 18 | 4.3% |
G | 18 | 4.3% |
其他值 (8) | 73 |
最常出现的类别
值 | 计数 | 频率 (%) |
(未知) | 421 |
每类别最常出现的字符
(未知)
值 | 计数 | 频率 (%) |
e | 82 | |
r | 40 | |
o | 40 | |
a | 38 | |
v | 30 | 7.1% |
A | 30 | 7.1% |
g | 30 | 7.1% |
l | 22 | 5.2% |
d | 18 | 4.3% |
G | 18 | 4.3% |
其他值 (8) | 73 |
最常出现的脚本
值 | 计数 | 频率 (%) |
(未知) | 421 |
每脚本最常出现的字符
(未知)
值 | 计数 | 频率 (%) |
e | 82 | |
r | 40 | |
o | 40 | |
a | 38 | |
v | 30 | 7.1% |
A | 30 | 7.1% |
g | 30 | 7.1% |
l | 22 | 5.2% |
d | 18 | 4.3% |
G | 18 | 4.3% |
其他值 (8) | 73 |
最常出现的块
值 | 计数 | 频率 (%) |
(未知) | 421 |
每块最常出现的字符
(未知)
值 | 计数 | 频率 (%) |
e | 82 | |
r | 40 | |
o | 40 | |
a | 38 | |
v | 30 | 7.1% |
A | 30 | 7.1% |
g | 30 | 7.1% |
l | 22 | 5.2% |
d | 18 | 4.3% |
G | 18 | 4.3% |
其他值 (8) | 73 |
headroom
实数 (ℝ)
高度相关
非重复值 | 8 |
---|---|
非重复值 (%) | 10.8% |
缺失 | 0 |
缺失值 (%) | 0.0% |
无穷大 | 0 |
无穷大 (%) | 0.0% |
均值 | 2.9932432 |
最小值 | 1.5 |
---|---|
最大值 | 5 |
零值 | 0 |
零值 (%) | 0.0% |
负值 | 0 |
负值 (%) | 0.0% |
内存大小 | 428.0 B |
分位数统计
最小值 | 1.5 |
---|---|
第 5 百分位数 | 1.825 |
Q1 | 2.5 |
中位数 | 3 |
Q3 | 3.5 |
第 95 百分位数 | 4.5 |
最大值 | 5 |
范围 | 3.5 |
四分位距 (IQR) | 1 |
描述性统计
标准差 | 0.84599477 |
---|---|
变异系数 (CV) | 0.28263482 |
峰度 | -0.76207393 |
均值 | 2.9932432 |
中位数绝对偏差 (MAD) | 0.5 |
偏度 | 0.14379646 |
总和 | 221.5 |
方差 | 0.71570712 |
单调性 | 非单调 |
固定大小分箱直方图 (bins=8)
值 | 计数 | 频率 (%) |
3.5 | 15 | |
2.5 | 14 | |
2 | 13 | |
3 | 13 | |
4 | 10 | |
4.5 | 4 | 5.4% |
1.5 | 4 | 5.4% |
5 | 1 | 1.4% |
值 | 计数 | 频率 (%) |
1.5 | 4 | 5.4% |
2 | 13 | |
2.5 | 14 | |
3 | 13 | |
3.5 | 15 | |
4 | 10 | |
4.5 | 4 | 5.4% |
5 | 1 | 1.4% |
值 | 计数 | 频率 (%) |
5 | 1 | 1.4% |
4.5 | 4 | 5.4% |
4 | 10 | |
3.5 | 15 | |
3 | 13 | |
2.5 | 14 | |
2 | 13 | |
1.5 | 4 | 5.4% |
trunk
实数 (ℝ)
高度相关
非重复值 | 18 |
---|---|
非重复值 (%) | 24.3% |
缺失 | 0 |
缺失值 (%) | 0.0% |
无穷大 | 0 |
无穷大 (%) | 0.0% |
均值 | 13.756757 |
最小值 | 5 |
---|---|
最大值 | 23 |
零值 | 0 |
零值 (%) | 0.0% |
负值 | 0 |
负值 (%) | 0.0% |
内存大小 | 280.0 B |
分位数统计
最小值 | 5 |
---|---|
第 5 百分位数 | 7 |
Q1 | 10.25 |
中位数 | 14 |
Q3 | 16.75 |
第 95 百分位数 | 20.35 |
最大值 | 23 |
范围 | 18 |
四分位距 (IQR) | 6.5 |
描述性统计
标准差 | 4.2774042 |
---|---|
变异系数 (CV) | 0.31093115 |
峰度 | -0.77963931 |
均值 | 13.756757 |
中位数绝对偏差 (MAD) | 3 |
偏度 | 0.029811133 |
总和 | 1018 |
方差 | 18.296187 |
单调性 | 非单调 |
固定大小分箱直方图 (bins=18)
值 | 计数 | 频率 (%) |
16 | 12 | |
11 | 8 | |
17 | 8 | |
20 | 6 | |
15 | 5 | 6.8% |
10 | 5 | 6.8% |
8 | 5 | 6.8% |
14 | 4 | 5.4% |
9 | 4 | 5.4% |
13 | 4 | 5.4% |
其他值 (8) | 13 |
值 | 计数 | 频率 (%) |
5 | 1 | 1.4% |
6 | 1 | 1.4% |
7 | 3 | 4.1% |
8 | 5 | |
9 | 4 | |
10 | 5 | |
11 | 8 | |
12 | 3 | 4.1% |
13 | 4 | |
14 | 4 |
值 | 计数 | 频率 (%) |
23 | 1 | 1.4% |
22 | 1 | 1.4% |
21 | 2 | 2.7% |
20 | 6 | |
18 | 1 | 1.4% |
17 | 8 | |
16 | 12 | |
15 | 5 | |
14 | 4 | 5.4% |
13 | 4 | 5.4% |
weight
实数 (ℝ)
高度相关
非重复值 | 64 |
---|---|
非重复值 (%) | 86.5% |
缺失 | 0 |
缺失值 (%) | 0.0% |
无穷大 | 0 |
无穷大 (%) | 0.0% |
均值 | 3019.4595 |
最小值 | 1760 |
---|---|
最大值 | 4840 |
零值 | 0 |
零值 (%) | 0.0% |
负值 | 0 |
负值 (%) | 0.0% |
内存大小 | 280.0 B |
分位数统计
最小值 | 1760 |
---|---|
第 5 百分位数 | 1895 |
Q1 | 2250 |
中位数 | 3190 |
Q3 | 3600 |
第 95 百分位数 | 4186 |
最大值 | 4840 |
范围 | 3080 |
四分位距 (IQR) | 1350 |
描述性统计
标准差 | 777.19357 |
---|---|
变异系数 (CV) | 0.25739493 |
峰度 | -0.85851775 |
均值 | 3019.4595 |
中位数绝对偏差 (MAD) | 550 |
偏度 | 0.15119863 |
总和 | 223440 |
方差 | 604029.84 |
单调性 | 非单调 |
固定大小分箱直方图 (bins=50)
值 | 计数 | 频率 (%) |
3690 | 2 | 2.7% |
1800 | 2 | 2.7% |
3370 | 2 | 2.7% |
4060 | 2 | 2.7% |
3600 | 2 | 2.7% |
2750 | 2 | 2.7% |
2650 | 2 | 2.7% |
2830 | 2 | 2.7% |
2200 | 2 | 2.7% |
3420 | 2 | 2.7% |
其他值 (54) | 54 |
值 | 计数 | 频率 (%) |
1760 | 1 | |
1800 | 2 | |
1830 | 1 | |
1930 | 1 | |
1980 | 1 | |
1990 | 1 | |
2020 | 1 | |
2040 | 1 | |
2050 | 1 | |
2070 | 1 |
值 | 计数 | 频率 (%) |
4840 | 1 | |
4720 | 1 | |
4330 | 1 | |
4290 | 1 | |
4130 | 1 | |
4080 | 1 | |
4060 | 2 | |
4030 | 1 | |
3900 | 1 | |
3880 | 1 |
length
实数 (ℝ)
高度相关
非重复值 | 47 |
---|---|
非重复值 (%) | 63.5% |
缺失 | 0 |
缺失值 (%) | 0.0% |
无穷大 | 0 |
无穷大 (%) | 0.0% |
均值 | 187.93243 |
最小值 | 142 |
---|---|
最大值 | 233 |
零值 | 0 |
零值 (%) | 0.0% |
负值 | 0 |
负值 (%) | 0.0% |
内存大小 | 280.0 B |
分位数统计
最小值 | 142 |
---|---|
第 5 百分位数 | 154.65 |
Q1 | 170 |
中位数 | 192.5 |
Q3 | 203.75 |
第 95 百分位数 | 221 |
最大值 | 233 |
范围 | 91 |
四分位距 (IQR) | 33.75 |
描述性统计
标准差 | 22.26634 |
---|---|
变异系数 (CV) | 0.11848056 |
峰度 | -0.94081772 |
均值 | 187.93243 |
中位数绝对偏差 (MAD) | 19 |
偏度 | -0.041827224 |
总和 | 13907 |
方差 | 495.78989 |
单调性 | 非单调 |
固定大小分箱直方图 (bins=47)
值 | 计数 | 频率 (%) |
170 | 4 | 5.4% |
200 | 4 | 5.4% |
198 | 4 | 5.4% |
201 | 3 | 4.1% |
165 | 3 | 4.1% |
206 | 3 | 4.1% |
179 | 3 | 4.1% |
193 | 2 | 2.7% |
163 | 2 | 2.7% |
155 | 2 | 2.7% |
其他值 (37) | 44 |
值 | 计数 | 频率 (%) |
142 | 1 | |
147 | 1 | |
149 | 1 | |
154 | 1 | |
155 | 2 | |
156 | 1 | |
157 | 1 | |
161 | 1 | |
163 | 2 | |
164 | 1 |
值 | 计数 | 频率 (%) |
233 | 1 | |
230 | 1 | |
222 | 1 | |
221 | 2 | |
220 | 2 | |
218 | 2 | |
217 | 1 | |
214 | 1 | |
212 | 2 | |
207 | 1 |
turn
实数 (ℝ)
高度相关
非重复值 | 18 |
---|---|
非重复值 (%) | 24.3% |
缺失 | 0 |
缺失值 (%) | 0.0% |
无穷大 | 0 |
无穷大 (%) | 0.0% |
均值 | 39.648649 |
最小值 | 31 |
---|---|
最大值 | 51 |
零值 | 0 |
零值 (%) | 0.0% |
负值 | 0 |
负值 (%) | 0.0% |
内存大小 | 280.0 B |
分位数统计
最小值 | 31 |
---|---|
第 5 百分位数 | 33.65 |
Q1 | 36 |
中位数 | 40 |
Q3 | 43 |
第 95 百分位数 | 46 |
最大值 | 51 |
范围 | 20 |
四分位距 (IQR) | 7 |
描述性统计
标准差 | 4.3993537 |
---|---|
变异系数 (CV) | 0.11095848 |
峰度 | -0.73957736 |
均值 | 39.648649 |
中位数绝对偏差 (MAD) | 3.5 |
偏度 | 0.12640268 |
总和 | 2934 |
方差 | 19.354313 |
单调性 | 非单调 |
固定大小分箱直方图 (bins=18)
值 | 计数 | 频率 (%) |
43 | 12 | |
36 | 9 | |
42 | 7 | |
40 | 6 | |
35 | 6 | |
34 | 6 | |
37 | 4 | 5.4% |
41 | 4 | 5.4% |
44 | 3 | 4.1% |
45 | 3 | 4.1% |
其他值 (8) | 14 |
值 | 计数 | 频率 (%) |
31 | 1 | 1.4% |
32 | 1 | 1.4% |
33 | 2 | 2.7% |
34 | 6 | |
35 | 6 | |
36 | 9 | |
37 | 4 | |
38 | 3 | 4.1% |
39 | 1 | 1.4% |
40 | 6 |
值 | 计数 | 频率 (%) |
51 | 1 | 1.4% |
48 | 2 | 2.7% |
46 | 3 | 4.1% |
45 | 3 | 4.1% |
44 | 3 | 4.1% |
43 | 12 | |
42 | 7 | |
41 | 4 | 5.4% |
40 | 6 | |
39 | 1 | 1.4% |
displacement
实数 (ℝ)
高度相关
非重复值 | 31 |
---|---|
非重复值 (%) | 41.9% |
缺失 | 0 |
缺失值 (%) | 0.0% |
无穷大 | 0 |
无穷大 (%) | 0.0% |
均值 | 197.2973 |
最小值 | 79 |
---|---|
最大值 | 425 |
零值 | 0 |
零值 (%) | 0.0% |
负值 | 0 |
负值 (%) | 0.0% |
内存大小 | 280.0 B |
分位数统计
最小值 | 79 |
---|---|
第 5 百分位数 | 87.95 |
Q1 | 119 |
中位数 | 196 |
Q3 | 245.25 |
第 95 百分位数 | 350 |
最大值 | 425 |
范围 | 346 |
四分位距 (IQR) | 126.25 |
描述性统计
标准差 | 91.837219 |
---|---|
变异系数 (CV) | 0.46547632 |
峰度 | -0.58308176 |
均值 | 197.2973 |
中位数绝对偏差 (MAD) | 75 |
偏度 | 0.60396873 |
总和 | 14600 |
方差 | 8434.0748 |
单调性 | 非单调 |
固定大小分箱直方图 (bins=31)
值 | 计数 | 频率 (%) |
231 | 13 | |
350 | 5 | 6.8% |
97 | 5 | 6.8% |
302 | 4 | 5.4% |
140 | 3 | 4.1% |
151 | 3 | 4.1% |
121 | 3 | 4.1% |
250 | 3 | 4.1% |
119 | 3 | 4.1% |
98 | 2 | 2.7% |
其他值 (21) | 30 |
值 | 计数 | 频率 (%) |
79 | 1 | 1.4% |
85 | 1 | 1.4% |
86 | 2 | 2.7% |
89 | 1 | 1.4% |
90 | 1 | 1.4% |
91 | 1 | 1.4% |
97 | 5 | |
98 | 2 | 2.7% |
105 | 2 | 2.7% |
107 | 1 | 1.4% |
值 | 计数 | 频率 (%) |
425 | 1 | 1.4% |
400 | 2 | 2.7% |
350 | 5 | 6.8% |
318 | 2 | 2.7% |
304 | 1 | 1.4% |
302 | 4 | 5.4% |
258 | 1 | 1.4% |
250 | 3 | 4.1% |
231 | 13 | |
225 | 2 | 2.7% |
gear_ratio
实数 (ℝ)
高度相关
非重复值 | 36 |
---|---|
非重复值 (%) | 48.6% |
缺失 | 0 |
缺失值 (%) | 0.0% |
无穷大 | 0 |
无穷大 (%) | 0.0% |
均值 | 3.0148649 |
最小值 | 2.1900001 |
---|---|
最大值 | 3.8900001 |
零值 | 0 |
零值 (%) | 0.0% |
负值 | 0 |
负值 (%) | 0.0% |
内存大小 | 428.0 B |
分位数统计
最小值 | 2.1900001 |
---|---|
第 5 百分位数 | 2.3645 |
Q1 | 2.73 |
中位数 | 2.955 |
Q3 | 3.3524999 |
第 95 百分位数 | 3.78 |
最大值 | 3.8900001 |
范围 | 1.7 |
四分位距 (IQR) | 0.62249988 |
描述性统计
标准差 | 0.45628712 |
---|---|
变异系数 (CV) | 0.15134579 |
峰度 | -0.87628722 |
均值 | 3.0148649 |
中位数绝对偏差 (MAD) | 0.2650001 |
偏度 | 0.22372657 |
总和 | 223.1 |
方差 | 0.20819794 |
单调性 | 非单调 |
固定大小分箱直方图 (bins=36)
值 | 计数 | 频率 (%) |
2.730000019 | 9 | 12.2% |
2.930000067 | 8 | 10.8% |
3.079999924 | 7 | 9.5% |
2.470000029 | 5 | 6.8% |
3.049999952 | 3 | 4.1% |
3.779999971 | 3 | 4.1% |
3.539999962 | 3 | 4.1% |
2.410000086 | 3 | 4.1% |
3.369999886 | 2 | 2.7% |
3.579999924 | 2 | 2.7% |
其他值 (26) | 29 |
值 | 计数 | 频率 (%) |
2.190000057 | 1 | 1.4% |
2.24000001 | 1 | 1.4% |
2.25999999 | 1 | 1.4% |
2.279999971 | 1 | 1.4% |
2.410000086 | 3 | 4.1% |
2.430000067 | 1 | 1.4% |
2.470000029 | 5 | |
2.529999971 | 1 | 1.4% |
2.559999943 | 2 | 2.7% |
2.730000019 | 9 |
值 | 计数 | 频率 (%) |
3.890000105 | 1 | 1.4% |
3.809999943 | 1 | 1.4% |
3.779999971 | 3 | |
3.74000001 | 1 | 1.4% |
3.730000019 | 1 | 1.4% |
3.720000029 | 1 | 1.4% |
3.700000048 | 2 | |
3.640000105 | 1 | 1.4% |
3.579999924 | 2 | |
3.549999952 | 1 | 1.4% |
常见值
值 | 计数 | 频率 (%) |
国产 | 52 | |
进口 | 22 |
长度
类别长度直方图
常见值 (图示)
值 | 计数 | 频率 (%) |
domestic | 52 | |
foreign | 22 |
最常出现的字符
值 | 计数 | 频率 (%) |
o | 74 | |
e | 74 | |
i | 74 | |
D | 52 | |
m | 52 | |
s | 52 | |
t | 52 | |
c | 52 | |
F | 22 | 3.9% |
r | 22 | 3.9% |
其他值 (2) | 44 |
最常出现的类别
值 | 计数 | 频率 (%) |
(未知) | 570 |
每类别最常出现的字符
(未知)
值 | 计数 | 频率 (%) |
o | 74 | |
e | 74 | |
i | 74 | |
D | 52 | |
m | 52 | |
s | 52 | |
t | 52 | |
c | 52 | |
F | 22 | 3.9% |
r | 22 | 3.9% |
其他值 (2) | 44 |
最常出现的脚本
值 | 计数 | 频率 (%) |
(未知) | 570 |
每脚本最常出现的字符
(未知)
值 | 计数 | 频率 (%) |
o | 74 | |
e | 74 | |
i | 74 | |
D | 52 | |
m | 52 | |
s | 52 | |
t | 52 | |
c | 52 | |
F | 22 | 3.9% |
r | 22 | 3.9% |
其他值 (2) | 44 |
最常出现的块
值 | 计数 | 频率 (%) |
(未知) | 570 |
每块最常出现的字符
(未知)
值 | 计数 | 频率 (%) |
o | 74 | |
e | 74 | |
i | 74 | |
D | 52 | |
m | 52 | |
s | 52 | |
t | 52 | |
c | 52 | |
F | 22 | 3.9% |
r | 22 | 3.9% |
其他值 (2) | 44 |
交互
相关性
displacement | foreign | gear_ratio | headroom | length | mpg | price | rep78 | trunk | turn | weight | |
---|---|---|---|---|---|---|---|---|---|---|---|
displacement | 1.000 | 0.635 | -0.855 | 0.478 | 0.852 | -0.771 | 0.374 | 0.229 | 0.577 | 0.779 | 0.905 |
foreign | 0.635 | 1.000 | 0.658 | 0.451 | 0.591 | 0.295 | 0.000 | 0.584 | 0.369 | 0.657 | 0.541 |
gear_ratio | -0.855 | 0.658 | 1.000 | -0.384 | -0.706 | 0.610 | -0.253 | 0.210 | -0.509 | -0.654 | -0.753 |
headroom | 0.478 | 0.451 | -0.384 | 1.000 | 0.532 | -0.487 | 0.097 | 0.286 | 0.677 | 0.450 | 0.528 |
length | 0.852 | 0.591 | -0.706 | 0.532 | 1.000 | -0.831 | 0.487 | 0.274 | 0.719 | 0.882 | 0.949 |
mpg | -0.771 | 0.295 | 0.610 | -0.487 | -0.831 | 1.000 | -0.542 | 0.220 | -0.650 | -0.758 | -0.858 |
price | 0.374 | 0.000 | -0.253 | 0.097 | 0.487 | -0.542 | 1.000 | 0.000 | 0.400 | 0.306 | 0.487 |
rep78 | 0.229 | 0.584 | 0.210 | 0.286 | 0.274 | 0.220 | 0.000 | 1.000 | 0.202 | 0.362 | 0.245 |
trunk | 0.577 | 0.369 | -0.509 | 0.677 | 0.719 | -0.650 | 0.400 | 0.202 | 1.000 | 0.620 | 0.656 |
turn | 0.779 | 0.657 | -0.654 | 0.450 | 0.882 | -0.758 | 0.306 | 0.362 | 0.620 | 1.000 | 0.860 |
weight | 0.905 | 0.541 | -0.753 | 0.528 | 0.949 | -0.858 | 0.487 | 0.245 | 0.656 | 0.860 | 1.000 |
缺失值
按列显示空值情况的简单可视化。
空值矩阵是一种数据密集型显示,可以让你快速直观地找出数据完整性中的模式。
样本
make | price | mpg | rep78 | headroom | trunk | weight | length | turn | displacement | gear_ratio | foreign | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | AMC Concord | 4099 | 22 | 平均 | 2.5 | 11 | 2930 | 186 | 40 | 121 | 3.58 | 国产 |
1 | AMC Pacer | 4749 | 17 | 平均 | 3.0 | 11 | 3350 | 173 | 40 | 258 | 2.53 | 国产 |
2 | AMC Spirit | 3799 | 22 | NaN | 3.0 | 12 | 2640 | 168 | 35 | 121 | 3.08 | 国产 |
3 | Buick Century | 4816 | 20 | 平均 | 4.5 | 16 | 3250 | 196 | 40 | 196 | 2.93 | 国产 |
4 | Buick Electra | 7827 | 15 | 好 | 4.0 | 20 | 4080 | 222 | 43 | 350 | 2.41 | 国产 |
5 | Buick LeSabre | 5788 | 18 | 平均 | 4.0 | 21 | 3670 | 218 | 43 | 231 | 2.73 | 国产 |
6 | Buick Opel | 4453 | 26 | NaN | 3.0 | 10 | 2230 | 170 | 34 | 304 | 2.87 | 国产 |
7 | Buick Regal | 5189 | 20 | 平均 | 2.0 | 16 | 3280 | 200 | 42 | 196 | 2.93 | 国产 |
8 | Buick Riviera | 10372 | 16 | 平均 | 3.5 | 17 | 3880 | 207 | 43 | 231 | 2.93 | 国产 |
9 | Buick Skylark | 4082 | 19 | 平均 | 3.5 | 13 | 3400 | 200 | 42 | 231 | 3.08 | 国产 |
make | price | mpg | rep78 | headroom | trunk | weight | length | turn | displacement | gear_ratio | foreign | |
---|---|---|---|---|---|---|---|---|---|---|---|---|
64 | Renault Le Car | 3895 | 26 | 平均 | 3.0 | 10 | 1830 | 142 | 34 | 79 | 3.72 | 进口 |
65 | Subaru | 3798 | 35 | 优秀 | 2.5 | 11 | 2050 | 164 | 36 | 97 | 3.81 | 进口 |
66 | Toyota Celica | 5899 | 18 | 优秀 | 2.5 | 14 | 2410 | 174 | 36 | 134 | 3.06 | 进口 |
67 | Toyota Corolla | 3748 | 31 | 优秀 | 3.0 | 9 | 2200 | 165 | 35 | 97 | 3.21 | 进口 |
68 | Toyota Corona | 5719 | 18 | 优秀 | 2.0 | 11 | 2670 | 175 | 36 | 134 | 3.05 | 进口 |
69 | VW Dasher | 7140 | 23 | 好 | 2.5 | 12 | 2160 | 172 | 36 | 97 | 3.74 | 进口 |
70 | VW Diesel | 5397 | 41 | 优秀 | 3.0 | 15 | 2040 | 155 | 35 | 90 | 3.78 | 进口 |
71 | VW Rabbit | 4697 | 25 | 好 | 3.0 | 15 | 1930 | 155 | 35 | 89 | 3.78 | 进口 |
72 | VW Scirocco | 6850 | 25 | 好 | 2.0 | 16 | 1990 | 156 | 36 | 97 | 3.78 | 进口 |
73 | Volvo 260 | 11995 | 17 | 优秀 | 2.5 | 14 | 3170 | 193 | 37 | 163 | 2.98 | 进口 |