概览
由 YData 为您呈现
数据集统计信息
变量数量 | 15 |
---|---|
观测值数量 | 45726 |
缺失单元格 | 29682 |
缺失单元格 (%) | 4.3% |
重复行 | 10 |
重复行 (%) | < 0.1% |
内存总大小 | 24.7 MiB |
平均记录内存大小 | 566.8 B |
变量类型
文本 | 3 |
---|---|
数值 | 5 |
分类 | 4 |
日期时间 | 1 |
布尔值 | 1 |
不支持 | 1 |
警告
source 具有常量值 "NASA" | 常量 |
数据集有 10 个 (< 0.1%) 重复行 | 重复项 |
reclat 与 reclat_city 以及 1 个其他字段 整体高度相关 | 高相关性 |
reclat_city 与 reclat 以及 1 个其他字段 整体高度相关 | 高相关性 |
reclong 与 reclat 以及 1 个其他字段 整体高度相关 | 高相关性 |
nametype 高度不均衡 (98.2%) | 不均衡 |
fall 高度不均衡 (83.4%) | 不均衡 |
reclat 有 7315 个 (16.0%) 缺失值 | 缺失 |
reclong 有 7315 个 (16.0%) 缺失值 | 缺失 |
GeoLocation 有 7315 个 (16.0%) 缺失值 | 缺失 |
reclat_city 有 7315 个 (16.0%) 缺失值 | 缺失 |
mass (g) 高度偏斜 (γ1 = 76.91847245) | 偏斜 |
unhashable 是一种不支持的类型,请检查是否需要清洗或进一步分析 | 不支持 |
reclat 有 6438 个 (14.1%) 零值 | 零值 |
reclong 有 6214 个 (13.6%) 零值 | 零值 |
重现
分析开始 | 2025-03-26 00:52:15.055819 |
---|---|
分析完成 | 2025-03-26 00:52:18.767248 |
持续时间 | 3.71 秒 |
软件版本 | ydata-profiling v0.0.dev0 |
下载配置 | config.json |
变量
name
文本
离散值 | 45716 |
---|---|
离散值 (%) | > 99.9% |
缺失 | 0 |
缺失 (%) | 0.0% |
内存大小 | 3.3 MiB |
值 | 计数 | 频率 (%) |
yamato | 7269 | 5.7% |
range | 6575 | 5.2% |
africa | 4502 | 3.6% |
northwest | 4499 | 3.5% |
hills | 3995 | 3.2% |
queen | 3445 | 2.7% |
alexandra | 3444 | 2.7% |
mountains | 3004 | 2.4% |
al | 2663 | 2.1% |
grove | 2496 | 2.0% |
其他值 (37726) | 84860 |
最常出现的字符
值 | 计数 | 频率 (%) |
81032 | 10.0% | |
a | 72715 | 8.9% |
e | 48167 | 5.9% |
n | 38392 | 4.7% |
0 | 34943 | 4.3% |
r | 33097 | 4.1% |
i | 32658 | 4.0% |
l | 31873 | 3.9% |
t | 30898 | 3.8% |
o | 30428 | 3.7% |
其他值 (86) | 378919 |
最常出现的类别
值 | 计数 | 频率 (%) |
(未知) | 813122 |
每个类别中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
81032 | 10.0% | |
a | 72715 | 8.9% |
e | 48167 | 5.9% |
n | 38392 | 4.7% |
0 | 34943 | 4.3% |
r | 33097 | 4.1% |
i | 32658 | 4.0% |
l | 31873 | 3.9% |
t | 30898 | 3.8% |
o | 30428 | 3.7% |
其他值 (86) | 378919 |
最常出现的脚本
值 | 计数 | 频率 (%) |
(未知) | 813122 |
每个脚本中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
81032 | 10.0% | |
a | 72715 | 8.9% |
e | 48167 | 5.9% |
n | 38392 | 4.7% |
0 | 34943 | 4.3% |
r | 33097 | 4.1% |
i | 32658 | 4.0% |
l | 31873 | 3.9% |
t | 30898 | 3.8% |
o | 30428 | 3.7% |
其他值 (86) | 378919 |
最常出现的块
值 | 计数 | 频率 (%) |
(未知) | 813122 |
每个块中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
81032 | 10.0% | |
a | 72715 | 8.9% |
e | 48167 | 5.9% |
n | 38392 | 4.7% |
0 | 34943 | 4.3% |
r | 33097 | 4.1% |
i | 32658 | 4.0% |
l | 31873 | 3.9% |
t | 30898 | 3.8% |
o | 30428 | 3.7% |
其他值 (86) | 378919 |
id
实数 (ℝ)
离散值 | 45716 |
---|---|
离散值 (%) | > 99.9% |
缺失 | 0 |
缺失 (%) | 0.0% |
无穷大 | 0 |
无穷大 (%) | 0.0% |
均值 | 26883.906 |
最小值 | 1 |
---|---|
最大值 | 57458 |
零值 | 0 |
零值 (%) | 0.0% |
负值 | 0 |
负值 (%) | 0.0% |
内存大小 | 357.4 KiB |
分位数统计
最小值 | 1 |
---|---|
第 5 百分位数 | 2388.75 |
Q1 | 12681.25 |
中位数 | 24256.5 |
Q3 | 40653.5 |
第 95 百分位数 | 54890.75 |
最大值 | 57458 |
范围 | 57457 |
四分位距 (IQR) | 27972.25 |
描述性统计
标准差 | 16863.446 |
---|---|
变异系数 (CV) | 0.62726917 |
峰度 | -1.1601308 |
均值 | 26883.906 |
中位数绝对偏差 (MAD) | 13264 |
偏度 | 0.26653007 |
总和 | 1.2292935 × 109 |
方差 | 2.843758 × 108 |
单调性 | 非单调 |
固定宽度直方图 (bins=50)
值 | 计数 | 频率 (%) |
1 | 2 | < 0.1% |
2 | 2 | < 0.1% |
6 | 2 | < 0.1% |
10 | 2 | < 0.1% |
370 | 2 | < 0.1% |
379 | 2 | < 0.1% |
390 | 2 | < 0.1% |
392 | 2 | < 0.1% |
398 | 2 | < 0.1% |
417 | 2 | < 0.1% |
其他值 (45706) | 45706 |
值 | 计数 | 频率 (%) |
1 | 2 | |
2 | 2 | |
4 | 1 | |
5 | 1 | |
6 | 2 | |
7 | 1 | |
8 | 1 | |
9 | 1 | |
10 | 2 | |
11 | 1 |
值 | 计数 | 频率 (%) |
57458 | 1 | |
57457 | 1 | |
57456 | 1 | |
57455 | 1 | |
57454 | 1 | |
57453 | 1 | |
57436 | 1 | |
57435 | 1 | |
57434 | 1 | |
57433 | 1 |
常见值
值 | 计数 | 频率 (%) |
Valid | 45651 | |
Relict | 75 | 0.2% |
长度
类别长度直方图
常见值 (图)
值 | 计数 | 频率 (%) |
valid | 45651 | |
relict | 75 | 0.2% |
最常出现的字符
值 | 计数 | 频率 (%) |
l | 45726 | |
i | 45726 | |
V | 45651 | |
a | 45651 | |
d | 45651 | |
R | 75 | < 0.1% |
e | 75 | < 0.1% |
c | 75 | < 0.1% |
t | 75 | < 0.1% |
最常出现的类别
值 | 计数 | 频率 (%) |
(未知) | 228705 |
每个类别中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
l | 45726 | |
i | 45726 | |
V | 45651 | |
a | 45651 | |
d | 45651 | |
R | 75 | < 0.1% |
e | 75 | < 0.1% |
c | 75 | < 0.1% |
t | 75 | < 0.1% |
最常出现的脚本
值 | 计数 | 频率 (%) |
(未知) | 228705 |
每个脚本中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
l | 45726 | |
i | 45726 | |
V | 45651 | |
a | 45651 | |
d | 45651 | |
R | 75 | < 0.1% |
e | 75 | < 0.1% |
c | 75 | < 0.1% |
t | 75 | < 0.1% |
最常出现的块
值 | 计数 | 频率 (%) |
(未知) | 228705 |
每个块中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
l | 45726 | |
i | 45726 | |
V | 45651 | |
a | 45651 | |
d | 45651 | |
R | 75 | < 0.1% |
e | 75 | < 0.1% |
c | 75 | < 0.1% |
t | 75 | < 0.1% |
recclass
文本
离散值 | 466 |
---|---|
离散值 (%) | 1.0% |
缺失 | 0 |
缺失 (%) | 0.0% |
内存大小 | 2.6 MiB |
值 | 计数 | 频率 (%) |
l6 | 8341 | |
h5 | 7165 | |
l5 | 4818 | |
h6 | 4530 | |
h4 | 4223 | 8.9% |
ll5 | 2766 | 5.8% |
ll6 | 2046 | 4.3% |
l4 | 1256 | 2.7% |
iron | 1070 | 2.3% |
h4/5 | 428 | 0.9% |
其他值 (434) | 10712 |
最常出现的字符
值 | 计数 | 频率 (%) |
L | 28467 | |
H | 18396 | |
5 | 16419 | |
6 | 16132 | |
4 | 6930 | 5.0% |
e | 3972 | 2.8% |
i | 3834 | 2.7% |
r | 3648 | 2.6% |
t | 3327 | 2.4% |
3 | 3278 | 2.3% |
其他值 (52) | 35177 |
最常出现的类别
值 | 计数 | 频率 (%) |
(未知) | 139580 |
每个类别中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
L | 28467 | |
H | 18396 | |
5 | 16419 | |
6 | 16132 | |
4 | 6930 | 5.0% |
e | 3972 | 2.8% |
i | 3834 | 2.7% |
r | 3648 | 2.6% |
t | 3327 | 2.4% |
3 | 3278 | 2.3% |
其他值 (52) | 35177 |
最常出现的脚本
值 | 计数 | 频率 (%) |
(未知) | 139580 |
每个脚本中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
L | 28467 | |
H | 18396 | |
5 | 16419 | |
6 | 16132 | |
4 | 6930 | 5.0% |
e | 3972 | 2.8% |
i | 3834 | 2.7% |
r | 3648 | 2.6% |
t | 3327 | 2.4% |
3 | 3278 | 2.3% |
其他值 (52) | 35177 |
最常出现的块
值 | 计数 | 频率 (%) |
(未知) | 139580 |
每个块中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
L | 28467 | |
H | 18396 | |
5 | 16419 | |
6 | 16132 | |
4 | 6930 | 5.0% |
e | 3972 | 2.8% |
i | 3834 | 2.7% |
r | 3648 | 2.6% |
t | 3327 | 2.4% |
3 | 3278 | 2.3% |
其他值 (52) | 35177 |
mass (g)
实数 (ℝ)
偏斜
离散值 | 12576 |
---|---|
离散值 (%) | 27.6% |
缺失 | 131 |
缺失 (%) | 0.3% |
无穷大 | 0 |
无穷大 (%) | 0.0% |
均值 | 13278.426 |
最小值 | 0 |
---|---|
最大值 | 60000000 |
零值 | 19 |
零值 (%) | < 0.1% |
负值 | 0 |
负值 (%) | 0.0% |
内存大小 | 357.4 KiB |
分位数统计
最小值 | 0 |
---|---|
第 5 百分位数 | 1.1 |
Q1 | 7.2 |
中位数 | 32.61 |
Q3 | 202.9 |
第 95 百分位数 | 4000 |
最大值 | 60000000 |
范围 | 60000000 |
四分位距 (IQR) | 195.7 |
描述性统计
标准差 | 574926.01 |
---|---|
变异系数 (CV) | 43.297752 |
峰度 | 6798.3984 |
均值 | 13278.426 |
中位数绝对偏差 (MAD) | 30.51 |
偏度 | 76.918472 |
总和 | 6.0542985 × 108 |
方差 | 3.3053992 × 1011 |
单调性 | 非单调 |
固定宽度直方图 (bins=50)
值 | 计数 | 频率 (%) |
1.3 | 171 | 0.4% |
1.2 | 140 | 0.3% |
1.4 | 138 | 0.3% |
2.1 | 130 | 0.3% |
2.4 | 126 | 0.3% |
1.6 | 120 | 0.3% |
0.5 | 119 | 0.3% |
1.1 | 116 | 0.3% |
3.8 | 114 | 0.2% |
1.5 | 111 | 0.2% |
其他值 (12566) | 44310 | |
(缺失) | 131 | 0.3% |
值 | 计数 | 频率 (%) |
0 | 19 | |
0.01 | 2 | < 0.1% |
0.013 | 1 | < 0.1% |
0.02 | 1 | < 0.1% |
0.03 | 1 | < 0.1% |
0.04 | 1 | < 0.1% |
0.05 | 1 | < 0.1% |
0.06 | 1 | < 0.1% |
0.07 | 3 | < 0.1% |
0.08 | 2 | < 0.1% |
值 | 计数 | 频率 (%) |
60000000 | 1 | |
58200000 | 1 | |
50000000 | 1 | |
30000000 | 1 | |
28000000 | 1 | |
26000000 | 1 | |
24300000 | 1 | |
24000000 | 1 | |
23000000 | 1 | |
22000000 | 1 |
常见值
值 | 计数 | 频率 (%) |
Found | 44609 | |
Fell | 1117 | 2.4% |
长度
类别长度直方图
常见值 (图)
值 | 计数 | 频率 (%) |
found | 44609 | |
fell | 1117 | 2.4% |
最常出现的字符
值 | 计数 | 频率 (%) |
F | 45726 | |
o | 44609 | |
u | 44609 | |
n | 44609 | |
d | 44609 | |
l | 2234 | 1.0% |
e | 1117 | 0.5% |
最常出现的类别
值 | 计数 | 频率 (%) |
(未知) | 227513 |
每个类别中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
F | 45726 | |
o | 44609 | |
u | 44609 | |
n | 44609 | |
d | 44609 | |
l | 2234 | 1.0% |
e | 1117 | 0.5% |
最常出现的脚本
值 | 计数 | 频率 (%) |
(未知) | 227513 |
每个脚本中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
F | 45726 | |
o | 44609 | |
u | 44609 | |
n | 44609 | |
d | 44609 | |
l | 2234 | 1.0% |
e | 1117 | 0.5% |
最常出现的块
值 | 计数 | 频率 (%) |
(未知) | 227513 |
每个块中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
F | 45726 | |
o | 44609 | |
u | 44609 | |
n | 44609 | |
d | 44609 | |
l | 2234 | 1.0% |
e | 1117 | 0.5% |
year
日期
离散值 | 265 |
---|---|
离散值 (%) | 0.6% |
缺失 | 291 |
缺失 (%) | 0.6% |
内存大小 | 357.4 KiB |
最小值 | 1970-01-01 00:00:00 |
---|---|
最大值 | 1970-01-01 00:00:00.000002 |
无效日期 | 0 |
无效日期 (%) | 0.0% |
固定宽度直方图 (bins=50)
reclat
实数 (ℝ)
高相关性 缺失 零值
离散值 | 12738 |
---|---|
离散值 (%) | 33.2% |
缺失 | 7315 |
缺失 (%) | 16.0% |
无穷大 | 0 |
无穷大 (%) | 0.0% |
均值 | -39.107095 |
最小值 | -87.36667 |
---|---|
最大值 | 81.16667 |
零值 | 6438 |
零值 (%) | 14.1% |
负值 | 23416 |
负值 (%) | 51.2% |
内存大小 | 357.4 KiB |
分位数统计
最小值 | -87.36667 |
---|---|
第 5 百分位数 | -84.35476 |
Q1 | -76.71377 |
中位数 | -71.5 |
Q3 | 0 |
第 95 百分位数 | 34.494325 |
最大值 | 81.16667 |
范围 | 168.53334 |
四分位距 (IQR) | 76.71377 |
描述性统计
标准差 | 46.386011 |
---|---|
变异系数 (CV) | -1.1861278 |
峰度 | -1.4768651 |
均值 | -39.107095 |
中位数绝对偏差 (MAD) | 12.76459 |
偏度 | 0.49131573 |
总和 | -1502142.6 |
方差 | 2151.662 |
单调性 | 非单调 |
固定宽度直方图 (bins=50)
值 | 计数 | 频率 (%) |
0 | 6438 | 14.1% |
-71.5 | 4761 | 10.4% |
-84 | 3040 | 6.6% |
-72 | 1506 | 3.3% |
-79.68333 | 1130 | 2.5% |
-76.71667 | 680 | 1.5% |
-76.18333 | 539 | 1.2% |
-84.21667 | 263 | 0.6% |
-86.36667 | 226 | 0.5% |
-86.71667 | 217 | 0.5% |
其他值 (12728) | 19611 | |
(缺失) | 7315 | 16.0% |
值 | 计数 | 频率 (%) |
-87.36667 | 4 | < 0.1% |
-87.03333 | 3 | < 0.1% |
-86.93333 | 3 | < 0.1% |
-86.71667 | 217 | |
-86.56667 | 17 | < 0.1% |
-86.54488 | 1 | < 0.1% |
-86.5379 | 1 | < 0.1% |
-86.53734 | 1 | < 0.1% |
-86.53725 | 1 | < 0.1% |
-86.53035 | 1 | < 0.1% |
值 | 计数 | 频率 (%) |
81.16667 | 1 | |
76.53333 | 1 | |
76.13333 | 1 | |
72.88333 | 1 | |
72.68333 | 1 | |
70.73333 | 1 | |
70 | 1 | |
69.1 | 1 | |
68 | 1 | |
67.88333 | 1 |
reclong
实数 (ℝ)
高相关性 缺失 零值
离散值 | 14640 |
---|---|
离散值 (%) | 38.1% |
缺失 | 7315 |
缺失 (%) | 16.0% |
无穷大 | 0 |
无穷大 (%) | 0.0% |
均值 | 61.052594 |
最小值 | -165.43333 |
---|---|
最大值 | 354.47333 |
零值 | 6214 |
零值 (%) | 13.6% |
负值 | 4057 |
负值 (%) | 8.9% |
内存大小 | 357.4 KiB |
分位数统计
最小值 | -165.43333 |
---|---|
第 5 百分位数 | -90.427 |
Q1 | 0 |
中位数 | 35.66667 |
Q3 | 157.16667 |
第 95 百分位数 | 168 |
最大值 | 354.47333 |
范围 | 519.90666 |
四分位距 (IQR) | 157.16667 |
描述性统计
标准差 | 80.655258 |
---|---|
变异系数 (CV) | 1.3210783 |
峰度 | -0.73139356 |
均值 | 61.052594 |
中位数绝对偏差 (MAD) | 39.53972 |
偏度 | -0.17438133 |
总和 | 2345091.2 |
方差 | 6505.2706 |
单调性 | 非单调 |
固定宽度直方图 (bins=50)
值 | 计数 | 频率 (%) |
0 | 6214 | 13.6% |
35.66667 | 4985 | 10.9% |
168 | 3040 | 6.6% |
26 | 1506 | 3.3% |
159.75 | 657 | 1.4% |
159.66667 | 637 | 1.4% |
157.16667 | 542 | 1.2% |
155.75 | 473 | 1.0% |
160.5 | 263 | 0.6% |
-70 | 228 | 0.5% |
其他值 (14630) | 19866 | |
(缺失) | 7315 | 16.0% |
值 | 计数 | 频率 (%) |
-165.43333 | 9 | |
-165.11667 | 17 | |
-163.16667 | 1 | < 0.1% |
-162.55 | 1 | < 0.1% |
-157.86667 | 1 | < 0.1% |
-157.78333 | 1 | < 0.1% |
-149.5 | 4 | < 0.1% |
-148.55 | 2 | < 0.1% |
-148 | 3 | < 0.1% |
-146.26667 | 1 | < 0.1% |
值 | 计数 | 频率 (%) |
354.47333 | 1 | < 0.1% |
178.2 | 1 | < 0.1% |
178.08333 | 1 | < 0.1% |
175.73028 | 1 | < 0.1% |
175.13333 | 1 | < 0.1% |
175 | 185 | |
174.50043 | 1 | < 0.1% |
174.4 | 1 | < 0.1% |
172.7 | 1 | < 0.1% |
172.6 | 1 | < 0.1% |
缺失
离散值 | 17100 |
---|---|
离散值 (%) | 44.5% |
缺失 | 7315 |
缺失 (%) | 16.0% |
内存大小 | 2.9 MiB |
值 | 计数 | 频率 (%) |
0.0 | 12652 | 16.5% |
35.66667 | 4991 | 6.5% |
71.5 | 4761 | 6.2% |
84.0 | 3041 | 4.0% |
168.0 | 3040 | 4.0% |
26.0 | 1512 | 2.0% |
72.0 | 1506 | 2.0% |
79.68333 | 1130 | 1.5% |
76.71667 | 680 | 0.9% |
159.75 | 657 | 0.9% |
其他值 (26608) | 42852 |
最常出现的字符
值 | 计数 | 频率 (%) |
. | 76822 | |
6 | 67560 | 10.2% |
7 | 52499 | 7.9% |
0 | 49033 | 7.4% |
3 | 44771 | 6.7% |
1 | 44476 | 6.7% |
5 | 42757 | 6.4% |
( | 38411 | 5.8% |
38411 | 5.8% | |
) | 38411 | 5.8% |
其他值 (6) | 171544 |
最常出现的类别
值 | 计数 | 频率 (%) |
(未知) | 664695 |
每个类别中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
. | 76822 | |
6 | 67560 | 10.2% |
7 | 52499 | 7.9% |
0 | 49033 | 7.4% |
3 | 44771 | 6.7% |
1 | 44476 | 6.7% |
5 | 42757 | 6.4% |
( | 38411 | 5.8% |
38411 | 5.8% | |
) | 38411 | 5.8% |
其他值 (6) | 171544 |
最常出现的脚本
值 | 计数 | 频率 (%) |
(未知) | 664695 |
每个脚本中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
. | 76822 | |
6 | 67560 | 10.2% |
7 | 52499 | 7.9% |
0 | 49033 | 7.4% |
3 | 44771 | 6.7% |
1 | 44476 | 6.7% |
5 | 42757 | 6.4% |
( | 38411 | 5.8% |
38411 | 5.8% | |
) | 38411 | 5.8% |
其他值 (6) | 171544 |
最常出现的块
值 | 计数 | 频率 (%) |
(未知) | 664695 |
每个块中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
. | 76822 | |
6 | 67560 | 10.2% |
7 | 52499 | 7.9% |
0 | 49033 | 7.4% |
3 | 44771 | 6.7% |
1 | 44476 | 6.7% |
5 | 42757 | 6.4% |
( | 38411 | 5.8% |
38411 | 5.8% | |
) | 38411 | 5.8% |
其他值 (6) | 171544 |
常见值
值 | 计数 | 频率 (%) |
NASA | 45726 |
长度
类别长度直方图
常见值 (图)
值 | 计数 | 频率 (%) |
nasa | 45726 |
最常出现的字符
值 | 计数 | 频率 (%) |
A | 91452 | |
N | 45726 | |
S | 45726 |
最常出现的类别
值 | 计数 | 频率 (%) |
(未知) | 182904 |
每个类别中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
A | 91452 | |
N | 45726 | |
S | 45726 |
最常出现的脚本
值 | 计数 | 频率 (%) |
(未知) | 182904 |
每个脚本中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
A | 91452 | |
N | 45726 | |
S | 45726 |
最常出现的块
值 | 计数 | 频率 (%) |
(未知) | 182904 |
每个块中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
A | 91452 | |
N | 45726 | |
S | 45726 |
值 | 计数 | 频率 (%) |
True | 22934 | |
False | 22792 |
常见值
值 | 计数 | 频率 (%) |
A | 22889 | |
1 | 22837 |
长度
类别长度直方图
常见值 (图)
值 | 计数 | 频率 (%) |
a | 22889 | |
1 | 22837 |
最常出现的字符
值 | 计数 | 频率 (%) |
A | 22889 | |
1 | 22837 |
最常出现的类别
值 | 计数 | 频率 (%) |
(未知) | 45726 |
每个类别中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
A | 22889 | |
1 | 22837 |
最常出现的脚本
值 | 计数 | 频率 (%) |
(未知) | 45726 |
每个脚本中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
A | 22889 | |
1 | 22837 |
最常出现的块
值 | 计数 | 频率 (%) |
(未知) | 45726 |
每个块中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
A | 22889 | |
1 | 22837 |
unhashable
不支持
已拒绝 不支持
缺失 | 0 |
---|---|
缺失 (%) | 0.0% |
内存大小 | 3.1 MiB |
reclat_city
实数 (ℝ)
高相关性 缺失
离散值 | 38401 |
---|---|
离散值 (%) | > 99.9% |
缺失 | 7315 |
缺失 (%) | 16.0% |
无穷大 | 0 |
无穷大 (%) | 0.0% |
均值 | -39.153542 |
最小值 | -104.31717 |
---|---|
最大值 | 77.749011 |
零值 | 0 |
零值 (%) | 0.0% |
负值 | 26603 |
负值 (%) | 58.2% |
内存大小 | 357.4 KiB |
分位数统计
最小值 | -104.31717 |
---|---|
第 5 百分位数 | -87.871058 |
Q1 | -78.407752 |
中位数 | -68.975293 |
Q3 | 4.7886449 |
第 95 百分位数 | 35.42981 |
最大值 | 77.749011 |
范围 | 182.06618 |
四分位距 (IQR) | 83.196397 |
描述性统计
标准差 | 46.685687 |
---|---|
变异系数 (CV) | -1.1923745 |
峰度 | -1.446385 |
均值 | -39.153542 |
中位数绝对偏差 (MAD) | 17.255843 |
偏度 | 0.48160358 |
总和 | -1503926.7 |
方差 | 2179.5534 |
单调性 | 非单调 |
固定宽度直方图 (bins=50)
值 | 计数 | 频率 (%) |
50.51806008 | 2 | < 0.1% |
23.16596589 | 2 | < 0.1% |
-23.28864666 | 2 | < 0.1% |
36.5165896 | 2 | < 0.1% |
43.27957156 | 2 | < 0.1% |
49.60726921 | 2 | < 0.1% |
-32.5810219 | 2 | < 0.1% |
-29.65152821 | 2 | < 0.1% |
52.70663547 | 2 | < 0.1% |
52.01104434 | 2 | < 0.1% |
其他值 (38391) | 38391 | |
(缺失) | 7315 | 16.0% |
值 | 计数 | 频率 (%) |
-104.3171665 | 1 | |
-102.4312375 | 1 | |
-102.0868253 | 1 | |
-101.5556373 | 1 | |
-101.3269284 | 1 | |
-101.2084341 | 1 | |
-101.0146935 | 1 | |
-100.9191264 | 1 | |
-100.7856947 | 1 | |
-100.5751117 | 1 |
值 | 计数 | 频率 (%) |
77.74901083 | 1 | |
72.80622023 | 1 | |
72.75730423 | 1 | |
72.42607973 | 1 | |
72.25809595 | 1 | |
71.78938297 | 1 | |
71.42543169 | 1 | |
70.89755212 | 1 | |
70.53373183 | 1 | |
70.48523932 | 1 |
交互
相关性
boolean | fall | id | mass (g) | mixed | nametype | reclat | reclat_city | reclong | |
---|---|---|---|---|---|---|---|---|---|
boolean | 1.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.000 | 0.015 | 0.007 |
fall | 0.000 | 1.000 | 0.126 | 0.012 | 0.000 | 0.000 | 0.450 | 0.424 | 0.195 |
id | 0.000 | 0.126 | 1.000 | -0.142 | 0.009 | 0.130 | 0.261 | 0.219 | -0.316 |
mass (g) | 0.000 | 0.012 | -0.142 | 1.000 | 0.003 | 0.000 | 0.409 | 0.424 | -0.281 |
mixed | 0.000 | 0.000 | 0.009 | 0.003 | 1.000 | 0.000 | 0.013 | 0.000 | 0.000 |
nametype | 0.000 | 0.000 | 0.130 | 0.000 | 0.000 | 1.000 | 0.349 | 0.379 | 0.044 |
reclat | 0.000 | 0.450 | 0.261 | 0.409 | 0.013 | 0.349 | 1.000 | 0.943 | -0.650 |
reclat_city | 0.015 | 0.424 | 0.219 | 0.424 | 0.000 | 0.379 | 0.943 | 1.000 | -0.618 |
reclong | 0.007 | 0.195 | -0.316 | -0.281 | 0.000 | 0.044 | -0.650 | -0.618 | 1.000 |
缺失值
按列显示的简单空值可视化。
空值矩阵是一种数据密集型显示,可让您快速直观地找出数据完整性中的模式。
相关性热力图衡量空值相关性:一个变量的存在或缺失对另一个变量的存在的影响程度。
样本
name | id | nametype | recclass | mass (g) | fall | year | reclat | reclong | GeoLocation | source | boolean | mixed | unhashable | reclat_city | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | Aachen | 1 | Valid | L5 | 21.0 | Fell | 1970-01-01 00:00:00.000001880 | 50.77500 | 6.08333 | (50.775, 6.08333) | NASA | True | 1 | [1] | 50.518060 |
1 | Aarhus | 2 | Valid | H6 | 720.0 | Fell | 1970-01-01 00:00:00.000001951 | 56.18333 | 10.23333 | (56.18333, 10.23333) | NASA | False | A | [1] | 52.011044 |
2 | Abee | 6 | Valid | EH4 | 107000.0 | Fell | 1970-01-01 00:00:00.000001952 | 54.21667 | -113.00000 | (54.21667, -113.0) | NASA | False | 1 | [1] | 52.706635 |
3 | Acapulco | 10 | Valid | Acapulcoite | 1914.0 | Fell | 1970-01-01 00:00:00.000001976 | 16.88333 | -99.90000 | (16.88333, -99.9) | NASA | False | A | [1] | 23.165966 |
4 | Achiras | 370 | Valid | L6 | 780.0 | Fell | 1970-01-01 00:00:00.000001902 | -33.16667 | -64.95000 | (-33.16667, -64.95) | NASA | False | A | [1] | -23.288647 |
5 | Adhi Kot | 379 | Valid | EH4 | 4239.0 | Fell | 1970-01-01 00:00:00.000001919 | 32.10000 | 71.80000 | (32.1, 71.8) | NASA | True | 1 | [1] | 36.516590 |
6 | Adzhi-Bogdo (stone) | 390 | Valid | LL3-6 | 910.0 | Fell | 1970-01-01 00:00:00.000001949 | 44.83333 | 95.16667 | (44.83333, 95.16667) | NASA | True | 1 | [1] | 43.279572 |
7 | Agen | 392 | Valid | H5 | 30000.0 | Fell | 1970-01-01 00:00:00.000001814 | 44.21667 | 0.61667 | (44.21667, 0.61667) | NASA | False | A | [1] | 49.607269 |
8 | Aguada | 398 | Valid | L6 | 1620.0 | Fell | 1970-01-01 00:00:00.000001930 | -31.60000 | -65.23333 | (-31.6, -65.23333) | NASA | False | 1 | [1] | -32.581022 |
9 | Aguila Blanca | 417 | Valid | L | 1440.0 | Fell | 1970-01-01 00:00:00.000001920 | -30.86667 | -64.55000 | (-30.86667, -64.55) | NASA | False | A | [1] | -29.651528 |
name | id | nametype | recclass | mass (g) | fall | year | reclat | reclong | GeoLocation | source | boolean | mixed | unhashable | reclat_city | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
45716 | Aachen | 1 | Valid | L5 | 21.0 | Fell | 1970-01-01 00:00:00.000001880 | 50.77500 | 6.08333 | (50.775, 6.08333) | NASA | True | 1 | [1] | 50.518060 |
45717 | Aarhus | 2 | Valid | H6 | 720.0 | Fell | 1970-01-01 00:00:00.000001951 | 56.18333 | 10.23333 | (56.18333, 10.23333) | NASA | False | A | [1] | 52.011044 |
45718 | Abee | 6 | Valid | EH4 | 107000.0 | Fell | 1970-01-01 00:00:00.000001952 | 54.21667 | -113.00000 | (54.21667, -113.0) | NASA | False | 1 | [1] | 52.706635 |
45719 | Acapulco | 10 | Valid | Acapulcoite | 1914.0 | Fell | 1970-01-01 00:00:00.000001976 | 16.88333 | -99.90000 | (16.88333, -99.9) | NASA | False | A | [1] | 23.165966 |
45720 | Achiras | 370 | Valid | L6 | 780.0 | Fell | 1970-01-01 00:00:00.000001902 | -33.16667 | -64.95000 | (-33.16667, -64.95) | NASA | False | A | [1] | -23.288647 |
45721 | Adhi Kot | 379 | Valid | EH4 | 4239.0 | Fell | 1970-01-01 00:00:00.000001919 | 32.10000 | 71.80000 | (32.1, 71.8) | NASA | True | 1 | [1] | 36.516590 |
45722 | Adzhi-Bogdo (stone) | 390 | Valid | LL3-6 | 910.0 | Fell | 1970-01-01 00:00:00.000001949 | 44.83333 | 95.16667 | (44.83333, 95.16667) | NASA | True | 1 | [1] | 43.279572 |
45723 | Agen | 392 | Valid | H5 | 30000.0 | Fell | 1970-01-01 00:00:00.000001814 | 44.21667 | 0.61667 | (44.21667, 0.61667) | NASA | False | A | [1] | 49.607269 |
45724 | Aguada | 398 | Valid | L6 | 1620.0 | Fell | 1970-01-01 00:00:00.000001930 | -31.60000 | -65.23333 | (-31.6, -65.23333) | NASA | False | 1 | [1] | -32.581022 |
45725 | Aguila Blanca | 417 | Valid | L | 1440.0 | Fell | 1970-01-01 00:00:00.000001920 | -30.86667 | -64.55000 | (-30.86667, -64.55) | NASA | False | A | [1] | -29.651528 |
重复行
最常出现
name | id | nametype | recclass | mass (g) | fall | year | reclat | reclong | GeoLocation | source | boolean | mixed | reclat_city | # 重复项 | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | Aachen | 1 | Valid | L5 | 21.0 | Fell | 1970-01-01 00:00:00.000001880 | 50.77500 | 6.08333 | (50.775, 6.08333) | NASA | True | 1 | 50.518060 | 2 |
1 | Aarhus | 2 | Valid | H6 | 720.0 | Fell | 1970-01-01 00:00:00.000001951 | 56.18333 | 10.23333 | (56.18333, 10.23333) | NASA | False | A | 52.011044 | 2 |
2 | Abee | 6 | Valid | EH4 | 107000.0 | Fell | 1970-01-01 00:00:00.000001952 | 54.21667 | -113.00000 | (54.21667, -113.0) | NASA | False | 1 | 52.706635 | 2 |
3 | Acapulco | 10 | Valid | Acapulcoite | 1914.0 | Fell | 1970-01-01 00:00:00.000001976 | 16.88333 | -99.90000 | (16.88333, -99.9) | NASA | False | A | 23.165966 | 2 |
4 | Achiras | 370 | Valid | L6 | 780.0 | Fell | 1970-01-01 00:00:00.000001902 | -33.16667 | -64.95000 | (-33.16667, -64.95) | NASA | False | A | -23.288647 | 2 |
5 | Adhi Kot | 379 | Valid | EH4 | 4239.0 | Fell | 1970-01-01 00:00:00.000001919 | 32.10000 | 71.80000 | (32.1, 71.8) | NASA | True | 1 | 36.516590 | 2 |
6 | Adzhi-Bogdo (stone) | 390 | Valid | LL3-6 | 910.0 | Fell | 1970-01-01 00:00:00.000001949 | 44.83333 | 95.16667 | (44.83333, 95.16667) | NASA | True | 1 | 43.279572 | 2 |
7 | Agen | 392 | Valid | H5 | 30000.0 | Fell | 1970-01-01 00:00:00.000001814 | 44.21667 | 0.61667 | (44.21667, 0.61667) | NASA | False | A | 49.607269 | 2 |
8 | Aguada | 398 | Valid | L6 | 1620.0 | Fell | 1970-01-01 00:00:00.000001930 | -31.60000 | -65.23333 | (-31.6, -65.23333) | NASA | False | 1 | -32.581022 | 2 |
9 | Aguila Blanca | 417 | Valid | L | 1440.0 | Fell | 1970-01-01 00:00:00.000001920 | -30.86667 | -64.55000 | (-30.86667, -64.55) | NASA | False | A | -29.651528 | 2 |