概览

YData 为您呈现

数据集统计信息

变量数量15
观测值数量45726
缺失单元格29682
缺失单元格 (%)4.3%
重复行10
重复行 (%)< 0.1%
内存总大小24.7 MiB
平均记录内存大小566.8 B

变量类型

文本3
数值5
分类4
日期时间1
布尔值1
不支持1

警告

source 具有常量值 "NASA"常量
数据集有 10 个 (< 0.1%) 重复行重复项
reclatreclat_city 以及 1 个其他字段 整体高度相关高相关性
reclat_cityreclat 以及 1 个其他字段 整体高度相关高相关性
reclongreclat 以及 1 个其他字段 整体高度相关高相关性
nametype 高度不均衡 (98.2%)不均衡
fall 高度不均衡 (83.4%)不均衡
reclat 有 7315 个 (16.0%) 缺失值缺失
reclong 有 7315 个 (16.0%) 缺失值缺失
GeoLocation 有 7315 个 (16.0%) 缺失值缺失
reclat_city 有 7315 个 (16.0%) 缺失值缺失
mass (g) 高度偏斜 (γ1 = 76.91847245)偏斜
unhashable 是一种不支持的类型,请检查是否需要清洗或进一步分析不支持
reclat 有 6438 个 (14.1%) 零值零值
reclong 有 6214 个 (13.6%) 零值零值

重现

分析开始2025-03-26 00:52:15.055819
分析完成2025-03-26 00:52:18.767248
持续时间3.71 秒
软件版本ydata-profiling v0.0.dev0
下载配置config.json

变量

name
文本

离散值45716
离散值 (%)> 99.9%
缺失0
缺失 (%)0.0%
内存大小3.3 MiB
2025-03-26T00:52:18.973964image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

长度

最大长度28
中位长度25
平均长度17.782487
最小长度2

字符与 Unicode

总字符数813122
离散字符数96
离散类别数1 ?
离散脚本数1 ?
离散块数1 ?
Unicode 标准为每个码点分配字符属性,可用于分析文本变量。

唯一值

唯一值45706 ?
唯一值 (%)> 99.9%

样本

第 1 行Aachen
第 2 行Aarhus
第 3 行Abee
第 4 行Acapulco
第 5 行Achiras
计数频率 (%)
yamato7269
 
5.7%
range6575
 
5.2%
africa4502
 
3.6%
northwest4499
 
3.5%
hills3995
 
3.2%
queen3445
 
2.7%
alexandra3444
 
2.7%
mountains3004
 
2.4%
al2663
 
2.1%
grove2496
 
2.0%
其他值 (37726)84860
66.9%
2025-03-26T00:52:19.419775image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

最常出现的字符

计数频率 (%)
81032
 
10.0%
a72715
 
8.9%
e48167
 
5.9%
n38392
 
4.7%
0 34943
 
4.3%
r33097
 
4.1%
i32658
 
4.0%
l31873
 
3.9%
t30898
 
3.8%
o30428
 
3.7%
其他值 (86)378919
46.6%

最常出现的类别

计数频率 (%)
(未知)813122
100.0%

每个类别中最常见的字符

(未知)
计数频率 (%)
81032
 
10.0%
a72715
 
8.9%
e48167
 
5.9%
n38392
 
4.7%
0 34943
 
4.3%
r33097
 
4.1%
i32658
 
4.0%
l31873
 
3.9%
t30898
 
3.8%
o30428
 
3.7%
其他值 (86)378919
46.6%

最常出现的脚本

计数频率 (%)
(未知)813122
100.0%

每个脚本中最常见的字符

(未知)
计数频率 (%)
81032
 
10.0%
a72715
 
8.9%
e48167
 
5.9%
n38392
 
4.7%
0 34943
 
4.3%
r33097
 
4.1%
i32658
 
4.0%
l31873
 
3.9%
t30898
 
3.8%
o30428
 
3.7%
其他值 (86)378919
46.6%

最常出现的块

计数频率 (%)
(未知)813122
100.0%

每个块中最常见的字符

(未知)
计数频率 (%)
81032
 
10.0%
a72715
 
8.9%
e48167
 
5.9%
n38392
 
4.7%
0 34943
 
4.3%
r33097
 
4.1%
i32658
 
4.0%
l31873
 
3.9%
t30898
 
3.8%
o30428
 
3.7%
其他值 (86)378919
46.6%

id
实数 (ℝ)

离散值45716
离散值 (%)> 99.9%
缺失0
缺失 (%)0.0%
无穷大0
无穷大 (%)0.0%
均值26883.906
最小值1
最大值57458
零值0
零值 (%)0.0%
负值0
负值 (%)0.0%
内存大小357.4 KiB
2025-03-26T00:52:19.506634image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

分位数统计

最小值1
第 5 百分位数2388.75
Q112681.25
中位数24256.5
Q340653.5
第 95 百分位数54890.75
最大值57458
范围57457
四分位距 (IQR)27972.25

描述性统计

标准差16863.446
变异系数 (CV)0.62726917
峰度-1.1601308
均值26883.906
中位数绝对偏差 (MAD)13264
偏度0.26653007
总和1.2292935 × 109
方差2.843758 × 108
单调性非单调
2025-03-26T00:52:19.600503image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
固定宽度直方图 (bins=50)
计数频率 (%)
1 2
 
< 0.1%
2 2
 
< 0.1%
6 2
 
< 0.1%
10 2
 
< 0.1%
370 2
 
< 0.1%
379 2
 
< 0.1%
390 2
 
< 0.1%
392 2
 
< 0.1%
398 2
 
< 0.1%
417 2
 
< 0.1%
其他值 (45706)45706
> 99.9%
计数频率 (%)
1 2
< 0.1%
2 2
< 0.1%
4 1
< 0.1%
5 1
< 0.1%
6 2
< 0.1%
7 1
< 0.1%
8 1
< 0.1%
9 1
< 0.1%
10 2
< 0.1%
11 1
< 0.1%
计数频率 (%)
57458 1
< 0.1%
57457 1
< 0.1%
57456 1
< 0.1%
57455 1
< 0.1%
57454 1
< 0.1%
57453 1
< 0.1%
57436 1
< 0.1%
57435 1
< 0.1%
57434 1
< 0.1%
57433 1
< 0.1%

nametype
分类

不均衡 

离散值2
离散值 (%)< 0.1%
缺失0
缺失 (%)0.0%
内存大小2.7 MiB
Valid
45651 
Relict
 
75

长度

最大长度6
中位长度5
平均长度5.0016402
最小长度5

字符与 Unicode

总字符数228705
离散字符数9
离散类别数1 ?
离散脚本数1 ?
离散块数1 ?
Unicode 标准为每个码点分配字符属性,可用于分析文本变量。

唯一值

唯一值0 ?
唯一值 (%)0.0%

样本

第 1 行Valid
第 2 行Valid
第 3 行Valid
第 4 行Valid
第 5 行Valid

常见值

计数频率 (%)
Valid45651
99.8%
Relict75
 
0.2%

长度

2025-03-26T00:52:19.685088image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
类别长度直方图

常见值 (图)

2025-03-26T00:52:19.728879image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
计数频率 (%)
valid45651
99.8%
relict75
 
0.2%

最常出现的字符

计数频率 (%)
l45726
20.0%
i45726
20.0%
V45651
20.0%
a45651
20.0%
d45651
20.0%
R75
 
< 0.1%
e75
 
< 0.1%
c75
 
< 0.1%
t75
 
< 0.1%

最常出现的类别

计数频率 (%)
(未知)228705
100.0%

每个类别中最常见的字符

(未知)
计数频率 (%)
l45726
20.0%
i45726
20.0%
V45651
20.0%
a45651
20.0%
d45651
20.0%
R75
 
< 0.1%
e75
 
< 0.1%
c75
 
< 0.1%
t75
 
< 0.1%

最常出现的脚本

计数频率 (%)
(未知)228705
100.0%

每个脚本中最常见的字符

(未知)
计数频率 (%)
l45726
20.0%
i45726
20.0%
V45651
20.0%
a45651
20.0%
d45651
20.0%
R75
 
< 0.1%
e75
 
< 0.1%
c75
 
< 0.1%
t75
 
< 0.1%

最常出现的块

计数频率 (%)
(未知)228705
100.0%

每个块中最常见的字符

(未知)
计数频率 (%)
l45726
20.0%
i45726
20.0%
V45651
20.0%
a45651
20.0%
d45651
20.0%
R75
 
< 0.1%
e75
 
< 0.1%
c75
 
< 0.1%
t75
 
< 0.1%

recclass
文本

离散值466
离散值 (%)1.0%
缺失0
缺失 (%)0.0%
内存大小2.6 MiB
2025-03-26T00:52:19.913953image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

长度

最大长度26
中位长度2
平均长度3.0525303
最小长度1

字符与 Unicode

总字符数139580
离散字符数62
离散类别数1 ?
离散脚本数1 ?
离散块数1 ?
Unicode 标准为每个码点分配字符属性,可用于分析文本变量。

唯一值

唯一值145 ?
唯一值 (%)0.3%

样本

第 1 行L5
第 2 行H6
第 3 行EH4
第 4 行Acapulcoite
第 5 行L6
计数频率 (%)
l68341
17.6%
h57165
15.1%
l54818
10.2%
h64530
9.6%
h44223
 
8.9%
ll52766
 
5.8%
ll62046
 
4.3%
l41256
 
2.7%
iron1070
 
2.3%
h4/5428
 
0.9%
其他值 (434)10712
22.6%
2025-03-26T00:52:20.202405image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

最常出现的字符

计数频率 (%)
L28467
20.4%
H18396
13.2%
5 16419
11.8%
6 16132
11.6%
4 6930
 
5.0%
e3972
 
2.8%
i3834
 
2.7%
r3648
 
2.6%
t3327
 
2.4%
3 3278
 
2.3%
其他值 (52)35177
25.2%

最常出现的类别

计数频率 (%)
(未知)139580
100.0%

每个类别中最常见的字符

(未知)
计数频率 (%)
L28467
20.4%
H18396
13.2%
5 16419
11.8%
6 16132
11.6%
4 6930
 
5.0%
e3972
 
2.8%
i3834
 
2.7%
r3648
 
2.6%
t3327
 
2.4%
3 3278
 
2.3%
其他值 (52)35177
25.2%

最常出现的脚本

计数频率 (%)
(未知)139580
100.0%

每个脚本中最常见的字符

(未知)
计数频率 (%)
L28467
20.4%
H18396
13.2%
5 16419
11.8%
6 16132
11.6%
4 6930
 
5.0%
e3972
 
2.8%
i3834
 
2.7%
r3648
 
2.6%
t3327
 
2.4%
3 3278
 
2.3%
其他值 (52)35177
25.2%

最常出现的块

计数频率 (%)
(未知)139580
100.0%

每个块中最常见的字符

(未知)
计数频率 (%)
L28467
20.4%
H18396
13.2%
5 16419
11.8%
6 16132
11.6%
4 6930
 
5.0%
e3972
 
2.8%
i3834
 
2.7%
r3648
 
2.6%
t3327
 
2.4%
3 3278
 
2.3%
其他值 (52)35177
25.2%

mass (g)
实数 (ℝ)

偏斜 

离散值12576
离散值 (%)27.6%
缺失131
缺失 (%)0.3%
无穷大0
无穷大 (%)0.0%
均值13278.426
最小值0
最大值60000000
零值19
零值 (%)< 0.1%
负值0
负值 (%)0.0%
内存大小357.4 KiB
2025-03-26T00:52:20.286508image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

分位数统计

最小值0
第 5 百分位数1.1
Q17.2
中位数32.61
Q3202.9
第 95 百分位数4000
最大值60000000
范围60000000
四分位距 (IQR)195.7

描述性统计

标准差574926.01
变异系数 (CV)43.297752
峰度6798.3984
均值13278.426
中位数绝对偏差 (MAD)30.51
偏度76.918472
总和6.0542985 × 108
方差3.3053992 × 1011
单调性非单调
2025-03-26T00:52:20.377599image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
固定宽度直方图 (bins=50)
计数频率 (%)
1.3 171
 
0.4%
1.2 140
 
0.3%
1.4 138
 
0.3%
2.1 130
 
0.3%
2.4 126
 
0.3%
1.6 120
 
0.3%
0.5 119
 
0.3%
1.1 116
 
0.3%
3.8 114
 
0.2%
1.5 111
 
0.2%
其他值 (12566)44310
96.9%
(缺失)131
 
0.3%
计数频率 (%)
0 19
< 0.1%
0.01 2
 
< 0.1%
0.013 1
 
< 0.1%
0.02 1
 
< 0.1%
0.03 1
 
< 0.1%
0.04 1
 
< 0.1%
0.05 1
 
< 0.1%
0.06 1
 
< 0.1%
0.07 3
 
< 0.1%
0.08 2
 
< 0.1%
计数频率 (%)
60000000 1
< 0.1%
58200000 1
< 0.1%
50000000 1
< 0.1%
30000000 1
< 0.1%
28000000 1
< 0.1%
26000000 1
< 0.1%
24300000 1
< 0.1%
24000000 1
< 0.1%
23000000 1
< 0.1%
22000000 1
< 0.1%

fall
分类

不均衡 

离散值2
离散值 (%)< 0.1%
缺失0
缺失 (%)0.0%
内存大小2.7 MiB
Found
44609 
Fell
 
1117

长度

最大长度5
中位长度5
平均长度4.9755719
最小长度4

字符与 Unicode

总字符数227513
离散字符数7
离散类别数1 ?
离散脚本数1 ?
离散块数1 ?
Unicode 标准为每个码点分配字符属性,可用于分析文本变量。

唯一值

唯一值0 ?
唯一值 (%)0.0%

样本

第 1 行Fell
第 2 行Fell
第 3 行Fell
第 4 行Fell
第 5 行Fell

常见值

计数频率 (%)
Found44609
97.6%
Fell1117
 
2.4%

长度

2025-03-26T00:52:20.458109image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
类别长度直方图

常见值 (图)

2025-03-26T00:52:20.501936image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
计数频率 (%)
found44609
97.6%
fell1117
 
2.4%

最常出现的字符

计数频率 (%)
F45726
20.1%
o44609
19.6%
u44609
19.6%
n44609
19.6%
d44609
19.6%
l2234
 
1.0%
e1117
 
0.5%

最常出现的类别

计数频率 (%)
(未知)227513
100.0%

每个类别中最常见的字符

(未知)
计数频率 (%)
F45726
20.1%
o44609
19.6%
u44609
19.6%
n44609
19.6%
d44609
19.6%
l2234
 
1.0%
e1117
 
0.5%

最常出现的脚本

计数频率 (%)
(未知)227513
100.0%

每个脚本中最常见的字符

(未知)
计数频率 (%)
F45726
20.1%
o44609
19.6%
u44609
19.6%
n44609
19.6%
d44609
19.6%
l2234
 
1.0%
e1117
 
0.5%

最常出现的块

计数频率 (%)
(未知)227513
100.0%

每个块中最常见的字符

(未知)
计数频率 (%)
F45726
20.1%
o44609
19.6%
u44609
19.6%
n44609
19.6%
d44609
19.6%
l2234
 
1.0%
e1117
 
0.5%

year
日期

离散值265
离散值 (%)0.6%
缺失291
缺失 (%)0.6%
内存大小357.4 KiB
最小值1970-01-01 00:00:00
最大值1970-01-01 00:00:00.000002
无效日期0
无效日期 (%)0.0%
2025-03-26T00:52:20.564342image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:20.658512image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
固定宽度直方图 (bins=50)

reclat
实数 (ℝ)

高相关性  缺失  零值 

离散值12738
离散值 (%)33.2%
缺失7315
缺失 (%)16.0%
无穷大0
无穷大 (%)0.0%
均值-39.107095
最小值-87.36667
最大值81.16667
零值6438
零值 (%)14.1%
负值23416
负值 (%)51.2%
内存大小357.4 KiB
2025-03-26T00:52:20.745256image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

分位数统计

最小值-87.36667
第 5 百分位数-84.35476
Q1-76.71377
中位数-71.5
Q30
第 95 百分位数34.494325
最大值81.16667
范围168.53334
四分位距 (IQR)76.71377

描述性统计

标准差46.386011
变异系数 (CV)-1.1861278
峰度-1.4768651
均值-39.107095
中位数绝对偏差 (MAD)12.76459
偏度0.49131573
总和-1502142.6
方差2151.662
单调性非单调
2025-03-26T00:52:20.834017image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
固定宽度直方图 (bins=50)
计数频率 (%)
0 6438
 
14.1%
-71.5 4761
 
10.4%
-84 3040
 
6.6%
-72 1506
 
3.3%
-79.68333 1130
 
2.5%
-76.71667 680
 
1.5%
-76.18333 539
 
1.2%
-84.21667 263
 
0.6%
-86.36667 226
 
0.5%
-86.71667 217
 
0.5%
其他值 (12728)19611
42.9%
(缺失)7315
 
16.0%
计数频率 (%)
-87.36667 4
 
< 0.1%
-87.03333 3
 
< 0.1%
-86.93333 3
 
< 0.1%
-86.71667 217
0.5%
-86.56667 17
 
< 0.1%
-86.54488 1
 
< 0.1%
-86.5379 1
 
< 0.1%
-86.53734 1
 
< 0.1%
-86.53725 1
 
< 0.1%
-86.53035 1
 
< 0.1%
计数频率 (%)
81.16667 1
< 0.1%
76.53333 1
< 0.1%
76.13333 1
< 0.1%
72.88333 1
< 0.1%
72.68333 1
< 0.1%
70.73333 1
< 0.1%
70 1
< 0.1%
69.1 1
< 0.1%
68 1
< 0.1%
67.88333 1
< 0.1%

reclong
实数 (ℝ)

高相关性  缺失  零值 

离散值14640
离散值 (%)38.1%
缺失7315
缺失 (%)16.0%
无穷大0
无穷大 (%)0.0%
均值61.052594
最小值-165.43333
最大值354.47333
零值6214
零值 (%)13.6%
负值4057
负值 (%)8.9%
内存大小357.4 KiB
2025-03-26T00:52:20.924933image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

分位数统计

最小值-165.43333
第 5 百分位数-90.427
Q10
中位数35.66667
Q3157.16667
第 95 百分位数168
最大值354.47333
范围519.90666
四分位距 (IQR)157.16667

描述性统计

标准差80.655258
变异系数 (CV)1.3210783
峰度-0.73139356
均值61.052594
中位数绝对偏差 (MAD)39.53972
偏度-0.17438133
总和2345091.2
方差6505.2706
单调性非单调
2025-03-26T00:52:21.017059image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
固定宽度直方图 (bins=50)
计数频率 (%)
0 6214
 
13.6%
35.66667 4985
 
10.9%
168 3040
 
6.6%
26 1506
 
3.3%
159.75 657
 
1.4%
159.66667 637
 
1.4%
157.16667 542
 
1.2%
155.75 473
 
1.0%
160.5 263
 
0.6%
-70 228
 
0.5%
其他值 (14630)19866
43.4%
(缺失)7315
 
16.0%
计数频率 (%)
-165.43333 9
< 0.1%
-165.11667 17
< 0.1%
-163.16667 1
 
< 0.1%
-162.55 1
 
< 0.1%
-157.86667 1
 
< 0.1%
-157.78333 1
 
< 0.1%
-149.5 4
 
< 0.1%
-148.55 2
 
< 0.1%
-148 3
 
< 0.1%
-146.26667 1
 
< 0.1%
计数频率 (%)
354.47333 1
 
< 0.1%
178.2 1
 
< 0.1%
178.08333 1
 
< 0.1%
175.73028 1
 
< 0.1%
175.13333 1
 
< 0.1%
175 185
0.4%
174.50043 1
 
< 0.1%
174.4 1
 
< 0.1%
172.7 1
 
< 0.1%
172.6 1
 
< 0.1%

GeoLocation
文本

缺失 

离散值17100
离散值 (%)44.5%
缺失7315
缺失 (%)16.0%
内存大小2.9 MiB
2025-03-26T00:52:21.241176image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

长度

最大长度24
中位长度22
平均长度17.304809
最小长度10

字符与 Unicode

总字符数664695
离散字符数16
离散类别数1 ?
离散脚本数1 ?
离散块数1 ?
Unicode 标准为每个码点分配字符属性,可用于分析文本变量。

唯一值

唯一值16363 ?
唯一值 (%)42.6%

样本

第 1 行(50.775, 6.08333)
第 2 行(56.18333, 10.23333)
第 3 行(54.21667, -113.0)
第 4 行(16.88333, -99.9)
第 5 行(-33.16667, -64.95)
计数频率 (%)
0.0 12652
 
16.5%
35.66667 4991
 
6.5%
71.5 4761
 
6.2%
84.0 3041
 
4.0%
168.0 3040
 
4.0%
26.0 1512
 
2.0%
72.0 1506
 
2.0%
79.68333 1130
 
1.5%
76.71667 680
 
0.9%
159.75 657
 
0.9%
其他值 (26608)42852
55.8%
2025-03-26T00:52:21.542860image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

最常出现的字符

计数频率 (%)
. 76822
11.6%
6 67560
 
10.2%
7 52499
 
7.9%
0 49033
 
7.4%
3 44771
 
6.7%
1 44476
 
6.7%
5 42757
 
6.4%
( 38411
 
5.8%
38411
 
5.8%
) 38411
 
5.8%
其他值 (6)171544
25.8%

最常出现的类别

计数频率 (%)
(未知)664695
100.0%

每个类别中最常见的字符

(未知)
计数频率 (%)
. 76822
11.6%
6 67560
 
10.2%
7 52499
 
7.9%
0 49033
 
7.4%
3 44771
 
6.7%
1 44476
 
6.7%
5 42757
 
6.4%
( 38411
 
5.8%
38411
 
5.8%
) 38411
 
5.8%
其他值 (6)171544
25.8%

最常出现的脚本

计数频率 (%)
(未知)664695
100.0%

每个脚本中最常见的字符

(未知)
计数频率 (%)
. 76822
11.6%
6 67560
 
10.2%
7 52499
 
7.9%
0 49033
 
7.4%
3 44771
 
6.7%
1 44476
 
6.7%
5 42757
 
6.4%
( 38411
 
5.8%
38411
 
5.8%
) 38411
 
5.8%
其他值 (6)171544
25.8%

最常出现的块

计数频率 (%)
(未知)664695
100.0%

每个块中最常见的字符

(未知)
计数频率 (%)
. 76822
11.6%
6 67560
 
10.2%
7 52499
 
7.9%
0 49033
 
7.4%
3 44771
 
6.7%
1 44476
 
6.7%
5 42757
 
6.4%
( 38411
 
5.8%
38411
 
5.8%
) 38411
 
5.8%
其他值 (6)171544
25.8%

source
分类

常量 

离散值1
离散值 (%)< 0.1%
缺失0
缺失 (%)0.0%
内存大小2.7 MiB
NASA
45726 

长度

最大长度4
中位长度4
平均长度4
最小长度4

字符与 Unicode

总字符数182904
离散字符数3
离散类别数1 ?
离散脚本数1 ?
离散块数1 ?
Unicode 标准为每个码点分配字符属性,可用于分析文本变量。

唯一值

唯一值0 ?
唯一值 (%)0.0%

样本

第 1 行NASA
第 2 行NASA
第 3 行NASA
第 4 行NASA
第 5 行NASA

常见值

计数频率 (%)
NASA45726
100.0%

长度

2025-03-26T00:52:21.621643image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
类别长度直方图

常见值 (图)

2025-03-26T00:52:21.660729image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
计数频率 (%)
nasa45726
100.0%

最常出现的字符

计数频率 (%)
A91452
50.0%
N45726
25.0%
S45726
25.0%

最常出现的类别

计数频率 (%)
(未知)182904
100.0%

每个类别中最常见的字符

(未知)
计数频率 (%)
A91452
50.0%
N45726
25.0%
S45726
25.0%

最常出现的脚本

计数频率 (%)
(未知)182904
100.0%

每个脚本中最常见的字符

(未知)
计数频率 (%)
A91452
50.0%
N45726
25.0%
S45726
25.0%

最常出现的块

计数频率 (%)
(未知)182904
100.0%

每个块中最常见的字符

(未知)
计数频率 (%)
A91452
50.0%
N45726
25.0%
S45726
25.0%

boolean
布尔值

离散值2
离散值 (%)< 0.1%
缺失0
缺失 (%)0.0%
内存大小44.8 KiB
True
22934 
False
22792 
计数频率 (%)
True22934
50.2%
False22792
49.8%
2025-03-26T00:52:21.686949image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

mixed
分类

离散值2
离散值 (%)< 0.1%
缺失0
缺失 (%)0.0%
内存大小2.5 MiB
A
22889 
1
22837 

长度

最大长度1
中位长度1
平均长度1
最小长度1

字符与 Unicode

总字符数45726
离散字符数2
离散类别数1 ?
离散脚本数1 ?
离散块数1 ?
Unicode 标准为每个码点分配字符属性,可用于分析文本变量。

唯一值

唯一值0 ?
唯一值 (%)0.0%

样本

第 1 行1
第 2 行A
第 3 行1
第 4 行A
第 5 行A

常见值

计数频率 (%)
A22889
50.1%
1 22837
49.9%

长度

2025-03-26T00:52:21.739239image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
类别长度直方图

常见值 (图)

2025-03-26T00:52:21.780552image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
计数频率 (%)
a22889
50.1%
1 22837
49.9%

最常出现的字符

计数频率 (%)
A22889
50.1%
1 22837
49.9%

最常出现的类别

计数频率 (%)
(未知)45726
100.0%

每个类别中最常见的字符

(未知)
计数频率 (%)
A22889
50.1%
1 22837
49.9%

最常出现的脚本

计数频率 (%)
(未知)45726
100.0%

每个脚本中最常见的字符

(未知)
计数频率 (%)
A22889
50.1%
1 22837
49.9%

最常出现的块

计数频率 (%)
(未知)45726
100.0%

每个块中最常见的字符

(未知)
计数频率 (%)
A22889
50.1%
1 22837
49.9%

unhashable
不支持

已拒绝  不支持 

缺失0
缺失 (%)0.0%
内存大小3.1 MiB

reclat_city
实数 (ℝ)

高相关性  缺失 

离散值38401
离散值 (%)> 99.9%
缺失7315
缺失 (%)16.0%
无穷大0
无穷大 (%)0.0%
均值-39.153542
最小值-104.31717
最大值77.749011
零值0
零值 (%)0.0%
负值26603
负值 (%)58.2%
内存大小357.4 KiB
2025-03-26T00:52:21.845720image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

分位数统计

最小值-104.31717
第 5 百分位数-87.871058
Q1-78.407752
中位数-68.975293
Q34.7886449
第 95 百分位数35.42981
最大值77.749011
范围182.06618
四分位距 (IQR)83.196397

描述性统计

标准差46.685687
变异系数 (CV)-1.1923745
峰度-1.446385
均值-39.153542
中位数绝对偏差 (MAD)17.255843
偏度0.48160358
总和-1503926.7
方差2179.5534
单调性非单调
2025-03-26T00:52:22.066670image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
固定宽度直方图 (bins=50)
计数频率 (%)
50.51806008 2
 
< 0.1%
23.16596589 2
 
< 0.1%
-23.28864666 2
 
< 0.1%
36.5165896 2
 
< 0.1%
43.27957156 2
 
< 0.1%
49.60726921 2
 
< 0.1%
-32.5810219 2
 
< 0.1%
-29.65152821 2
 
< 0.1%
52.70663547 2
 
< 0.1%
52.01104434 2
 
< 0.1%
其他值 (38391)38391
84.0%
(缺失)7315
 
16.0%
计数频率 (%)
-104.3171665 1
< 0.1%
-102.4312375 1
< 0.1%
-102.0868253 1
< 0.1%
-101.5556373 1
< 0.1%
-101.3269284 1
< 0.1%
-101.2084341 1
< 0.1%
-101.0146935 1
< 0.1%
-100.9191264 1
< 0.1%
-100.7856947 1
< 0.1%
-100.5751117 1
< 0.1%
计数频率 (%)
77.74901083 1
< 0.1%
72.80622023 1
< 0.1%
72.75730423 1
< 0.1%
72.42607973 1
< 0.1%
72.25809595 1
< 0.1%
71.78938297 1
< 0.1%
71.42543169 1
< 0.1%
70.89755212 1
< 0.1%
70.53373183 1
< 0.1%
70.48523932 1
< 0.1%

交互

2025-03-26T00:52:17.982810image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:16.596121image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:16.948494image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:17.300214image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:17.650991image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:18.057876image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:16.669609image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:17.018169image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:17.370382image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:17.716765image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:18.130199image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:16.739343image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:17.088556image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:17.439738image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:17.787321image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:18.201620image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:16.810139image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:17.157577image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:17.508940image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:17.852881image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:18.269186image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:16.875952image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:17.228111image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:17.577830image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
2025-03-26T00:52:17.914423image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/

相关性

2025-03-26T00:52:22.135138image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
booleanfallidmass (g)mixednametypereclatreclat_cityreclong
boolean1.0000.0000.0000.0000.0000.0000.0000.0150.007
fall0.0001.0000.1260.0120.0000.0000.4500.4240.195
id0.0000.1261.000-0.1420.0090.1300.2610.219-0.316
mass (g)0.0000.012-0.1421.0000.0030.0000.4090.424-0.281
mixed0.0000.0000.0090.0031.0000.0000.0130.0000.000
nametype0.0000.0000.1300.0000.0001.0000.3490.3790.044
reclat0.0000.4500.2610.4090.0130.3491.0000.943-0.650
reclat_city0.0150.4240.2190.4240.0000.3790.9431.000-0.618
reclong0.0070.195-0.316-0.2810.0000.044-0.650-0.6181.000

缺失值

2025-03-26T00:52:18.395395image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
按列显示的简单空值可视化。
2025-03-26T00:52:18.522799image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
空值矩阵是一种数据密集型显示,可让您快速直观地找出数据完整性中的模式。
2025-03-26T00:52:18.684412image/svg+xmlMatplotlib v3.10.0, https://matplotlib.net.cn/
相关性热力图衡量空值相关性:一个变量的存在或缺失对另一个变量的存在的影响程度。

样本

nameidnametyperecclassmass (g)fallyearreclatreclongGeoLocationsourcebooleanmixedunhashablereclat_city
0Aachen1ValidL521.0Fell1970-01-01 00:00:00.00000188050.775006.08333(50.775, 6.08333)NASATrue1[1]50.518060
1Aarhus2ValidH6720.0Fell1970-01-01 00:00:00.00000195156.1833310.23333(56.18333, 10.23333)NASAFalseA[1]52.011044
2Abee6ValidEH4107000.0Fell1970-01-01 00:00:00.00000195254.21667-113.00000(54.21667, -113.0)NASAFalse1[1]52.706635
3Acapulco10ValidAcapulcoite1914.0Fell1970-01-01 00:00:00.00000197616.88333-99.90000(16.88333, -99.9)NASAFalseA[1]23.165966
4Achiras370ValidL6780.0Fell1970-01-01 00:00:00.000001902-33.16667-64.95000(-33.16667, -64.95)NASAFalseA[1]-23.288647
5Adhi Kot379ValidEH44239.0Fell1970-01-01 00:00:00.00000191932.1000071.80000(32.1, 71.8)NASATrue1[1]36.516590
6Adzhi-Bogdo (stone)390ValidLL3-6910.0Fell1970-01-01 00:00:00.00000194944.8333395.16667(44.83333, 95.16667)NASATrue1[1]43.279572
7Agen392ValidH530000.0Fell1970-01-01 00:00:00.00000181444.216670.61667(44.21667, 0.61667)NASAFalseA[1]49.607269
8Aguada398ValidL61620.0Fell1970-01-01 00:00:00.000001930-31.60000-65.23333(-31.6, -65.23333)NASAFalse1[1]-32.581022
9Aguila Blanca417ValidL1440.0Fell1970-01-01 00:00:00.000001920-30.86667-64.55000(-30.86667, -64.55)NASAFalseA[1]-29.651528
nameidnametyperecclassmass (g)fallyearreclatreclongGeoLocationsourcebooleanmixedunhashablereclat_city
45716Aachen1ValidL521.0Fell1970-01-01 00:00:00.00000188050.775006.08333(50.775, 6.08333)NASATrue1[1]50.518060
45717Aarhus2ValidH6720.0Fell1970-01-01 00:00:00.00000195156.1833310.23333(56.18333, 10.23333)NASAFalseA[1]52.011044
45718Abee6ValidEH4107000.0Fell1970-01-01 00:00:00.00000195254.21667-113.00000(54.21667, -113.0)NASAFalse1[1]52.706635
45719Acapulco10ValidAcapulcoite1914.0Fell1970-01-01 00:00:00.00000197616.88333-99.90000(16.88333, -99.9)NASAFalseA[1]23.165966
45720Achiras370ValidL6780.0Fell1970-01-01 00:00:00.000001902-33.16667-64.95000(-33.16667, -64.95)NASAFalseA[1]-23.288647
45721Adhi Kot379ValidEH44239.0Fell1970-01-01 00:00:00.00000191932.1000071.80000(32.1, 71.8)NASATrue1[1]36.516590
45722Adzhi-Bogdo (stone)390ValidLL3-6910.0Fell1970-01-01 00:00:00.00000194944.8333395.16667(44.83333, 95.16667)NASATrue1[1]43.279572
45723Agen392ValidH530000.0Fell1970-01-01 00:00:00.00000181444.216670.61667(44.21667, 0.61667)NASAFalseA[1]49.607269
45724Aguada398ValidL61620.0Fell1970-01-01 00:00:00.000001930-31.60000-65.23333(-31.6, -65.23333)NASAFalse1[1]-32.581022
45725Aguila Blanca417ValidL1440.0Fell1970-01-01 00:00:00.000001920-30.86667-64.55000(-30.86667, -64.55)NASAFalseA[1]-29.651528

重复行

最常出现

nameidnametyperecclassmass (g)fallyearreclatreclongGeoLocationsourcebooleanmixedreclat_city# 重复项
0Aachen1ValidL521.0Fell1970-01-01 00:00:00.00000188050.775006.08333(50.775, 6.08333)NASATrue150.5180602
1Aarhus2ValidH6720.0Fell1970-01-01 00:00:00.00000195156.1833310.23333(56.18333, 10.23333)NASAFalseA52.0110442
2Abee6ValidEH4107000.0Fell1970-01-01 00:00:00.00000195254.21667-113.00000(54.21667, -113.0)NASAFalse152.7066352
3Acapulco10ValidAcapulcoite1914.0Fell1970-01-01 00:00:00.00000197616.88333-99.90000(16.88333, -99.9)NASAFalseA23.1659662
4Achiras370ValidL6780.0Fell1970-01-01 00:00:00.000001902-33.16667-64.95000(-33.16667, -64.95)NASAFalseA-23.2886472
5Adhi Kot379ValidEH44239.0Fell1970-01-01 00:00:00.00000191932.1000071.80000(32.1, 71.8)NASATrue136.5165902
6Adzhi-Bogdo (stone)390ValidLL3-6910.0Fell1970-01-01 00:00:00.00000194944.8333395.16667(44.83333, 95.16667)NASATrue143.2795722
7Agen392ValidH530000.0Fell1970-01-01 00:00:00.00000181444.216670.61667(44.21667, 0.61667)NASAFalseA49.6072692
8Aguada398ValidL61620.0Fell1970-01-01 00:00:00.000001930-31.60000-65.23333(-31.6, -65.23333)NASAFalse1-32.5810222
9Aguila Blanca417ValidL1440.0Fell1970-01-01 00:00:00.000001920-30.86667-64.55000(-30.86667, -64.55)NASAFalseA-29.6515282