概览
由 YData 提供
数据集统计
变量数量 | 3 |
---|---|
观测值数量 | 1000 |
缺失单元格 | 0 |
缺失单元格 (%) | 0.0% |
重复行 | 0 |
重复行 (%) | 0.0% |
内存总大小 | 23.6 KiB |
平均记录内存大小 | 24.1 B |
变量类型
文本 | 2 |
---|---|
分类 | 1 |
复现
分析开始时间 | 2025-03-26 00:45:33.220882 |
---|---|
分析完成时间 | 2025-03-26 00:45:33.390066 |
持续时间 | 0.17 秒 |
软件版本 | ydata-profiling v0.0.dev0 |
下载配置 | config.json |
变量
俄语
文本
不同值 | 995 |
---|---|
不同值 (%) | 99.5% |
缺失值 | 0 |
缺失值 (%) | 0.0% |
内存大小 | 7.9 KiB |
值 | 计数 | 频率 (%) |
знать | 2 | 0.2% |
много | 2 | 0.2% |
что | 2 | 0.2% |
пора | 2 | 0.2% |
мало | 2 | 0.2% |
как | 1 | 0.1% |
это | 1 | 0.1% |
весь | 1 | 0.1% |
а | 1 | 0.1% |
с | 1 | 0.1% |
其他值 (987) | 987 |
最常见的字符
值 | 计数 | 频率 (%) |
о | 645 | 10.5% |
т | 526 | 8.6% |
а | 484 | 7.9% |
е | 395 | 6.5% |
с | 364 | 6.0% |
и | 345 | 5.6% |
н | 339 | 5.5% |
ь | 316 | 5.2% |
р | 306 | 5.0% |
в | 263 | 4.3% |
其他值 (33) | 2134 |
最常见的类别
值 | 计数 | 频率 (%) |
(未知) | 6117 |
每种类别中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
о | 645 | 10.5% |
т | 526 | 8.6% |
а | 484 | 7.9% |
е | 395 | 6.5% |
с | 364 | 6.0% |
и | 345 | 5.6% |
н | 339 | 5.5% |
ь | 316 | 5.2% |
р | 306 | 5.0% |
в | 263 | 4.3% |
其他值 (33) | 2134 |
最常见的脚本
值 | 计数 | 频率 (%) |
(未知) | 6117 |
每种脚本中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
о | 645 | 10.5% |
т | 526 | 8.6% |
а | 484 | 7.9% |
е | 395 | 6.5% |
с | 364 | 6.0% |
и | 345 | 5.6% |
н | 339 | 5.5% |
ь | 316 | 5.2% |
р | 306 | 5.0% |
в | 263 | 4.3% |
其他值 (33) | 2134 |
最常见的块
值 | 计数 | 频率 (%) |
(未知) | 6117 |
每种块中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
о | 645 | 10.5% |
т | 526 | 8.6% |
а | 484 | 7.9% |
е | 395 | 6.5% |
с | 364 | 6.0% |
и | 345 | 5.6% |
н | 339 | 5.5% |
ь | 316 | 5.2% |
р | 306 | 5.0% |
в | 263 | 4.3% |
其他值 (33) | 2134 |
英语
文本
不同值 | 961 |
---|---|
不同值 (%) | 96.1% |
缺失值 | 0 |
缺失值 (%) | 0.0% |
内存大小 | 7.9 KiB |
值 | 计数 | 频率 (%) |
to | 256 | 11.0% |
see | 33 | 1.4% |
in | 20 | 0.9% |
be | 20 | 0.9% |
as | 18 | 0.8% |
for | 16 | 0.7% |
come | 15 | 0.6% |
of | 14 | 0.6% |
the | 13 | 0.6% |
a | 12 | 0.5% |
其他值 (1240) | 1914 |
最常见的字符
值 | 计数 | 频率 (%) |
e | 1370 | 10.4% |
1334 | 10.1% | |
t | 1048 | 8.0% |
o | 1021 | 7.8% |
a | 788 | 6.0% |
r | 730 | 5.5% |
, | 673 | 5.1% |
n | 656 | 5.0% |
i | 616 | 4.7% |
s | 611 | 4.6% |
其他值 (65) | 4322 |
最常见的类别
值 | 计数 | 频率 (%) |
(未知) | 13169 |
每种类别中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
e | 1370 | 10.4% |
1334 | 10.1% | |
t | 1048 | 8.0% |
o | 1021 | 7.8% |
a | 788 | 6.0% |
r | 730 | 5.5% |
, | 673 | 5.1% |
n | 656 | 5.0% |
i | 616 | 4.7% |
s | 611 | 4.6% |
其他值 (65) | 4322 |
最常见的脚本
值 | 计数 | 频率 (%) |
(未知) | 13169 |
每种脚本中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
e | 1370 | 10.4% |
1334 | 10.1% | |
t | 1048 | 8.0% |
o | 1021 | 7.8% |
a | 788 | 6.0% |
r | 730 | 5.5% |
, | 673 | 5.1% |
n | 656 | 5.0% |
i | 616 | 4.7% |
s | 611 | 4.6% |
其他值 (65) | 4322 |
最常见的块
值 | 计数 | 频率 (%) |
(未知) | 13169 |
每种块中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
e | 1370 | 10.4% |
1334 | 10.1% | |
t | 1048 | 8.0% |
o | 1021 | 7.8% |
a | 788 | 6.0% |
r | 730 | 5.5% |
, | 673 | 5.1% |
n | 656 | 5.0% |
i | 616 | 4.7% |
s | 611 | 4.6% |
其他值 (65) | 4322 |
常见值
值 | 计数 | 频率 (%) |
名词 | 374 | |
动词 | 232 | |
形容词 | 127 | 12.7% |
副词 | 112 | 11.2% |
介词 | 37 | 3.7% |
代词 | 36 | 3.6% |
其他 | 12 | 1.2% |
连词 | 12 | 1.2% |
基数词 | 11 | 1.1% |
助词 | 7 | 0.7% |
其他值 (27) | 40 | 4.0% |
长度
类别长度直方图
值 | 计数 | 频率 (%) |
名词 | 378 | |
动词 | 234 | |
形容词 | 129 | 12.3% |
副词 | 118 | 11.2% |
代词 | 40 | 3.8% |
介词 | 39 | 3.7% |
助词 | 19 | 1.8% |
数词 | 18 | 1.7% |
基数 | 16 | 1.5% |
连词 | 15 | 1.4% |
其他值 (15) | 43 | 4.1% |
最常见的字符
值 | 计数 | 频率 (%) |
n | 984 | |
e | 698 | |
o | 588 | |
r | 497 | |
v | 481 | |
u | 456 | |
b | 373 | 6.3% |
a | 309 | 5.3% |
i | 283 | 4.8% |
d | 268 | 4.6% |
其他值 (14) | 948 |
最常见的类别
值 | 计数 | 频率 (%) |
(未知) | 5885 |
每种类别中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
n | 984 | |
e | 698 | |
o | 588 | |
r | 497 | |
v | 481 | |
u | 456 | |
b | 373 | 6.3% |
a | 309 | 5.3% |
i | 283 | 4.8% |
d | 268 | 4.6% |
其他值 (14) | 948 |
最常见的脚本
值 | 计数 | 频率 (%) |
(未知) | 5885 |
每种脚本中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
n | 984 | |
e | 698 | |
o | 588 | |
r | 497 | |
v | 481 | |
u | 456 | |
b | 373 | 6.3% |
a | 309 | 5.3% |
i | 283 | 4.8% |
d | 268 | 4.6% |
其他值 (14) | 948 |
最常见的块
值 | 计数 | 频率 (%) |
(未知) | 5885 |
每种块中最常见的字符
(未知)
值 | 计数 | 频率 (%) |
n | 984 | |
e | 698 | |
o | 588 | |
r | 497 | |
v | 481 | |
u | 456 | |
b | 373 | 6.3% |
a | 309 | 5.3% |
i | 283 | 4.8% |
d | 268 | 4.6% |
其他值 (14) | 948 |
缺失值
按列显示的空值简单可视化。
空值矩阵是一种数据密集的显示方式,可让您快速直观地找出数据完成度中的模式。
样本
俄语 | 英语 | 词性 | |
---|---|---|---|
0 | и | and, though | 连词 |
1 | в | in, at | 介词 |
2 | не | not | 助词 |
3 | он | he | 代词 |
4 | на | on, it, at, to | 介词 |
5 | я | 我 | 代词 |
6 | что | what, that, why | 连词,代词 |
7 | тот | 那个 | 形容词,代词 |
8 | быть | 是 | 动词 |
9 | с | with, and, from, of | 介词 |
俄语 | 英语 | 词性 | |
---|---|---|---|
990 | художник | 画家,艺术家 | 名词 |
991 | знак | 标志,记号 | 名词 |
992 | завод | 工厂 | 名词 |
993 | кулак | 拳头 | 名词 |
994 | использовать | 使用,利用 | 动词 |
995 | стакан | 玻璃杯 | 名词 |
996 | пахнуть | 闻 | 动词 |
997 | отсюда | 从这里 | 副词 |
998 | рот | 嘴巴 | 名词 |
999 | пора | 是时候了;有时,偶尔 (参见 #279) | 其他 |