0

我有一个 ispell 巨大的 .mwl 文件,我想删除所有 ispell 后缀以使用 unix ispell、bash 或 perl 命令生成一个简单的纯文本单词字典。

是否有 ispell 命令选项可以做到这一点?

(在 unix 中,.mwl.gz 文件位于 /usr/share/ispell/ 目录

中)该文件的简短摘录:

a/MRSY
A'asia
a'body
a'thing
aaa
AAAS
Aaberg/M
Aachen/M
Aaedon/M
AAeE
AAeE's
aaerially
aaerialness
Aaerope/M
AAgr/M
aah/DGS
aal/MS
Aalborg
Aalesund
aalii/MS
Aaliyah/M
Aalst/M
Aalto
aam
Aandahl/M
Aani/M
Aaqbiye/M
Aar/MN
Aara/M
Aarau
aardvark/MS
aardwolf/M
aardwolves
Aaren/M
Aargau
aargh
Aarhus
Aarika/M
aarogramme
4

1 回答 1

2

我不确定您所说的后缀是什么意思,但我假设它是示例文本中 / 或 ' 之后的部分。您可以使用来自 Bash 的简单管道来完成此操作。

cat something.mwl | perl -pe 's{[/\x27].*$}{}; ' > stripped_something.txt

开关意味着在-p管道中运行 perl。无论您输入什么,都会一次放入$_一行,进行处理,然后打印出来。请注意,我\x27在正则表达式中添加了撇号。在命令行中转义它是一个很大的痛苦。如果有任何其他以后缀开头的字符,您可以将它们放在字符类中。

您也可以在以这种方式打印之前在线上进行任何其他工作。

有关开关的更多信息,请参阅perlrun文档-p

于 2021-12-07T00:32:02.413 回答