Полный список чешских слов в ubuntu /usr/share/dict

Мне нужен полный список чешских слов. Под полным я подразумеваю список (одно слово в строке), который охватывает более 70K слов как минимум. Есть ли способ добавить чешский язык в /usr/share/dict? Я не могу найти никаких ресурсов в установщике пакетов ubuntu (другие языки покрыты, но не чешский), и Google не помог!

1
задан 24 May 2015 в 06:36

2 ответа

Существует список 166 566 чешских слов в: https://raw.githubusercontent.com/titoBouzout/Dictionaries/master/Czech.dic. Этот список содержит слова только и не включает определения слов в списке.

0
ответ дан 24 May 2015 в 06:36

Я нуждался к grep определенным словам в целом чешском словаре также и использовал aspell содержащий 3.1M чешские слова.

$apt install aspell aspell-cs
$aspell -d cs dump master | aspell -l cs expand | wc -l
3141344
$aspell -d cs dump master | aspell -l cs expand | egrep ".{30,}" | wc -l
110

Это показывает общее количество слов дольше 30 + символы. Можно играть с другим grep шаблоном для нахождения недостающих слов в кроссвордах :-)

Источник: https://superuser.com/questions/137957/how-to-convert-aspell-dictionary-to-simple-list-of-words

0
ответ дан 4 October 2019 в 14:44

Другие вопросы по тегам:

Похожие вопросы: