Удалить неарабские слова в R [закрыто]

Я пытаюсь удалить неарабские слова в r , и я пробовал этот код, но он удалил все

> L<-"you المجدo to yes"
> gsub("[^\\p{InArabic}.,]+","",L)
[1] ""
-1
задан 30 December 2018 в 01:23

1 ответ

Необходимо добавить perl = TRUE для R для компиляции regex в режиме PCRE.

Также я не уверен это {InArabic} класс поддерживаемого символа - хотя {Arabic} действительно кажется, по крайней мере, в моей версии R (R версия 3.4.4 (2018-03-15) - "Кто-то для Облокачиваний"):

> L<-"you المجدo to yes"
> 
> gsub("[^\\p{Arabic}.,]+", "", L, perl = TRUE)
[1] "المجد"
2
ответ дан 26 October 2019 в 16:51

Другие вопросы по тегам:

Похожие вопросы: