Я пытаюсь удалить неарабские слова в r , и я пробовал этот код, но он удалил все
> L<-"you المجدo to yes"
> gsub("[^\\p{InArabic}.,]+","",L)
[1] ""
Необходимо добавить perl = TRUE
для R для компиляции regex в режиме PCRE.
Также я не уверен это {InArabic}
класс поддерживаемого символа - хотя {Arabic}
действительно кажется, по крайней мере, в моей версии R (R версия 3.4.4 (2018-03-15) - "Кто-то для Облокачиваний"):
> L<-"you المجدo to yes"
>
> gsub("[^\\p{Arabic}.,]+", "", L, perl = TRUE)
[1] "المجد"