Удалите весь текст на английском языке и оставьте текст на арабском языке

Ubuntu 12.04

Перейдите к «Настройки системы» -> «Макет клавиатуры» -> + в нижнем левом углу окна «Раскладка клавиатуры». Нажмите кнопку +, и откроется новое окно, которое выглядит так:

В этом примере я использую греческий язык как новый язык раскладки клавиатуры, но вы можете заменить любой другой язык раскладки клавиатуры в списке для Греческий, чтобы добавить другой язык раскладки клавиатуры. Выберите греческий (политонический) из меню и нажмите кнопку System Settings , чтобы добавить греческий политонический язык в меню выбора языка, которое находится в области уведомлений панели рабочего стола рядом с значком тома и часами icon.

Ubuntu 14.04 и более поздние версии

Инструкции те же, что и для Ubuntu 12.04 (а также для Ubuntu 12.10 и Ubuntu 13.04), за исключением первого абзаца: [!d13 ]

Перейдите к «Настройки системы» -> «Клавиатура» -> + в нижнем левом углу окна ввода текста. Нажмите кнопку + (она помечена курсором мыши в приведенном ниже снимке экрана), и откроется новое окно, похожее на приведенный выше снимок экрана.

1
задан 7 May 2018 в 09:07

1 ответ

Поскольку вы спрашивали о perl конкретно, возможно, это можно сделать с помощью спецификатора свойства \p{ARABIC} unicode perl, хотя, кажется, необходимо декодировать кодировку UTF-8 перед применением теста регулярного выражения.

В своем простейшем случае вы можете просто удалить неарабские символы и перекодировать:

$ perl -MEncode -lpe '$_ = decode("UTF-8",$_); s/\P{ARABIC}+//g; $_ = encode("UTF-8", $_)' yourfile.csv 

أستطيع
كما
شئ
منذ
لذا
واحد
جدا
يمكنك
لديك
الرجل
يبدو
كلا
لدي
أوه
تفعل
سيدي

Если вы хотите обработать CSV чуть более структурированным способом, вы мог бы сделать что-то вроде этого:

#!/usr/bin/perl -wl

use strict;
use Encode;

my @F;
my @matches;
my $infile = $ARGV[0];

open FILE, $infile or die $!;

while (<FILE>) {
  @F = split(',');
  push @matches, grep { decode("UTF-8",$_) =~ /\"\p{ARABIC}+\"/ } @F;
}

print join ", ", map {$_ =~ s/\"//g; $_} @matches;

Повторное тестирование с предоставленными данными как yourfile.csv:

$ ./print_arabic.pl yourfile.csv
كما, شئ, منذ, لذا, واحد, جدا, يمكنك, لديك, الرجل, يبدو, كلا, لدي, أوه, تفعل, سيدي

[По какой-то причине запятая и пробел переключаются, когда арабский текст вставляется в браузер из моего терминала - возможно, из-за свойства скрипта справа налево?]

4
ответ дан 24 May 2018 в 00:36

Другие вопросы по тегам:

Похожие вопросы: