Как заменить текст случайно из файла?

Как можно произвольно заменить определенные строки в одном текстовом файле на строки из другого файла? Например:

file1.txt(file has more than 200 lines):
moonwalker@address.com
hansolo@address.com
anakinskywalker@address.com
obiwankenobi@address.com
darthvader@address.com

file2.txt(file has 10-20 lines):
@adress1.com
@adress2.com
@adress3.com
@adress4.com
@adress5.com

output.txt:
moonwalker@address4.com
hansolo@address1.com
anakinskywalker@address5.com
obiwankenobi@address2.com
darthvader@address3.com
9
задан 18 December 2017 в 04:36

6 ответов

Если Вы действительно хотите случайный выбор, то вот один способ использовать awk:

awk '
  BEGIN{FS="@"; OFS=""} 
  NR==FNR{a[NR]=$0; n++; next} 
  {$2=a[int(1 + n * rand())]; print}
' file2.txt file1.txt
moonwalker@adress2.com
hansolo@adress2.com
anakinskywalker@adress5.com
obiwankenobi@adress1.com
darthvader@adress3.com

OTOH, если бы Вы хотите случайную перестановку адресов, я предложил бы что-то как

paste -d '' <(cut -d'@' -f1 file1.txt) <(sort -R file2.txt)
moonwalker@adress2.com
hansolo@adress1.com
anakinskywalker@adress5.com
obiwankenobi@adress4.com
darthvader@adress3.com
9
ответ дан 18 December 2017 в 04:36

Вы можете реализовать этот алгоритм:

  • Загрузить содержимое file2.txt в массив
  • Для каждой строки в file1.txt:
    • Извлечь name part
    • Получить случайный адрес
    • Распечатать вывод правильно отформатированный

Примерно так:

mapfile -t addresses < file2.txt
while IFS='' read -r orig || [[ -n "$orig" ]]; do
    ((index = RANDOM % ${#addresses[@]}))
    name=${orig%%@*}
    echo "$name${addresses[index]}"
done < file1.txt

(Отдельное спасибо @GlennJackman и @dessert за улучшения.)

10
ответ дан 18 December 2017 в 04:36

Вы можете использовать shuf (вам может понадобиться sudo apt install shuf), чтобы перетасовать строки второго файла, а затем использовать их для замены:

$ awk -F'@' 'NR==FNR{a[NR]=$1;next}{print a[FNR]"@"$2} ' file1 <(shuf file2)
moonwalker@adress3.com
hansolo@adress1.com
anakinskywalker@adress5.com
obiwankenobi@adress4.com
darthvader@adress2.com

shuf просто рандомизирует порядок его входные строки. Команда awk сначала прочитает весь файл1 (NR==FNR будет истинным только во время чтения первого файла) и сохранит второе поле (поля определены как @, так что это домен) в ассоциативный массив a, значениями которого являются домены, а ключами - номера строк. Затем, когда мы перейдем к следующему файлу, он просто напечатает все, что было сохранено в a для этого номера строки, вместе с тем, что находится в файле 2 для того же номера строки.

Обратите внимание, что это предполагает, что оба файла имеют одинаковое количество строк и на самом деле не являются «случайными», так как не допускают повторения чего-либо. Но это похоже на то, что вы хотели попросить.

5
ответ дан 18 December 2017 в 04:36

Решение Python 2.7 и 3

Это решение заменяет первое вхождение единственной произвольной данной строки (“игла”) в каждой строке входного файла со строкой каждый раз, выбранный случайным образом из набора строк заменяющего списка строк.

#!/usr/bin/python
from __future__ import print_function
import sys, random

needle = sys.argv[1]

if sys.argv[2] == '-':
    f_replacements = sys.stdin
else:
    f_replacements = open(sys.argv[2])
with f_replacements:
    replacements = [l.rstrip('\n') for l in f_replacements]
if not replacements:
    raise ValueError('No replacement strings given')

if len(sys.argv) <= 3 or sys.argv[3] == '-':
    f_in = sys.stdin
else:
    f_in = open(sys.argv[3])
with f_in:
    for s in f_in:
        rep = replacements[random.randrange(len(replacements))]
        print(s.rstrip('\n').replace(needle, rep, 1))

Это должно быть почти тривиально, чтобы привязать иглу к началу или концу строки или использовать регулярные выражения в целом.

Использование

python replace-random.py NEEDLE REPLACEMENTS-FILE [INPUT-FILE]

Пример:

python replace-random.py '@address.com' file2.txt file1.txt

или

python replace-random.py '@address.com' file2.txt < file1.txt
5
ответ дан 18 December 2017 в 04:36

Вот способ Perl:

#!/usr/bin/perl
use warnings;
use strict;
use Tie::File;

tie my @file1,'Tie::File','file1.txt' or die "Can't open file1.txt\n";
tie my @file2,'Tie::File','file2.txt' or die "Can't open file2.txt\n";

for my $file_index (0..$#file1) {
   my $suffix = $file2[int(rand($#file2+1))];
   $file1[$file_index] =~ s/@.*$/$suffix/;
}

untie @file1;
untie @file2;
3
ответ дан 18 December 2017 в 04:36

Еще одно решение Bash. Он использует встроенную функцию замены строк в bash. Также предполагается, что file2.txt содержит только замещающие строки. Если нет, то их можно сначала отфильтровать, используя grep -o <replace> file2.txt

С shuf

#search string
Search="@address.com"
for lines in $(grep $Search file1.txt)
do 
    echo ${lines/$Search/$(shuf file2.txt -n 1)} 
done

Без shuf (почти чистый bash)

Здесь мы имеем сначала создать функцию, которая имитирует shuf, например,

bshuf () 
{ 
    nlines=$(( $(wc -l < $1) + 1))
    rand=0
    while [ "$rand" -eq 0 ]; do
        rand=$(( $RANDOM % nlines ))
    done
    echo $(head -n $rand $1 | tail -1)
}

, затем аналогично

for lines in $(grep $Search file1.txt) 
do 
    echo ${lines/$Search/$(bshuf file2.txt)}
done

Тест:

$ for lines in $(grep $Search file1.txt); do echo ${lines/$Search/$(bshuf file2.txt)} ; done
moonwalker@adress4.com
hansolo@adress2.com
anakinskywalker@adress2.com
obiwankenobi@adress3.com
darthvader@adress5.com
$ 
2
ответ дан 18 December 2017 в 04:36

Другие вопросы по тегам:

Похожие вопросы: