Как можно произвольно заменить определенные строки в одном текстовом файле на строки из другого файла? Например:
file1.txt(file has more than 200 lines):
moonwalker@address.com
hansolo@address.com
anakinskywalker@address.com
obiwankenobi@address.com
darthvader@address.com
file2.txt(file has 10-20 lines):
@adress1.com
@adress2.com
@adress3.com
@adress4.com
@adress5.com
output.txt:
moonwalker@address4.com
hansolo@address1.com
anakinskywalker@address5.com
obiwankenobi@address2.com
darthvader@address3.com
Если Вы действительно хотите случайный выбор, то вот один способ использовать awk
:
awk '
BEGIN{FS="@"; OFS=""}
NR==FNR{a[NR]=$0; n++; next}
{$2=a[int(1 + n * rand())]; print}
' file2.txt file1.txt
moonwalker@adress2.com
hansolo@adress2.com
anakinskywalker@adress5.com
obiwankenobi@adress1.com
darthvader@adress3.com
OTOH, если бы Вы хотите случайную перестановку адресов, я предложил бы что-то как
paste -d '' <(cut -d'@' -f1 file1.txt) <(sort -R file2.txt)
moonwalker@adress2.com
hansolo@adress1.com
anakinskywalker@adress5.com
obiwankenobi@adress4.com
darthvader@adress3.com
Вы можете реализовать этот алгоритм:
file2.txt
в массив file1.txt
: Примерно так:
mapfile -t addresses < file2.txt
while IFS='' read -r orig || [[ -n "$orig" ]]; do
((index = RANDOM % ${#addresses[@]}))
name=${orig%%@*}
echo "$name${addresses[index]}"
done < file1.txt
(Отдельное спасибо @GlennJackman и @dessert за улучшения.)
Вы можете использовать shuf
(вам может понадобиться sudo apt install shuf
), чтобы перетасовать строки второго файла, а затем использовать их для замены:
$ awk -F'@' 'NR==FNR{a[NR]=$1;next}{print a[FNR]"@"$2} ' file1 <(shuf file2)
moonwalker@adress3.com
hansolo@adress1.com
anakinskywalker@adress5.com
obiwankenobi@adress4.com
darthvader@adress2.com
shuf
просто рандомизирует порядок его входные строки. Команда awk
сначала прочитает весь файл1 (NR==FNR
будет истинным только во время чтения первого файла) и сохранит второе поле (поля определены как @
, так что это домен) в ассоциативный массив a
, значениями которого являются домены, а ключами - номера строк. Затем, когда мы перейдем к следующему файлу, он просто напечатает все, что было сохранено в a
для этого номера строки, вместе с тем, что находится в файле 2 для того же номера строки.
Обратите внимание, что это предполагает, что оба файла имеют одинаковое количество строк и на самом деле не являются «случайными», так как не допускают повторения чего-либо. Но это похоже на то, что вы хотели попросить.
Это решение заменяет первое вхождение единственной произвольной данной строки (“игла”) в каждой строке входного файла со строкой каждый раз, выбранный случайным образом из набора строк заменяющего списка строк.
#!/usr/bin/python
from __future__ import print_function
import sys, random
needle = sys.argv[1]
if sys.argv[2] == '-':
f_replacements = sys.stdin
else:
f_replacements = open(sys.argv[2])
with f_replacements:
replacements = [l.rstrip('\n') for l in f_replacements]
if not replacements:
raise ValueError('No replacement strings given')
if len(sys.argv) <= 3 or sys.argv[3] == '-':
f_in = sys.stdin
else:
f_in = open(sys.argv[3])
with f_in:
for s in f_in:
rep = replacements[random.randrange(len(replacements))]
print(s.rstrip('\n').replace(needle, rep, 1))
Это должно быть почти тривиально, чтобы привязать иглу к началу или концу строки или использовать регулярные выражения в целом.
python replace-random.py NEEDLE REPLACEMENTS-FILE [INPUT-FILE]
Пример:
python replace-random.py '@address.com' file2.txt file1.txt
или
python replace-random.py '@address.com' file2.txt < file1.txt
Вот способ Perl:
#!/usr/bin/perl
use warnings;
use strict;
use Tie::File;
tie my @file1,'Tie::File','file1.txt' or die "Can't open file1.txt\n";
tie my @file2,'Tie::File','file2.txt' or die "Can't open file2.txt\n";
for my $file_index (0..$#file1) {
my $suffix = $file2[int(rand($#file2+1))];
$file1[$file_index] =~ s/@.*$/$suffix/;
}
untie @file1;
untie @file2;
Еще одно решение Bash. Он использует встроенную функцию замены строк в bash. Также предполагается, что file2.txt
содержит только замещающие строки. Если нет, то их можно сначала отфильтровать, используя grep -o <replace> file2.txt
shuf
#search string
Search="@address.com"
for lines in $(grep $Search file1.txt)
do
echo ${lines/$Search/$(shuf file2.txt -n 1)}
done
shuf
(почти чистый bash
) Здесь мы имеем сначала создать функцию, которая имитирует shuf
, например,
bshuf ()
{
nlines=$(( $(wc -l < $1) + 1))
rand=0
while [ "$rand" -eq 0 ]; do
rand=$(( $RANDOM % nlines ))
done
echo $(head -n $rand $1 | tail -1)
}
, затем аналогично
for lines in $(grep $Search file1.txt)
do
echo ${lines/$Search/$(bshuf file2.txt)}
done
Тест:
$ for lines in $(grep $Search file1.txt); do echo ${lines/$Search/$(bshuf file2.txt)} ; done
moonwalker@adress4.com
hansolo@adress2.com
anakinskywalker@adress2.com
obiwankenobi@adress3.com
darthvader@adress5.com
$