У меня есть Windows 10 (предустановленная), и теперь я хочу выполнить двойную загрузку с Ubuntu. У меня нет USB или CD/DVD, так что как я могу его двойную загрузку. Все еще сейчас я пытаюсь использовать Unetbootin и Linuxlive USB Creator, но оба они не работают. Я не могу использовать виртуальную машину, так как у меня есть компьютер низкого уровня. У меня низкая оперативная память и процессор также не слишком хорошо, но да у меня нет никаких проблем с ПЗУ Пожалуйста, помогите мне...
Знаете кого-то, кто может ответить? Поделитесь ссылкой на этот вопрос по электронной почте, через Twitter или Facebook.
-121--888141-У меня есть файл с разделителями табуляции, который имеет значения частоты в последнем столбце (фактически значения также с разделителями табуляции). У меня в основном два значения (например, A:0 G:1), но некоторые строки имеют три значения (например, G:0 C:1 A:0)
CHROM POS N_ALLELES N_CHR {ALLELE:FREQ}
NC_037638.1 355689 2 2 A:0 G:1
NC_037638.1 355694 2 2 G:0.5 A:0.5
NC_037638.1 355703 2 2 C:0.5 G:0.5
NC_037638.1 355706 2 2 T:0.5 C:0.5
NC_037638.1 355715 2 2 A:0.5 G:0.5
NC_037638.1 355794 3 1 G:0 C:1 A:0
NC_037638.1 355723 2 2 A:0 G:1
NC_037638.1 355732 2 2 C:0.5 T:0.5
.
.
.
Я хочу извлечь значения частоты в виде новых столбцов для каждой строки в зависимости от того, какая буква есть из четырех (A, C, G, T). Мой желаемый выход примерно такой:
CHROM POS N_ALLELES N_CHR A_FREQ G_FREQ C_FREQ T_FREQ
NC_037638.1 355689 2 2 0 1 NA NA
NC_037638.1 355694 2 2 0.5 0.5 NA NA
NC_037638.1 355703 2 2 NA 0.5 0.5 NA
NC_037638.1 355706 2 2 NA NA 0.5 0.5
NC_037638.1 355715 2 2 0.5 0.5 NA NA
NC_037638.1 355794 3 1 0 0 1 NA
NC_037638.1 355723 2 2 0 1 NA NA
NC_037638.1 355732 2 2 NA NA 0.5 0.5
.
.
.
Если я имею значения частоты в столбцах, то я могу легко построить график в R или что-то еще. "NA" является желательным, но может быть просто отсутствующими значениями или даже 0 ". Меня в основном беспокоит, как удалить двоеточие и поместить значения в столбцы.
Альтернативное решение может быть, если кто-то может предложить мне, как построить график частоты каждого основания (A, T, G, C) в каждом POS в R или Excel, не беспокоясь о преобразовании его в столбцы.
Я пробовал разные решения и боролся с заговорами, но все напрасно. Любая помощь/предложение будет оценена, чтобы выполнить это в bash/R/Python. Большое спасибо заранее!
Given
$ cat file
CHROM POS N_ALLELES N_CHR {ALLELE:FREQ}
NC_037638.1 355689 2 2 A:0 G:1
NC_037638.1 355694 2 2 G:0.5 A:0.5
NC_037638.1 355703 2 2 C:0.5 G:0.5
NC_037638.1 355706 2 2 T:0.5 C:0.5
NC_037638.1 355715 2 2 A:0.5 G:0.5
NC_037638.1 355794 3 1 G:0 C:1 A:0
NC_037638.1 355723 2 2 A:0 G:1
NC_037638.1 355732 2 2 C:0.5 T:0.5
then
$ awk '
BEGIN{
split("A:G:C:T",allele,/:/); OFS="\t"
}
NR==1 {
print $1,$2,$3,$4,"A_FREQ","G_FREQ","C_FREQ","T_FREQ"; next
}
{
for(i=5;i<=NF;i++){
split($i,a,/:/); freq[a[1]]=a[2]
}
}
{
for(i=1;i<=4;i++){
$(i+4) = allele[i] in freq ? freq[allele[i]] : "NA"
}
delete freq
}
1
' file
CHROM POS N_ALLELES N_CHR A_FREQ G_FREQ C_FREQ T_FREQ
NC_037638.1 355689 2 2 0 1 NA NA
NC_037638.1 355694 2 2 0.5 0.5 NA NA
NC_037638.1 355703 2 2 NA 0.5 0.5 NA
NC_037638.1 355706 2 2 NA NA 0.5 0.5
NC_037638.1 355715 2 2 0.5 0.5 NA NA
NC_037638.1 355794 3 1 0 0 1 NA
NC_037638.1 355723 2 2 0 1 NA NA
NC_037638.1 355732 2 2 NA NA 0.5 0.5