Как я могу использовать `awk` для разделения текста в столбце?

Question 1

Это язык программирования, который скомпилирован в C (см. Википедию). Это первый раз, когда я видел его использование - cool:)

Если вы установите valac из synaptic или Software Center, вы должны пройти эту проверку.

Question 2

Используйте поле { (пробел, фигурная скобка) в качестве разделителя полей, так как вы не заботитесь обо втором поле:

$ awk -F ' {' '{print $1}' foo
"xxxxx1"
"xx2"
"xx3 gsdd"
"sdsdf xxx"
"sdfsdf ccc dd"
"dsdsf sfsdf"
"sdfsdfsd"
"sdfsdff"
"sdfsdfdff sdfs"
"sdfsdsds sdfsdf d"
"sdfsdfs sdf sdfsdf"
"sdfsdfsdf sdf"

Question 3

Question 4

Используйте поле { (пробел, фигурная скобка) в качестве разделителя полей, так как вы не заботитесь обо втором поле:

$ awk -F ' {' '{print $1}' foo
"xxxxx1"
"xx2"
"xx3 gsdd"
"sdsdf xxx"
"sdfsdf ccc dd"
"dsdsf sfsdf"
"sdfsdfsd"
"sdfsdff"
"sdfsdfdff sdfs"
"sdfsdsds sdfsdf d"
"sdfsdfs sdf sdfsdf"
"sdfsdfsdf sdf"

Question 5

Используйте поле { (пробел, фигурная скобка) в качестве разделителя полей, так как вы не заботитесь обо втором поле:

$ awk -F ' {' '{print $1}' foo
"xxxxx1"
"xx2"
"xx3 gsdd"
"sdsdf xxx"
"sdfsdf ccc dd"
"dsdsf sfsdf"
"sdfsdfsd"
"sdfsdff"
"sdfsdfdff sdfs"
"sdfsdsds sdfsdf d"
"sdfsdfs sdf sdfsdf"
"sdfsdfsdf sdf"

Question 6

Если вы просто хотите, чтобы все между первым и последним символом двойной кавычки " каждой строки, самым простым решением, вероятно, было бы это, используя grep вместо awk:

grep -o '".*"' FILENAME

Переключатель -o позволяет grep выводить только совпадающие части, а не целую строку, содержащую совпадение. Шаблон (однокасканный, чтобы предотвратить интерпретацию оболочки) ".*" соответствует последовательности любого символа (.) с любой длиной (*), включая ноль, которая окружена двойными кавычками.

Question 7

Question 8

В качестве альтернативы решению awk мура

с использованием cut:

cut -f 1 -d { < file.txt

с использованием grep:

grep -o '".*"' file.txt

или

grep -o \".*\" file.txt

, используя sed:

sed -r 's/(".*").*/\1/' file.txt

или

sed -r 's/\{.*\}//' file.txt

или даже:

sed 's/{.*//'

Question 9

Perl с группировкой (.*) тоже может это сделать:

$ perl -pe 's/"(.*)".*/"\1"/g' input.txt                                                    
"xxxxx1"
"xx2"
"xx3 gsdd"
"sdsdf xxx"
"sdfsdf ccc dd"
"dsdsf sfsdf"
"sdfsdfsd"
"sdfsdff"
"sdfsdfdff sdfs"
"sdfsdsds sdfsdf d"
"sdfsdfs sdf sdfsdf"
"sdfsdfsdf sdf"

Фокус в том, что мы сопоставляем целую строку и используем "(.*)" для обработки всего между двойными кавычками как одной группой. Мы заменяем эту целую строку группой, которую мы сопоставляем, обращаясь к ней через часть \1.

Question 10

Если вы просто хотите, чтобы все между первым и последним символом двойной кавычки " каждой строки, самым простым решением, вероятно, было бы это, используя grep вместо awk:

grep -o '".*"' FILENAME

Переключатель -o позволяет grep выводить только совпадающие части, а не целую строку, содержащую совпадение. Шаблон (однокасканный, чтобы предотвратить интерпретацию оболочки) ".*" соответствует последовательности любого символа (.) с любой длиной (*), включая ноль, которая окружена двойными кавычками.

Question 11

В качестве альтернативы решению awk мура

с использованием cut:

cut -f 1 -d { < file.txt

с использованием grep:

grep -o '".*"' file.txt

или

grep -o \".*\" file.txt

, используя sed:

sed -r 's/(".*").*/\1/' file.txt

или

sed -r 's/\{.*\}//' file.txt

или даже:

sed 's/{.*//'

Question 12

Perl с группировкой (.*) тоже может это сделать:

$ perl -pe 's/"(.*)".*/"\1"/g' input.txt                                                    
"xxxxx1"
"xx2"
"xx3 gsdd"
"sdsdf xxx"
"sdfsdf ccc dd"
"dsdsf sfsdf"
"sdfsdfsd"
"sdfsdff"
"sdfsdfdff sdfs"
"sdfsdsds sdfsdf d"
"sdfsdfs sdf sdfsdf"
"sdfsdfsdf sdf"

Фокус в том, что мы сопоставляем целую строку и используем "(.*)" для обработки всего между двойными кавычками как одной группой. Мы заменяем эту целую строку группой, которую мы сопоставляем, обращаясь к ней через часть \1.

Question 13

Question 14

Если вы просто хотите, чтобы все между первым и последним символом двойной кавычки " каждой строки, самым простым решением, вероятно, было бы это, используя grep вместо awk:

grep -o '".*"' FILENAME

Переключатель -o позволяет grep выводить только совпадающие части, а не целую строку, содержащую совпадение. Шаблон (однокасканный, чтобы предотвратить интерпретацию оболочки) ".*" соответствует последовательности любого символа (.) с любой длиной (*), включая ноль, которая окружена двойными кавычками.

Question 15

В качестве альтернативы решению awk мура

с использованием cut:

cut -f 1 -d { < file.txt

с использованием grep:

grep -o '".*"' file.txt

или

grep -o \".*\" file.txt

, используя sed:

sed -r 's/(".*").*/\1/' file.txt

или

sed -r 's/\{.*\}//' file.txt

или даже:

sed 's/{.*//'

Question 16

Perl с группировкой (.*) тоже может это сделать:

$ perl -pe 's/"(.*)".*/"\1"/g' input.txt                                                    
"xxxxx1"
"xx2"
"xx3 gsdd"
"sdsdf xxx"
"sdfsdf ccc dd"
"dsdsf sfsdf"
"sdfsdfsd"
"sdfsdff"
"sdfsdfdff sdfs"
"sdfsdsds sdfsdf d"
"sdfsdfs sdf sdfsdf"
"sdfsdfsdf sdf"

Фокус в том, что мы сопоставляем целую строку и используем "(.*)" для обработки всего между двойными кавычками как одной группой. Мы заменяем эту целую строку группой, которую мы сопоставляем, обращаясь к ней через часть \1.

muru · Accepted Answer · 22 May 2018 в 22:30

Используйте поле { (пробел, фигурная скобка) в качестве разделителя полей, так как вы не заботитесь обо втором поле:

$ awk -F ' {' '{print $1}' foo
"xxxxx1"
"xx2"
"xx3 gsdd"
"sdsdf xxx"
"sdfsdf ccc dd"
"dsdsf sfsdf"
"sdfsdfsd"
"sdfsdff"
"sdfsdfdff sdfs"
"sdfsdsds sdfsdf d"
"sdfsdfs sdf sdfsdf"
"sdfsdfsdf sdf"

muru · Accepted Answer · 18 July 2018 в 13:05

Используйте поле { (пробел, фигурная скобка) в качестве разделителя полей, так как вы не заботитесь обо втором поле:

$ awk -F ' {' '{print $1}' foo
"xxxxx1"
"xx2"
"xx3 gsdd"
"sdsdf xxx"
"sdfsdf ccc dd"
"dsdsf sfsdf"
"sdfsdfsd"
"sdfsdff"
"sdfsdfdff sdfs"
"sdfsdsds sdfsdf d"
"sdfsdfs sdf sdfsdf"
"sdfsdfsdf sdf"

muru · Accepted Answer · 24 July 2018 в 20:06

Используйте поле { (пробел, фигурная скобка) в качестве разделителя полей, так как вы не заботитесь обо втором поле:

$ awk -F ' {' '{print $1}' foo
"xxxxx1"
"xx2"
"xx3 gsdd"
"sdsdf xxx"
"sdfsdf ccc dd"
"dsdsf sfsdf"
"sdfsdfsd"
"sdfsdff"
"sdfsdfdff sdfs"
"sdfsdsds sdfsdf d"
"sdfsdfs sdf sdfsdf"
"sdfsdfsdf sdf"

Byte Commander · Answer 4 · 22 May 2018 в 22:30

Если вы просто хотите, чтобы все между первым и последним символом двойной кавычки " каждой строки, самым простым решением, вероятно, было бы это, используя grep вместо awk:

grep -o '".*"' FILENAME

Переключатель -o позволяет grep выводить только совпадающие части, а не целую строку, содержащую совпадение. Шаблон (однокасканный, чтобы предотвратить интерпретацию оболочки) ".*" соответствует последовательности любого символа (.) с любой длиной (*), включая ноль, которая окружена двойными кавычками.

Ravexina · Answer 5 · 22 May 2018 в 22:30

В качестве альтернативы решению awk мура

с использованием cut:

cut -f 1 -d { < file.txt

с использованием grep:

grep -o '".*"' file.txt

или

grep -o \".*\" file.txt

, используя sed:

sed -r 's/(".*").*/\1/' file.txt

или

sed -r 's/\{.*\}//' file.txt

или даже:

sed 's/{.*//'

Sergiy Kolodyazhnyy · Answer 6 · 22 May 2018 в 22:30

Perl с группировкой (.*) тоже может это сделать:

$ perl -pe 's/"(.*)".*/"\1"/g' input.txt                                                    
"xxxxx1"
"xx2"
"xx3 gsdd"
"sdsdf xxx"
"sdfsdf ccc dd"
"dsdsf sfsdf"
"sdfsdfsd"
"sdfsdff"
"sdfsdfdff sdfs"
"sdfsdsds sdfsdf d"
"sdfsdfs sdf sdfsdf"
"sdfsdfsdf sdf"

Фокус в том, что мы сопоставляем целую строку и используем "(.*)" для обработки всего между двойными кавычками как одной группой. Мы заменяем эту целую строку группой, которую мы сопоставляем, обращаясь к ней через часть \1.

Byte Commander · Answer 7 · 18 July 2018 в 13:05

Если вы просто хотите, чтобы все между первым и последним символом двойной кавычки " каждой строки, самым простым решением, вероятно, было бы это, используя grep вместо awk:

grep -o '".*"' FILENAME

Переключатель -o позволяет grep выводить только совпадающие части, а не целую строку, содержащую совпадение. Шаблон (однокасканный, чтобы предотвратить интерпретацию оболочки) ".*" соответствует последовательности любого символа (.) с любой длиной (*), включая ноль, которая окружена двойными кавычками.

Ravexina · Answer 8 · 18 July 2018 в 13:05

В качестве альтернативы решению awk мура

с использованием cut:

cut -f 1 -d { < file.txt

с использованием grep:

grep -o '".*"' file.txt

или

grep -o \".*\" file.txt

, используя sed:

sed -r 's/(".*").*/\1/' file.txt

или

sed -r 's/\{.*\}//' file.txt

или даже:

sed 's/{.*//'

Sergiy Kolodyazhnyy · Answer 9 · 18 July 2018 в 13:05

Perl с группировкой (.*) тоже может это сделать:

$ perl -pe 's/"(.*)".*/"\1"/g' input.txt                                                    
"xxxxx1"
"xx2"
"xx3 gsdd"
"sdsdf xxx"
"sdfsdf ccc dd"
"dsdsf sfsdf"
"sdfsdfsd"
"sdfsdff"
"sdfsdfdff sdfs"
"sdfsdsds sdfsdf d"
"sdfsdfs sdf sdfsdf"
"sdfsdfsdf sdf"

Фокус в том, что мы сопоставляем целую строку и используем "(.*)" для обработки всего между двойными кавычками как одной группой. Мы заменяем эту целую строку группой, которую мы сопоставляем, обращаясь к ней через часть \1.

Byte Commander · Answer 10 · 24 July 2018 в 20:06

Если вы просто хотите, чтобы все между первым и последним символом двойной кавычки " каждой строки, самым простым решением, вероятно, было бы это, используя grep вместо awk:

grep -o '".*"' FILENAME

Переключатель -o позволяет grep выводить только совпадающие части, а не целую строку, содержащую совпадение. Шаблон (однокасканный, чтобы предотвратить интерпретацию оболочки) ".*" соответствует последовательности любого символа (.) с любой длиной (*), включая ноль, которая окружена двойными кавычками.

Ravexina · Answer 11 · 24 July 2018 в 20:06

В качестве альтернативы решению awk мура

с использованием cut:

cut -f 1 -d { < file.txt

с использованием grep:

grep -o '".*"' file.txt

или

grep -o \".*\" file.txt

, используя sed:

sed -r 's/(".*").*/\1/' file.txt

или

sed -r 's/\{.*\}//' file.txt

или даже:

sed 's/{.*//'

Sergiy Kolodyazhnyy · Answer 12 · 24 July 2018 в 20:06

Perl с группировкой (.*) тоже может это сделать:

$ perl -pe 's/"(.*)".*/"\1"/g' input.txt                                                    
"xxxxx1"
"xx2"
"xx3 gsdd"
"sdsdf xxx"
"sdfsdf ccc dd"
"dsdsf sfsdf"
"sdfsdfsd"
"sdfsdff"
"sdfsdfdff sdfs"
"sdfsdsds sdfsdf d"
"sdfsdfs sdf sdfsdf"
"sdfsdfsdf sdf"

Фокус в том, что мы сопоставляем целую строку и используем "(.*)" для обработки всего между двойными кавычками как одной группой. Мы заменяем эту целую строку группой, которую мы сопоставляем, обращаясь к ней через часть \1.

Как я могу использовать `awk` для разделения текста в столбце?

12 ответов

Другие вопросы по тегам:

Похожие вопросы: