Разбор JSON с инструментами Unix

Question

Разбор JSON с инструментами Unix

570

Я пытаюсь разобрать JSON, возвращенный из запроса curl, например:

curl 'http://twitter.com/users/username.json' |
    sed -e 's/[{}]/''/g' | 
    awk -v k="text" '{n=split($0,a,","); for (i=1; i<=n; i++) print a[i]}'

Вышеуказанное разбивает JSON на поля, например:

% ...
"geo_enabled":false
"friends_count":245
"profile_text_color":"000000"
"status":"in_reply_to_screen_name":null
"source":"web"
"truncated":false
"text":"My status"
"favorited":false
% ...

Как напечатать определенное поле (обозначено -v k=text)?

auser 23 дек. 2009, в 19:59

Источник

4

Эээ ... это не очень хороший анализ json, кстати ... как насчет escape-символов в строках ... и т.д. Есть ли на SO ответ на python (даже на perl ...)?
martinr 23 дек. 2009, в 22:00
1

Ответ Python на это заключается в том, чтобы просто использовать библиотеку Python JSON, которая на самом деле будет анализировать JSON. sed и AWK предоставляют регулярные выражения, но они не являются хорошим решением проблемы правильного синтаксического анализа JSON.
steveha 29 дек. 2009, в 01:04
1

Согласен. На самом деле, библиотека jsawk обеспечила идеальное решение, которое я искал. Спасибо за идею!
auser 03 янв. 2010, в 03:10
39

Каждый раз, когда кто-то говорит: «Проблема X может быть легко решена с помощью другого языка Y», это код для «моей панели инструментов есть только камень для гвоздей ... зачем беспокоиться о чем-то еще?»
BryanH 04 фев. 2013, в 16:16
20

@BryanH: за исключением того, что иногда язык Y может быть более приспособлен для решения конкретной проблемы X независимо от того, сколько языков знает человек, предложивший Y.
jfs 30 май 2013, в 14:44
11

Вроде поздно, но здесь это идет. grep -Po '"'"version"'"\s*:\s*"\K([^"]*)' package.json . Это решает задачу легко и только с помощью grep и отлично работает для простых JSON. Для сложных JSON вы должны использовать правильный синтаксический анализатор.
diosney 17 нояб. 2014, в 22:14
2

@auser, не могли бы вы изменить правку в заголовке с помощью sed и awk на «инструменты UNIX»?
Charles Duffy 30 апр. 2015, в 22:07
0

@diosney Не могли бы вы объяснить, как работает это регулярное выражение Python, или указать мне страницу, на которой я мог бы учиться? Мое кольцо секретного декодера Google до сих пор меня не подводило. Благодарю.
D-Klotz 06 нояб. 2015, в 17:51
0

Будет ли cut набор ваших потребностей?
jpaugh 18 нояб. 2015, в 23:42
0

Есть ли способ добавить jq к инструменту bash в таких окнах, как Git Bash?
Vinay 13 дек. 2016, в 15:22
0

@diosney, ... если у вас есть GNU grep, скомпилированный с поддержкой libpcre. Некоторые люди находятся на платформах BSD, платформах busybox или местах, где GNU grep был скомпилирован без включенных дополнительных функций.
Charles Duffy 12 июль 2018, в 19:17
0

Хороший список инструментов приведен в этом вопросе о «XSLT-эквиваленте для JSON».
jschnasse 10 сен. 2018, в 11:10
0

shapeshed.com/jq-json
Damien Ó Ceallaigh 29 янв. 2019, в 05:16

Показать ещё 11 комментариев

Теги:

bash

curl

json

parsing

command-line

44 ответа

213

Чтобы быстро извлечь значения для определенного ключа, мне лично нравится использовать "grep -o", который возвращает только соответствие регулярному выражению. Например, чтобы получить поле "текст" из твитов, например:

grep -Po '"text":.*?[^\\]",' tweets.json

Это регулярное выражение более надежное, чем вы думаете; например, он отлично разбирается со строками, имеющими встроенные запятые и скрытыми кавычками внутри них. Я думаю, что с немного дополнительной работой вы могли бы создать тот, который на самом деле гарантированно извлекает значение, если оно будет атомарным. (Если он имеет гнездование, то регулярное выражение не может этого сделать, конечно.)

И для дальнейшей очистки (хотя и сохранения оригинального экранирования строки) вы можете использовать что-то вроде: | perl -pe 's/"text"://; s/^"//; s/",$//'. (Я сделал это для этот анализ.)

Для всех ненавистников, которые настаивают на том, что вы должны использовать настоящий парсер JSON - да, это важно для правильности, но

Чтобы сделать действительно быстрый анализ, например, подсчитывать значения, чтобы проверять ошибки очистки данных или получать общее представление о данных, быстрее удалять что-то из командной строки. Открытие редактора для записи script отвлекает.
grep -o на порядок быстрее, чем стандартная библиотека json на Python, по крайней мере, когда вы делаете это для твитов (каждая составляет ~ 2 КБ). Я не уверен, что это просто потому, что json медленный (я должен иногда сравнивать с yajl); но в принципе, регулярное выражение должно быть быстрее, поскольку оно является конечным состоянием и гораздо более оптимизированным, вместо парсера, который должен поддерживать рекурсию, и в этом случае тратит много деревьев на сборку зданий для структур, которые вам не нужны. (Если кто-то написал конечный преобразователь состояния, который сделал правильный (ограниченный глубиной) разбор JSON, это было бы фантастично! Тем временем у нас есть "grep -o".)

Чтобы написать поддерживаемый код, я всегда использую настоящую парсинговую библиотеку. Я не пробовал jsawk, но если он работает хорошо, это касается точки № 1.

Последнее, более wackier, решение: я написал script, который использует Python json и извлекает нужные вам ключи, в столбцы с разделителями столбцов; затем я прохожу через обертку вокруг awk, которая позволяет именованный доступ к столбцам. Здесь: скрипты json2tsv и tvvawk. Итак, для этого примера это будет:

json2tsv id text < tweets.json | tsvawk '{print "tweet " $id " is: " $text}'

Этот подход не относится к № 2, является более неэффективным, чем один Python script, и он немного хрупкий: он принудительно нормализует новые строки и вкладки в строковых значениях, чтобы играть хорошо с awk-полем/разделителем записей взгляд на мир. Но это позволяет вам оставаться в командной строке с большей точностью, чем grep -o.

Brendan OConnor 28 июль 2011, в 01:10

0

что если параметр last в кортеже thwn в конце не запятая, а правая скобка. И +1 точно.
Yola 12 нояб. 2011, в 19:11
0

Привет Йола, верно, это зависит от ввода. Вы должны посмотреть на это в первую очередь.
Brendan OConnor 12 нояб. 2011, в 22:33
10

Вы забыли о целочисленных значениях. grep -Po '"text":(\d*?,|.*?[^\\]",)'
Robert 04 дек. 2013, в 01:52
3

Роберт: Да, мое регулярное выражение было написано только для строковых значений для этого поля. Целые числа могут быть добавлены, как вы говорите. Если вы хотите все типы, вы должны делать больше и больше: логическое значение, ноль. И массивы и объекты требуют больше работы; возможно только ограничение по глубине при стандартных регулярных выражениях.
Brendan OConnor 05 дек. 2013, в 02:02
7

1. jq .name работает в командной строке и не требует «открытия редактора для написания скрипта». 2. Неважно, насколько быстро ваше регулярное выражение может давать неправильные результаты
jfs 24 авг. 2014, в 20:50
4

и если вам нужны только значения, вы можете просто добавить к ним awk. | grep -Po '"text":.*?[^\\]",'|awk -F':' '{print $2}'
JeffCharter 06 сен. 2015, в 19:37
24

Похоже, что в OSX опция -P отсутствует. Я тестировал на OSX 10.11.5 и grep --version была grep (BSD grep) 2.5.1-FreeBSD . Я получил это работает с опцией "расширенное регулярное выражение" на OSX. Команда сверху была бы grep -Eo '"text":.*?[^\\]",' tweets.json .
Jens 08 июнь 2016, в 13:14
0

Да, jq намного лучше. Когда я писал оригинальный пост, его еще не было или он не был широко распространен.
Brendan OConnor 09 июнь 2016, в 14:18
0

он не имеет дело со значением, появляющимся несколько раз в JSON, поскольку вы не можете указать путь, который ведет к тому, который вы хотите внутри дерева.
Marcus Wolschon 30 июнь 2016, в 06:18
0

это работало со мной, но как я могу получить результаты в файле для этой команды grep -Po '"text":. *? [^ \] ",' tweets.json
user1 16 нояб. 2016, в 06:37

Показать ещё 8 комментариев

149

На основании того, что некоторые из рекомендаций здесь (esp в комментариях) предложили использовать Python, я был разочарован, чтобы не найти пример.

Итак, здесь один лайнер, чтобы получить одно значение из некоторых данных JSON. Предполагается, что вы передаете данные в (откуда-то) и поэтому должны быть полезны в контексте сценариев.

echo '{"hostname":"test","domainname":"example.com"}' | python -c 'import json,sys;obj=json.load(sys.stdin);print obj[0]["hostname"]'

paulkmoore 06 дек. 2011, в 13:06

0

Я улучшил этот ответ ниже, чтобы использовать функцию bash: curl 'some_api' | getJsonVal 'ключ'
Joe Heyming 11 апр. 2014, в 22:06
0

pythonpy ( github.com/russell91/pythonpy почти всегда является лучшей альтернативой python -c , хотя его нужно устанавливать с помощью pip. просто py --ji -x 'x[0]["hostname"]' json в py --ji -x 'x[0]["hostname"]' . Если вы не хотите использовать встроенную поддержку json_input, вы все равно можете автоматически импортировать их как py 'json.loads(sys.stdin)[0]["hostname"]'
RussellStewart 14 сен. 2014, в 20:18
2

Спасибо! Для более быстрого и грязного анализа JSON я обернул его в функцию bash: jsonq() { python -c "import sys,json; obj=json.load(sys.stdin); print($1)"; } чтобы я мог написать: curl ...... | jsonq 'json.dumps([key["token"] for key in obj], indent=2)' и другие подобные страшные вещи ... Кстати, obj[0] кажется ненужным, похоже, что просто obj работает нормально в случаи по умолчанию (?).
akavel 23 март 2015, в 13:05
0

Благодарю. Я сделал это уважение JSON немного лучше, чем print: jsonq() { python -c "import sys,json; obj=json.load(sys.stdin); sys.stdout.write(json.dumps($1))"; }
Adam K Dean 01 март 2016, в 17:58
4

obj[0] вызывает ошибку при разборе { "port":5555 } . Работает нормально после удаления [0] .
CyberEd 16 авг. 2016, в 20:49

Показать ещё 3 комментария

121

Следуя указаниям MartinR и Boecko:

$ curl -s 'http://twitter.com/users/username.json' | python -mjson.tool

Это даст вам очень дружелюбный результат. Очень удобно:

$ curl -s 'http://twitter.com/users/username.json' | python -mjson.tool | grep my_key

jnrg 12 июнь 2011, в 09:47

35

Как бы вы извлекли конкретный ключ, как спрашивает OP?
juan 28 март 2013, в 13:58
2

Лучший ответ на данный момент imho, нет необходимости устанавливать что-либо еще в большинстве дистрибутивов, и вы можете | grep field . Спасибо!
Andrea Richiardi 12 май 2013, в 04:31
7

Все это делает формат JSON, если я не ошибаюсь. Он не позволяет вызывающей стороне выбирать конкретное поле из вывода, как решение xpath или что-то на основе «указателя JSON».
Cheeso 04 июнь 2014, в 00:42
0

или вы можете использовать pythonpy: curl 'http://twitter.com/users/username.json' | py --json_input -x 'x.name'
RussellStewart 14 сен. 2014, в 20:14
1

Я просто получаю пару ключ-значение, а не значение само по себе.
christopher 28 дек. 2017, в 10:15
0

grep без якорей подхватит любую строку, которая содержит имя поля. Угадайте, что произойдет, если поле называется чем-то очень общим и коротким, как id . (Это можно исправить с помощью grep "\"id\":" но это все равно дает вам всю строку, а не только значение или только имя поля, если его значение является другой сложной структурой.)
tripleee 18 июнь 2018, в 12:57
0

Ребята, это 2018, игнорируйте мой комментарий, обязательно используйте jq ;-)
jnrg 01 авг. 2018, в 23:27
0

jq обычно не устанавливается, а python. Кроме того, попав в Python, вы можете пройти весь путь и проанализировать его с помощью import json...
CpILL 03 сен. 2018, в 13:10

Показать ещё 6 комментариев

106

Вы можете просто загрузить jq двоичный файл для своей платформы и запустить (chmod +x jq):

$ curl 'https://twitter.com/users/username.json' | ./jq -r '.name'

Он извлекает атрибут "name" из объекта json.

jq homepage говорит, что это похоже на sed для данных JSON.

jfs 30 май 2013, в 15:48

25

Для jq , jq - удивительный инструмент.
hoss 25 июнь 2013, в 16:48
2

Согласовано. Я не могу сравнить с jsawk из принятого ответа, поскольку я не использовал его, но для локальных экспериментов (где установка инструмента приемлема) я настоятельно рекомендую jq. Вот немного более обширный пример, который берет каждый элемент массива и синтезирует новый объект JSON с выбранными данными: curl -s https://api.example.com/jobs | jq '.jobs[] | {id, o: .owner.username, dateCreated, s: .status.state}'
jbyler 21 апр. 2014, в 22:04
1

Люблю это. Очень легкий вес, и, поскольку он находится в обычном старом C, его можно скомпилировать где угодно.
Benmj 21 окт. 2014, в 16:28
0

Наиболее практичный: он не требует сторонних библиотек (в отличие от jsawk) и прост в установке (OSX: brew install jq)
lauhub 19 дек. 2014, в 09:10
0

Это наиболее практичный и легко реализуемый ответ для моего варианта использования. Для системы Ubuntu (14.04) простая apt-get install jq добавила инструмент в мою систему. Я передаю вывод JSON из ответов CLI AWS в jq, и он прекрасно работает для извлечения значений для определенных ключей, вложенных в ответ.
Brandon K 27 май 2015, в 15:01
0

Это намного быстрее, чем jsawk, с чем у меня недавно была проблема из-за дорогих вызовов spidermonkey.
thrau 28 фев. 2016, в 19:18
0

Это мой личный фаворит для разбора JSON. Это позволяет для сложного анализа, фильтрации и расчета. И это доступно в репозиториях Debian, а также для Cygwin.
Stéphane Ch. 03 июнь 2016, в 13:44
0

Чушь собачья ... Чушь собачья ... Вот! Я люблю, я абсолютно люблю!
odiszapc 16 июнь 2016, в 09:34
0

xmodulo.com/...
enthusiasticgeek 28 июль 2016, в 16:36

Показать ещё 7 комментариев

88

Используйте поддержку Python JSON вместо использования awk!

Что-то вроде этого:

curl -s http://twitter.com/users/username.json | \
    python -c "import json,sys;obj=json.load(sys.stdin);print obj['name'];"

martinr 24 дек. 2009, в 00:09

4

Извините за попытку придумать хороший ответ ...: Я буду стараться изо всех сил. Чтобы избавиться от партизанства, нужно больше, чем написать сценарий awk!
martinr 23 дек. 2009, в 22:45
7

Почему вы используете переменную obj в этом решении oneliner? Это бесполезно и не хранится вообще? Вы пишете меньше, используя json.load(sys.stdin)['"key']" качестве примера, например: curl -sL httpbin.org/ip | python -c "import json,sys; print json.load(sys.stdin)['origin']" .
erm3nda 15 фев. 2016, в 07:23

72

Использование Node.js

Если система имеет node, можно использовать флаги -p print и -e evaulate script с JSON.parse, чтобы вытащить любое значение, которое необходимо.

Простой пример с использованием строки JSON { "foo": "bar" } и вытягивания значения "foo":

$ node -pe 'JSON.parse(process.argv[1]).foo' '{ "foo": "bar" }'
bar

Поскольку у нас есть доступ к cat и другим утилитам, мы можем использовать это для файлов:

$ node -pe 'JSON.parse(process.argv[1]).foo' "$(cat foobar.json)"
bar

Или любой другой формат, такой как URL-адрес, содержащий JSON:

$ node -pe 'JSON.parse(process.argv[1]).name' "$(curl -s https://api.github.com/users/trevorsenior)"
Trevor Senior

x9hb8wcy6quezjk 27 авг. 2013, в 15:54

1

Спасибо! но в моем случае это работает только с node -p -e 'JSON.parse(process.argv[1]).foo' '{ "foo": "bar" }' -e flag node -p -e 'JSON.parse(process.argv[1]).foo' '{ "foo": "bar" }'
Rnd_d 25 нояб. 2013, в 23:02
27

Трубы! curl -s https://api.github.com/users/trevorsenior | node -pe "JSON.parse(require('fs').readFileSync('/dev/stdin').toString()).name"
nicerobot 07 май 2014, в 19:19
3

это мое любимое решение; используйте язык (javascript) для анализа естественной для него структуры данных (JSON). кажется наиболее правильным . Кроме того, возможно, узел уже доступен в системе, и вам не придется манипулировать двоичными файлами jq (что выглядит как еще один правильный выбор).
Eliran Malka 01 март 2017, в 15:05
0

Это функция сценария bash: # jsonv получить значение объекта json для определенного атрибута # первый параметр - документ json # второй параметр - атрибут, значение которого должно быть возвращено get_json_attribute_value () {node -pe 'JSON.parse (process. argv [1]) [process.argv [2]] '"$ 1" "$ 2"}
Youness 04 июль 2017, в 23:35
4

С Node.js 10 работает следующее: cat package.json | node -pe 'JSON.parse(fs.readFileSync(0)).version'
Ilya Boyandin 15 окт. 2018, в 10:21

Показать ещё 3 комментария

46

Вы спросили, как стрелять себе в ногу, и я здесь, чтобы предоставить боеприпасы:

curl -s 'http://twitter.com/users/username.json' | sed -e 's/[{}]/''/g' | awk -v RS=',"' -F: '/^text/ {print $2}'

Вы можете использовать tr -d '{}' вместо sed. Но оставляя их полностью, кажется, тоже имеет желаемый эффект.

Если вы хотите удалить внешние кавычки, проведите результат выше, используя sed 's/$^"\|"$$//g'

Я думаю, что другие услышали достаточную тревогу. Я буду стоять рядом с мобильным телефоном, чтобы вызвать скорую. Пожар при готовности.

Dennis Williamson 24 дек. 2009, в 01:01

9

Таким образом, ложь безумия, прочитайте это: stackoverflow.com/questions/1732348/…
Dennis Williamson 24 дек. 2009, в 00:12
1

Я прочитал все ответы, и этот работает отлично для меня без каких-либо дополнительных зависимостей. +1
eth0 26 янв. 2015, в 22:39
0

Это то, что я искал. Единственное исправление - команда sed для удаления кавычек у меня не работала, вместо этого я использовал sed 's / "// g'
AlexG 12 авг. 2015, в 12:43

Показать ещё 1 комментарий

37

Использование Bash с Python

Создайте функцию Bash в файле .bash_rc

function getJsonVal () { 
    python -c "import json,sys;sys.stdout.write(json.dumps(json.load(sys.stdin)$1))"; 
}

Тогда

$ curl 'http://twitter.com/users/username.json' | getJsonVal "['text']"
My status
$

Вот такая же функция, но с проверкой ошибок.

function getJsonVal() {
   if [ \( $# -ne 1 \) -o \( -t 0 \) ]; then
       cat <<EOF
Usage: getJsonVal 'key' < /tmp/
 -- or -- 
 cat /tmp/input | getJsonVal 'key'
EOF
       return;
   fi;
   python -c "import json,sys;sys.stdout.write(json.dumps(json.load(sys.stdin)$1))";
}

Где $# -ne 1 обеспечивает как минимум 1 вход, и -t 0 убедитесь, что вы перенаправляетесь из канала.

Хорошая вещь об этой реализации заключается в том, что вы можете получить доступ к вложенным значениям json и получить json в ответ! =)

Пример:

$ echo '{"foo": {"bar": "baz", "a": [1,2,3]}}' |  getJsonVal "['foo']['a'][1]"
2

Если вы хотите быть действительно причудливым, вы можете распечатать данные:

function getJsonVal () { 
    python -c "import json,sys;sys.stdout.write(json.dumps(json.load(sys.stdin)$1, sort_keys=True, indent=4))"; 
}

$ echo '{"foo": {"bar": "baz", "a": [1,2,3]}}' |  getJsonVal "['foo']"
{
    "a": [
        1, 
        2, 
        3
    ], 
    "bar": "baz"
}

Joe Heyming 06 фев. 2014, в 06:56

2

+1 но вам действительно нужно избавиться от бесполезного использования cat
tripleee 19 фев. 2014, в 05:17
0

Однострочник без функции bash: curl http://foo | python -c 'import json,sys;obj=json.load(sys.stdin);print obj["environment"][0]["name"]'
Cheeso 04 июнь 2014, в 00:53
1

sys.stdout.write() если вы хотите, чтобы он работал с Python 2 и 3.
Per Johansson 27 июнь 2014, в 09:17
0

Я думаю, что это должно измениться на system.stdout.write (obj $ 1). Таким образом, вы можете сказать: getJsonVal "['environment'] ['name']", как пример @Cheeso
Joe Heyming 07 июль 2014, в 20:14
0

Pythonpy может быть полезным здесь github.com/Russell91/pythonpy
Narek 09 июнь 2016, в 20:05
1

@Narek В этом случае это будет выглядеть так: function getJsonVal() { py -x "json.dumps(json.loads(x)$1, sort_keys=True, indent=4)"; }
Joe Heyming 22 сен. 2016, в 22:57

Показать ещё 4 комментария

28

jq

$ curl 'https://api.github.com/repos/stedolan/jq/commits?per_page=5' | \
    jq '.[0] | {message: .commit.message, name: .commit.committer.name}'

liruqi 03 дек. 2017, в 01:33

19

Разбор JSON с PHP CLI

Возможно, не в тему, но поскольку приоритет царит, этот вопрос остается неполным без упоминания нашего надежного и верного PHP, я прав?

Используя тот же пример JSON, но давайте присваиваем его переменной для уменьшения неопределенности.

$ export JSON='{"hostname":"test","domainname":"example.com"}'

Теперь для PHP goodness, используя file_get_contents и php://stdin.

$ echo $JSON|php -r 'echo json_decode(file_get_contents("php://stdin"))->hostname;'

или, как указано, используя fgets и уже открытый поток при постоянной константе CLI STDIN.

$ echo $JSON|php -r 'echo json_decode(fgets(STDIN))->hostname;'

NJoy!

nickl- 23 янв. 2013, в 23:21

0

Я использую то же самое, что работает также с fgets(STDIN)
Elvis Ciotti 02 апр. 2013, в 14:01
0

Вы даже можете использовать $argn вместо fgets(STDIN)
IcanDivideBy0 23 сен. 2013, в 11:50
0

К сожалению, $argn работает с флагом -E или -R и только если содержимое JSON находится в одной строке ...
IcanDivideBy0 23 сен. 2013, в 11:58

Показать ещё 1 комментарий

18

TickTick является парсером JSON, написанным в bash (< 250 строк кода)

Здесь авторский снипп из своей статьи Представьте мир, в котором bash поддерживает JSON:

#!/bin/bash
. ticktick.sh

``  
  people = { 
    "Writers": [
      "Rod Serling",
      "Charles Beaumont",
      "Richard Matheson"
    ],  
    "Cast": {
      "Rod Serling": { "Episodes": 156 },
      "Martin Landau": { "Episodes": 2 },
      "William Shatner": { "Episodes": 2 } 
    }   
  }   
``  

function printDirectors() {
  echo "  The ``people.Directors.length()`` Directors are:"

  for director in ``people.Directors.items()``; do
    printf "    - %s\n" ${!director}
  done
}   

`` people.Directors = [ "John Brahm", "Douglas Heyes" ] ``
printDirectors

newDirector="Lamont Johnson"
`` people.Directors.push($newDirector) ``
printDirectors

echo "Shifted: "``people.Directors.shift()``
printDirectors

echo "Popped: "``people.Directors.pop()``
printDirectors

CoolAJ86 10 дек. 2011, в 05:44

1

Как единственный надежный ответ на этот вопрос, заслуживающий чистого внимания, это заслуживает большего числа голосов.
Ed Randall 13 сен. 2018, в 12:59

17

пожалуйста не делайте этого!

не используют линейно-ориентированные инструменты для анализа иерархических данных, сериализованных в текст. он работает только для особых случаев и будет преследовать вас и других людей. если вы действительно не можете использовать готовый json-парсер, напишите простой, используя рекурсивный спуск. это легко и будет выносить изменения, испускающая сторона справедливо рассматривает косметические (добавленные или удаленные пробелы, включая символы новой строки).

just somebody 03 дек. 2017, в 02:34

17

Нативная версия Bash: Также хорошо работает с обратными косыми чертами (\) и кавычками (")

function parse_json()
{
    echo $1 | \
    sed -e 's/[{}]/''/g' | \
    sed -e 's/", "/'\",\"'/g' | \
    sed -e 's/" ,"/'\",\"'/g' | \
    sed -e 's/" , "/'\",\"'/g' | \
    sed -e 's/","/'\"---SEPERATOR---\"'/g' | \
    awk -F=':' -v RS='---SEPERATOR---' "\$1~/\"$2\"/ {print}" | \
    sed -e "s/\"$2\"://" | \
    tr -d "\n\t" | \
    sed -e 's/\\"/"/g' | \
    sed -e 's/\\\\/\\/g' | \
    sed -e 's/^[ \t]*//g' | \
    sed -e 's/^"//'  -e 's/"$//'
}


parse_json '{"username":"john, doe","email":"[email protected]"}' username
parse_json '{"username":"john doe","email":"[email protected]"}' email

--- outputs ---

john, doe
[email protected]

maikel 30 окт. 2014, в 15:28

0

Это круто. Но если строка JSON содержит более одного ключа электронной почты, анализатор выдаст [email protected] "" [email protected]
rtc11 06 апр. 2016, в 12:03
0

Не работает, если в письме есть тире вроде [email protected]
alexmngn 15 март 2019, в 14:53

13

Не изобретайте колесо и не выбирайте из официального инструмента анализа JSON, рекомендованного создателем JSON: http://www.json.org/ (см. внизу)

TMS 03 дек. 2017, в 01:38

11

Версия, которая использует Ruby и http://flori.github.com/json/

$ < file.json ruby -e "require 'rubygems'; require 'json'; puts JSON.pretty_generate(JSON[STDIN.read]);"

или более кратко:

$ < file.json ruby -r rubygems -r json -e "puts JSON.pretty_generate(JSON[STDIN.read]);"

boecko 27 апр. 2011, в 10:34

3

это мой любимый;) Кстати, вы можете сократить его с помощью ruby -rjson, чтобы потребовать библиотеку
lucapette 04 май 2011, в 10:57
0

Обратите внимание, что финал ; не требуется в Ruby (он используется только для объединения операторов, которые обычно располагаются на отдельных строках в одну строку).
Zack Morris 15 авг. 2018, в 20:50

9

Кажется, что все недооценивают awk. Правда, одного или двух строк awk script не хватит. Но нетрудно написать настоящий JSON-парсер в awk. Я просто добавил один из своих awkenough.

dubiousjim 03 дек. 2017, в 02:41

9

Несколько лет спустя я предполагаю (извините), но я создал чистый bash script, который поддерживает вложенность и может легко получить значения.

Основная часть script:

curl "http://twitter.com/users/username.json" |
./JSON.sh |
grep -F -e "[\"text\"] |
cut -s -f 2 -d '    '

В рабочем каталоге script требуется JSON.sh.

Автор json-формата рекомендует использовать JSON.sh в bash (перейдите в www.json.org и прокрутите вниз до второго раздела и он указан в разделе "Bash" ).

Если вы хотите, чтобы ваш script находился только в одном файле .sh, вы можете скопировать и вставить команды throw, parse_array, parse_object, parse_value и parse в ваш script. Измените script на следующее:

curl "http://twitter.com/users/username.json" |
grep -aoE '\"[^[:cntrl:]"\\]*((\\[^u[:cntrl:]]|\\u[0-9a-fA-F]{4})[^[:cntrl:]"\\]*)*\"|-?(0|[1-9][0-9]*)([.][0-9]*)?([eE][+-]?[0-9]*)?|null|false|true|[[:space:]]+$|.' --color=never |
grep -vE '^[[:space:]]+' |
parse |
grep -F -e "[\"text\"] |
cut -s -f 2 -d '    '

Как это работает:

curl получает json файл, затем передает его на grep.
grep "tokenizes" json (он выводит строку, число или символ и т.д.), а затем передает ее на второй grep, чья задача состоит в том, чтобы съесть пробелы. Это не относится к вам, если вы не копируете функции из JSON.sh.
Если вы копируете функции из JSON.sh, функция parse рекурсивно выводит путь к значению, затем вкладку, а затем значение. Если вы этого не сделаете, то JSON.sh выполняет токенизацию, ест пустоты и вызывает внутреннюю функцию parse. Оба передают их вывод на grep.
grep ищет список ключей и значений для пары, которую вы хотите. Он ищет ключ и выводит строку с ключом и значением. Как форматируются ключи: [aKey], где aKey - это ключ. Если ваш json вложен, он разделяется запятой. Если ваши значения находятся в массиве, используйте индекс массива (начиная с нуля), чтобы получить значение. Строка key/value переводится на cut (используйте несколько экземпляров -e "[aKey]", чтобы получить сразу несколько значений).
cut разрезает строку по два с помощью вкладки в качестве разделителя, а затем печатает только значение.

Таким образом, вы можете использовать только файл script и использовать чистый bash и поддерживать вложенный json. Наслаждайтесь! (хотя теперь вы, вероятно, перешли к другим проектам).

user837703 03 дек. 2017, в 01:51

6

Я создал модуль, специально предназначенный для манипуляции JSON с командной строкой:

https://github.com/ddopson/underscore-cli

FLEXIBLE. Инструмент "swiss-army-knife" для обработки данных JSON - может использоваться как простой симпатичный принтер или как полноценная Javascript-команда.
МОЩНЫЙ - предоставляет полную мощность и функциональность underscore.js(плюс underscore.string)
ПРОСТОЙ - упрощает запись однострочных JS, аналогичных использованию "perl -pe"
CHAINED. Несколько команд-команд можно связать вместе для создания конвейера обработки данных.
MULTI-FORMAT. Богатая поддержка форматов ввода/вывода - довольно-печатная, строгая JSON, msgpack и т.д.
DOCUMENTED - отличная документация по командной строке с несколькими примерами для каждой команды

Выбор поля довольно прост:

cat file.json | underscore extract field.subfield.subsubfield

По умолчанию он будет печатать вывод с "smart-whitespace", который является как читаемым, так и 100% строгим JSON (но вы можете выбрать другие форматы с флагами):

Если у вас есть какие-либо функции, прокомментируйте это сообщение или добавьте проблему в github. Я был бы рад определить приоритеты функций, которые необходимы членам сообщества.

Dave Dopson 03 дек. 2017, в 02:05

5

К сожалению, верхний проголосовавший ответ, который использует grep, возвращает совпадение full, которое не работает в моем сценарии, но если вы знаете, что формат JSON останется постоянным, вы можете использовать lookbehind и lookahead для извлеките только нужные значения.

# echo '{"TotalPages":33,"FooBar":"he\"llo","anotherValue":100}' | grep -Po '(?<="FooBar":")(.*?)(?=",)'
he\"llo
# echo '{"TotalPages":33,"FooBar":"he\"llo","anotherValue":100}' | grep -Po '(?<="TotalPages":)(.*?)(?=,)'
33
#  echo '{"TotalPages":33,"FooBar":"he\"llo","anotherValue":100}' | grep -Po '(?<="anotherValue":)(.*?)(?=})'
100

Daniel Sokolowski 20 нояб. 2016, в 21:07

0

Вы никогда не знаете порядок элементов в словаре JSON. Они по определению неупорядочены. Это как раз одна из фундаментальных причин, почему использование собственного JSON-парсера является обреченным подходом.
tripleee 18 июнь 2018, в 12:54

5

Вы можете использовать jshon:

curl 'http://twitter.com/users/username.json' | jshon -e text

kev 11 апр. 2012, в 16:02

0

На сайте написано: «В два раза быстрее, 1/6 памяти», а затем: «Jshon анализирует, считывает и создает JSON. Он предназначен для максимально возможного использования из оболочки и заменяет хрупкие анализаторы adhoc, созданные из grep / sed / awk, а также тяжёлые однострочные парсеры из perl / python. "
Roger 27 янв. 2017, в 09:20
0

это указано в качестве рекомендуемого решения для анализа JSON в Bash
qodeninja 08 июль 2017, в 04:33

4

Если у вас php:

php -r 'var_export(json_decode(`curl http://twitter.com/users/username.json`, 1));'

Например:
У нас есть ресурс, который предоставляет json со странами iso-коды: http://country.io/iso3.json, и мы можем легко увидеть его в оболочке с curl:

curl http://country.io/iso3.json

но он выглядит не очень удобным и не читаемым, лучше разобрать json и увидеть читаемую структуру:

php -r 'var_export(json_decode(`curl http://country.io/iso3.json`, 1));'

Этот код напечатает что-то вроде:

array (
  'BD' => 'BGD',
  'BE' => 'BEL',
  'BF' => 'BFA',
  'BG' => 'BGR',
  'BA' => 'BIH',
  'BB' => 'BRB',
  'WF' => 'WLF',
  'BL' => 'BLM',
  ...

если у вас есть вложенные массивы, этот вывод будет выглядеть намного лучше...

Надеюсь, это поможет...

Vladimir Kovpak 18 нояб. 2015, в 15:44

4

Для более сложного разбора JSON я предлагаю использовать модуль jsonpath python (by Stefan Goessner) -

Установить его -

sudo easy_install -U jsonpath

Используйте его -

Пример file.json(из http://goessner.net/articles/JsonPath) -

{ "store": {
    "book": [ 
      { "category": "reference",
        "author": "Nigel Rees",
        "title": "Sayings of the Century",
        "price": 8.95
      },
      { "category": "fiction",
        "author": "Evelyn Waugh",
        "title": "Sword of Honour",
        "price": 12.99
      },
      { "category": "fiction",
        "author": "Herman Melville",
        "title": "Moby Dick",
        "isbn": "0-553-21311-3",
        "price": 8.99
      },
      { "category": "fiction",
        "author": "J. R. R. Tolkien",
        "title": "The Lord of the Rings",
        "isbn": "0-395-19395-8",
        "price": 22.99
      }
    ],
    "bicycle": {
      "color": "red",
      "price": 19.95
    }
  }
}

Разберите его (извлеките все названия книг с ценой < 10) -

$ cat file.json | python -c "import sys, json, jsonpath; print '\n'.join(jsonpath.jsonpath(json.load(sys.stdin), 'store.book[?(@.price < 10)].title'))"

Выведет -

Sayings of the Century
Moby Dick

ПРИМЕЧАНИЕ. Вышеуказанная командная строка не включает проверку ошибок. для полного решения с проверкой ошибок вы должны создать небольшой python script и обернуть код с помощью try-except.

shlomosh 01 апр. 2014, в 09:01

0

красивая идиома. Я даже не знаю Python, но это кажется мощным решением
Sridhar-Sarnobat 20 авг. 2016, в 05:15
0

У меня возникли небольшие проблемы с установкой jsonpath поэтому вместо этого был установлен jsonpath_rw , поэтому вот что-то похожее, что вы можете попробовать, если вышеперечисленное не работает: 1) /usr/bin/python -m pip install jsonpath-rw 2) cat ~/trash/file.json | /usr/bin/python -c "from jsonpath_rw import jsonpath, parse; import sys,json; jsonpath_expr = parse('store.book[0]'); out = [match.value for match in jsonpath_expr.find(json.load(sys.stdin))]; print out;" (Я использовал полный путь к двоичному файлу Python, потому что у меня были некоторые проблемы с несколькими установленными питонами).
Sridhar-Sarnobat 20 авг. 2016, в 05:27

4

Кому-то, у которого также есть xml файлы, может захотеть посмотреть на Xidel. Это беспроигрышный процессор JSONiq. (т.е. он также поддерживает XQuery для обработки xml или json)

Пример в вопросе:

 xidel -e 'json("http://twitter.com/users/username.json")("name")'

Или с моим собственным, нестандартным синтаксисом расширения:

 xidel -e 'json("http://twitter.com/users/username.json").name'

BeniBela 30 май 2013, в 17:30

2

Этот инструмент оооочень много больше, чем просто парсер JSON ...
Roger 27 янв. 2017, в 09:45
0

Или проще: xidel -s https://api.github.com/users/lambda -e 'name' (или -e '$json/name' , или -e '($json).name' ).
Reino 13 янв. 2019, в 13:03

4

здесь один из способов сделать это с помощью awk

curl -sL 'http://twitter.com/users/username.json' | awk -F"," -v k="text" '{
    gsub(/{|}/,"")
    for(i=1;i<=NF;i++){
        if ( $i ~ k ){
            print $i
        }
    }
}'

ghostdog74 24 дек. 2009, в 01:49

3

Это может считаться оффтопическим, но это может быть полезно. Вот мой парсер JSON для URI Spotify:

wget -qO- "http://ws.spotify.com/lookup/1/.json?uri=[spotify url goes here]" | jsawk 'return this.track.artists[0].name + " - " + this.track.name + " (" + this.track.album.name + ")"'

script весьма полезен при использовании Spotify URI в качестве параметра (т.е. $1).

jsawk @github

Niko Riitala 03 дек. 2017, в 01:18

3

Если кто-то просто хочет извлечь значения из простых объектов JSON без необходимости вложенных структур, можно использовать регулярные выражения, даже не выходя из bash.

Вот функция, которую я определил с помощью регулярных выражений bash на основе стандарта JSON:

function json_extract() {
  local key=$1
  local json=$2

  local string_regex='"([^"\]|\\.)*"'
  local number_regex='-?(0|[1-9][0-9]*)(\.[0-9]+)?([eE][+-]?[0-9]+)?'
  local value_regex="${string_regex}|${number_regex}|true|false|null"
  local pair_regex="\"${key}\"[[:space:]]*:[[:space:]]*(${value_regex})"

  if [[ ${json} =~ ${pair_regex} ]]; then
    echo $(sed 's/^"\|"$//g' <<< "${BASH_REMATCH[1]}")
  else
    return 1
  fi
}

Предостережения: объекты и массивы не поддерживаются как значение, но поддерживаются все другие типы значений, определенные в стандарте. Кроме того, пара будет сопоставляться независимо от того, насколько глубоко в документе JSON она сохраняется до тех пор, пока она имеет точно такое же ключевое имя.

Пример OP:

$ json_extract text "$(curl 'http://twitter.com/users/username.json')"
My status

$ json_extract friends_count "$(curl 'http://twitter.com/users/username.json')"
245

Helder Pereira 20 сен. 2017, в 14:51

3

Это еще один гибридный ответ bash и python. Я опубликовал этот ответ, потому что мне хотелось обработать более сложный вывод JSON, но, уменьшив сложность моего приложения bash. Я хочу открыть следующий объект JSON из http://www.arcgis.com/sharing/rest/info?f=json в bash:

{
  "owningSystemUrl": "http://www.arcgis.com",
  "authInfo": {
    "tokenServicesUrl": "https://www.arcgis.com/sharing/rest/generateToken",
    "isTokenBasedSecurity": true
  }
}

Хотя этот подход увеличивает сложность функции Python, использование bash становится проще:

function jsonGet {
  python -c 'import json,sys
o=json.load(sys.stdin)
k="'$1'"
if k != "":
  for a in k.split("."):
    if isinstance(o, dict):
      o=o[a] if a in o else ""
    elif isinstance(o, list):
      if a == "length":
        o=str(len(o))
      elif a == "join":
        o=",".join(o)
      else:
        o=o[int(a)]
    else:
      o=""
if isinstance(o, str) or isinstance(o, unicode):
  print o
else:
  print json.dumps(o)
'
}

curl -s http://www.arcgis.com/sharing/rest/info?f=json | jsonGet
curl -s http://www.arcgis.com/sharing/rest/info?f=json | jsonGet authInfo
curl -s http://www.arcgis.com/sharing/rest/info?f=json | jsonGet authInfo.tokenServicesUrl

Выходной сигнал выше script:

{ "owningSystemUrl": " http://www.arcgis.com", "authInfo": { "tokenServicesUrl": " https://www.arcgis.com/sharing/rest/generateToken", "isTokenBasedSecurity": true}}
{ "tokenServicesUrl": " https://www.arcgis.com/sharing/rest/generateToken", "isTokenBasedSecurity": true}
https://www.arcgis.com/sharing/rest/generateToken

Я добавил поддержку массивов, поэтому вы можете использовать .length, и если источник представляет собой строковый массив, вы можете использовать .join:

curl -s http://www.arcgis.com/sharing/rest/portals/self?f=pjson | jsonGet defaultBasemap.baseMapLayers.length
curl -s http://www.arcgis.com/sharing/rest/portals/self?f=pjson | jsonGet defaultBasemap.baseMapLayers.0.resourceInfo.tileInfo.lods
curl -s http://www.arcgis.com/sharing/rest/portals/self?f=pjson | jsonGet defaultBasemap.baseMapLayers.0.resourceInfo.tileInfo.lods.length
curl -s http://www.arcgis.com/sharing/rest/portals/self?f=pjson | jsonGet defaultBasemap.baseMapLayers.0.resourceInfo.tileInfo.lods.23

Какие выходы:

1
[{ "scale" : 591657527.591555, "resolution" : 156543.03392800014, "level" : 0}, { "scale" : 295828763.795777, "resolution" : 78271.51696399994, "level" : 1}, { "scale" : 147914381.897889, "resolution" : 39135.75848200009, "level" : 2}, { "scale" : 73957190.948944, "resolution" : 19567.87924099992, "level" : 3}, { "scale" : 36978595.474472, "resolution" : 9783.93962049996, "level" : 4}, { "scale" : 18489297.737236, "resolution" : 4891.96981024998, "level" : 5}, { "scale" : 9244648.868618, "resolution" : 2445.98490512499, "level" : 6}, { "scale" : 4622324.434309, "разрешение" : 1222.992452562495, "level" : 7}, { "scale" : 2311162.217155, "resolution" : 611.4962262813797, "level" : 8}, { "scale" : 1155581.108577, "resolution" : 305.74811314055756, "level" : 9}, { "scale" : 577790.554289, "resolution" : 152.87405657041106, "level" : 10}, { "scale" : 288895.277144, "resolution" : 76.43702828507324, "level" : 11}, { "scale" : 144447.638572, "разрешение" : 38.21851414253662, "level" : 12}, { "scale" : 72223.819286, "resolution" : 19.109257071 26831, "level" : 13}, { "scale" : 36111.909643, "resolution" : 9.554628535634155, "level" : 14}, { "scale" : 18055.954822, "resolution" : 4.77731426794937, "level" : 15}, { "масштаб": 9027.977411, "разрешение" : 2.388657133974685, "уровень": 16}, { "масштаб": 4513.988705, "разрешение" : 1.1943285668550503, "уровень": 17}, { "шкала": 2256.994353, "разрешение" : 0,5971642835598172, "level" : 18}, { "scale" : 1128.497176, "resolution" : 0.29858214164761665, "level" : 19}, { "scale" : 564.248588, "resolution" : 0.14929107082380833, "level" : 20}, { "масштаб": 282.124294, "разрешение" : 0.07464553541190416, "уровень": 21}, { "шкала": 141.062147, "разрешение" : 0.03732276770595208, "уровень": 22}, { "масштаб": 70.5310735, "разрешение" : 0.01866138385297604, "level" : 23}]
24
{ "scale" : 70.5310735, "resolution" : 0.01866138385297604, "level" : 23}

Stephen Quan 26 апр. 2017, в 08:51

3

Теперь, когда Powershell является кросс-платформой, я подумал, что я брошу туда путь, так как считаю, что это довольно интуитивно понятный и чрезвычайно простой.

curl -s 'https://api.github.com/users/lambda' | ConvertFrom-Json

ConvertFrom-Json преобразует JSON в пользовательский объект Powershell, поэтому вы можете легко работать со свойствами с этой точки вперед. Если вам нужно только свойство id, вы просто выполните следующее:

curl -s 'https://api.github.com/users/lambda' | ConvertFrom-Json | select -ExpandProperty id

Если вы хотите вызвать все это из Bash, тогда вам придется называть его следующим образом:

powershell 'curl -s "https://api.github.com/users/lambda" | ConvertFrom-Json'

Конечно, есть чистый способ Powershell сделать это без завитки, который был бы следующим:

Invoke-WebRequest 'https://api.github.com/users/lambda' | select -ExpandProperty Content | ConvertFrom-Json

Наконец, также есть "ConvertTo-Json", который так же легко преобразует пользовательский объект в JSON. Вот пример:

(New-Object PsObject -Property @{ Name = "Tester"; SomeList = @('one','two','three')}) | ConvertTo-Json

Что создало бы хороший JSON вот так:

{
"Name":  "Tester",
"SomeList":  [
                 "one",
                 "two",
                 "three"
             ]

}

По общему признанию, использование оболочки Windows в Unix несколько кощунственно, но Powershell действительно хорош в некоторых вещах, а парсинг JSON и XML - это пара из них. Это страница GitHub для кросс-платформенной версии https://github.com/PowerShell/PowerShell

user2233949 20 март 2017, в 13:54

0

проголосовал за то, что вы продвигаете новую стратегию Microsoft по открытому исходному коду своих инструментов и включаете в себя иностранные инструменты с открытым исходным кодом. Это хорошо для нашего мира.
Alex 22 июнь 2017, в 15:58
0

Раньше мне не нравился PowerShell, но я должен признать, что обработка JSON очень хороша.
MartinThé 19 нояб. 2018, в 15:05

3

Если pip доступен в системе, то:

$ pip install json-query

Примеры использования:

$ curl -s http://0/file.json | json-query
{
    "key":"value"    
}

$ curl -s http://0/file.json | json-query my.key
value

$ curl -s http://0/file.json | json-query my.keys.
key_1
key_2
key_3

$ curl -s http://0/file.json | json-query my.keys.2
value_2

Alexey Dubkov 27 авг. 2016, в 05:41

0

Как найти json-массив длины использования пакета json-запроса?
Pruthvi Chitrala 25 авг. 2017, в 18:39

3

Двухстрочный, который использует python. Он работает особенно хорошо, если вы пишете один файл .sh, и вы не хотите зависеть от другого .py файла. Он также использует использование трубы |. echo "{\"field\": \"value\"}" можно заменить чем-либо, печатающим json в stdout.

echo "{\"field\": \"value\"}" | python -c 'import sys, json
print(json.load(sys.stdin)["field"])'

Adam Kurkiewicz 04 дек. 2014, в 19:46

0

Вопрос не в поиске решения Python. Смотрите комментарии тоже.
Andrew Barber 04 дек. 2014, в 19:38

3

Это хорошая утилита для pythonpy:

curl 'http://twitter.com/users/username.json' | py 'json.load(sys.stdin)["name"]'

RussellStewart 14 сен. 2014, в 21:00

0

Еще короче, модуль Python -c здесь :) приятно.
erm3nda 15 фев. 2016, в 07:25

3

Разбор JSON болезнен в оболочке script. С помощью более подходящего языка создайте инструмент, который извлекает атрибуты JSON в соответствии с соглашениями об использовании сценариев оболочки. Вы можете использовать свой новый инструмент для решения проблемы немедленного сценария оболочки, а затем добавить его в свой комплект для будущих ситуаций.

Например, рассмотрим инструмент jsonlookup таким образом, что если я скажу jsonlookup access token id, он вернет идентификатор атрибута, определенный в маркете атрибута, определенном в доступе атрибута от stdin, который, по-видимому, является данными JSON. Если атрибут не существует, инструмент ничего не возвращает (статус выхода 1). Если синтаксический анализ не выполняется, выйдите из состояния 2 и передайте сообщение stderr. Если поиск выполняется успешно, инструмент печатает значение атрибута.

Создав инструмент unix для точной цели извлечения значений JSON, вы можете легко использовать его в сценариях оболочки:

access_token=$(curl <some horrible crap> | jsonlookup access token id)

Любой язык будет использоваться для реализации jsonlookup. Вот довольно краткая версия python:

#!/usr/bin/python                                                               

import sys
import json

try: rep = json.loads(sys.stdin.read())
except:
    sys.stderr.write(sys.argv[0] + ": unable to parse JSON from stdin\n")
    sys.exit(2)
for key in sys.argv[1:]:
    if key not in rep:
        sys.exit(1)
    rep = rep[key]
print rep

mcnabicus 02 фев. 2014, в 22:23

3

Вы можете попробовать что-то вроде этого -

curl -s 'http://twitter.com/users/jaypalsingh.json' | 
awk -F=":" -v RS="," '$1~/"text"/ {print}'

jaypal singh 07 дек. 2011, в 00:57

2

Niet - это инструмент, который поможет вам извлекать данные из json или yaml файла непосредственно в CLI оболочки /bash.

$ pip install niet

Рассмотрим json файл с именем project.json со следующим содержимым:

{
  project: {
    meta: {
      name: project-sample
    }
}

Вы можете использовать niet следующим образом:

$ PROJECT_NAME=$(niet project.json project.meta.name)
$ echo ${PROJECT_NAME}
project-sample

Herve 12 фев. 2018, в 17:30

2

Как насчет использования Rhino? Это инструмент командной строки JavaScript. К сожалению, это немного грубо для такого типа приложений. Он не читает из stdin очень хорошо.

User1 03 дек. 2017, в 01:44

2

Я использовал это, чтобы извлечь продолжительность видео с выхода ffprobe json:

MOVIE_INFO='ffprobe "path/to/movie.mp4"  -show_streams -show_format -print_format json -v quiet' 
MOVIE_SECONDS='echo "$MOVIE_INFO"|grep -w \"duration\" |tail -1 | cut -d\" -f4 |cut -d \. -f 1'

его можно использовать для извлечения значения из любого json:

value='echo "$jsondata"|grep -w \"key_name\" |tail -1 | cut -d\" -f4

Ehsan Chavoshi 22 июнь 2016, в 09:54

1

Если предполагается, что это допустимый сценарий оболочки, пробелы вокруг знака равенства в последнем фрагменте являются синтаксической ошибкой.
tripleee 18 июнь 2018, в 12:55
0

@tripleee Исправлено. Tnx.
Ehsan Chavoshi 19 июнь 2018, в 13:22

2

Вот хорошая ссылка. В этом случае:

curl 'http://twitter.com/users/username.json' | sed -e 's/[{}]/''/g' | awk -v k="text" '{n=split($0,a,","); for (i=1; i<=n; i++) { where = match(a[i], /\"text\"/); if(where) {print a[i]} }  }'

Max Barrass 25 май 2015, в 04:38

0

этот ответ должен получить наибольшее количество голосов, большинство, если не все остальные ответы зависят от пакета (php, python и т. д.).
M03 19 март 2018, в 12:18
0

Нет, наоборот, ничто с бесполезным использованием sed не должно получить больше голосов.
tripleee 18 июнь 2018, в 13:00
0

СекКарма, Точно! В теме сказано, что инструменты UNIX не так ли? tripleee, есть пример кода ON TOPIC для проверки?
Max Barrass 21 июнь 2018, в 04:47

Показать ещё 1 комментарий

1

Я сделал это, "разобрав" ответ json для определенного значения следующим образом:

curl $url | grep $var | awk '{print $2}' | sed s/\"//g

Очевидно, что $url здесь будет URL-адресом twitter, а $var будет "text", чтобы получить ответ для этого var.

На самом деле, я думаю, что единственное, что я делаю в OP, оставил grep для строки с конкретной переменной, которую он ищет. Awk захватывает второй элемент на линии, и с sed я снимаю кавычки.

Кто-то умнее, чем я, возможно, мог бы сделать все это с помощью awk или grep.

Теперь вы можете сделать все это с помощью sed:

curl $url | sed '/text/!d' | sed s/\"text\"://g | sed s/\"//g | sed s/\ //g

Таким образом, нет awk, нет grep... Я не знаю, почему я об этом не думал раньше. Хммм...

tonybaldwin 10 дек. 2012, в 06:00

0

На самом деле, с Sed вы можете сделать
tonybaldwin 10 дек. 2012, в 04:16
0

grep | awk | sed и sed | sed | sed Трубопроводы sed | sed | sed - это расточительные антипаттерны. Ваш последний пример может быть легко переписан в curl "$url" | sed '/text/!d;s/\"text\"://g;s/\"//g;s/\ //g' но, как и другие отмечали, это и подвержено ошибкам, и хрупкое подход, который не следует рекомендовать в первую очередь.
tripleee 04 дек. 2014, в 10:10

0

Вы можете использовать bashJson

Это оболочка для модуля Python json и может обрабатывать сложные json-данные.

Давайте рассмотрим данные exlaple json из файла test.json

{
    "name":"Test tool",
    "author":"hack4mer",
    "supported_os":{
        "osx":{
            "foo":"bar",
            "min_version" : 10.12,
            "tested_on" : [10.1,10.13]
        },
        "ubuntu":{
            "min_version":14.04,
            "tested_on" : 16.04
        }
    }
}

Следующие команды читают данные из этого примера json файла

/bashjson.sh test.json name

Печать: тестовый инструмент

./bashjson.sh test.json supported_os osx foo

Печать: бар

./bashjson.sh test.json supported_os osx tested_on

Печать: [10.1,10.13]

hack4mer 13 авг. 2018, в 13:02

0

Существует также очень простой, но мощный инструмент обработки JSON CLI fx - https://github.com/antonmedv/fx

Примеры

Использовать анонимную функцию:

$ echo '{"key": "value"}' | fx "x => x.key"
value

Если вы не передадите анонимную функцию param =>..., код будет автоматически преобразован в анонимную функцию. И вы можете получить доступ к JSON по этому ключевому слову:

$ echo '[1,2,3]' | fx "this.map(x => x * 2)"
[2, 4, 6]

Или просто используйте точечный синтаксис:

$ echo '{"items": {"one": 1}}' | fx .items.one
1

Вы можете передать любое количество анонимных функций для уменьшения JSON:

$ echo '{"items": ["one", "two"]}' | fx "this.items" "this[1]"
two

Вы можете обновить существующий JSON с помощью оператора спредов:

$ echo '{"count": 0}' | fx "{...this, count: 1}"
{"count": 1}

Просто обычный JavaScript. Не нужно изучать новый синтаксис.

Anton Medvedev 25 янв. 2018, в 17:55

0

Также статья: medv.io/json-in-bash
Anton Medvedev 14 сен. 2018, в 06:11
4

Если вы продвигаете свое собственное творение, вы должны быть откровенными об этом. Смотрите, как не быть спамером.
tripleee 29 окт. 2018, в 08:25

0

Python может сделать это с помощью oneliner без дополнительных зависимостей:

например.

echo 'import urllib; import json; print json.load(urllib.urlopen( "http://api.wordpress.org/plugins/info/1.0/authenticator.json" )) [ "download_link" ] '| Python

уверен, что вы можете сделать его более читаемым:

echo '
    import urllib
    import json
    print json.load(urllib.urlopen("http://api.wordpress.org/plugins/info/1.0/authenticator.json"))["download_link"]
     ' | python

Henning 03 дек. 2017, в 03:01

0

jq определенно является хорошим выбором, как многие ответили выше. Я дам вам несколько быстрых советов, прежде чем отказаться от

Это выводит все поля в строке json:

jq keys YourJsonString

Это выдает поле, называемое "присоединением" всех ваших узлов:

jq '.files[].accession' YourJsonString

Обычно, если выходы следуют постоянному порядку, вы можете сопоставить поля, которые вам нужны, для создания таблицы, набрав это:

paste -s <(jq '.files[].href' YourJsonString) <(jq '.files[].accession' YourJsonString)

Dr_Hope 03 дек. 2017, в 02:42

0

Существует более простой способ получить свойство из строки json. Используя пример файла package.json, попробуйте следующее:

#!/usr/bin/env bash
str=`cat package.json`;
my_val="$(node -pe "JSON.parse(\`$str\`)['version']")"

или

#!/usr/bin/env bash
prop="version"
my_val="$(node -pe "require('./package.json')['$prop']")"

оба метода работают отлично. наслаждаться.

читайте здесь: Прочитайте свойство name файла package.json с bash

Alexander Mills 11 нояб. 2017, в 06:17

0

Использование конкатенации строк для подстановки значений в строку, анализируемую как код, позволяет запускать произвольный код node.js, что означает, что использовать его со случайным контентом, полученным из Интернета, крайне небезопасно. Есть причина, по которой безопасные / передовые методы анализа JSON в JavaScript не просто оценивают его.
Charles Duffy 12 июль 2018, в 19:18

Ещё вопросы

Эээ ... это не очень хороший анализ json, кстати ... как насчет escape-символов в строках ... и т.д. Есть ли на SO ответ на python (даже на perl ...)?
Ответ Python на это заключается в том, чтобы просто использовать библиотеку Python JSON, которая на самом деле будет анализировать JSON. sed и AWK предоставляют регулярные выражения, но они не являются хорошим решением проблемы правильного синтаксического анализа JSON.
Согласен. На самом деле, библиотека jsawk обеспечила идеальное решение, которое я искал. Спасибо за идею!
Каждый раз, когда кто-то говорит: «Проблема X может быть легко решена с помощью другого языка Y», это код для «моей панели инструментов есть только камень для гвоздей ... зачем беспокоиться о чем-то еще?»
@BryanH: за исключением того, что иногда язык Y может быть более приспособлен для решения конкретной проблемы X независимо от того, сколько языков знает человек, предложивший Y.
Вроде поздно, но здесь это идет. grep -Po '"'"version"'"\s*:\s*"\K([^"]*)' package.json . Это решает задачу легко и только с помощью grep и отлично работает для простых JSON. Для сложных JSON вы должны использовать правильный синтаксический анализатор.
@auser, не могли бы вы изменить правку в заголовке с помощью sed и awk на «инструменты UNIX»?
@diosney Не могли бы вы объяснить, как работает это регулярное выражение Python, или указать мне страницу, на которой я мог бы учиться? Мое кольцо секретного декодера Google до сих пор меня не подводило. Благодарю.
Будет ли cut набор ваших потребностей?
Есть ли способ добавить jq к инструменту bash в таких окнах, как Git Bash?
@diosney, ... если у вас есть GNU grep, скомпилированный с поддержкой libpcre. Некоторые люди находятся на платформах BSD, платформах busybox или местах, где GNU grep был скомпилирован без включенных дополнительных функций.
Хороший список инструментов приведен в этом вопросе о «XSLT-эквиваленте для JSON».
что если параметр last в кортеже thwn в конце не запятая, а правая скобка. И +1 точно.
Привет Йола, верно, это зависит от ввода. Вы должны посмотреть на это в первую очередь.
Вы забыли о целочисленных значениях. grep -Po '"text":(\d*?,|.*?[^\\]",)'
Роберт: Да, мое регулярное выражение было написано только для строковых значений для этого поля. Целые числа могут быть добавлены, как вы говорите. Если вы хотите все типы, вы должны делать больше и больше: логическое значение, ноль. И массивы и объекты требуют больше работы; возможно только ограничение по глубине при стандартных регулярных выражениях.
1. jq .name работает в командной строке и не требует «открытия редактора для написания скрипта». 2. Неважно, насколько быстро ваше регулярное выражение может давать неправильные результаты
и если вам нужны только значения, вы можете просто добавить к ним awk. | grep -Po '"text":.*?[^\\]",'|awk -F':' '{print $2}'
Похоже, что в OSX опция -P отсутствует. Я тестировал на OSX 10.11.5 и grep --version была grep (BSD grep) 2.5.1-FreeBSD . Я получил это работает с опцией "расширенное регулярное выражение" на OSX. Команда сверху была бы grep -Eo '"text":.*?[^\\]",' tweets.json .
Да, jq намного лучше. Когда я писал оригинальный пост, его еще не было или он не был широко распространен.
он не имеет дело со значением, появляющимся несколько раз в JSON, поскольку вы не можете указать путь, который ведет к тому, который вы хотите внутри дерева.
это работало со мной, но как я могу получить результаты в файле для этой команды grep -Po '"text":. *? [^ \] ",' tweets.json
Я улучшил этот ответ ниже, чтобы использовать функцию bash: curl 'some_api' | getJsonVal 'ключ'
pythonpy ( github.com/russell91/pythonpy почти всегда является лучшей альтернативой python -c , хотя его нужно устанавливать с помощью pip. просто py --ji -x 'x[0]["hostname"]' json в py --ji -x 'x[0]["hostname"]' . Если вы не хотите использовать встроенную поддержку json_input, вы все равно можете автоматически импортировать их как py 'json.loads(sys.stdin)[0]["hostname"]'
Спасибо! Для более быстрого и грязного анализа JSON я обернул его в функцию bash: jsonq() { python -c "import sys,json; obj=json.load(sys.stdin); print($1)"; } чтобы я мог написать: curl ...... | jsonq 'json.dumps([key["token"] for key in obj], indent=2)' и другие подобные страшные вещи ... Кстати, obj[0] кажется ненужным, похоже, что просто obj работает нормально в случаи по умолчанию (?).
Благодарю. Я сделал это уважение JSON немного лучше, чем print: jsonq() { python -c "import sys,json; obj=json.load(sys.stdin); sys.stdout.write(json.dumps($1))"; }
obj[0] вызывает ошибку при разборе { "port":5555 } . Работает нормально после удаления [0] .
Как бы вы извлекли конкретный ключ, как спрашивает OP?
Лучший ответ на данный момент imho, нет необходимости устанавливать что-либо еще в большинстве дистрибутивов, и вы можете | grep field . Спасибо!
Все это делает формат JSON, если я не ошибаюсь. Он не позволяет вызывающей стороне выбирать конкретное поле из вывода, как решение xpath или что-то на основе «указателя JSON».
или вы можете использовать pythonpy: curl 'http://twitter.com/users/username.json' | py --json_input -x 'x.name'
Я просто получаю пару ключ-значение, а не значение само по себе.
grep без якорей подхватит любую строку, которая содержит имя поля. Угадайте, что произойдет, если поле называется чем-то очень общим и коротким, как id . (Это можно исправить с помощью grep "\"id\":" но это все равно дает вам всю строку, а не только значение или только имя поля, если его значение является другой сложной структурой.)
Ребята, это 2018, игнорируйте мой комментарий, обязательно используйте jq ;-)
jq обычно не устанавливается, а python. Кроме того, попав в Python, вы можете пройти весь путь и проанализировать его с помощью import json...
Для jq , jq - удивительный инструмент.
Согласовано. Я не могу сравнить с jsawk из принятого ответа, поскольку я не использовал его, но для локальных экспериментов (где установка инструмента приемлема) я настоятельно рекомендую jq. Вот немного более обширный пример, который берет каждый элемент массива и синтезирует новый объект JSON с выбранными данными: curl -s https://api.example.com/jobs | jq '.jobs[] | {id, o: .owner.username, dateCreated, s: .status.state}'
Люблю это. Очень легкий вес, и, поскольку он находится в обычном старом C, его можно скомпилировать где угодно.
Наиболее практичный: он не требует сторонних библиотек (в отличие от jsawk) и прост в установке (OSX: brew install jq)
Это наиболее практичный и легко реализуемый ответ для моего варианта использования. Для системы Ubuntu (14.04) простая apt-get install jq добавила инструмент в мою систему. Я передаю вывод JSON из ответов CLI AWS в jq, и он прекрасно работает для извлечения значений для определенных ключей, вложенных в ответ.
Это намного быстрее, чем jsawk, с чем у меня недавно была проблема из-за дорогих вызовов spidermonkey.
Это мой личный фаворит для разбора JSON. Это позволяет для сложного анализа, фильтрации и расчета. И это доступно в репозиториях Debian, а также для Cygwin.
Чушь собачья ... Чушь собачья ... Вот! Я люблю, я абсолютно люблю!
Извините за попытку придумать хороший ответ ...: Я буду стараться изо всех сил. Чтобы избавиться от партизанства, нужно больше, чем написать сценарий awk!
Почему вы используете переменную obj в этом решении oneliner? Это бесполезно и не хранится вообще? Вы пишете меньше, используя json.load(sys.stdin)['"key']" качестве примера, например: curl -sL httpbin.org/ip | python -c "import json,sys; print json.load(sys.stdin)['origin']" .
Спасибо! но в моем случае это работает только с node -p -e 'JSON.parse(process.argv[1]).foo' '{ "foo": "bar" }' -e flag node -p -e 'JSON.parse(process.argv[1]).foo' '{ "foo": "bar" }'
Трубы! curl -s https://api.github.com/users/trevorsenior | node -pe "JSON.parse(require('fs').readFileSync('/dev/stdin').toString()).name"
это мое любимое решение; используйте язык (javascript) для анализа естественной для него структуры данных (JSON). кажется наиболее правильным . Кроме того, возможно, узел уже доступен в системе, и вам не придется манипулировать двоичными файлами jq (что выглядит как еще один правильный выбор).
Это функция сценария bash: # jsonv получить значение объекта json для определенного атрибута # первый параметр - документ json # второй параметр - атрибут, значение которого должно быть возвращено get_json_attribute_value () {node -pe 'JSON.parse (process. argv [1]) [process.argv [2]] '"$ 1" "$ 2"}
С Node.js 10 работает следующее: cat package.json | node -pe 'JSON.parse(fs.readFileSync(0)).version'
Таким образом, ложь безумия, прочитайте это: stackoverflow.com/questions/1732348/…
Я прочитал все ответы, и этот работает отлично для меня без каких-либо дополнительных зависимостей. +1
Это то, что я искал. Единственное исправление - команда sed для удаления кавычек у меня не работала, вместо этого я использовал sed 's / "// g'
+1 но вам действительно нужно избавиться от бесполезного использования cat
Однострочник без функции bash: curl http://foo | python -c 'import json,sys;obj=json.load(sys.stdin);print obj["environment"][0]["name"]'
sys.stdout.write() если вы хотите, чтобы он работал с Python 2 и 3.
Я думаю, что это должно измениться на system.stdout.write (obj $ 1). Таким образом, вы можете сказать: getJsonVal "['environment'] ['name']", как пример @Cheeso
Pythonpy может быть полезным здесь github.com/Russell91/pythonpy
@Narek В этом случае это будет выглядеть так: function getJsonVal() { py -x "json.dumps(json.loads(x)$1, sort_keys=True, indent=4)"; }
Я использую то же самое, что работает также с fgets(STDIN)
Вы даже можете использовать $argn вместо fgets(STDIN)
К сожалению, $argn работает с флагом -E или -R и только если содержимое JSON находится в одной строке ...
Как единственный надежный ответ на этот вопрос, заслуживающий чистого внимания, это заслуживает большего числа голосов.
Это круто. Но если строка JSON содержит более одного ключа электронной почты, анализатор выдаст [email protected] "" [email protected]
Не работает, если в письме есть тире вроде [email protected]
это мой любимый;) Кстати, вы можете сократить его с помощью ruby -rjson, чтобы потребовать библиотеку
Обратите внимание, что финал ; не требуется в Ruby (он используется только для объединения операторов, которые обычно располагаются на отдельных строках в одну строку).
Вы никогда не знаете порядок элементов в словаре JSON. Они по определению неупорядочены. Это как раз одна из фундаментальных причин, почему использование собственного JSON-парсера является обреченным подходом.
На сайте написано: «В два раза быстрее, 1/6 памяти», а затем: «Jshon анализирует, считывает и создает JSON. Он предназначен для максимально возможного использования из оболочки и заменяет хрупкие анализаторы adhoc, созданные из grep / sed / awk, а также тяжёлые однострочные парсеры из perl / python. "
это указано в качестве рекомендуемого решения для анализа JSON в Bash
красивая идиома. Я даже не знаю Python, но это кажется мощным решением
У меня возникли небольшие проблемы с установкой jsonpath поэтому вместо этого был установлен jsonpath_rw , поэтому вот что-то похожее, что вы можете попробовать, если вышеперечисленное не работает: 1) /usr/bin/python -m pip install jsonpath-rw 2) cat ~/trash/file.json | /usr/bin/python -c "from jsonpath_rw import jsonpath, parse; import sys,json; jsonpath_expr = parse('store.book[0]'); out = [match.value for match in jsonpath_expr.find(json.load(sys.stdin))]; print out;" (Я использовал полный путь к двоичному файлу Python, потому что у меня были некоторые проблемы с несколькими установленными питонами).
Этот инструмент оооочень много больше, чем просто парсер JSON ...
Или проще: xidel -s https://api.github.com/users/lambda -e 'name' (или -e '$json/name' , или -e '($json).name' ).
проголосовал за то, что вы продвигаете новую стратегию Microsoft по открытому исходному коду своих инструментов и включаете в себя иностранные инструменты с открытым исходным кодом. Это хорошо для нашего мира.
Раньше мне не нравился PowerShell, но я должен признать, что обработка JSON очень хороша.
Как найти json-массив длины использования пакета json-запроса?
Вопрос не в поиске решения Python. Смотрите комментарии тоже.
Еще короче, модуль Python -c здесь :) приятно.
Если предполагается, что это допустимый сценарий оболочки, пробелы вокруг знака равенства в последнем фрагменте являются синтаксической ошибкой.
этот ответ должен получить наибольшее количество голосов, большинство, если не все остальные ответы зависят от пакета (php, python и т. д.).
Нет, наоборот, ничто с бесполезным использованием sed не должно получить больше голосов.
СекКарма, Точно! В теме сказано, что инструменты UNIX не так ли? tripleee, есть пример кода ON TOPIC для проверки?
На самом деле, с Sed вы можете сделать
grep | awk | sed и sed | sed | sed Трубопроводы sed | sed | sed - это расточительные антипаттерны. Ваш последний пример может быть легко переписан в curl "$url" | sed '/text/!d;s/\"text\"://g;s/\"//g;s/\ //g' но, как и другие отмечали, это и подвержено ошибкам, и хрупкое подход, который не следует рекомендовать в первую очередь.
Если вы продвигаете свое собственное творение, вы должны быть откровенными об этом. Смотрите, как не быть спамером.
Использование конкатенации строк для подстановки значений в строку, анализируемую как код, позволяет запускать произвольный код node.js, что означает, что использовать его со случайным контентом, полученным из Интернета, крайне небезопасно. Есть причина, по которой безопасные / передовые методы анализа JSON в JavaScript не просто оценивают его.

Brian Campbell · Accepted Answer · 2009-12-23T23-13-00.000Z

695

Лучший ответ

Существует несколько инструментов, специально предназначенных для управления JSON из командной строки, и будет намного проще и надежнее, чем делать с Awk, например jq:

curl -s 'https://api.github.com/users/lambda' | jq -r '.name'

Вы также можете сделать это с помощью инструментов, которые, вероятно, уже установлены в вашей системе, например Python, с помощью модуля json, и поэтому избегайте любых дополнительных зависимостей, при этом все еще пользуясь надлежащим парсером JSON. Далее предполагается, что вы хотите использовать UTF-8, который должен быть закодирован исходным JSON, и это то, что используют большинство современных терминалов:

Python 2:

export PYTHONIOENCODING=utf8
curl -s 'https://api.github.com/users/lambda' | \
    python -c "import sys, json; print json.load(sys.stdin)['name']"

Python 3:

curl -s 'https://api.github.com/users/lambda' | \
    python3 -c "import sys, json; print(json.load(sys.stdin)['name'])"

Исторические заметки

Этот ответ первоначально рекомендовал jsawk, который должен по-прежнему работать, но немного более громоздко использовать, чем jq, и зависит на установленном автономном интерпретаторе JavaScript, который менее распространен, чем интерпретатор Python, поэтому, вероятно, предпочтительные ответы:

curl -s 'https://api.github.com/users/lambda' | jsawk -a 'return this.name'

Этот ответ также первоначально использовал API Twitter из вопроса, но этот API больше не работает, что затрудняет копирование примеров для тестирования, а для нового API Twitter API требуются ключи API, поэтому я переключился на использование API GitHub, который можно легко использовать без ключей API. Первый ответ на исходный вопрос:

curl 'http://twitter.com/users/username.json' | jq -r '.text'

Brian Campbell 23 дек. 2009, в 23:13

21

Я не хотел добавлять зависимости в проект, поэтому я хочу использовать sed / awk / curl, но jsawk кажется наиболее «надежным» решением.
auser 24 дек. 2009, в 21:28
1

Да, я понимаю, что не хочу добавлять дополнительные зависимости. Но JSON немного подходит для обычного awk анализа, поэтому я подумал, что должен указать на то, что похоже на то, что было создано для того, что вы пытаетесь сделать.
Brian Campbell 24 дек. 2009, в 22:30
8

@ari Я не уверен, какой вариант * nix вы используете, но Python является частью спецификации LSB (Linux Standard Base), которая должна охватывать большинство дистрибутивов сегодня.
Evan Plaice 28 фев. 2011, в 10:18
2

Похоже, это зависит от внешнего двоичного файла (spidermonkey-bin)
Thomas Dignan 04 окт. 2013, в 05:19
6

==> Установка зависимостей для jsawk: nspr, spidermonkey
Jason 20 авг. 2014, в 18:53
2

Хотя контейнеры для докеров обычно поставляются без Python
Wayne Werner 20 дек. 2014, в 14:43
6

Поскольку он каждый раз запускает spidermonkey, jsawk работает очень медленно, когда вам нужно часто его вызывать. jq - хорошая альтернатива
thrau 28 фев. 2016, в 19:20
7

@thrau +1. jq он доступен в репозитории и очень прост в использовании, поэтому он намного лучше, чем jsawk. Я проверил оба в течение нескольких минут, JQ выиграл эту битву
Szymon Sadło 17 июнь 2016, в 09:51
1

Обратите внимание, что в Python 2, если вы передаете вывод в другую команду, оператор print всегда будет кодировать в ASCII, потому что вы используете Python в конвейере. Вставьте PYTHONIOENCODING=<desired codec> в команду, чтобы установить другую выходную кодировку, подходящую для вашего терминала. В Python 3, по умолчанию UTF-8 в этом случае ( с помощью print() функции).
Martijn Pieters♦ 09 сен. 2016, в 11:28
1

мой python 2.6.6 хочет косвенно python -c "import sys, json; print(json.load(sys.stdin)[0]['name'])" массив первого уровня в квадратных скобках, поэтому у меня есть python -c "import sys, json; print(json.load(sys.stdin)[0]['name'])" (обратите внимание на [0])
Mat M 22 сен. 2016, в 15:55
1

@MatM Используете ли вы тот же API, что я в примере? GitHub API возвращает объект JSON, а не массив JSON. Однако, если вы используете другой API, который возвращает массив JSON, тогда да, вам нужно сначала проиндексировать его.
Brian Campbell 23 сен. 2016, в 04:02
0

@BrianCampbell: о да, я не уловил, что это может исходить из данных :). API, к которому я подключаюсь, отправляет обратно массив, вы были правы. Мои извенения.
Mat M 23 сен. 2016, в 06:58
0

Если вам нужно добавить 'jq' в качестве зависимости, вы можете просто использовать 'etcdctl' ...
ColinM 16 нояб. 2016, в 23:32
1

Установите jq на OSX с помощью brew install jq
Andy Fraley 20 апр. 2018, в 14:56
0

@ColinM Это не знакомый инструмент, вы можете уточнить? Быстрый поиск в Google дает мне github.com/coreos/etcd/blob/master/etcdctl/READMEv2.md, который выглядит как специфический для чего-то, называемого etcd котором я также никогда не слышал. На самом деле он может содержать анализатор JSON, но это не очевидно из быстрого сканирования README чтобы увидеть, как использовать это для анализа значения из dict. Может быть, это ваша точка зрения ...?
tripleee 18 июнь 2018, в 12:51
0

@triplee Хм, кажется, там нет упоминания о etcd в этом вопросе или ответе. Может быть, я просто представлял это, или, возможно, он был удален. В любом случае, yes etcdctl - это клиент, специфичный для etcd, который использует JSON. Точка остается в силе, хотя: если вам нужно добавить новую зависимость и изучить новый синтаксис, то, вероятно, есть какая-то клиентская программа, которая в любом случае лучше подходит, и большинство людей, вероятно, пришли сюда в поисках способа, который не добавляет новые зависимости. Мне нравятся ответы на основе Python, хотя я и не являюсь сильным в Python, поскольку Python часто доступен по умолчанию, например, Perl.
ColinM 19 июнь 2018, в 22:54
0

@ColinM (Для записи, нет упоминания о etcd в истории изменений .) Я вроде согласен, хотя jq набирает обороты в качестве стандартного инструмента де - факто для манипуляции JSON, поэтому аргумент , что обучение это является накладные расходы на самом деле не держать , Он также был специально разработан, чтобы быть достаточно автономным, поэтому сам по себе он не имеет большой цепочки зависимостей. Но да, для разового использования использование языка сценариев, с которым вы, по крайней мере, немного знакомы, с библиотекой JSON, намного лучше, чем попытка создать собственный синтаксический анализатор.
tripleee 20 июнь 2018, в 03:41
1

curl -s эквивалентен curl --silent , тогда как jq -r означает jq --raw-output то есть без строковых кавычек.
Serge Stroobandt 26 окт. 2018, в 21:52
0

JQ - это круто, но в тех случаях, когда вы не можете гарантировать, что он (или может быть) установлен, хитрость Python выше очень хороша .
Jon Lorusso 09 март 2019, в 17:46

Показать ещё 17 комментариев