У меня есть большое количество json-файлов, и ранее мне сказали использовать следующую строку для поиска, если твит создается в определенный временной интервал в дате: grep -wirnEzc '},.*created_at":\s"Wed Oct 19 2(1:[0-5][0-9]:[0-5][0-9]|2:([0-2][0-9]:[0-5][0-9]|30:00)) .* 2016' *
Я не понимая, что именно точно пытается представить:
2(1:[0-5][0-9]:[0-5][0-9]|2:([0-2][0-9]:[0-5][0-9]|30:00))
На данный момент мне нужно изменить его, чтобы я мог найти количество результатов, возвращаемых этим grep, которые находятся между 17 июля 2016 года и 8 ноября 2016 года для поля «created_at». Вот пример одного из этих json-файлов: следующая строка
Как вы видите, каждый json-файл может содержать различные твиты. Поэтому я ищу поиск всех этих файлов * .json и поиск шаблонов "created_at":, которые следуют в следующей строке "retweeted":, потому что другие вещи, такие как изображение профиля или профиля, могут иметь атрибут "created_at":. И диапазон дат, который я ищу, - с 17 июля 2016 по 8 ноября 2016.
Пример интереса (не по дате):
},
"created_at": "Wed Dec 14 22:34:28 +0000 2016",
"retweeted": false,
"coordinates": null,
"in_reply_to_user_id_str": null,
"source": "IFTTT",
"in_reply_to_status_id_str": null,
"in_reply_to_screen_name": null,
"in_reply_to_user_id": null,
"extended_entities": {