Пакет, отличный от калибра, для преобразования записей RSS-канала в электронную книгу

Есть ли в репозиториях пакет (кроме Caliber), который можно было бы использовать для получения RSS-канала и преобразования записей в электронную книгу для чтения?

Калибр кажется слишком громоздким, чтобы его просто использовать возьмите один канал и выложите записи, как, возможно, epub.

У Calibre есть ручная секция для захвата RSS-каналов, но я не слишком заинтересован в том, чтобы возиться с Python.

5
задан 25 April 2014 в 03:38

2 ответа

Вы можете извлечь xml в текст, используя только bash и wget.

Например,

# Setup
URI=http://www.nydailynews.com/new-york/index_rss.xml
LINES=20 #max number of lines
EXEC="wget -q -O temp.temp"
clear

# Start
$EXEC $URI
cat temp.temp | grep title |\

# use sed loop to delete all LFs bar last line
sed ':a;N;$!ba;s/\n/ /g' |\

#replace all titles and descriptions with LFs
sed -e 's/<title>/\n\n/g' |\
sed -e 's/<description>/\n/g' |\

# uncook
sed -e 's/&lt;/</g' |\
sed -e 's/&gt;/>/g' |\
sed -e 's/nbsp;/ /g' |\
sed -e 's/&amp;/+/g' |\

#delete URLs
sed -e 's/http.[^<]*//g' |\

#replace other angled brackets with space
sed -e 's/<[^>]*>/ /g' |\

head -n $(($LINES + 2)) |\
tail -n $(($LINES))
0
ответ дан 25 April 2014 в 03:38

Не программное обеспечение, но я использовал http://newstoebook.com/ и был впечатлен тем, насколько хорошо это работает.

0
ответ дан 25 April 2014 в 03:38

Другие вопросы по тегам:

Похожие вопросы: