Экспорт статей Хабра в html, markdown
Url: https://habr.com/ru/post/665254
Author: Jessy_James
Date: 2022-05-11, 20:15

До меня было написано 4 статьи по экспорту статей с хабра в FB2 и pdf:
- Экспорт избранного Хабра в FB2
- Экспорт избранного Хабра в FB2 — скоростная PHP-версия
- Экспорт Хабра в FB2
- Экспорт Избранного на Хабре в PDF
Я захотел получить исходники своих статей. Поскольку для написания на хабре пользуюсь старым редактором и пишу в markdown, то и основная цель была получить исходник markdown. HTML пошел прицепом, т.к. статьи с хабра получаю в нем, а затем с помощью библиотеки markdownify и некоторых танцев с бубном получаю md.
Как пользоваться
Скрипт написан на python3, скачиваем с github, устанавливаем зависимости и запускаем:
| |
Скачиваем статьи пользователя:
| |
Скачиваем закладки пользователя:
| |
Скачиваем одиночную статью:
| |
Вместо jessy_james подставить имя нужного пользователя. Взять можно из ссылки профиля:

Вместо 665634 подставить id нужной статьи. Взять из ссылки на статью:

После запуска получаем такую картину:
| |
Статьи скачиваются от последней написанной к первой. Нумерация будет в порядки написания или добавления в закладки.
Иерархия каталога будет такой:

Создается папка article, favorites или singles, далее папка с именем пользователя, далее папки с названиями статей. В папке со статьей будет два файла (.md и .html) и папка с картинками статьи.
Смотрим что получилось, берем содержимое полученного файла markdown и вставляем в редактор статей:

Почти работает как я хотел ;), есть некоторые проблемы с отображением изображений (исходник html отображает правильнее). Постараюсь их исправить.
Спасибо за внимание.