Главная » Блог » Python — парсинг таблиц в PDF

Python — парсинг таблиц в PDF

09.04.202113.10.2022

Задача: Есть таблица в PDF. Нужно сохранить эту таблицу в эксель XLS или CSV.

Решение: Используем библиотеку camelot.

Ссылка на библиотеку: https://github.com/camelot-dev/camelot

Устанавливаем библиотеку python3 -m pip install camelot-py[cv]

import camelot

def main():
    tables = camelot.read_pdf('jones.pdf')
    print(tables[0].df)
    tables[0].to_csv('jones.csv')
    tables[0].to_excel('jones.xlsx')

if __name__ == '__main__':
    main()

Таблица экспортирована в CSV и XLS.
Ссылка на документацию https://camelot-py.readthedocs.io/en/master/user/quickstart.html#read-the-pdf

База знаний

Как настроить ключи SSH в Ubuntu 22.04
07.10.202207.10.2022

В этом руководстве мы сосредоточимся на настройке SSH-ключей для установки Ubuntu 22.04. SSH-ключи обеспечивают безопасный способ входа на ваш сервер и рекомендуются всем пользователям.
База знаний

Storefront — как изменить ссылки в футер-баре
08.03.202217.12.2022

Скрыть футер-бар, удалить или добавить ссылку.
База знаний

Фото для товаров. Скачать с Яндекс.Диска и преобразовать. Скринкаст #1
10.04.202125.03.2022

00:00 Что нужно сделать01:18 Получить ссылки на файлы Яндекс.Диска02:10 Скрипт для скачивания с Яндекс.Диска02:30 Скрипт для распаковки архивов03:27 Изменить названия фотографий13:13 Групповое переименование фотографий15:57 Групповое изменение размера фотографий19:03 Заключительное слово
База знаний

Как перевести плагин или тему WordPress
07.01.202005.03.2022

Перевести плагин или тему можно тремя способами: найти на wordpress.org, перевести с помощью плагина Loco Translate или программы Poedit
База знаний

СПАМ: как защитить сайт с помощью Google reCAPTCHA
15.07.202031.03.2022

Чтобы защититься от роботов — Google предлагает бесплатную капчу. Установка занимает 3 минуты.
База знаний

Оптимизация изображений
09.01.201805.03.2022

Чтобы сайт загружался быстрее, можно уменьшить вес изображений. Сжатие изображений происходит без потери качества, благодаря специальным алгоритмам сжатия. EWWW Image Optimizer Имадж оптимайзер автоматически оптимизирует новые изображения, которые вы загружаете на сайт, а также оптимизирует изображения, которые уже есть на сайте. Compress JPEG & PNG images Плагин лучше, чем EWWW Image Optimizer, но платный.Бесплатно доступна загрузка до…

Похожие записи

Добавить комментарий Отменить ответ