今回は、PDFファイルからテキストを読み取ってメモに書き出す方法についてまとめてみます。 Pythonを使ったPDF処理に興味がある方、特にデータを自動で抽出したい方にお役に立てればと思い執筆しました。 では早速、Excelで作成した帳票をPDFに変換した後 ...
こんにちは!TechCommitメンバーの友季子です♬ 今回は、PDFファイルからテキストをレイアウトを保ちながら抽出する&ページNOと区切り線を出力する方法についてまとめてみました。 具体的にはPythonのPyMuPDFというライブラリを使って、PDF化ファイル=>メモ ...