[Python] PDFファイルからテキスト抽出
今日は、PyMuPDFというライブラリを利用し、PDFファイルからテキストを抽出します。 PyMuPDFはUnicodeに対応しているので、中国語や日本語の含まれるファイルも問題なく扱うことができます。なお、PyMuPD...
今日は、PyMuPDFというライブラリを利用し、PDFファイルからテキストを抽出します。 PyMuPDFはUnicodeに対応しているので、中国語や日本語の含まれるファイルも問題なく扱うことができます。なお、PyMuPD...