有価証券報告書の中からテキスト抽出したいなあと思ったのだけど、その時につまずいた部分のメモ。
XPDF使えばいいはずだったのに、そうでもなかった。
brew install xpdf brew install poppler
でpdftotextコマンドが日本語に対応する。
というか多分後者だけで良いのかもしれない。
popplerはxpdfから派生したものなので。
後はよしなに。
有価証券報告書の中からテキスト抽出したいなあと思ったのだけど、その時につまずいた部分のメモ。
XPDF使えばいいはずだったのに、そうでもなかった。
brew install xpdf brew install poppler
でpdftotextコマンドが日本語に対応する。
というか多分後者だけで良いのかもしれない。
popplerはxpdfから派生したものなので。
後はよしなに。