2005-08-19から1日間の記事一覧

PDFのParser

ドキュメント管理ソフトを作ろうと思い立って、まずはPDF専用の管理ソフトを作っているんだけど、PDFのParserが問題。 今は http://www.pdfbox.org/ を使ってるんだけど、PDF全体をparseしているらしく遅い。MetaData欲しいだけなので、ヘッダーだけparseで…