#pragma section-numbers off [[TableOfContents]] = 概要 = X上でPDFをあつかうためのプログラムですが{{{pdftotxt}}}や{{{pdftohtml}}}が利用できので便利です。 = URL = http://www.foolabs.com/xpdf/ http://pdftohtml.sourceforge.net/ = インストール = == xpdf == {{{ fink install xpdf }}} == 日本語対応 == http://www.foolabs.com/xpdf/download.html からxpdf-japanese.tar.gzを取得。 {{{ tar xvfz xpdf-japanese.tar.gz cd xpdf-japanese sudo mkdir /usr/local/share/xpdf sudo mkdir /usr/local/share/xpdf/japanese }}} とりあえず全部コピー add-to-xpdfrc の中身を$HOME/.xpdfrcとかにコピーする。 == pdftohtml == 現在はfinkでインストールされる。以前というかかなり前ははいっていなかった時のメモ。 http://pdftohtml.sourceforge.net/ xpdf/Makefile {{{ CXXFLAGS = -g -DJAPANESE_SUPPORT -DHAVE_DIRENT_H=1 … }}} OSX10.2以上だと {{{ storage size of... }}} というエラーがでます。MakeFileを修正してgcc2やg++2を利用するようにしてください。 = 設定 = = 利用方法 = == pdftotext == -enc EUC-JPオプションをつけないと日本語がうまく通らない。 {{{ pdftotext -enc EUC-JP hoge.pdf }}} http://october.servehttp.com/pdftotext.htm 利用してみるとわかるが、結構微妙な出力になる。 = 参考サイト = = 関連 = http://www.adobe.com/products/acrobat/access_email.html http://atrey.karlin.mff.cuni.cz/~clock/twibright/pdf2html/ http://www.twcu.ac.jp/~k-oda/VIRN/JARVI-MLTD/Windows/PDFtoTEXT.html http://sakura.ducub.com/cgi/a-column/data/etc/1017931215.html ---- CategoryMac CategoryUnix