概要
X上でPDFをあつかうためのプログラムですがpdftotxtやpdftohtmlが利用できので便利です。
URL
http://pdftohtml.sourceforge.net/
インストール
xpdf
fink install xpdf
日本語対応
http://www.foolabs.com/xpdf/download.html
からxpdf-japanese.tar.gzを取得。
tar xvfz xpdf-japanese.tar.gz cd xpdf-japanese sudo mkdir /usr/local/share/xpdf sudo mkdir /usr/local/share/xpdf/japanese
とりあえず全部コピー
add-to-xpdfrc
の中身を$HOME/.xpdfrcとかにコピーする。
pdftohtml
現在はfinkでインストールされる。以前というかかなり前ははいっていなかった時のメモ。
http://pdftohtml.sourceforge.net/
xpdf/Makefile
CXXFLAGS = -g -DJAPANESE_SUPPORT -DHAVE_DIRENT_H=1 …
OSX10.2以上だと
storage size of...
というエラーがでます。MakeFileを修正してgcc2やg++2を利用するようにしてください。
設定
利用方法
pdftotext
-enc EUC-JPオプションをつけないと日本語がうまく通らない。
pdftotext -enc EUC-JP hoge.pdf
http://october.servehttp.com/pdftotext.htm
利用してみるとわかるが、結構微妙な出力になる。
参考サイト
関連
http://www.adobe.com/products/acrobat/access_email.html
http://atrey.karlin.mff.cuni.cz/~clock/twibright/pdf2html/
http://www.twcu.ac.jp/~k-oda/VIRN/JARVI-MLTD/Windows/PDFtoTEXT.html
http://sakura.ducub.com/cgi/a-column/data/etc/1017931215.html