[HOME]: [Mac OS X]: [MacPython]: [Emacs]: [生存報告記]: [MacEmacs JP Project]: [NTEmacs JP Project]:

概要

X上でPDFをあつかうためのプログラムですがpdftotxtpdftohtmlが利用できので便利です。

URL

http://www.foolabs.com/xpdf/

http://pdftohtml.sourceforge.net/

インストール

xpdf

fink install xpdf

日本語対応

http://www.foolabs.com/xpdf/download.html

からxpdf-japanese.tar.gzを取得。

tar xvfz xpdf-japanese.tar.gz
cd xpdf-japanese
sudo mkdir /usr/local/share/xpdf
sudo mkdir /usr/local/share/xpdf/japanese

とりあえず全部コピー

add-to-xpdfrc

の中身を$HOME/.xpdfrcとかにコピーする。

pdftohtml

現在はfinkでインストールされる。以前というかかなり前ははいっていなかった時のメモ。

http://pdftohtml.sourceforge.net/

xpdf/Makefile

CXXFLAGS = -g -DJAPANESE_SUPPORT -DHAVE_DIRENT_H=1 …

OSX10.2以上だと

storage size of...

というエラーがでます。MakeFileを修正してgcc2やg++2を利用するようにしてください。

設定

利用方法

pdftotext

-enc EUC-JPオプションをつけないと日本語がうまく通らない。

pdftotext -enc EUC-JP hoge.pdf

http://october.servehttp.com/pdftotext.htm

利用してみるとわかるが、結構微妙な出力になる。

参考サイト

関連

http://www.adobe.com/products/acrobat/access_email.html

http://atrey.karlin.mff.cuni.cz/~clock/twibright/pdf2html/

http://www.twcu.ac.jp/~k-oda/VIRN/JARVI-MLTD/Windows/PDFtoTEXT.html

http://sakura.ducub.com/cgi/a-column/data/etc/1017931215.html


CategoryMac CategoryUnix