[PHP-users 7060] Re: read the pdf

Naoto Imai php-users@php.gr.jp
Tue, 23 Apr 2002 00:39:31 +0900


今井です。
自己レスです。

> PDFファイルはバイナリファイルなので、表示されているのは、PDFファイルをテキ
> ストエディタで開いたのと同じではないでしょうか?

すみません、上記、ちょっと間違っていました。
テキストだけのPDFの場合、ファイル自体もテキストファイルになっているよう
ですね。ただし、画像が入ったりした場合には、バイナリファイル(?)のよう
になります。


ご質問の意味も私なりに少し考えてみたのですが、
1.webサーバーからアクセスできないディレクトリからpdfファイルを読み込んで、
  pdfとして表示
2.pdfファイルの中身のテキストデータを表示
  例:pdfを開いたときに「こんにちは」と表示されるファイルをPHPで読み込んで
    テキストとして「こんにちは」をブラウザに表示
の2つのどちらかかなと思います。
それで、1の場合は、ヘッダにpdfであることを書けばよいかと思います。
2の場合ですが、これは、pdfのファイルフォーマットを解析してテキストの部分だ
けを抜き出す作業が必要です。
(確か標準ではそのような関数は無かったと思います)
pdfのファイルフォーマットは一般公開されているようです。