PDF内のテキストや画像を抽出する方法のまとめ 公開

例のまいさんの配置図を色々いじってゐた時に偶然発見した方法。っていふか、こんな機能いつの間に付いたのかしら。

レポもさうだけど、かういふTips的なことも書いておかないと忘れてしまふのよねぇ。

それはともかく、これでまいさんに一々PNGデータを頂かなくても、PDFから直接高解像度な画像データを抽出する事が出来るやうになった。これでもっと綺麗な色付き配置図が出来るぞー……と意気込んでゐたのだけど、AzPainterの仕様によると、

編集できる画像のサイズは?
幅・高さが1〜10,000pxで、かつ幅×高さ(面積)が16,000,000以下であれば編集できますが、それ以上のサイズの画像は編集できません。

となってをり、精々400dpi*1で取得するのがやっと言ふことに。まあ、今でもメモリ*2が涸渇寸前だったことを考へると、少しましになっただけでも良しとした方が良いのかも知れない。

一応まいさんにお願ひしてヴェクトルデータも頂いてゐるのですが、こちらの環境で上手く読み込めないため、今のところ実用化の目処は立ってゐません。むぅ。

*1:3,307 * 4,677 = 15,466,839

*2:1GB、DDR1なので碌に拡張も出来ない罠。