1. 普通に読む
→首と腰をやられる(900頁クラスで経験済み)。
2. OCRつけてスキャンし、テキストデータを抽出して、equb形式で構造化してKindleで読む
→長い本は往々にして凝った組版になっており、OCRでテキストを抽出しようとしても註やら欄外の小見出しやらが本文と混ざってしまい、選り分けにかなりの手作業が発生し断念。シンプルなモノであればAIで作成可能。
3. スキャンしたPDFをタブレットか何かで読む。
→結局これが一番安パイだった。Adobe ScanやvFlatの湾曲補正が結構有効。
結果が無難過ぎて哀しい…。
1. 普通に読む
→首と腰をやられる(900頁クラスで経験済み)。
2. OCRつけてスキャンし、テキストデータを抽出して、equb形式で構造化してKindleで読む
→長い本は往々にして凝った組版になっており、OCRでテキストを抽出しようとしても註やら欄外の小見出しやらが本文と混ざってしまい、選り分けにかなりの手作業が発生し断念。シンプルなモノであればAIで作成可能。
3. スキャンしたPDFをタブレットか何かで読む。
→結局これが一番安パイだった。Adobe ScanやvFlatの湾曲補正が結構有効。
結果が無難過ぎて哀しい…。