<\/p>\n
<\/p>\n
\r\npackage br.com.feltex.lerpdf;\r\n\r\nimport java.io.File;\r\nimport java.io.FileInputStream;\r\nimport java.io.IOException;\r\nimport java.io.PrintWriter;\r\nimport java.util.Scanner;\r\n\r\nimport org.apache.pdfbox.cos.COSDocument;\r\nimport org.apache.pdfbox.pdfparser.PDFParser;\r\nimport org.apache.pdfbox.pdmodel.PDDocument;\r\nimport org.apache.pdfbox.util.PDFTextStripper;\r\n\r\npublic class LeituraPDFBox {\r\n\r\n\tpublic static void main(String args[]) {\r\n\t\tSystem.out.println(\"Inicio\");\r\n\t\tPDFTextStripper pdfStripper = null;\r\n\t\tPDDocument pdDoc = null;\r\n\t\tCOSDocument cosDoc = null;\r\n\t\tFile file = new File(\"MeuArquivo.pdf\");\r\n\t\ttry {\r\n\t\t\tPDFParser parser = new PDFParser(new FileInputStream(file));\r\n\t\t\tparser.parse();\r\n\t\t\tcosDoc = parser.getDocument();\r\n\t\t\tpdfStripper = new PDFTextStripper();\r\n\t\t\tpdDoc = new PDDocument(cosDoc);\r\n \/\/Come\u00e7a a leitura do arquivo a partir da p\u00e1gina informada\r\n \/\/ neste exemplo \u00e9 a p\u00e1gina \"1\"\r\n\t\t\tpdfStripper.setStartPage(1);\r\n\r\n\t\t\tpdfStripper.setEndPage(pdfStripper.getEndPage());\r\n\t\t\tString parsedText = pdfStripper.getText(pdDoc);\r\n\r\n\t\t\tScanner s = new Scanner(parsedText);\r\n\t\t\ts.useDelimiter(\"\\n\");\r\n\r\n\t\t\tString linha = \"\";\r\n\t\t\twhile (s.hasNext()) {\r\n\t\t\t\tlinha = s.next();\t\t\t\t\r\n\t\t\t\tSystem.out.println(linha);\t\t\t\t\r\n\t\t\t}\r\n\t\t\ts.close();\r\n\t\t} catch (IOException e) {\r\n\t\t\te.printStackTrace();\r\n\t\t}\r\n\t\tSystem.out.println(\"Fim\");\r\n\t}\r\n}\r\n<\/pre>\n2. Criando um arquivo a partir da leitura do PDF<\/H2>
\n Agora vamos melhorar o nosso c\u00f3digo gerando uma arquivo TXT a partir do PDF que foi lido.<\/p>\n\r\npackage br.com.feltex.lerpdf;\r\n\r\nimport java.io.File;\r\nimport java.io.FileInputStream;\r\nimport java.io.IOException;\r\nimport java.io.PrintWriter;\r\nimport java.util.Scanner;\r\n\r\nimport org.apache.pdfbox.cos.COSDocument;\r\nimport org.apache.pdfbox.pdfparser.PDFParser;\r\nimport org.apache.pdfbox.pdmodel.PDDocument;\r\nimport org.apache.pdfbox.util.PDFTextStripper;\r\n\r\npublic class LeituraJava2 {\r\n\r\n\tpublic static void main(String args[]) {\r\n\t\tSystem.out.println(\"Inicio\");\r\n\t\tPDFTextStripper pdfStripper = null;\r\n\t\tPDDocument pdDoc = null;\r\n\t\tCOSDocument cosDoc = null;\r\n\t\tFile file = new File(\r\n\t\t\t\t\"MeuArquivo.pdf\");\r\n\t\ttry {\r\n\t\t\tPDFParser parser = new PDFParser(new FileInputStream(file));\r\n\t\t\tparser.parse();\r\n\t\t\tcosDoc = parser.getDocument();\r\n\t\t\tpdfStripper = new PDFTextStripper();\r\n\t\t\tpdDoc = new PDDocument(cosDoc);\r\n\t\t\tpdfStripper.setStartPage(1);\r\n\t\t\tpdfStripper.setEndPage(pdfStripper.getEndPage());\r\n\t\t\tString parsedText = pdfStripper.getText(pdDoc);\r\n\r\n\t\t\tPrintWriter saida = new PrintWriter(\r\n\t\t\t\t\tnew File(\"D:\/Temp\/saidapdf.txt\"));\r\n\r\n\t\t\tScanner s = new Scanner(parsedText);\r\n\t\t\ts.useDelimiter(\"\\n\");\r\n\r\n\t\t\tString linha = \"\";\r\n\t\t\twhile (s.hasNext()) {\r\n\t\t\t\tlinha = s.next();\r\n\t\t\t\tsaida.print(linha);\r\n\t\t\t}\r\n\t\t\tsaida.close();\r\n\t\t\ts.close();\r\n\t\t} catch (IOException e) {\r\n\t\t\te.printStackTrace();\r\n\t\t}\r\n\t\tSystem.out.println(\"Fim\");\r\n\t}\r\n}\r\n<\/pre>\n3. Conclus\u00e3o<\/H2>
\n Conseguimos, atrav\u00e9s do PDFBox, realizar a leitura de um arquivo PDF e tamb\u00e9m criamos um novo arquivo “txt” com o conte\u00fado encontrado no arquivo de origem. Com esse framework \u00e9 poss\u00edvel tamb\u00e9m gerar arquivos, manipular imagens entre muitas outras a\u00e7\u00f5es com PDFs.
\n Na se\u00e7\u00e3o de Links relacionados acesse a p\u00e1gina oficial do projeto e veja os v\u00e1rios exemplos dispon\u00edveis.<\/p>\n
Abra\u00e7os e bons estudos. No mais Vida que segue!!<\/p>\n
Links relacionados
\nSite oficial do PDFBox<\/a>
\nCriar arquivos PDF em Java iText<\/a>
\nProjetos Completos em Java \u2013 aprenda na pr\u00e1tica<\/a><\/p>\nN\u00e3o esque\u00e7a de curtir este post nas redes sociais. D\u00ea a sua contribui\u00e7\u00e3o social e ajude o autor:<\/H2><\/p>\n","protected":false},"excerpt":{"rendered":"
Dica R\u00e1pida: Leitura de PDF com PDFBox Ol\u00e1 amigos, A dica de hoje \u00e9 o PDFBox, mais um projeto Apache. Como o nome j\u00e1 sugere \u00e9 este framework nos ajuda a manipular arquivos no formado PDF. Para isso mostraremos um …<\/p>\n