Convert PDF to Word using Java

Você pode facilmente converter seus documentos PDF em documentos do Word (.docx ou .doc) programaticamente em seus aplicativos Java. Essa conversão é útil quando você precisa editar o texto de seus documentos PDF ou pode precisar aplicar a formatação do texto. Neste artigo, você aprenderá como converter PDF para Word usando Java.

Os seguintes tópicos são discutidos/abordados neste artigo:

API Java para converter PDF para Word

Usarei GroupDocs.Conversion for Java API para a conversão de PDF para DOCX. Essa API fornece uma solução de conversão de arquivos rápida, eficiente e confiável em aplicativos Java sem instalar nenhum software externo. Ele suporta conversões entre todos os formatos de documentos comerciais populares, como PDF, HTML, E-mail, Word, Excel, PowerPoint, Project, Photoshop, CorelDraw, AutoCAD, formatos de arquivo de imagem raster e muito mais. Também permite exibir todo o documento ou renderizá-lo parcialmente para acelerar o processo. A API é compatível com todas as versões do Java e suporta sistemas operacionais populares (Windows, Linux, macOS) capazes de executar o Java runtime.

Baixe e configure

Você pode baixar o JAR da API ou simplesmente adicionar a seguinte configuração pom.xml em seu aplicativo Java baseado em Maven para experimentar os exemplos de código mencionados abaixo.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.7</version> 
</dependency>

Converter PDF para Word usando Java

Você pode converter documentos PDF para Word seguindo as etapas simples abaixo:

  1. Crie uma instância da classe Converter
  2. Forneça o caminho do arquivo de entrada
  3. Crie uma instância de WordProcessingConvertOptions
  4. Defina o número da página inicial
  5. Forneça o total de páginas para converter
  6. Definir o formato do arquivo de saída
  7. Chame o método Convert() junto com o caminho do arquivo de saída e as opções de conversão

O exemplo de código a seguir mostra como converter um arquivo PDF em um documento do Word usando Java.

// criar conversor
Converter converterer = new Converter("C:\\Files\\sample.pdf");

// definir opções de conversão do Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPageNumber(1);
options.setPagesCount(1);
options.setFormat(WordProcessingFileType.Docx);

// converter
converterer.converter("C:\\Files\\output.docx", options);
Converter PDF para Word usando Java

Converter PDF para Word usando Java

A classe Converter é a classe principal que controla o processo de conversão de documentos. Ele fornece vários métodos para converter documentos de formatos de arquivo suportados. O método Convert() dessa classe converte documentos de origem e usa dois parâmetros de entrada, o caminho do arquivo para o documento de origem e ConvertOptions para converter um documento de origem específico para o tipo de arquivo de destino desejado.

A classe WordProcessingConvertOptions fornece opções para conversão para o tipo de arquivo WordProcessing. O método setPageNumber() permite definir o número da página inicial para iniciar a conversão. Considerando que, o método setPagesCount() define o número total de páginas a serem convertidas a partir do número de página definido. O método setFormat() desta classe permite definir o formato de saída do documento convertido. Ele usa o tipo de enumeração WordProcessingFileType como entrada.

Converter páginas específicas de PDF para Word

Você pode converter páginas específicas de um documento PDF para Word seguindo as etapas simples abaixo:

  1. Crie uma instância da classe Converter
  2. Forneça o caminho do arquivo de entrada
  3. Crie uma instância de WordProcessingConvertOptions
  4. Definir lista de números de página para converter
  5. Chame o método Convert() junto com o caminho do arquivo de saída e as opções de conversão

O exemplo de código a seguir mostra como converter páginas específicas de um arquivo PDF em um documento do Word usando Java.

// criar conversor
Converter converterer = new Converter("C:\\Files\\sample.pdf");

// definir opções de conversão do Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();
options.setPages(Arrays.asList(2, 3));

// converter
converterer.converter("C:\\Files\\output.docx", options);

A classe WordProcessingConvertOptions fornece o método setPages() para converter números de página específicos definidos em uma lista separada por vírgulas de um documento de origem.

Carregar PDF protegido por senha e converter para Word

Você pode converter documentos PDF protegidos por senha para o Word seguindo as etapas simples abaixo:

  1. Criar PdfLoadOptions
  2. Configurar senha
  3. Crie uma instância da classe Converter
  4. Forneça o caminho do arquivo de entrada
  5. Crie uma instância de WordProcessingConvertOptions
  6. Chame o método Convert() junto com o caminho do arquivo de saída e as opções de conversão

O exemplo de código a seguir mostra como converter um arquivo PDF protegido por senha em um documento do Word usando Java.

// Opções de carregamento de PDF
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("password");

// criar conversor
Converter converterer = new Converter("C:\\Files\\sample.pdf", loadOptions);

// definir opções de conversão do Word
WordProcessingConvertOptions options = new WordProcessingConvertOptions();

// converter
converterer.converter("C:\\Files\\output.docx", options);

A classe PdfLoadOptions oferece várias opções para carregar documentos PDF. O método setPassword() dessa classe permite desproteger o documento protegido fornecendo sua senha.

Você pode encontrar mais detalhes sobre “Carregar documento PDF com opções” na documentação.

Obtenha uma licença gratuita

Você pode experimentar a API sem limitações de avaliação solicitando uma licença temporária gratuita.

Conclusão

Neste artigo, você aprendeu como converter documentos PDF para Word usando Java. Você também aprendeu como converter um arquivo PDF protegido por senha em um documento do Word. Além disso, você aprendeu como converter páginas específicas de um PDF para um documento do Word programaticamente. Você pode aprender ainda mais sobre GroupDocs.Conversion Java API usando a documentação. Em caso de qualquer ambiguidade, não hesite em contactar-nos no fórum.

Veja também