Converter PDF para HTML usando Java

PDF oferece compartilhar e imprimir documentos somente leitura sem perder a formatação dos documentos. Podemos converter facilmente documentos PDF em páginas da Web HTML e visualizá-los em qualquer navegador. Neste artigo, aprenderemos como converter documentos PDF em páginas da Web HTML usando Java.

Os seguintes tópicos serão abordados neste artigo:

API Java para converter PDF em HTML — Download grátis

Para converter PDF para HTML, usaremos a API GroupDocs.Conversion for Java. Ele fornece soluções de conversão de arquivos rápidas, eficientes e confiáveis para usuários finais. Faça o download do JAR da API ou apenas adicione a seguinte configuração pom.xml em um aplicativo Java baseado em Maven.

<repository>
	<id>GroupDocsJavaAPI</id>
	<name>GroupDocs Java API</name>
	<url>http://repository.groupdocs.com/repo/</url>
</repository>
<dependency>
        <groupId>com.groupdocs</groupId>
        <artifactId>groupdocs-conversion</artifactId>
        <version>21.10.1</version> 
</dependency>

Conversão de PDF para HTML usando Java

Podemos converter facilmente documentos PDF em páginas HTML de forma programática, seguindo as etapas simples abaixo:

  1. Primeiramente, carregue um documento PDF usando a classe Converter.
  2. Em seguida, crie uma instância da classe MarkupConvertOptions.
  3. Em seguida, defina opcionalmente várias opções de conversão, como FixedLayout, FixedLayoutShowBorders, etc.
  4. Finalmente, converta PDF para HTML usando o método Converter.Convert(). Leva o caminho do arquivo de saída e converte as opções como argumentos.

O exemplo de código a seguir mostra como converter um documento PDF em uma página da Web HTML usando Java.

// Este exemplo de código demonstra como converter um documento PDF em arquivo HTML.
// Inicializar o objeto da classe Converter
Converterer converter = new Converterer("C:\\Files\\Conversion\\sample.pdf");

// Definir opções de conversão
MarkupConverterOptions options = new MarkupConverterOptions();
options.setFixedLayout(true);

// Converter
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);
Conversão de PDF para HTML usando Java

Conversão de PDF para HTML usando Java.

Converter intervalo de páginas de PDF para HTML

Podemos converter um intervalo de páginas de um documento PDF para HTML seguindo as etapas abaixo:

  1. Primeiramente, carregue um documento PDF usando a classe Converter.
  2. Em seguida, crie uma instância da classe MarkupConvertOptions.
  3. Em seguida, defina o número da página para iniciar a conversão.
  4. Depois disso, defina a contagem de páginas para converter o número total de páginas.
  5. Finalmente, converta PDF para HTML usando o método Converter.Convert().

O exemplo de código a seguir mostra como converter um intervalo de páginas de um documento PDF em um arquivo HTML usando Java.

// Este exemplo de código demonstra como converter um intervalo de páginas PDF em arquivo HTML.
// Inicializar o objeto da classe Converter
Converterer converter = new Converterer("C:\\Files\\Conversion\\sample.pdf");

// Definir opções de conversão
MarkupConverterOptions options = new MarkupConverterOptions();
options.setPageNumber(1);	// Starting page number
options.setPagesCount(2);	// Total number of pages to convert

// Converter
String outputFile =  "C:\\Files\\Conversion\\sample_N_pages.html";
converter.convert(outputFile, options);

Converter páginas específicas de PDF para HTML

Podemos converter páginas específicas de um documento PDF para HTML seguindo as etapas abaixo:

  1. Primeiramente, carregue um documento PDF usando a classe Converter.
  2. Em seguida, crie uma instância da classe MarkupConvertOptions.
  3. Em seguida, forneça números de página específicos em uma lista separada por vírgulas para converter.
  4. Finalmente, converta PDF para HTML usando o método Converter.Convert().

O exemplo de código a seguir mostra como converter páginas específicas de um documento PDF em um arquivo HTML usando Java.

// Este exemplo de código demonstra como converter páginas específicas de um documento PDF em arquivo HTML.
// Inicializar o objeto da classe Converter
Converterer converter = new Converterer("C:\\Files\\Conversion\\sample.pdf");

// Definir opções de conversão
MarkupConverterOptions options = new MarkupConverterOptions();
options.setPages(Arrays.asList( 1, 3)); // Page numbers to convert

// Converter
String outputFile =  "C:\\Files\\Conversion\\sample_pages.html";
converter.convert(outputFile, options);

Converter PDF protegido por senha para HTML em Java

Também podemos converter documentos PDF protegidos por senha em páginas da Web HTML seguindo as etapas abaixo:

  1. Primeiramente, forneça a senha usando o objeto de classe PdfLoadOptions .
  2. Em seguida, carregue um documento PDF usando a classe Converter com PdfLoadOptions.
  3. Em seguida, crie uma instância da classe MarkupConvertOptions.
  4. Finalmente, converta PDF para HTML usando o método Converter.Convert().

O exemplo de código a seguir mostra como converter um documento PDF protegido por senha em um documento HTML usando Java.

// Este exemplo de código demonstra como converter PDF protegido por senha em HTML.
// Definir opções de carregamento
PdfLoadOptions loadOptions = new PdfLoadOptions();
loadOptions.setPassword("12345");

// Inicializar o objeto da classe Converter
Converterer converter = new Converterer("C:\\Files\\Conversion\\sample.pdf", loadOptions);

// Definir opções de conversão
MarkupConverterOptions options = new MarkupConverterOptions();

// Converter
String outputFile =  "C:\\Files\\Conversion\\sample.html";
converter.convert(outputFile, options);

Conversão de PDF para HTML com marca d’água em Java

Podemos converter documentos PDF em páginas da Web HTML e adicionar marcas d’água a arquivos HTML convertidos seguindo as etapas abaixo:

  1. Primeiramente, carregue um documento PDF usando a classe Converter.
  2. Em seguida, crie uma instância da classe WatermarkOptions.
  3. Em seguida, defina várias opções, como Texto, Cor, Largura, Altura, Fonte, etc.
  4. Em seguida, crie uma instância da classe MarkupConvertOptions.
  5. Depois disso, atribua WatermarkOptions a MarkupConvertOptions.
  6. Finalmente, converta PDF para HTML usando o método Converter.Convert().

O exemplo de código a seguir mostra como converter um documento PDF em um documento HTML com uma marca d’água.

// Este exemplo de código demonstra como converter um PDF em HTML com marca d'água.
// Inicializar o objeto da classe Converter
Converterer converter = new Converterer("C:\\Files\\Conversion\\sample.pdf");

// Definir marca d'água 
WatermarkOptions watermark = new WatermarkOptions();
watermark.setText("This is a Sample watermark");
watermark.setColor(Color.red);
watermark.setWidth(500);
watermark.setHeight(100);
watermark.setTop(0);
watermark.setLeft(300);
watermark.setBackground(true);

// Definir opções de conversão
MarkupConverterOptions options = new MarkupConverterOptions();
options.setWatermark(watermark);

// Caminho do arquivo de saída
String outputFile =  "C:\\Files\\Conversion\\sampleWithWatermark.html";

// Converter
converter.convert(outputFile, options);
Conversão de PDF para HTML com marca d'água em Java

Conversão de PDF para HTML com marca d’água em Java.

Obtenha uma licença gratuita

Experimente a API sem limitações de avaliação solicitando uma licença temporária gratuita.

Conclusão

Neste artigo, aprendemos como converter documentos PDF em páginas da Web HTML em Java. Também vimos como converter um arquivo PDF protegido por senha em HTML e adicionar uma marca d’água ao arquivo convertido programaticamente. Além disso, você pode aprender mais sobre GroupDocs.Conversion for Java API usando a documentação. Em caso de qualquer ambiguidade, não hesite em contactar-nos no fórum.

Veja também