Converter Word para Markdown usando Java

Converter Word para Markdown usando Java

A linguagem Markdown oferece uma grande variedade de recursos e é fácil de aprender. Visto que os documentos do MS Word sempre foram uma vantagem na organização e representação de dados de negócios de maneira bem mantida. No entanto, no desenvolvimento rápido de aplicativos, é realmente importante combinar as mudanças em tempo de execução. Portanto, os arquivos Markdown oferecem muito quando se trata de desenvolvimento de aplicativos de negócios. Esta postagem de blog mostrará como converter Word para Markdown usando Java programaticamente.

Abordaremos as seguintes seções:

Instalação da biblioteca Java Docx

Esta é uma biblioteca rica em recursos que permite criar um conversor de Word para Markdown de nível empresarial para seu aplicativo Java. No entanto, você pode baixar a API ou apenas adicionar a seguinte configuração em seus aplicativos Java baseados em Maven.

<repository>
    <id>AsposeJavaAPI</id>
    <name>Aspose Java API</name>
    <url>https://repository.aspose.com/repo/</url>
</repository>
<dependency>
    <groupId>com.aspose</groupId>
    <artifactId>aspose-words</artifactId>
    <version>21.11</version>
    <type>pom</type>
</dependency>

Converter Word para Markdown usando Java

Na verdade, existem muitos métodos expostos por esta biblioteca Java Docx para converter documentos do Word para outros formatos populares de arquivo e imagem programaticamente.

Siga as etapas e o trecho de código mencionado abaixo:

  1. Carregue um documento do Word de origem inicializando o construtor da classe Document.
  2. Salve o documento no formato Markdown chamando o método save.

Copie e cole o seguinte código em seu arquivo principal:

// Carregue um documento do Word de origem inicializando o construtor da classe Document. 
Document doc = new Document("sample.doc");
// Salve o documento no formato Markdown chamando o método save. 
doc.save(  "SaveDocx2Markdown.md");

Você pode ver a saída na imagem abaixo:

Conversor de Word para Markdown

Conversor de Word para Markdown - opções avançadas

Vamos verificar alguns dos outros recursos proeminentes desta biblioteca Java. Então, vamos criar um documento com alguns estilos e salvá-lo no Markdown:

Os passos são:

  1. Crie um objeto da classe Document.
  2. Instancie uma instância da classe DocumentBuilder para facilitar a adição de conteúdo ao documento.
  3. Especifique o estilo “Título 1” para o parágrafo chamando o método insertParagraph.
  4. Invoque o método setStyleName para definir o nome do estilo de parágrafo aplicado a essa formatação.
  5. Insira uma string no documento na posição de inserção atual chamando o método write.
  6. Torne o formato da fonte em itálico chamando o método setItalic.
  7. Chame o método insertHyperlink para inserir um hiperlink no documento.
  8. Invoque o método save para salvar seu documento como um arquivo Markdown.
// Crie um objeto da classe Document. 
Document doc = new Document();
// Instancie uma instância da classe DocumentBuilder para facilitar a adição de conteúdo ao documento.
DocumentBuilder builder = new DocumentBuilder(doc);
// Especifique o estilo "Título 1" para o parágrafo chamando o método insertParagraph. 
builder.insertParagraph();
// Invoque o método setStyleName para definir o nome do estilo de parágrafo aplicado a essa formatação. 
builder.getParagraphFormat().setStyleName("Heading 1");
// Insira uma string no documento na posição de inserção atual chamando o método write. 
builder.write("Heading 1");
// Especifique a ênfase em itálico para o parágrafo.
builder.insertParagraph();
// Redefina estilos do parágrafo anterior para não combinar estilos entre parágrafos.
builder.getParagraphFormat().setStyleName("Normal");
// Torne o formato da fonte em itálico chamando o método setItalic. 
builder.getFont().setItalic(true);
builder.write("Italic Text");
// Redefina estilos do parágrafo anterior para não combinar estilos entre parágrafos.
builder.setItalic(false);
// Especifique um Hyperlink para o texto desejado.
builder.insertParagraph();
// Chame o método insertHyperlink para inserir um hiperlink no documento. 
builder.insertHyperlink("Aspose","https://www.aspose.com", false);
builder.write("Aspose");
// Invoque o método save para salvar seu documento como um arquivo Markdown.
doc.save(  "example.md");

A saída é mostrada na imagem abaixo:

Palavra para MD

Obtenha uma licença gratuita

Você pode aproveitar uma licença temporária gratuita para experimentar a API sem limitações de avaliação.

Resumindo

Podemos encerrar este tutorial aqui com a esperança de que você tenha aprendido como converter Word para Markdown usando Java programaticamente. Além disso, você também passou por alguns métodos avançados oferecidos por esta biblioteca Java Docx. Além disso, não saia sem visitar a documentação desta biblioteca.

Além disso, sugerimos que você siga nosso Guia de primeiros passos.

Finalmente, conholdate.com está escrevendo novas postagens no blog. Portanto, por favor, fique em contato para atualizações regulares.

Faça uma pergunta

Você pode nos informar sobre suas perguntas ou dúvidas em nosso fórum.

Perguntas frequentes

Como você cria um documento HTML em um aplicativo .NET?

Carregue um documento do Word de origem inicializando o construtor da classe Document. Em seguida, salve o documento no formato Markdown chamando o método save.

Veja também