Java'da Word'ü HTML'ye dönüştürme

Java’da Word’ü HTML’ye dönüştürme

İş uygulamanız için bir Word‘den HTML’ye dönüştürücü geliştirmek istiyorsanız bu blog yazısı tam size göre. Docx dosyalarını HTML, PNG, PDF ve daha fazlası gibi diğer popüler formatlara dönüştürmek için bu Java Word kütüphanesini yükleyebilirsiniz. Ancak bu eğitimin sonunda, bu dosya dönüştürme Java kütüphanesi hakkında iyi bir bilgiye sahip olacaksınız. Bu nedenle makaleye başlayalım ve Word’ü Java’da programlı olarak HTML’ye nasıl dönüştüreceğimizi öğrenelim.

Aşağıdaki hususlar ele alınacaktır:

Java Word kütüphanesi kurulumu

Geliştirme ve kurulumla ilgili kapsamlı belgeler bulacağınız için bu kütüphanenin kurulum süreci geliştirici dostudur. Böylece JAR dosyasını indirebilir veya aşağıdaki Maven yapılandırmalarını kullanarak bu kitaplığı kurabilirsiniz.

<repository>
   <id>AsposeJavaAPI</id>
   <name>Aspose Java API</name>
   <url>https://releases.aspose.com/java/repo/</url>
 </repository> 
<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>22.10</version>
  <classifier>jdk17</classifier>
</dependency>

Java’da Word’ü HTML’ye dönüştürme

Word’den HTML’ye dönüştürücüyü programlı olarak oluşturmak için Java uygulamanızda kaynak kodu yazmaya hazırsınız.

Word’ü HTML’ye dönüştürme adımları şunlardır:

  1. Document sınıfının bir örneğini oluşturun ve kaynak Word dosyasını yükleyin.
  2. Bir belgeyi HTML formatlarında kaydederken ek seçenekleri belirtmek için HtmlSaveOptions sınıfının bir nesnesini başlatın.
  3. HTML’ye kaydederken gidiş dönüş bilgilerinin yazıp yazmayacağını belirtmek için setExportRoundtripInformation‘i çağırın.
  4. setExportFontResources yönteminin değeri doğruysa yazı tipi kaynakları HTML’ye aktarılacaktır.
  5. Yazı tipi kaynaklarının Base64 kodlamasında HTML’ye gömülmesi gerekip gerekmediğini belirtmek için setExportFontsAsBase64 yöntemini çağırın.
  6. Şimdi, save yöntemi Word belgesini HTML formatında kaydedecektir.

Aşağıdaki kodu kopyalayıp ana dosyanıza yapıştırın:

// Document sınıfının bir örneğini oluşturun ve kaynak Word dosyasını yükleyin. 
Document doc = new Document(  "sample.doc");
// Bir belgeyi HTML formatlarında kaydederken ek seçenekleri belirtmek için HtmlSaveOptions sınıfının bir nesnesini başlatın.  
HtmlSaveOptions options = new HtmlSaveOptions();
// HTML'ye kaydederken gidiş-dönüş bilgilerinin yazıp yazmayacağını belirtmek için setExportRoundtripInformation öğesini çağırın.
options.setExportRoundtripInformation(true);
// setExportFontResources yönteminin değeri doğruysa yazı tipi kaynakları HTML'ye aktarılacaktır.
options.setExportFontResources(true);
// Font kaynaklarının Base64 kodlamasında HTML'ye gömülmesi gerekip gerekmediğini belirtmek için setExportFontsAsBase64 yöntemini çağırın.
options.setExportFontsAsBase64(true);
// Şimdi, kaydetme yöntemi Word belgesini HTML formatında kaydedecektir.  
doc.save("Document_out.html", SaveFormat.HTML);

Çıktı aşağıdaki resimde görülebilir:

kelimeyi html'ye dönüştürme

Ücretsiz Lisans Alın

API’yi değerlendirme sınırlamaları olmadan denemek için ücretsiz geçici lisans’tan yararlanabilirsiniz.

Özetliyor

Bu blog yazısını burada sonlandırabiliriz. Umarız makaleyi beğenmişsinizdir ve Word’ü Java’da programlı olarak HTML’ye nasıl dönüştüreceğinizi öğrenmişsinizdir. Bu Java Word kütüphanesinin sunduğu pek çok başka özellik vardır; bu nedenle belgeleri ziyaret etmeyi unutmayın.

Ayrıca Başlangıç kılavuzumuzu takip etmenizi öneririz.

Son olarak conholdate.com yeni blog yazıları yazıyor. Bu nedenle, düzenli güncellemeler için lütfen iletişim halinde kalın.

Bir soru sor

Sorularınızı veya sorularınızı forum üzerinden bize bildirebilirsiniz.

SSS

DOCX’i HTML’ye nasıl dönüştürebilirim?

Document sınıfının bir örneğini oluşturun ve kaynak Word dosyasını yükleyin ve Word dosyasını HTML formatında kaydetmek için save yöntemini çağırın.

Ayrıca bakınız