C# kullanarak HTML'yi Word Belgesine dönüştürün

HTML(Köprü Metni İşaretleme Dili), tüm tarayıcılar tarafından desteklenen web sayfaları için önde gelen bir dosya biçimidir. Çeşitli durumlarda, HTML dosyalarını veya canlı web sayfalarındaki içeriği Word belgelerine (DOC, DOCX, DOT, DOTM, DOCM) dönüştürmemiz gerekebilir. ). HTML web sayfalarının metnini düzenlemeye veya metin biçimlendirmesini uygulamaya yardımcı olur. Bu yazıda C# kullanarak HTML’yi Word belgesine nasıl dönüştüreceğimizi öğreneceğiz.

Bu makalede aşağıdaki konular ele alınacaktır:

HTML’yi DOCX’e Dönüştürmek için C# API’si - Ücretsiz İndirin

HTML dosyalarını veya web sayfalarını Word işlem dosya formatlarına dönüştürmek için Aspose.Words for .NET API’sini kullanacağız. Word belgelerini programlı olarak oluşturmak, düzenlemek, dönüştürmek veya analiz etmek için eksiksiz bir çözümdür. Lütfen API’nin DLL dosyasını indirin veya NuGet kullanarak yükleyin.

Install-Package Aspose.Words

C# HTML’yi Word’e Dönüştürme - Kısa Eğitim

Aşağıdaki adımları izleyerek HTML dosyalarını programlı olarak kolayca Word belgelerine dönüştürebiliriz:

  1. Document sınıfını kullanarak bir HTML dosyası yükleyin.
  2. HTML dosyasını “output.docx" olarak kaydetmek için Document.Save(string, SaveFormat) yöntemini çağırın.

Document.Save() yöntemindeki SaveFormat numaralandırması, HTML dosyasını dönüştürmek istediğiniz biçimi belirtir. Aşağıdaki kod örneği, C# kullanarak bir HTML dosyasının DOCX’e nasıl dönüştürüleceğini gösterir.

// Bu kod örneği, C# kullanarak HTML dosyasının bir Word belgesine nasıl dönüştürüleceğini gösterir.
// Document sınıfını kullanarak HTML dosyasını yükleyin
Document document = new Document(@"C:\Files\sample.html");

// HTML dosyasını Word DOCX formatına dönüştürün
document.Save(@"C:\Files\output.docx", SaveFormat.Docx);

C# Bir Web Sayfasını URL’den Word’e Dönüştürme - Adım Adım Eğitim

Ayrıca, aşağıda verilen adımları izleyerek bir HTML web sayfasını doğrudan canlı bir URL’den bir Word belgesine dönüştürebiliriz:

  1. Öncelikle web sayfası içeriğini belirtilen URL’den System.Byte dizisi olarak indirin.
  2. Daha sonra, bağımsız değişken olarak bir dizi nesnesiyle MemoryStream nesnesini başlatın.
  3. Daha sonra HtmlLoadOptions sınıfının bir örneğini oluşturun.
  4. Bundan sonra, Document sınıfının bir örneğini oluşturun ve bunu MemoryStream ve HtmlLoadOptions nesneleriyle başlatın.
  5. Son olarak, HTML dosyasını “output.docx" olarak kaydetmek için Document.Save(string, SaveFormat) yöntemini çağırın.

Aşağıdaki kod örneği, C# kullanarak bir HTML web sayfasının DOCX’e nasıl dönüştürüleceğini gösterir.

// Bu kod örneği, C# kullanarak HTML web sayfasının doğrudan canlı bir URL'den bir Word belgesine nasıl kaydedileceğini gösterir.
// URL
string Url = "https://en.wikipedia.org/wiki/Aspose.Words";

// HTML yükleme seçeneklerini tanımlayın 
HtmlLoadOptions options = new HtmlLoadOptions();

byte[] imageData = null;

// URL'den içeriği Bayt dizisi olarak indirin
using (var wc = new System.Net.WebClient())
    imageData = wc.DownloadData(Url);

// Bayt dizisini akışa dönüştür
var urlStream =  new MemoryStream(imageData);

// Document nesnesinin bir örneğini oluşturun
Document document = new Document(urlStream, options);

// DOCX olarak kaydet
document.Save(@"C:\Files\output_url.docx", SaveFormat.Docx);

C# Bir HTML Dizisini Word’e Dönüştürme - Kısa Kılavuz

Aşağıdaki adımları izleyerek dinamik olarak bir HTML dizesinden bir Word belgesi oluşturabiliriz:

  1. Öncelikle Document sınıfının bir örneğini oluşturun.
  2. Daha sonra, Document nesnesiyle DocumentBuilder sınıfının bir örneğini oluşturun.
  3. Daha sonra, DocumentBuilder.InsertHtml(string) yöntemini kullanarak belgeye HTML ekleyin.
  4. Son olarak, Document.Save(string, SaveFormat) yöntemini kullanarak Word belgesini kaydedin.

Aşağıdaki kod örneği, C# kullanarak bir HTML dizesinin DOCX’e nasıl dönüştürüleceğini gösterir.

// Bu kod örneği, C# kullanarak bir HTML dizesinden Word belgesinin nasıl oluşturulacağını gösterir.
// Yeni bir belge oluştur
Document document = new Document();

// Belge oluşturucu oluşturma
DocumentBuilder builder = new DocumentBuilder(document);

// HTML ekle
builder.InsertHtml("<ul>\r\n" +
    "<li>Item1</li>\r\n" +
    "<li>Item2</li>\r\n" +
    "</ul>");

// DOCX olarak kaydet
document.Save(@"C:\Files\html-string-as-word.docx", SaveFormat.Docx);

Ücretsiz Lisans Alın

Lütfen ücretsiz bir geçici lisans talep ederek API’yi değerlendirme sınırlamaları olmadan deneyin.

Çözüm

Bu kısa eğitimde, C# kullanarak HTML’yi Word belgesine nasıl dönüştüreceğimizi öğrendik. Ayrıca canlı web sayfalarını bir URL’den program aracılığıyla Word dosyalarına nasıl dönüştüreceğimizi de gördük. Ayrıca belgeleri kullanarak Aspose.Words for .NET API hakkında daha fazla bilgi edinebilirsiniz. Herhangi bir belirsizlik durumunda lütfen forum üzerinden bizimle iletişime geçmekten çekinmeyin.

Ayrıca bakınız