C#을 사용하여 HTML을 Word 문서로 변환

HTML(HyperText Markup Language)는 모든 브라우저에서 지원하는 웹 페이지용 파일 형식입니다. 다양한 경우에 HTML 파일이나 라이브 웹 페이지의 콘텐츠를 Word 문서(DOC, DOCX, DOT, DOTM, DOCM ). HTML 웹 페이지의 텍스트를 편집하거나 텍스트 서식을 적용하는 데 도움이 됩니다. 이 기사에서는 C#을 사용하여 HTML을 Word 문서로 변환하는 방법을 배웁니다.

이 기사에서는 다음 주제를 다룹니다.

HTML을 DOCX로 변환하는 C# API — 무료 다운로드

HTML 파일 또는 웹 페이지를 워드 프로세싱 파일 형식으로 변환하기 위해 Aspose.Words for .NET API를 사용합니다. 프로그래밍 방식으로 Word 문서를 생성, 편집, 변환 또는 분석하는 완벽한 솔루션입니다. API의 DLL을 다운로드하거나 NuGet을 사용하여 설치하십시오.

Install-Package Aspose.Words

C#에서 HTML을 Word로 변환

아래 단계에 따라 프로그래밍 방식으로 HTML 파일을 Word 문서로 쉽게 변환할 수 있습니다.

  1. Document 클래스를 사용하여 HTML 파일을 로드합니다.
  2. Document.Save(string, SaveFormat) 메서드를 호출하여 HTML 파일을 “output.docx"로 저장합니다.

Document.Save() 메서드의 SaveFormat 열거형은 HTML 파일을 변환할 형식을 지정합니다. 다음 코드 샘플은 C#을 사용하여 HTML 파일을 DOCX로 변환하는 방법을 보여줍니다.

// 이 코드 예제에서는 C#을 사용하여 HTML 파일을 Word 문서로 변환하는 방법을 보여줍니다.
// Document 클래스를 사용하여 HTML 파일 로드
Document document = new Document(@"C:\Files\sample.html");

// HTML 파일을 Word DOCX 형식으로 변환
document.Save(@"C:\Files\output.docx", SaveFormat.Docx);
Convert HTML to Word in C#.

C#의 URL에서 웹 페이지를 Word로 변환

아래 단계에 따라 HTML 웹 페이지를 라이브 URL에서 Word 문서로 직접 변환할 수도 있습니다.

  1. 먼저 지정된 URL에서 웹 페이지 콘텐츠를 System.Byte 배열로 다운로드합니다.
  2. 다음으로 배열 개체를 인수로 사용하여 MemoryStream 개체를 시작합니다.
  3. 그런 다음 HtmlLoadOptions 클래스의 인스턴스를 만듭니다.
  4. 그런 다음 Document 클래스의 인스턴스를 만들고 MemoryStream 및 HtmlLoadOptions 개체로 초기화합니다.
  5. 마지막으로 Document.Save(string, SaveFormat) 메서드를 호출하여 HTML 파일을 “output.docx"로 저장합니다.

다음 코드 샘플은 C#을 사용하여 HTML 웹 페이지를 DOCX로 변환하는 방법을 보여줍니다.

// 이 코드 예제에서는 C#을 사용하여 라이브 URL에서 Word 문서로 HTML 웹 페이지를 직접 저장하는 방법을 보여줍니다.
// URL
string Url = "https://en.wikipedia.org/wiki/Aspose.Words";

// HTML 로드 옵션 정의 
HtmlLoadOptions options = new HtmlLoadOptions();

byte[] imageData = null;

// URL에서 바이트 배열로 콘텐츠 다운로드
using (var wc = new System.Net.WebClient())
    imageData = wc.DownloadData(Url);

// 바이트 배열을 스트림으로 변환
var urlStream =  new MemoryStream(imageData);

// Document 객체의 인스턴스 생성
Document document = new Document(urlStream, options);

// DOCX로 저장
document.Save(@"C:\Files\output_url.docx", SaveFormat.Docx);

C#을 사용하여 HTML 문자열을 Word로 변환

다음 단계에 따라 HTML 문자열에서 Word 문서를 동적으로 생성할 수 있습니다.

  1. 먼저 Document 클래스의 인스턴스를 만듭니다.
  2. 그런 다음 Document 객체를 사용하여 DocumentBuilder 클래스의 인스턴스를 만듭니다.
  3. 그런 다음 DocumentBuilder.InsertHtml(string) 메서드를 사용하여 문서에 HTML을 삽입합니다.
  4. 마지막으로 Document.Save(string, SaveFormat) 메서드를 사용하여 Word 문서를 저장합니다.

다음 코드 샘플은 C#을 사용하여 HTML 문자열을 DOCX로 변환하는 방법을 보여줍니다.

// 이 코드 예제에서는 C#을 사용하여 HTML 문자열에서 Word 문서를 생성하는 방법을 보여줍니다.
// 새 문서 만들기
Document document = new Document();

// 문서 빌더 만들기
DocumentBuilder builder = new DocumentBuilder(document);

// HTML 삽입
builder.InsertHtml("<ul>\r\n" +
    "<li>Item1</li>\r\n" +
    "<li>Item2</li>\r\n" +
    "</ul>");

// DOCX로 저장
document.Save(@"C:\Files\html-string-as-word.docx", SaveFormat.Docx);

무료 라이선스 받기

임시 무료 라이선스를 신청하여 평가 제한 없이 API를 사용해 보세요.

결론

이 기사에서는 C#을 사용하여 HTML을 Word 문서로 변환하는 방법을 배웠습니다. 또한 프로그래밍 방식으로 라이브 웹 페이지를 URL에서 Word 파일로 변환하는 방법을 살펴보았습니다. 또한 문서를 사용하여 Aspose.Words for .NET API에 대해 자세히 알아볼 수 있습니다. 모호한 부분이 있는 경우 포럼을 통해 언제든지 문의해 주십시오.

또한보십시오