
HTML(HyperText Markup Language)는 모든 브라우저에서 지원하는 웹 페이지용 파일 형식입니다. 다양한 경우에 HTML 파일이나 라이브 웹 페이지의 콘텐츠를 Word 문서(DOC, DOCX, DOT, DOTM, DOCM ). HTML 웹 페이지의 텍스트를 편집하거나 텍스트 서식을 적용하는 데 도움이 됩니다. 이 기사에서는 C#을 사용하여 HTML을 Word 문서로 변환하는 방법을 배웁니다.
이 기사에서는 다음 주제를 다룹니다.
- HTML을 DOCX로 변환하는 C# API — 무료 다운로드
- C#에서 HTML을 Word로 변환
- C#의 URL에서 웹 페이지를 Word로 변환
- C#을 사용하여 HTML 문자열을 Word로 변환
HTML을 DOCX로 변환하는 C# API — 무료 다운로드
HTML 파일 또는 웹 페이지를 워드 프로세싱 파일 형식으로 변환하기 위해 Aspose.Words for .NET API를 사용합니다. 프로그래밍 방식으로 Word 문서를 생성, 편집, 변환 또는 분석하는 완벽한 솔루션입니다. API의 DLL을 다운로드하거나 NuGet을 사용하여 설치하십시오.
Install-Package Aspose.Words
C#에서 HTML을 Word로 변환
아래 단계에 따라 프로그래밍 방식으로 HTML 파일을 Word 문서로 쉽게 변환할 수 있습니다.
- Document 클래스를 사용하여 HTML 파일을 로드합니다.
- Document.Save(string, SaveFormat) 메서드를 호출하여 HTML 파일을 “output.docx"로 저장합니다.
Document.Save() 메서드의 SaveFormat 열거형은 HTML 파일을 변환할 형식을 지정합니다. 다음 코드 샘플은 C#을 사용하여 HTML 파일을 DOCX로 변환하는 방법을 보여줍니다.
// 이 코드 예제에서는 C#을 사용하여 HTML 파일을 Word 문서로 변환하는 방법을 보여줍니다.
// Document 클래스를 사용하여 HTML 파일 로드
Document document = new Document(@"C:\Files\sample.html");
// HTML 파일을 Word DOCX 형식으로 변환
document.Save(@"C:\Files\output.docx", SaveFormat.Docx);

C#의 URL에서 웹 페이지를 Word로 변환
아래 단계에 따라 HTML 웹 페이지를 라이브 URL에서 Word 문서로 직접 변환할 수도 있습니다.
- 먼저 지정된 URL에서 웹 페이지 콘텐츠를 System.Byte 배열로 다운로드합니다.
- 다음으로 배열 개체를 인수로 사용하여 MemoryStream 개체를 시작합니다.
- 그런 다음 HtmlLoadOptions 클래스의 인스턴스를 만듭니다.
- 그런 다음 Document 클래스의 인스턴스를 만들고 MemoryStream 및 HtmlLoadOptions 개체로 초기화합니다.
- 마지막으로 Document.Save(string, SaveFormat) 메서드를 호출하여 HTML 파일을 “output.docx"로 저장합니다.
다음 코드 샘플은 C#을 사용하여 HTML 웹 페이지를 DOCX로 변환하는 방법을 보여줍니다.
// 이 코드 예제에서는 C#을 사용하여 라이브 URL에서 Word 문서로 HTML 웹 페이지를 직접 저장하는 방법을 보여줍니다.
// URL
string Url = "https://en.wikipedia.org/wiki/Aspose.Words";
// HTML 로드 옵션 정의
HtmlLoadOptions options = new HtmlLoadOptions();
byte[] imageData = null;
// URL에서 바이트 배열로 콘텐츠 다운로드
using (var wc = new System.Net.WebClient())
imageData = wc.DownloadData(Url);
// 바이트 배열을 스트림으로 변환
var urlStream = new MemoryStream(imageData);
// Document 객체의 인스턴스 생성
Document document = new Document(urlStream, options);
// DOCX로 저장
document.Save(@"C:\Files\output_url.docx", SaveFormat.Docx);
C#을 사용하여 HTML 문자열을 Word로 변환
다음 단계에 따라 HTML 문자열에서 Word 문서를 동적으로 생성할 수 있습니다.
- 먼저 Document 클래스의 인스턴스를 만듭니다.
- 그런 다음 Document 객체를 사용하여 DocumentBuilder 클래스의 인스턴스를 만듭니다.
- 그런 다음 DocumentBuilder.InsertHtml(string) 메서드를 사용하여 문서에 HTML을 삽입합니다.
- 마지막으로 Document.Save(string, SaveFormat) 메서드를 사용하여 Word 문서를 저장합니다.
다음 코드 샘플은 C#을 사용하여 HTML 문자열을 DOCX로 변환하는 방법을 보여줍니다.
// 이 코드 예제에서는 C#을 사용하여 HTML 문자열에서 Word 문서를 생성하는 방법을 보여줍니다.
// 새 문서 만들기
Document document = new Document();
// 문서 빌더 만들기
DocumentBuilder builder = new DocumentBuilder(document);
// HTML 삽입
builder.InsertHtml("<ul>\r\n" +
"<li>Item1</li>\r\n" +
"<li>Item2</li>\r\n" +
"</ul>");
// DOCX로 저장
document.Save(@"C:\Files\html-string-as-word.docx", SaveFormat.Docx);
무료 라이선스 받기
임시 무료 라이선스를 신청하여 평가 제한 없이 API를 사용해 보세요.
결론
이 기사에서는 C#을 사용하여 HTML을 Word 문서로 변환하는 방법을 배웠습니다. 또한 프로그래밍 방식으로 라이브 웹 페이지를 URL에서 Word 파일로 변환하는 방법을 살펴보았습니다. 또한 문서를 사용하여 Aspose.Words for .NET API에 대해 자세히 알아볼 수 있습니다. 모호한 부분이 있는 경우 포럼을 통해 언제든지 문의해 주십시오.