convert_html_to_docx es una librería que convierte un documento HTML a un documento de Word ".docx".
Los diferentes elementos soportados y parseados por esta librería son los siguientes:
- Negrita <strong>
- Cursiva <em>
- Párrafo < p>
- Capa <div>
- Listas anidadas con viñetas o numeradas <ul> / <ol>
- Tablas <table>
- Enlaces <a href >
- Citas <blockquote>
- Imágenes <img>
La URL de las imágenes del documento HTML se convierten todas primero a Base64, antes de convertir el documento a docx.
Los documentos generados admites orientación RTL para los textos que requieren escritura de derecha a izquierda.
Para poder usar el conversor, solo necesitas incluir los siguientes ficheros que ya vienen incluidos en el .zip para descargar:
- Encargados de guardar el .docx Stuk-jszip/dist/jszip.min.js
- Encargado de construir los diferentes documentos que integran y definen la estructura del archivo .docx convert_html_to_docx.js
Stuk-jszip/vendor/FileSaver.js
Probamos un ejemplo a partir del documento de ejemplo HTML que incluye textos en diferentes idiomas, y varias pruebas con los elementos descritos anteriormente
Librería disponible en GitHub