convert_html_to_docx es una librería que convierte un documento HTML a un documento de Word ".docx". Los diferentes elementos soportados y parseados por esta librería son los siguientes:


  • Negrita <strong>
  • Cursiva <em>
  • Párrafo < p>
  • Capa <div>
  • Listas anidadas con viñetas o numeradas <ul> / <ol>
  • Tablas <table>
  • Enlaces <a href >
  • Citas <blockquote>
  • Imágenes <img>

La URL de las imágenes del documento HTML se convierten todas primero a Base64, antes de convertir el documento a docx.
Los documentos generados admites orientación RTL para los textos que requieren escritura de derecha a izquierda.

Para poder usar el conversor, solo necesitas incluir los siguientes ficheros que ya vienen incluidos en el .zip para descargar:

  1. Encargados de guardar el .docx
  2. Stuk-jszip/dist/jszip.min.js
    Stuk-jszip/vendor/FileSaver.js
  3. Encargado de construir los diferentes documentos que integran y definen la estructura del archivo .docx
  4. convert_html_to_docx.js

Probamos un ejemplo a partir del documento de ejemplo HTML que incluye textos en diferentes idiomas, y varias pruebas con los elementos descritos anteriormente

Librería disponible en GitHub