Converta LaTeX para Word com ‘Pandoc’

Tudo bem?

Este será o primeiro post deste blog, que foi criado para compartilhar ferramentas e dicas que eu aprendi no decorrer da minha vida acadêmica e de trabalho. Na maioria das vezes aprendi “sozinha” na internet buscando soluções para os meus problemas. Sozinha entre aspas porque utilizei do conhecimento de muitas pessoas que eu nunca encontrei pessoalmente, mas que, de encontro com a minha persistência em buscar, ajudaram-me a resolver questões e a criar com recursos de muita utilidade. Deste modo, acredito que compartilhar os meus aprendizados em um só lugar, agregará valor a minha jornada.

Como primeira utilidade, que é a que estou usando com mais frequência no momento, irei mostrar como faz a conversão de um documento .tex para o .docx, de forma gratuita, sem desformatar textos com acentos e outros caracteres, coisas comuns que acontecem quando utilizamos ferramentas normais de conversão de documento LaTeX em .pdf para .docx.

Antes de chegar à conclusão da escolha desse método, eu testei alguns anteriormente. No entanto, caso tenha surgido outro método interessante ou você, leitor, saiba de outra forma que considere melhor para a finalidade aqui apresentada, deixe seu comentário na página. Dúvidas também serão bem-vindas.

Bom, vamos ao que interessa. O primeiro passo que você precisará fazer é a instalação do Pandoc, um programa que converte várias extensões de arquivos. Ele pode ser obtido na página oficial aqui. Na página do projeto Pandoc, você poderá encontrar instruções para a instalação em diferentes sistemas operacionais. A instalação é bastante intuitiva e você pode seguir os passos do instalador.

Tendo o Pandoc instalado em sua máquina, você agora vai precisar dos seguintes arquivos, reunidos em uma pasta, para a conversão funcionar:

  • main.tex
  • imagens (pode estar dentro de outra pasta dentro da raiz, de acordo como você chamou no código)
  • bibliography.bib
  • Pode ter também o arquivo .csl , que permite formatar as citações

As imagens obviamente são as mesmas que você chamou no seu arquivo principal .tex; porém percebi que o Pandoc não funciona para imagens em formato .pdf.

Dificilmente eu uso o arquivo .bib, pois gosto de fazer minhas bibliografias manuais. Desse modo, também não costumo usar o .csl, mas como disse, é possível fazer a conversão com eles.

Outra questão é que, apesar de ser um grande facilitador, alguns problemas (erros) podem aparecer e, neste caso, com arquivos muito grandes, como teses ou dissertações, gosto de fazer a conversão por capítulos. De qualquer modo, a ferramenta é ótima.

Tendo o seu projeto LaTeX reunido em uma pasta, você precisa abrir uma janela de Prompt de comando CMD para este mesmo diretório. Agora, é só aplicar o comando:

pandoc main.tex -o mainconverted.docx

O arquivo de saída mainconverted.docx não precisa ter o mesmo nome do arquivo .tex de entrada.

Se você quiser incluir o seu arquivo .bib, pode usar o seguinte código:

pandoc --citeproc --bibliography.bib .\main.tex -f latex -t docx -o mainconverted.docx

E se quiser também aplicar o arquivo .csl que formata as citações, só aplicar o código:

--citeproc --bibliography.bib --cslieee.csl .\main.tex -f latex -t docx -o mainconverted.docx.docx

Também é possível utilizar um estilo de arquivo .docx de um arquivo .docx de referência, no caso um arquivo modelo de alguma revista, por exemplo. Então, é só acrescentar esse arquivo na sua linha de código, como segue:

pandoc main.tex --bibliography.bib --referenceIEEEtemplate.docx -o mainconverted.docx

A página do Pandoc traz a documentação onde você pode descobrir mais das funções que o programa traz.

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *