terça-feira, 6 de janeiro de 2015

FDP.DOC, OU AINDA: POR QUE FORMATOS SÃO MAIS IMPORTANTES DO QUE PROGRAMAS?

(Publicado originalmente no Medium)




Senta que lá vem história.
Por anos, mantive uma caixinha com cerca de quarenta disquetes de 3.5 polegadas. Num determinado momento, decidi que ficar carregando aquilo seria perigoso, e deveria armazenar melhor o que quer que houvesse lá dentro. Então, copiei todo o conteúdo daqueles disquetes no meu computador.
Os arquivos se dividiam basicamente em cinco tipos: executáveis paleolíticos do DOS/Windows, desenhos feitos no AutoCAD, umas poucas planilhas do Excel, um porrilhão de arquivos .txt e um monte de arquivos do Word.
A medida em que eu copiava os arquivos, já processava/deletava os mesmos. Contudo alguns deles eram, naquele momento, inclassificáveis, e acabei deixando tudo numa pasta chamada, na falta de nome melhor, disquetes.
Vira e mexe abro essa pasta e tento decidir o que fazer com aquilo tudo, mas sempre surge algo mais importante e acabo deixando essa tarefa para depois. Como você já deve ter percebido, se esses arquivos não foram classificados até agora, é porque talvez não sejam tão importantes assim. Por outro lado, se não foram deletados, é porque tem um valor intrínseco (e emocional) pelo simples fato de existirem.
Pois bem. Em meados de 2013, lá vou eu de novo tentar dar um jeito naquilo e me deparo com um arquivo do Word, com o singelo título de FDP.doc.
Tentei abrir o arquivo, e aí veio a surpresa.
Meu computador rodava o Linux Mint 11 (já desatualizado na época). Além do LibreOffice, que é a suíte de escritório padrão, eu também usava oFreeOffice, a versão gratuita do SoftMaker Office, um produto bacana feito pela SoftMaker, uma pequena empresa alemã com a qual simpatizo bastante.
Por N motivos, eu associava os arquivos do Microsoft Office (tanto os velhos como os novos) ao FreeOffice, e usava o LibreOffice para manipular arquivos no formato ODT.
Então, ao dar o clique duplo no FDP.doc, fui surpreendido com a mensagem abaixo.





Tentei o LibreOffice, e o arquivo foi aberto normalmente.
Era um trabalho de escola, com 6 páginas, escrito em 1996. O título é PROTEÇÃO CONTRA DESCARGAS ATMOSFÉRICAS DE PÁRA-RAIOS DE HASTE. O conteúdo me fez lembrar de muita coisa, inclusive do que me motivou a nomear o arquivo com esse acrônimo tão singelo. Digamos que foi uma homenagem ao mestre. Com carinho. Também havia os nomes de alguns amigos que não vi nunca mais depois daquela época. Enfim.
Mas fiquei com uma pulga atrás da orelha. Dando uma olhada nos metadados do documento, vi que a última impressão foi em Abril de 1996, mas meu primeiro PC só foi comprado no final desse mesmo ano. Além disso, ele veio com o Office 95. Como aquele arquivo poderia ter sido criado antes, e numa versão anterior do Word?
Foi então que resolvi iniciar minha jornada em busca das origens daquele documento.
Depois de alguns testes (listados abaixo, e agora já desatualizados), consegui visualizar mais um metadado que me refrescou a memória. Redigi esse documento no computador da empresa onde trabalhava na época, um pczinho rodando Windows 3.11 com, muito provavelmente, o Word 6.0. Mas no screenshot não estava Word 2.0? Na linhagem do Word para Windows, existiu o Word 1.0 (e suas sub-versões), o 2.0 e depois, por motivos comerciais, o que seria o Word 3.0 foi batizado de 6.0. Embora os documentos tivessem a mesma extensão .doc, internamente eles eramdiferentes. Pode ser que o FreeOffice tenha se confundido.
Mistério quase resolvido.
Entretanto, fiquei abismado com algumas acontecimentos no percurso, como o fato da versão mais nova que do Microsoft Office (2007) a qual tinha acesso na época não ter aberto o documento de primeira, como os principais serviços web do segmento não terem conseguido lidar com esse mesmo arquivo, ou com a dificuldade de manipulá-lo em dispositivos móveis.
Agora estamos falando de um trabalho de escola mal redigido, mas e se fosse um documento importante? Se contivesse informação que ainda precisasse ser consultada?
Isso me levou a fazer outras considerações. Sou do tipo que faz estatísticas de coisas inúteis, tipo contar quantos documentos gerados pelo Word existem no meu computador. O processo não foi muito científico: usei a ferramenta de busca do Gnome, não vasculhei arquivos compactados, não contabilizei arquivos espalhados dispositivos de armazenamento removíveis e na nuvem. De qualquer maneira, o resultado me deixou ligeiramente estarrecido. Nos formatos antigos (*.doc e *.dot) existiam, na data, 2164 arquivos. Nos formatos novos (*.docx, *.dotx, *.docm e *.dotm) existiam 144.
Obviamente, não fui em quem produziu essa coisarada toda. Esses arquivos tem tudo quanto é procedência imaginável: manuais, cartas, roteiros, documentação técnica, lembretes, enfim, coisas que venho acumulando nesse anos todos.
Já existem vários casos de organizações e governos que não conseguem consultar informações criadas há vinte, trinta anos atrás, por não haver software e/ou hardware capaz de manipular determinados tipos de arquivos. Este artigo é um bom exemplo.
De uns anos pra cá, deixei de usar o Word em favor do OpenOffice/Go-OO/LibreOffice, e tudo o que produzo para “consumo próprio”, ou que possa ser distribuído como .pdf, crio no formato .odt. Na grande maioria dos casos, uso o Word apenas para editar arquivos que já recebo nesse formato.
Uma observação: o .rtf, meio que um formato franco dos processadores de texto no passado, está caindo em desuso, visto que não é bem manipulado nem por dispositivos móveis, nem por serviços online.

OS TESTES


Caso você não tenha interesse pelo viés técnico desse experimento, pode pular para a próxima seção: FINIS AFRICAE.
Esses testes foram feitos em meados de 2013. Além do que está descrito aqui, também já tentei outras alternativas mais recentes, como o Word 2013, com os mesmos resultados.
DESKTOP
WORD 2007 (Windows XP Professional SP3/VirtualBox)
Ao tentar abrir o arquivo, obtive essa mensagem:


Segundo a Microsoft, existem duas soluções para isso.
A primeira é alterar algumas configurações do Registro do Windows, algo não muito recomendado a usuários inexperientes.
A segunda, menos problemática, é mover/copiar o documento até o que eles chamam de local confiável (no meu caso, foi em C:\Arquivos de programas\Microsoft Office\Templates) e abrí-lo de lá. Evidentemente, se você salvar uma cópia desse documento em um local qualquer, independente do formato, a mesma estará “limpa”, e poderá ser utilizada normalmente.
WORD 2003 (Windows XP Professional SP3/VirtualBox)
Abriu o arquivo. Foi aqui que consegui ver o nome do usuário que criou o documento.
WORD 97 (Windows 98/VMware)
Abriu o arquivo.
WORD 95 (Windows 95/VMware)
Abriu o arquivo.
WORD 5.5 for DOS (via DOSBox)
Abriu o arquivo, mas com caracteres truncados o início e no final do mesmo (metadados).
LIBREOFFICE/OPENOFFICE/GO-OO.ORG/WHATEVEROFFICE (várias versões/vários sistemas operacionais)
Abriu o arquivo, mas sem conseguir ler alguns metadados.
ABIWORD (2.8.6)
Abriu o arquivo, mas com caracteres truncados o início e no final do mesmo (metadados).
FREEOFFICE (rev 767)
Não abriu o arquivo.
WEB
GOOGLE DRIVE
Não abriu o arquivo, nem no modo de visualização, nem após o mesmo ser convertido para o formato do Google Docs.


SKYDRIVE (agora Word Online)
Abriu o arquivo.
ZOHO DOCS
A mesma coisa que o Google Drive. Não abre nem o documento original (modo de visualização), nem o mesmo convertido para o formato utilizado pelo Zoho.
THINKFREE ONLINE
O ThinkFree Online nunca foi muito animador. Como eu esperava, não abriu o arquivo nem para visualização, nem para edição.
ZERO PC
O Zero PC tem um processador de textos embutido. Não abriu o arquivo.
ADOBE WORKSPACES (antigo Buzzword)
Não abriu o arquivo.
DROPBOX
Na época, o Dropbox havia recém-habilitado um recurso que permite (apenas) ver/ler documentos criados no Microsoft Office. O visualizador abriu o documento numa boa.
BOX.NET
Abriu o documento, apenas para visualização.
KINDLE
A Amazon tem um serviço interessante. Você envia um documento num formato pré-determinado (e o *.doc é um deles), e a Amazon converte o arquivo para um formato ebook, provavelmente o *.mobi, e envia o mesmo para o seu Kindle.
Não funcionou.
DISPOSITIVOS MÓVEIS
QUICKOFFICE (6.2.217 AM_S603.0/Symbian S60 3rd)
Não abriu o arquivo.


THINKFREE OFFICE MOBILE PARA ANDROID (2.0.110222/Android 2.3.6)
Abriu o arquivo mas com caracteres truncados no início e no final do documento (metadados).
KINGSOFT OFFICE (5.5.145789-mul00004/Android 2.3.6 e Android 4.0.3)
Embora a versão do aplicativo seja a mesma, testei em dois dispositivos com versões diferentes do Android.
Abriu o arquivo mas com caracteres truncados no início e no final do documento, e cheio de caracteres chineses no meio.
POLARIS OFFICE (3.0.31.20.5 FV03 e 4.0.3303.01 FT03/Android 4.0.3)
Duas versões diferentes do aplicativo instaladas no mesmo aparelho. Não abriram o arquivo.

FINIS AFRICAE


Certo, e o que isso tudo quis dizer?
Apesar da Microsoft ter liberado oficialmente as especificações dos antigos formatos do Office (.doc, .xls, .ppt, etc), eles são binários e instáveis, facilmente suscetíveis ao FUTURO.
Mas existe o OOXML que, em teoria seria um formato tão livre quanto o .ODF, certo?
Há controvérsias. Mas, se não há escapatória, o OOXML é melhor que os formatos antigos. Entretanto, ainda há problemas.
No mundo dos processadores de texto móveis, por exemplo, o negócio fica feio pois, apesar desses apps manipularem os mesmos formatos, um .docx criado em um aplicativo muitas vezes não é aberto por outro. Tenho cá minhas desconfianças de que isso se deva ao fato dos desenvolvedores continuarem fazendo engenharia reversa — como faziam com o .doc — em vez de simplesmente consultarem as 6000 e poucas páginas da especificação oficial do OOXML.


E a César o que é de César. As versões mais recentes do Word estão ficando mais amistosas em relação ao ODT. O Word Online tem mesmo opção para configurar o formato ODT como padrão. Suponho que isso se deva à pressão de entidades governamentais, que normalmente aderem ao padrão ODF, com o qual simpatizo mais.
De uns tempos pra cá, minha receita para salvar arquivos de texto é:
É só texto? Txt.
É só texto mas vai parar na internet? Markdown.
É texto, com formatação, tabelas e outros tipos de informação? ODF.
É texto, com formatação, tabelas e outros tipos de informação, que terá que ser compartilhado com outros seres humanos que sei não utilizarem as mesmas ferramentas que eu? OOXML (.docx).
Só uso os antigos formatos do Microsoft Office em último caso, mesmo. Algo que costumo fazer, por exemplo, é receber documentos nos formatos antigos para editá-los e enviá-los à fonte. Só que no processo de edição, eu converto os documentos para os formatos mais recentes. Na maioria das vezes, meus interlocutores nem percebem. ☺

Nenhum comentário:

Postar um comentário