Os cientistas brasileiros que inventaram a ferramentabetano eleiçõescorreção ortográfica do Word:betano eleições

Crédito, ICMC/USP

Legenda da foto, A cientista Maria das Graças Volpe Nunes foi a coordenadora do projeto que criou o corretor

"Aceitamos o desafio e,betano eleiçõespouco maisbetano eleiçõesum ano, já tínhamos a primeira versão do revisor, que, como projeto científico, ficou conhecido como ReGra."

Maria das Graças conta que, para desenvolver a tecnologia do corretor, foi formada uma grande equipebetano eleiçõespesquisadores, estudantesbetano eleiçõescomputação e linguística. O projeto teve apoio da Fundaçãobetano eleiçõesAmparo à Pesquisa do Estadobetano eleiçõesSão Paulo (Fapesp), durante um certo período, num programabetano eleiçõesparceria com a Itautec. Essa empresa, porbetano eleiçõesvez, financiou a equipe durante 15 anos seguidos.

Em 2000, a Microsoft adquiriu uma licença da Itautec para incluir o revisor desenvolvido no ICMC nos seus programas do pacote Office. Mas a equipe continuou a dar assessoria para a Microsoft: novas regrasbetano eleiçõescorreção eram implementadas, adaptações eram feitas, como à nova ortografia do português, entre outras coisas. "Em 2008, a Itautec vendeu definitivamente os direitos do produto à Microsoft, e portanto o projeto chegou ao final, com bastante sucesso, por sinal", diz Maria das Graças.

Crédito, Getty Images

Legenda da foto, Em 1993, uma fábrica brasileirabetano eleiçõescomputadores procurou cientistas para eles desenvolverem um corretorbetano eleiçõestexto

Seu colega no projeto, o físico Osvaldo Novaisbetano eleiçõesOliveira Junior, do Institutobetano eleiçõesFísicabetano eleiçõesSão Carlos (IFSC) da Universidadebetano eleiçõesSão Paulo (USP), diz que o ReGra foi o primeiro revisor gramatical desenvolvido para o português.

"No nosso caso, com o léxico da versão brasileira da nossa língua", explica. "Quase na mesma época, uma empresabetano eleiçõesPortugal, ativa até hoje, desenvolveu um revisor para a versão do idioma como é falado lá. O lançamento do deles deve ter ocorrido pouco depois do nosso."

Segundo Oliveira, o ReGra faz revisão com basebetano eleiçõesregras - algumasbetano eleiçõesanálise sintática e algumas empíricas,betano eleiçõesmaneira semelhante ao revisor do inglês disponível no Word da Microsoft. "Que eu saiba, a Microsoft nunca desenvolveu revisor para o português", diz.

Procurada pela BBC Brasil a empresa se manifestou por meiobetano eleiçõesuma nota: "Inicialmente, a Microsoft realizou acordos para a utilizaçãobetano eleiçõeslicençasbetano eleiçõescorretores ortográficosbetano eleiçõesterceiros para muitos idiomas ao redor do mundo, mas gradativamente todos eles foram migrados para a plataforma da empresa. A ferramenta brasileira fez essa migração na versão do Office 2010, o que significa que a tecnologia presente no produto já é 100% Microsoft."

De acordo com Oliveira, pode-se dizer que houve pouquíssimo avançobetano eleiçõesrevisão gramatical automática nos últimos anos, pois aparentemente as empresas não estão dispostas a fazer grandes investimentos. "Isso seria necessário, pois hoje um revisor gramatical poderia ser muito mais eficiente se combinasse regras com métodos estatísticos ebetano eleiçõesaprendizadobetano eleiçõesmáquina", complementa.

Oliveira diz que a Itautec "apostou muito numa equipebetano eleiçõesjovens pesquisadores, sem garantiabetano eleiçõesretorno. Apenas para ilustrar, a Itautec investiu o equivalente a cercabetano eleiçõesUS$ 2 milhões (tínhamos que memorizar valoresbetano eleiçõesdólares, pois a inflaçãobetano eleições1993 ainda era muito alta) nos primeiros anos do trabalho. Não prometemos fazer o revisor, mas apenas um estudo sobre o que era necessário e como criá-lo."

Crédito, IFSC/USP

Legenda da foto, O físico Osvaldo Novaisbetano eleiçõesOliveira Junior, da Universidade Federalbetano eleiçõesSão Carlos, também participou da criação do programa

O investimento da empresa tornou possível a formaçãobetano eleiçõesuma equipe multidisciplinar, e multi-institucional, que congregava professores das universidadesbetano eleiçõesSão Paulo (USP), Federalbetano eleiçõesSão Carlos (UFSCar), e Estadual Paulista (Unesp) do câmpus Araraquara, para realizar pesquisas na áreabetano eleiçõesProcessamentobetano eleiçõesLinguagem Natural (PLN).

"Acho que aindabetano eleições1993 decidimos que o grupo deveria ganhar um nome, que é o mesmo até hoje: Núcleo Insterinstitucionalbetano eleiçõesLinguística Computacional (NILC)", lembra Oliveira. "A meu ver, a criação dele é o maior legado do Projeto ReGra."

De acordo com ele, o NILC é hoje um dos maiores centrosbetano eleiçõesgeraçãobetano eleiçõestecnologia para o processamento automático do português. "Certamente é o que mais disponibilizou gratuitamente recursos lingüísticos computacionais para o nosso idioma", diz.

"Isso foi possível porque, desde o início, adotamos a políticabetano eleiçõesfranquear os recursos, como léxicos, corpus (basebetano eleiçõestextos, escritos ou falados, organizada e anotada, que possa servir como recurso linguístico-computacional) e ferramentasbetano eleiçõesprocessamento a colegasbetano eleiçõestodo o mundo. Mesmo aqueles recursos acessórios para o desenvolvimento do ReGra foram disponibilizados, com a autorização da Itautec."

Mas o NILC não parou por aí. Oliveira destaca os projetos que o núcleo desenvolveu e vem desenvolvendo nas áreasbetano eleiçõestradução automática, terminologia, simplificaçãobetano eleiçõestexto, reconhecimentobetano eleiçõesautoria, identificaçãobetano eleiçõesfake news (notícias falsas), sistemasbetano eleiçõesbusca, usobetano eleiçõeslinguagem para detecçãobetano eleiçõesdoenças e reconhecimentobetano eleiçõesfala, por exemplo.

"Ressalto que o processamento automáticobetano eleiçõeslíngua natural está presentebetano eleiçõesmuitos produtos, como os assistentes inteligentes que reconhecem voz e obedecem a comandos, os tradutores automáticos e os sistemasbetano eleiçõesbusca na internet", explica.

Segundo ele, são tantos os produtos que muitos dos desenvolvedores já não se referem ao trabalho como sendobetano eleiçõesProcessamentobetano eleiçõesLinguagem Natural. "Como hoje uma das tarefas mais relevantes na tecnologia é ensinar uma máquina a ler (e compreender), o PLN é uma das áreas mais importantesbetano eleiçõesciência e tecnologia", diz.

"Ninguém fala nisso, mas uma análise detalhada dos sistemas inteligentes (cerne da Inteligência Artificial) indica claramente que essa afirmação é irrefutável."