{"id":86251,"date":"2018-06-04T12:30:12","date_gmt":"2018-06-04T15:30:12","guid":{"rendered":"https:\/\/espacoecologico.com.br\/arquivo\/?p=86251"},"modified":"2018-06-04T10:20:59","modified_gmt":"2018-06-04T13:20:59","slug":"os-cientistas-brasileiros-que-inventaram-a-ferramenta-de-correcao-ortografica-do-word","status":"publish","type":"post","link":"https:\/\/espacoecologico.com.br\/arquivo\/os-cientistas-brasileiros-que-inventaram-a-ferramenta-de-correcao-ortografica-do-word\/","title":{"rendered":"Os cientistas brasileiros que inventaram a ferramenta de corre\u00e7\u00e3o ortogr\u00e1fica do Word"},"content":{"rendered":"<p><a href=\"https:\/\/espacoecologico.com.br\/arquivo\/wp-content\/uploads\/2018\/06\/corretor.jpg\"><img loading=\"lazy\" class=\"alignleft size-medium wp-image-86252\" src=\"https:\/\/espacoecologico.com.br\/arquivo\/wp-content\/uploads\/2018\/06\/corretor-300x192.jpg\" alt=\"\" width=\"300\" height=\"192\" srcset=\"https:\/\/espacoecologico.com.br\/arquivo\/wp-content\/uploads\/2018\/06\/corretor-300x192.jpg 300w, https:\/\/espacoecologico.com.br\/arquivo\/wp-content\/uploads\/2018\/06\/corretor.jpg 415w\" sizes=\"(max-width: 300px) 100vw, 300px\" \/><\/a>Quem j\u00e1 escreveu no Word, o processador de textos da Microsoft, com certeza usou o corretor ortogr\u00e1fico do programa &#8211; aquele que sublinha palavras erradas e sugere suas vers\u00f5es corretas. Diante da palavra &#8220;coreta&#8221;, por exemplo, ele vai indicar, por meio de uma linha vermelha embaixo dela que est\u00e1 errada, e quando o corretor for acionado para corrigir todo o texto, ele vai sugerir, para essa palavra, pela ordem: &#8220;correta&#8221;, &#8220;corveta&#8221;, &#8220;corta&#8221;, &#8220;coreto&#8221;, &#8220;corretas&#8221; e &#8220;careta&#8221;.<\/p>\n<p>O que poucos sabem \u00e9 que esta tecnologia de corre\u00e7\u00e3o de texto para o portugu\u00eas tem sotaque caipira &#8211; no bom sentido, \u00e9 claro. Ela foi desenvolvida no interior paulista, no Instituto de Ci\u00eancias Matem\u00e1ticas e de Computa\u00e7\u00e3o (ICMC), da Universidade de S\u00e3o Paulo, em S\u00e3o Carlos, a 241 quil\u00f4metros da capital.<\/p>\n<div class=\"teads-inread\"><\/div>\n<p>\u00c9 uma longa hist\u00f3ria, que come\u00e7ou em 1993, quando a Itautec, uma f\u00e1brica brasileira de computadores hoje extinta, procurou o ICMC, por causa de seus pesquisadores com forma\u00e7\u00e3o em computa\u00e7\u00e3o com alguma liga\u00e7\u00e3o com linguagem natural, para que desenvolvessem um sistema de corre\u00e7\u00e3o ortogr\u00e1fica &#8211; que depois evoluiu para gramatical e estil\u00edstica.<\/p>\n<p>Na \u00e9poca, a internet ainda era novidade. &#8220;A ideia era vender o sistema na forma de um CD, principalmente para uso em escrit\u00f3rios, no aux\u00edlio \u00e0 reda\u00e7\u00e3o de cartas e memorandos, ou seja, para usu\u00e1rios com ensino fundamental ou m\u00e9dio&#8221;, lembra a cientista da Maria das Gra\u00e7as Volpe Nunes, do ICMC, coordenadora do projeto. &#8220;Aceitamos o desafio e, em pouco mais de um ano, j\u00e1 t\u00ednhamos a primeira vers\u00e3o do revisor, que, como projeto cient\u00edfico, ficou conhecido como ReGra.&#8221;<\/p>\n<p>Maria das Gra\u00e7as conta que, para desenvolver a tecnologia do corretor, foi formada uma grande equipe de pesquisadores, estudantes de computa\u00e7\u00e3o e lingu\u00edstica. O projeto teve apoio da Funda\u00e7\u00e3o de Amparo \u00e0 Pesquisa do Estado de S\u00e3o Paulo (Fapesp), durante um certo per\u00edodo, num programa de parceria com a Itautec. Essa empresa, por sua vez, financiou a equipe durante 15 anos seguidos.<\/p>\n<p>Em 2000, a Microsoft adquiriu uma licen\u00e7a da Itautec para incluir o revisor desenvolvido no ICMC nos seus programas do pacote Office. Mas a equipe continuou a dar assessoria para a Microsoft: novas regras de corre\u00e7\u00e3o eram implementadas, adapta\u00e7\u00f5es eram feitas, como \u00e0 nova ortografia do portugu\u00eas, entre outras coisas. &#8220;Em 2008, a Itautec vendeu definitivamente os direitos do produto \u00e0 Microsoft, e portanto o projeto chegou ao final, com bastante sucesso, por sinal&#8221;, diz Maria das Gra\u00e7as.<\/p>\n<div class=\"media_box full-dimensions660x360\">\n<div class=\"edges\">\n<p><img loading=\"lazy\" class=\"croppable\" title=\"A cientista Maria das Gra\u00e7as Volpe Nunes foi a coordenadora do projeto que criou o corretor\" src=\"https:\/\/img.r7.com\/images\/cientista-maria-das-gracas-volpe-nunes-03062018113905642?dimensions=660x360\" alt=\"A cientista Maria das Gra\u00e7as Volpe Nunes foi a coordenadora do projeto que criou o corretor\" width=\"640\" height=\"349\" \/>A cientista Maria das Gra\u00e7as Volpe Nunes foi a coordenadora do projeto que criou o corretor<\/p>\n<\/div>\n<div class=\"content_image\">\n<p>&nbsp;<\/p>\n<\/div>\n<\/div>\n<p>Seu colega no projeto, o f\u00edsico Osvaldo Novais de Oliveira Junior, do Instituto de F\u00edsica da Universidade Federal de S\u00e3o Carlos (UFSCar), diz que o ReGra foi o primeiro revisor gramatical desenvolvido para o portugu\u00eas.<\/p>\n<p>&#8220;No nosso caso, com o l\u00e9xico da vers\u00e3o brasileira da nossa l\u00edngua&#8221;, explica. &#8220;Quase na mesma \u00e9poca, uma empresa em Portugal, ativa at\u00e9 hoje, desenvolveu um revisor para a vers\u00e3o do idioma como \u00e9 falado l\u00e1. O lan\u00e7amento do deles deve ter ocorrido pouco depois do nosso.&#8221;<\/p>\n<p>Segundo Oliveira, o ReGra faz revis\u00e3o com base em regras &#8211; algumas de an\u00e1lise sint\u00e1tica e algumas emp\u00edricas, de maneira semelhante ao revisor do ingl\u00eas dispon\u00edvel no Word da Microsoft. &#8220;Ao que eu saiba, a Microsoft nunca desenvolveu revisor para o portugu\u00eas&#8221;, diz.<\/p>\n<p>Procurada pela BBC Brasil a empresa se manifestou por meio de uma nota: &#8220;Inicialmente, a Microsoft realizou acordos para a utiliza\u00e7\u00e3o de licen\u00e7as de corretores ortogr\u00e1ficos de terceiros para muitos idiomas ao redor do mundo, mas gradativamente todos eles foram migrados para a plataforma da empresa. A ferramenta brasileira fez essa migra\u00e7\u00e3o na vers\u00e3o do Office 2010, o que significa que a tecnologia presente no produto j\u00e1 \u00e9 100% Microsoft.&#8221;<\/p>\n<p>De acordo com Oliveira, pode-se dizer que houve pouqu\u00edssimo avan\u00e7o em revis\u00e3o gramatical autom\u00e1tica nos \u00faltimos anos, pois aparentemente as empresas n\u00e3o est\u00e3o dispostas a fazer grandes investimentos. &#8220;Isso seria necess\u00e1rio, pois hoje um revisor gramatical poderia ser muito mais eficiente se combinasse regras com m\u00e9todos estat\u00edsticos e de aprendizado de m\u00e1quina&#8221;, complementa.<\/p>\n<p>Oliveira diz que a Itautec &#8220;apostou muito numa equipe de jovens pesquisadores, sem garantia de retorno. Apenas para ilustrar, a Itautec investiu o equivalente a cerca de US$ 2 milh\u00f5es (t\u00ednhamos que memorizar valores em d\u00f3lares, pois a infla\u00e7\u00e3o em 1993 ainda era muito alta) nos primeiros anos do trabalho. N\u00e3o prometemos fazer o revisor, mas apenas um estudo sobre o que era necess\u00e1rio e como cri\u00e1-lo.&#8221;<\/p>\n<div class=\"media_box full-dimensions660x360\">\n<div class=\"edges\">\n<p><img loading=\"lazy\" class=\"croppable\" title=\"O f\u00edsico Osvaldo Novais de Oliveira Junior, da Universidade Federal de S\u00e3o Carlos, tamb\u00e9m participou da cria\u00e7\u00e3o do programa\" src=\"https:\/\/img.r7.com\/images\/fisico-osvaldo-novais-de-oliveira-junior-03062018113905844?dimensions=660x360\" alt=\"O f\u00edsico Osvaldo Novais de Oliveira Junior, da Universidade Federal de S\u00e3o Carlos, tamb\u00e9m participou da cria\u00e7\u00e3o do programa\" width=\"640\" height=\"349\" \/>O f\u00edsico Osvaldo Novais de Oliveira Junior, da Universidade Federal de S\u00e3o Carlos, tamb\u00e9m participou da cria\u00e7\u00e3o do programa<\/p>\n<\/div>\n<div class=\"content_image\">\n<p>&nbsp;<\/p>\n<\/div>\n<\/div>\n<p>O investimento da Itautec tornou poss\u00edvel a forma\u00e7\u00e3o de uma equipe multidisciplinar, e multi-institucional, que congregava professores das universidades de S\u00e3o Paulo (USP), Federal de S\u00e3o Carlos (UFSCar), e Estadual Paulista (Unesp) do c\u00e2mpus Araraquara, para realizar pesquisas na \u00e1rea de Processamento de Linguagem Natural (PLN).<\/p>\n<p>&#8220;Acho que ainda em 1993 decidimos que o grupo deveria ganhar um nome, que \u00e9 o mesmo at\u00e9 hoje: N\u00facleo Insterinstitucional de Lingu\u00edstica Computacional (NILC)&#8221;, lembra Oliveira. &#8220;A meu ver, a cria\u00e7\u00e3o dele \u00e9 o maior legado do Projeto ReGra.&#8221;<\/p>\n<p>De acordo com ele, o NILC \u00e9 hoje um dos maiores centros de gera\u00e7\u00e3o de tecnologia para o processamento autom\u00e1tico do portugu\u00eas. &#8220;Certamente \u00e9 o que mais disponibilizou gratuitamente recursos ling\u00fc\u00edsticos computacionais para o nossa idioma&#8221;, diz.<\/p>\n<p>&#8220;Isso foi poss\u00edvel porque, desde o in\u00edcio, adotamos a pol\u00edtica de franquear os recursos, como l\u00e9xicos, corpus (base de textos, escritos ou falados, organizada e anotada, que possa servir como recurso lingu\u00edstico-computacional) e ferramentas de processamento a colegas de todo o mundo. Mesmo aqueles recursos acess\u00f3rios para o desenvolvimento do ReGra foram disponibilizados, com a autoriza\u00e7\u00e3o da Itautec.&#8221;<\/p>\n<p>Mas o NILC n\u00e3o parou por a\u00ed. Oliveira destaca os projetos que o n\u00facleo desenvolveu e vem desenvolvendo nas \u00e1reas de tradu\u00e7\u00e3o autom\u00e1tica, terminologia, simplifica\u00e7\u00e3o de texto, reconhecimento de autoria, identifica\u00e7\u00e3o de fake news (not\u00edcias falsas), sistemas de busca, uso de linguagem para detec\u00e7\u00e3o de doen\u00e7as e reconhecimento de fala, por exemplo.<\/p>\n<p>&#8220;Ressalto que o processamento autom\u00e1tico de l\u00edngua natural est\u00e1 presente em muitos produtos, como os assistentes inteligentes que reconhecem voz e obedecem a comandos, os tradutores autom\u00e1ticos e os sistemas de busca na internet&#8221;, explica.<\/p>\n<p>Segundo ele, s\u00e3o tantos os produtos que muitos dos desenvolvedores j\u00e1 n\u00e3o se referem ao trabalho como sendo de Processamento de Linguagem Natural. &#8220;Como hoje uma das tarefas mais relevantes na tecnologia \u00e9 ensinar uma m\u00e1quina a ler (e compreender), o PLN \u00e9 uma das \u00e1reas mais importantes de ci\u00eancia e tecnologia&#8221;, diz.<\/p>\n<p>&#8220;Ningu\u00e9m fala nisso, mas uma an\u00e1lise detalhada dos sistemas inteligentes (cerne da Intelig\u00eancia Artificial) indica claramente que essa afirma\u00e7\u00e3o \u00e9 irrefut\u00e1vel.&#8221;<\/p>\n<p class=\"copyright\">\n","protected":false},"excerpt":{"rendered":"<p>Quem j\u00e1 escreveu no Word, o processador de textos da Microsoft, com certeza usou o<\/p>\n","protected":false},"author":2,"featured_media":86252,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[],"tags":[],"uagb_featured_image_src":{"full":["https:\/\/espacoecologico.com.br\/arquivo\/wp-content\/uploads\/2018\/06\/corretor.jpg",415,265,false],"thumbnail":["https:\/\/espacoecologico.com.br\/arquivo\/wp-content\/uploads\/2018\/06\/corretor-150x150.jpg",150,150,true],"medium":["https:\/\/espacoecologico.com.br\/arquivo\/wp-content\/uploads\/2018\/06\/corretor-300x192.jpg",300,192,true],"medium_large":["https:\/\/espacoecologico.com.br\/arquivo\/wp-content\/uploads\/2018\/06\/corretor.jpg",415,265,false],"large":["https:\/\/espacoecologico.com.br\/arquivo\/wp-content\/uploads\/2018\/06\/corretor.jpg",415,265,false],"1536x1536":["https:\/\/espacoecologico.com.br\/arquivo\/wp-content\/uploads\/2018\/06\/corretor.jpg",415,265,false],"2048x2048":["https:\/\/espacoecologico.com.br\/arquivo\/wp-content\/uploads\/2018\/06\/corretor.jpg",415,265,false],"cream-magazine-thumbnail-2":["https:\/\/espacoecologico.com.br\/arquivo\/wp-content\/uploads\/2018\/06\/corretor.jpg",415,265,false],"cream-magazine-thumbnail-3":["https:\/\/espacoecologico.com.br\/arquivo\/wp-content\/uploads\/2018\/06\/corretor.jpg",415,265,false],"cream-magazine-thumbnail-4":["https:\/\/espacoecologico.com.br\/arquivo\/wp-content\/uploads\/2018\/06\/corretor.jpg",415,265,false]},"uagb_author_info":{"display_name":"","author_link":"https:\/\/espacoecologico.com.br\/arquivo\/author\/"},"uagb_comment_info":0,"uagb_excerpt":"Quem j\u00e1 escreveu no Word, o processador de textos da Microsoft, com certeza usou o","_links":{"self":[{"href":"https:\/\/espacoecologico.com.br\/arquivo\/wp-json\/wp\/v2\/posts\/86251"}],"collection":[{"href":"https:\/\/espacoecologico.com.br\/arquivo\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/espacoecologico.com.br\/arquivo\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/espacoecologico.com.br\/arquivo\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/espacoecologico.com.br\/arquivo\/wp-json\/wp\/v2\/comments?post=86251"}],"version-history":[{"count":0,"href":"https:\/\/espacoecologico.com.br\/arquivo\/wp-json\/wp\/v2\/posts\/86251\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/espacoecologico.com.br\/arquivo\/wp-json\/wp\/v2\/media\/86252"}],"wp:attachment":[{"href":"https:\/\/espacoecologico.com.br\/arquivo\/wp-json\/wp\/v2\/media?parent=86251"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/espacoecologico.com.br\/arquivo\/wp-json\/wp\/v2\/categories?post=86251"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/espacoecologico.com.br\/arquivo\/wp-json\/wp\/v2\/tags?post=86251"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}